數十年以來,Turing Test 一直是最常被用來測試人工智慧 (AI) 能力極限的指標。然而,最近一組來自 Facebook 的研究團隊發展出了另一套以一般語言及邏輯問題為基礎的測試,用於 AI 的能力檢驗。
根據 arXiv 的一篇研究報告指出:「這套由 Facebook 紐約 AI 實驗室所開發的問題,主要是用來測試 AI 系統是否能夠透過結合不同的知識及推理歸納回答問題。且目前大部份的 AI 仍無法通過這項考驗。」
這項測試包含了 20 個涵括推理與語言理解的問題。從簡單的從現有資料找出答案,到比較困難的解決以語言形式所呈現的計算、了解時間軸上的前後相對關係以及描述物品的性質等等。
在文章的最後附有三個例題,有興趣的話,也可以在 arXiv 的研究報告中找到完整的 20 題題庫。如果不小心答錯了幾題也不用太難過,因為根據到目前為止的測試,還沒有任何一個 AI 可以完全答對所以的題目。
就如同 New Scientist 所指出的,這項測試的困難點主要是在多樣的題型範圍,所以能夠有效的測驗出 AI 系統的先天缺陷。
當然,這項測試也顯示出電腦還不具有理解複雜真實世界的能力。這些題目的內容大多已將日常生活的情況簡化到兒童書籍的程度,但對於 AI 來說還是難以理解。因此,想要能夠與一般電腦聊聊心情或日常瑣事,還需要一段很長的時間。
由於目前世界上投入 AI 領域的研究者數量不少,這 20 個問題很可能不會成為未來 AI 測試的標準。但目前,看看 AI 到底有多聰明也不賴。
以下提供三個問題(解答在最後)。
- 問題一
約翰拿了一個蘋果
約翰去了辦公室
約翰去了廚房
約翰放下了蘋果
問:在進廚房之前,蘋果在哪裡?
- 問題二
有一個三角形在藍色正方形的右邊
有一個紅色正方形在藍色正方形的上面
有一個紅色圓形在藍色正方形圓形在的右邊
問:紅色的圓形是在藍色正方形的右邊嗎?紅色正方形是在三角形左邊嗎?
- 問題三
一顆足球可以被放在行李箱裡
行李箱可以被放在櫥櫃裡
一盒巧克力比足球小
問:巧克力可以被放在行李箱裡嗎?
- 解答
1: 辦公室
2: 是; 是
3: 是
你有比 AI 聰明嗎?
(資料來源:《Gizmodo.com》;圖片來源:A Health Blog,CC Licensed)
COMMENT