或許,再以不能將 facebook 當作純粹的社群媒體了!
90 年代中期時開始流行電腦與人類的競賽。一個叫做 Chinook 的軟體與世界冠軍選手 PK 西洋跳棋,擊敗了選手。IBM 的 Deep Blue 超級電腦與世界冠軍 Gary Kasparov 挑戰西洋棋,連 Kasparov 也潰敗。2011 年時,IBM 的另一個超級電腦 Watson 贏了智力遊戲 Jeopardy。
無論是什麼智力遊戲,電腦似乎都有機會贏過人類,除了人類永遠稱霸的一個遊戲:圍棋。
圍棋可說是東方版的西洋棋,源自中國,西方人稱之為「Go」。電腦透過分析每一步棋子的每種可能後果,稱霸上述的其他遊戲。像 Kasparov 這樣的世界冠軍高手當然也能預測西洋棋的每一步,但是電腦能預測更久之後的棋局。圍棋更另當別論了,圍棋有 19 乘 19 格的棋盤,所以能選擇的下棋策略比其他遊戲都多,每一步的利弊也更複雜。有些圍棋高手透露自己下棋已經近乎透過潛意識。想讓電腦也用潛意識下棋,Watson 或 Deep Blue 的傳統技術可行不通。
有鑑於動態消息(News Feed)的內容以每年 50% 的速度成長,Facebook 的人工智慧研究團隊(Facebook AI Research,FAIR)正運用更先進的人工智慧「深度學習」 (Deep Thinking),來破解圍棋,這麼做的背後原因,是要將影像辨識到對自然語言的理解得技術,進一步結合各種人工智慧,以達到真正代替人類完成各種任務的可能。
- 深度學習:目前人工智慧最高境界
深度學習系統擅長辨識照片、辨認口語對話和翻譯語言,近幾年 Facebook、Google 和微軟等企業都十分青睞它。舉例來說,深度學習辨識一隻貓之前,會分析千萬種已知的貓的圖像,並把資訊傳到像是人腦的中央神經網絡。facebook 可以辨識你的照片中的朋友,就是因為這些神經網絡。Google 的數位助理和 Skype 翻譯功能也都拜神經網絡所賜。
facebook 想要運用類似技術來視覺化分析圍棋策略,仿造人類下圍棋的方式,研究人員傳輸圍棋圖像到深度學習的神經網絡之中,深度學習便可了解一盤成功的圍棋「長怎樣」。
facebook 技術長 Mike “Schrep” Schroepfer 在加州告訴記者:「我們很肯定全世界最強的圍棋高手都是用看的,他們能直覺地看出哪個策略好、哪個不好。」他說 facebook 結合人工智慧的基本遊戲功能與視覺系統,雖然這套系統只成形 2、3 個月而已,Schrep 表示,它已經勝過單純的傳統人工智慧技術。
- 學會自然語言:電腦和你談心
facebook 的系統只是深度學習技術的冰山一角,很多企業正運用深度學習來針對某些特定任務。facebook 用神經網絡來更精準地篩選你的動態時報。他們也創造了一個盲人專用的系統,可分析 facebook 上的照片,並透過文字轉語言(text-to-speech)引擎對盲人使用者描述照片。深度學習不斷突破傳統電腦的極限,可見它有多強大!
深度學習就像人類的直覺,可以做一些直覺性的事情。深度學習下圍棋,讓我們窺視了它未來的發展,目前深度學習已經掌握的視覺和語言兩個面向,很多科學家相信它甚至可以學會自然語言!
自然語言就是人類口語化的自然說話方式,Schrep 提到過去曾做過的一個系統,它的神經網絡分析《魔戒》的大綱,並回答相關問題。他說:「我們把非常簡短的《魔戒》傳送到系統中,然後你馬上就可以問它問題。」這些電影資訊其實相對複雜,而且牽扯到空間性的關係。
Google 最近也發布了一篇研究報告,描述一個可以和你辯論人生意義的機器人。名為 MetaMind 的新創公司也在鑽研類似的機器人。
百度的研究總監吳恩達是研究深度學習系統的先鋒,他認為學會自然語言的路還很長,不能過度倚靠目前的微小進展。他說:「我們常常搞懂,但也常常搞砸。」
- 視覺障礙也能「看」照片:臉書唸給盲人聽
上個月,facebook 研究員們接受《Wired》雜誌採訪時,介紹專為盲人設計的深度學習系統。該系統可以辨識照片中的人物、物體或地點等,並決定照片中的臉部是否在微笑,也可辨認照片地點是室內或室外。Schrep 說這個系統也進展到可理解自然語言,使用者直接詢問「照片裡有嬰兒嗎?」、「照片中的男人在做什麼?」或「嬰兒坐在男人的腿上嗎?」等問題。
「我們給電腦邏輯能力,讓它能夠問問題和了解新資訊,再把圖像理解力和分割能力結合。」Schrep 指出這就是視覺 Q&A,分割能力就是系統能正確分辨照片中不同物件的功能,譬如辨識出哪個是嬰兒、哪個是男人。
同時,facebook 也嘗試開發比人工智慧更高等的數位系統「M」。M 如今正在舊金山灣一帶接受數百人使用測試,M 大部分是由操作者驅動,你可以問 M:「可以幫我預約今晚的晚餐嗎?」等算簡單的要求,這時一般的傳統人工智慧系統可能就會顯示出很多選項,然後再由使用者做出實際行動。
M 最厲害的地方就是,它能主動做出實際反應。facebook 觀察人類的行為,再教機器怎麼做,假設你問 M 能不能買花,M 就會反問你「你的預算是多少?」或是「花要送給哪位?」Schrep 說神經網絡分析人類使用者之間的互動後,精準地指定這兩個問題。
他表示目前有部分問題是由人工智慧自動發展出來的,他希望未來能提高這個比例。
M 系統和盲人專用系統目前都尚未開放大眾使用,但是距離正式發布也不遠了。Schrep 說:「我們得教電腦用我們的眼光了解這個世界。」facebook 的神經網絡在學習怎麼玩圍棋,搞不好有一天能破解圍棋!
編譯/蘇奕菲
COMMENT