從“炒作曲線”看人工智能的茍且與遠(yuǎn)方VR/AR
經(jīng)歷了 2016 、2017 上半年的瘋狂炒作之后,人工智能的熱潮正在褪去。
究其原因,如果按照 Gartner 的「炒作曲線」來解釋,則是由于新技術(shù)爆發(fā)時(shí)的公眾熱度更容易被媒體、資本所捕捉,而隨著技術(shù)落地過程中暴露出的一系列實(shí)際困難,會(huì)部分程度上導(dǎo)致公眾的悲觀,從而讓這項(xiàng)新技術(shù)逐步淡出公眾視野。
人工智能也是如此。在過去的 2017 年,圍繞人工智能的場(chǎng)景應(yīng)用正在成為國(guó)內(nèi)外巨頭、創(chuàng)業(yè)新貴押注的焦點(diǎn),然而不管是圖像、語音還是自然語言交互,盡管單項(xiàng)技術(shù)都不同程度地獲得巨大發(fā)展,但尚不足以與實(shí)際場(chǎng)景結(jié)合,形成全新的傳播熱點(diǎn),一個(gè)顯著的案例,AlphaGo 在 2017 年烏鎮(zhèn)橫掃中國(guó)圍棋高手的新聞遠(yuǎn)遠(yuǎn)不及單挑李世石那樣吸引全球關(guān)注。
另一個(gè)原因,則是更多新技術(shù)、新概念的出現(xiàn),這在中國(guó)的表現(xiàn)尤為明顯。2017 下半年,特別是 2017 年年底,區(qū)塊鏈成為中國(guó)互聯(lián)網(wǎng)行業(yè)的「新技術(shù)」,這種由虛擬貨幣所推動(dòng)的技術(shù)幾乎「瞬間」占據(jù)了投資人、主流科技媒體、各種自媒體的討論議題里。
上述兩個(gè)原因或多或少讓人工智能暫時(shí)擺脫了聚光燈的關(guān)注,也讓我們有更多的理性去看待這個(gè)過去幾年被譽(yù)為「改變?nèi)祟惷\(yùn)」的技術(shù),到底是一次面向遠(yuǎn)方偉大征程的開始,還是又一次從寒冬到盛夏再到寒冬的短暫更替。
人工智能的遠(yuǎn)方依然令人向往
事實(shí)上,關(guān)于人工智能的「遠(yuǎn)方風(fēng)景」已經(jīng)被重復(fù)了六十多年。自 1956 年「人工智能」一詞來到這個(gè)星球上,一代代的數(shù)學(xué)家、計(jì)算機(jī)科學(xué)家都在為之不懈努力,但到底何為「人工智能」卻存在太多理解角度。
作為達(dá)特茅斯會(huì)議組織者之一的約翰·麥卡錫,一直認(rèn)為「人工智能」一詞除了是暗示機(jī)器可以去完成人類可以完成的工作之外,和人類行為毫無關(guān)系。
而與麥卡錫專注數(shù)學(xué)邏輯模擬人類大腦的做法不同,另一位達(dá)特茅斯的參會(huì)者馬文·明斯基則早早看到了神經(jīng)網(wǎng)絡(luò)的重要性,但頗具諷刺意味的是,也正是明斯基在某種程度上否認(rèn)了神經(jīng)網(wǎng)絡(luò)的可行性,導(dǎo)致基于人工神經(jīng)網(wǎng)絡(luò)的研究長(zhǎng)期排除在人工智能「主流」研究之外。
而就在麥卡錫離開 MIT,扛起斯坦福大學(xué)人工智能研究大旗之時(shí),道格拉斯·恩格爾巴特正在努力將另一種「智能」帶入計(jì)算機(jī)行業(yè)。
這位北歐人的后裔并沒有麥卡錫的「遠(yuǎn)大志向」,而是在思考如何將技術(shù)去「提升」人類現(xiàn)有的技能,他終其一生都在研究計(jì)算機(jī)技術(shù)至于人類的意義,成為人機(jī)交互的「一代宗師」。
在硅谷資深記者約翰·馬爾科夫的《與機(jī)器人共舞》中,記錄了麥卡錫的「人工智能」與恩格爾巴特的「增強(qiáng)智能」之間的恩怨情仇,「在已經(jīng)過去的50年中,麥卡錫和恩格爾巴特的理論仍然各自為政,他們最為核心的沖突仍然懸而未決。一種方法要用日益強(qiáng)大的計(jì)算機(jī)硬件和軟件組合取代人類;另一種方法則要使用相同的工具,在腦力、經(jīng)濟(jì)、社會(huì)等方面拓展人類的能力?!?/p>
如今,這兩種理念在全世界范圍內(nèi)依然有不少支持者。伊隆·馬斯克與馬克·扎卡伯格口水戰(zhàn),霍金的末日預(yù)言與凱文·凱利的批判一度成為 2017 年各大科技媒體爭(zhēng)先報(bào)道的消息,但這一切討論卻排除了這個(gè)領(lǐng)域最有發(fā)言權(quán)的一線研究者,無論是 Facebook 人工智能實(shí)驗(yàn)室負(fù)責(zé)人 Yan Lecun 還是深度神經(jīng)網(wǎng)絡(luò)「教父」般的 Hinton,其冷靜而客觀的分析,都無法進(jìn)入大眾視野。
另一方面,掌握巨大傳播資源的巨頭公司則在塑造一個(gè)被技術(shù)賦能的美好未來。
過去的兩年,亞馬遜、Google、阿里巴巴等讓人工智能走入越來越多的家庭,通過語音交互的智能音箱,語音識(shí)別、自然語言處理等技術(shù)逐步落地,還讓越來越多的用戶感受到人工智能的威力;百度、英特爾、Google 還在不斷向公眾傳達(dá)自動(dòng)駕駛的美好未來,那些制作精良又充滿未來感的視頻不斷刷新著公眾對(duì)于駕駛的所有想象力;一場(chǎng)場(chǎng)科技峰會(huì)/發(fā)布會(huì)上,人工智能正在進(jìn)入不同行業(yè),它可以讓你的手機(jī)拍照更好看,它可能是醫(yī)院醫(yī)生的助手,它也可以在工廠里為提升產(chǎn)能貢獻(xiàn)自己的能力,還會(huì)扮演著城市公共安全保衛(wèi)者的角色......
就這樣,這兩年內(nèi),公眾在「人工智能如何幫xxx」的話術(shù)中開啟新的一天,又在「人工智能將徹底顛覆XXX」的描述中入睡,每隔若干個(gè)小時(shí),就有一個(gè)新行業(yè)被人工智能所改變,每隔若干天,就有一家人工智能創(chuàng)業(yè)公司拿了上億美金的融資,每隔若干月,「自動(dòng)駕駛即將上路」、「虛擬女朋友」的消息再重復(fù)一次。
然而,這一切事關(guān)遠(yuǎn)方的描述,無論是馬斯克的人類末日?qǐng)鼍斑€是扎克伯格的烏托邦世界,都跳過了這個(gè)行業(yè)如今的「茍且」。
當(dāng)下的茍且:軟件、硬件與應(yīng)用
坦率來說,上文中所有關(guān)于「人工智能」進(jìn)步的說法,都應(yīng)該換成「深度神經(jīng)網(wǎng)絡(luò)」,或者換句話說,過去幾年所謂人工智能的進(jìn)步,都來自深度神經(jīng)網(wǎng)絡(luò)的快速發(fā)展。
然而,盡管幾乎全世界的計(jì)算機(jī)/互聯(lián)網(wǎng)巨頭都投入到神經(jīng)網(wǎng)絡(luò)的研究之中,卻依然在處在一個(gè)非常初級(jí)的階段,包括以下三個(gè)方面:
軟件層面:被人寄予厚望的強(qiáng)化學(xué)習(xí)也難有突破;
硬件層面:群雄逐鹿;
應(yīng)用層面:圖像、語音之外還剩下什么?
先說軟件層面。作為 2017 年《MIT 商業(yè)評(píng)論》評(píng)選的年度十大技術(shù),強(qiáng)化學(xué)習(xí)曾在 AlphaGo 擊敗各路圍棋高手的對(duì)弈中發(fā)揮了重要作用。強(qiáng)化學(xué)習(xí)的基本原理,是一種和環(huán)境交互過程的「學(xué)習(xí)」過程,這種動(dòng)態(tài)的學(xué)習(xí)過程非常適合在一些沒有特定規(guī)則、實(shí)時(shí)反饋的場(chǎng)景中,比如工業(yè)機(jī)器人或自動(dòng)駕駛。
這是一種令人聽起來就激動(dòng)的機(jī)器學(xué)習(xí)模型,這幾乎也是人類學(xué)習(xí)周遭事物的方式。以駕駛為例,人類司機(jī)需要結(jié)合路況來實(shí)施調(diào)整自己的駕駛行為,當(dāng)下自動(dòng)駕駛系統(tǒng)中,感知系統(tǒng)可以被深度學(xué)習(xí)解決,而決策系統(tǒng)和控制系統(tǒng),則很有可能是強(qiáng)化學(xué)習(xí)所能發(fā)揮作用的領(lǐng)域。
但當(dāng)下除了 AlphaGo 利用自動(dòng)對(duì)弈進(jìn)行強(qiáng)化學(xué)習(xí)之外,其他實(shí)際應(yīng)用并不現(xiàn)實(shí),原因就在于,當(dāng)這一算法面臨現(xiàn)實(shí)社會(huì)數(shù)百個(gè)乃至幾千個(gè)環(huán)境變量的挑戰(zhàn)時(shí),這種交互過程能否從始至終地保持絕對(duì)可控還無法保證,因此,短期內(nèi),這個(gè)算法還無法真正實(shí)現(xiàn)應(yīng)用。
其次,在硬件領(lǐng)域,針對(duì)深度神經(jīng)網(wǎng)絡(luò)的競(jìng)爭(zhēng)日益白熱化。英偉達(dá)、英特爾、寒武紀(jì)、Google、華為、ARM、阿里巴巴 等公司正在緊鑼密鼓地推出各種硬件產(chǎn)品——用于訓(xùn)練和運(yùn)行深度神經(jīng)網(wǎng)絡(luò)的高性能、可定制的處理器。
英偉達(dá)股價(jià)兩年內(nèi)翻了 6 倍,英特爾不惜重金收購的 Nervana、Altera,其目的都是要在這個(gè)領(lǐng)域快速成為標(biāo)準(zhǔn)和規(guī)則的制定者。但圍繞硬件發(fā)展路線以及創(chuàng)業(yè)路徑,依然有諸多不確定性,比如,GPU、FPGA 以及 TPU 還無法有明確的優(yōu)劣好壞之分,再比如,近兩年的量子計(jì)算機(jī),又會(huì)給機(jī)器學(xué)習(xí)、深度學(xué)習(xí)帶來怎樣的變化?
事實(shí)上,和其他所有計(jì)算行業(yè)一樣,深度神經(jīng)網(wǎng)絡(luò)硬件的最終勝者,一定是那些能提供低價(jià)同時(shí)強(qiáng)大計(jì)算能力、并且能讓絕大多數(shù)開發(fā)者/研究者快速上手的產(chǎn)品,但在 2018 年的現(xiàn)在,我們還看不到。
第三,則是深度神經(jīng)網(wǎng)絡(luò)技術(shù)落地的關(guān)鍵環(huán)節(jié):應(yīng)用。過去幾年,圍繞人工智能落地的應(yīng)用實(shí)例時(shí),無外乎有兩大領(lǐng)域:
圍繞圖像/視頻的處理,從識(shí)別到后期處理,最直接的案例,手機(jī)相機(jī)的美顏功能;
基于語音的虛擬/實(shí)體產(chǎn)品,從手機(jī)虛擬助理到智能音箱;
上述兩大領(lǐng)域的落地案例在不同行業(yè)又有不同的展現(xiàn)形式。在消費(fèi)端,2017 年華為、蘋果都在其新一代旗艦手機(jī)中加入 NPU(神經(jīng)網(wǎng)絡(luò)處理單元),就是圍繞神經(jīng)網(wǎng)絡(luò)在處理圖像上的能力,用一個(gè)單獨(dú)的處理單元讓手機(jī)完成大量拍照、圖片的處理工作;國(guó)內(nèi) 2017 年出現(xiàn)了一股智能音箱熱,其背后的技術(shù)驅(qū)動(dòng)力則是語音識(shí)別、語義理解、自然語言理解等技術(shù)的整合;而在企業(yè)端,從 AWS、Google Cloud 到阿里云,云服務(wù)商正在將圖像/視頻的處理能力打包為 API,供開發(fā)者和企業(yè)調(diào)用;垂直領(lǐng)域,基于圖像/視頻技術(shù),讓國(guó)內(nèi)安防行業(yè)迎來一個(gè)史無前例的春天;也是基于圖像/視頻技術(shù),醫(yī)療影像的變革正徐徐而來......
然而當(dāng)我們?cè)噲D尋找上述單點(diǎn)技術(shù)之外的落地實(shí)例時(shí),卻會(huì)失望地發(fā)現(xiàn)這可能就是故事的全部。畢竟,語音、圖像/視頻與文本,構(gòu)成了互聯(lián)網(wǎng)上的所有內(nèi)容,整個(gè)互聯(lián)網(wǎng)行業(yè)努力的方向,都是要讓這些內(nèi)容最終變成結(jié)構(gòu)化的數(shù)據(jù),實(shí)現(xiàn)更高效的分析和再利用。
然而,這一切需求的誕生,與其說是一種「增強(qiáng)智能」——技術(shù)賦能行業(yè),倒不如說是,這是一種更實(shí)際、更功利的選擇,讓深度學(xué)習(xí)去解決最有可能解決的問題,并包裝為人工智能的福祉,其落腳點(diǎn)還是互聯(lián)網(wǎng)公司最擅長(zhǎng)的領(lǐng)域:數(shù)據(jù)。
「數(shù)據(jù)就是石油」,這是最近兩年內(nèi)經(jīng)常聽到一種說法,2017 年一期《經(jīng)濟(jì)學(xué)人》文章里,有一張圖表說明了諸多問題:
右圖是公司財(cái)報(bào)會(huì)議上對(duì)于人工智能的關(guān)注程度,從 2014 年開始就是極度陡峭的增長(zhǎng)線,而與之對(duì)應(yīng)的左圖里,IDC 制造的「digital universe」指代的是每年數(shù)據(jù)生產(chǎn)和復(fù)制的數(shù)量,其增速也是指數(shù)級(jí)的。
這至少說明了兩個(gè)問題:其一,人工智能的確是當(dāng)下最熱的命題之一;其二,人工智能的再次回歸,是海量數(shù)據(jù)帶來的最直接反應(yīng),這也就不難理解,為何當(dāng)下所有標(biāo)榜「人工智能」的應(yīng)用,幾乎都是數(shù)據(jù)密集領(lǐng)域的產(chǎn)物了。
寫在最后,超越不可能
如果以「遠(yuǎn)方」的標(biāo)準(zhǔn)來衡量當(dāng)下的「茍且」,深度神經(jīng)網(wǎng)絡(luò)遠(yuǎn)非人工智能的未來。在一個(gè)媒體效應(yīng)遠(yuǎn)大于實(shí)際效應(yīng)的當(dāng)下,公眾往往會(huì)將深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、人工智能混為一談;又或者,誤以為 AlphaGo 就是深度學(xué)習(xí)的產(chǎn)物。
我們還在期待更好的算法,從根本上解決「黑盒子」難題,從而可以讓機(jī)器決策過程變得更透明,這在當(dāng)下尤為重要。Google 面臨歐盟反壟斷調(diào)查時(shí)的首要問題是:為什么這個(gè)搜索結(jié)果要排在另一個(gè)結(jié)果之前?再比如,當(dāng)越來越多標(biāo)榜將深度學(xué)習(xí)應(yīng)用到金融領(lǐng)域的場(chǎng)景里,當(dāng)用戶的貸款請(qǐng)求被深度學(xué)習(xí)算法所駁回時(shí),能否解釋這其中的理由到底是什么?
我們也同樣需要一個(gè)沒有偏見的算法。 2017 年,IBM Watson 在被引入美國(guó)法院審判時(shí)也出現(xiàn)諸多爭(zhēng)議,由于過往數(shù)據(jù)顯示黑人犯罪比例高,導(dǎo)致 Watson 在決策時(shí)常常像人類法官一樣做出帶有偏見性的決策。而在一個(gè)男權(quán)之上的社會(huì),大量公司高管都是男性,此時(shí)倘若引入深度學(xué)習(xí)作為招聘工具,則很有可能招來更多男性。
這種根深蒂固的偏見幾乎普遍存在于所有的機(jī)器學(xué)習(xí)算法中,但很顯然,深度學(xué)習(xí)最難測(cè)試與調(diào)整,同時(shí)又由于其廣泛的應(yīng)用場(chǎng)景變得更加引人矚目,微軟幾次三番上線在 Twitter 上線聊天機(jī)器人,又幾次三番地下架,其原因就是當(dāng)一個(gè)深度學(xué)習(xí)應(yīng)用程序面臨真實(shí)社會(huì)場(chǎng)景時(shí),其所做作為已經(jīng)超出了應(yīng)用開發(fā)者的控制,甚至都無法讓其「浪子回頭」,唯一的做法就是下架。
你當(dāng)然可以說這不是算法的問題,而是社會(huì)環(huán)境的自然映射,可問題的關(guān)鍵在于,圍繞人工智能,甚至圍繞機(jī)器學(xué)習(xí),還有大量的選擇余地,深度學(xué)習(xí)不應(yīng)該、也沒有這么大能力承擔(dān)如此重大的任務(wù),在人類邁向智能社會(huì)的偉大征程之中,我們理應(yīng)有更好的工具。
來源:鈦媒體
1.砍柴網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來源;2.砍柴網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來源:砍柴網(wǎng)",不尊重原創(chuàng)的行為砍柴網(wǎng)或?qū)⒆肪控?zé)任;3.作者投稿可能會(huì)經(jīng)砍柴網(wǎng)編輯修改或補(bǔ)充。

- 蘋果和Vuzix加大AR投入,但游戲開發(fā)者興趣缺缺
- 回首過去展望2018,VR將走向何方?
- 透過現(xiàn)狀看未來 關(guān)于VR頭顯未來的五大趨勢(shì)
- HTC的VR轉(zhuǎn)型初見成效,但隱憂仍然存在
- 應(yīng)對(duì)人工智能挑戰(zhàn),公共政策比立法更“管用”
- 日媒稱中國(guó)需求讓全球機(jī)器人市場(chǎng)盛況空前
- AR行業(yè)報(bào)告:甩掉VR,2022年AR將迎來大爆發(fā)
- 政策扶持超高清視頻產(chǎn)業(yè),工信部調(diào)研VR終端企業(yè)小派科技
- CompTIA報(bào)告:AI,VR,AR正在加速全球企業(yè)現(xiàn)代化進(jìn)程
- 社交VR的成功取決于人,而不是VR頭顯