《AR改變世界》引言
超越現(xiàn)實,AR正在重塑未來
想象一下:12 月的一個清晨,天很陰沉,你戴著新的增強(qiáng)現(xiàn)實眼鏡,沿著紐約的拉斐特街漫步。這款眼鏡很新潮,配有微型數(shù)據(jù)投影儀和光學(xué)組合器,可以做到虛實融合——虛擬世界和現(xiàn)實世界幾乎無法被區(qū)分開來。你只要動一動頭部,全息數(shù)字層就會混合并疊加到現(xiàn)實世界,這種新穎的觀察世界的方式是量身定制的。你旁邊的行人看到的則是不同的影像,但也同樣是經(jīng)過精心設(shè)計的。
首先,你會注意到眼前的世界正變得更加豐富多彩,同時也充斥著海量的信息。在抬頭向上看時,天際線處,你會看到還沒建造起來的建筑,它們是半透明的,其中一些建筑還處于設(shè)計草圖階段,以便下次開分區(qū)會議時能得到你的反饋;另一些建筑則配有詳細(xì)的信息,并標(biāo)明了預(yù)計完工日期。還有,你最好不要盯著那些高層住宅看太久,否則你會立馬收到那些關(guān)于房產(chǎn)的廣告,而且這些廣告會被全景投射到你所居住公寓的窗戶上。
其次,棘手的問題則是,這些增強(qiáng)技術(shù)并非沒有情感。投射出的經(jīng)過優(yōu)化的影像旨在刺激你大腦的特定部位,同時這些影像會展現(xiàn)更積極的一面,這或許也是配置偏好。你的專屬人工智能(AI)——“現(xiàn)實編輯器”會推斷出,你今天不想看到它早上在街道上發(fā)現(xiàn)的垃圾桶,所以它會用虛擬灌木叢和樹木代替垃圾桶,而虛擬灌木叢和樹木影像則來自你童年時候的家庭前院。紐約市看起來無比美好!要是氣味能有查找和替換功能就更好了。由于眼鏡通過腦電圖和太陽穴上的皮電反射來感知你的情緒,并跟蹤你的瞳孔掃視活動(當(dāng)專注于某場景時你的眼睛是如何下意識地飛速轉(zhuǎn)動的),所以你看到的東西會迅速隨之做出反應(yīng)。如果你早上悶悶不樂,那么你的眼鏡就會扭曲現(xiàn)實,以便振奮你的精神:它們會照亮陰云密布的天空,加入夏日的陽光,逐漸增強(qiáng)與你的腳步相匹配的音樂節(jié)奏,此刻蔚藍(lán)的天空上會出現(xiàn)勵志的話語,云彩匯成了你的口頭禪:“你能行的!”。
再次,你會意識到這種看世界的方式比社交網(wǎng)站的社交性更強(qiáng)。廣告牌上不再是街頭小廣告,而是播放著的視頻,視頻里你的朋友和最喜歡的明星在與你講話,他們的話語還可以被翻譯成西班牙語,以幫助你提升詞匯量,為即將到來的假期旅行做好準(zhǔn)備。人行道上也像好萊塢的星光大道上一樣鑲嵌著名字和頭像,包括你的親戚和你最親近的教授和導(dǎo)師。多么好的回憶往事的方式呀!
你最近在尋找一件時髦的夾克,所以你的增強(qiáng)現(xiàn)實眼鏡會呈現(xiàn)其他人時下正在穿的流行款式。如果你在看到某個款式時立刻不經(jīng)意做出“揚眉”的動作,眼鏡就會幫你將其標(biāo)記在書簽上。多虧了 Tinder AR 智能眼鏡應(yīng)用程序,你可以自動“刪除”最近碰巧遇上的不太順利的約會,比如上周給你留下陰影的那次約會。就像在英國電視劇《黑鏡》(Black Mirror)中一樣,這些約會對象總會時不時地像幽靈一樣出現(xiàn)在你的腦海里。如果你說再也不想見到他們了,智能眼鏡立即就能幫你達(dá)成心愿。
稍后,你再次出門,這次是跑步。導(dǎo)航很容易,因為你只需沿著一條黃色磚路跑步,這條路是專為你設(shè)計的。昨天的10公里,最先和你一起跑的是電影《烈火戰(zhàn)車》(Chariots of Fire)中的蘇格蘭人[1],然后是洛奇[2],最后是牙買加短跑名將尤塞恩·博爾特(Usain Bolt),他和你一起進(jìn)行了最后的沖刺。這很有趣,但是帶來的動力沒有預(yù)期的那么強(qiáng)勁。今天,你的眼鏡又在你看到的景象中疊加了一群僵尸來追你。如果你的配速比昨天快,他們就抓不住你。也因此,你最后超過了昨天的配速!這些智能眼鏡不僅可以扭曲現(xiàn)實、編輯現(xiàn)實,還可以預(yù)測未來。當(dāng)你跑步經(jīng)過商店櫥窗時,櫥窗里會映射出你年老時的形象:兩鬢斑白,但是穿著 2032 年奧運會的 T 恤衫,你看起來精瘦、敏捷、健康。
我將這種新型的視覺現(xiàn)實稱為“超視”(SuperSight)。
眼睛的進(jìn)化
人眼是一種神奇的器官,擁有超過 1.2 億個感光細(xì)胞,可以識別 1 000 萬種顏色,同時也擁有全身最活躍的肌肉,這些肌肉使我們的平均眨眼時間僅為 100毫秒。人眼包含 200 多萬個可活動部分,復(fù)雜程度僅次于大腦。盡管人眼如此之奇妙,但幾千年來它的進(jìn)化并不顯著。雖然我們發(fā)明了眼鏡來矯正視力,發(fā)明了顯微鏡和望遠(yuǎn)鏡來完成特殊的觀測任務(wù),但我們的祖先和我們感知世界的能力相差無幾。未來 10 年,由于一系列技術(shù)呈現(xiàn)出指數(shù)級發(fā)展,這種情況將發(fā)生根本性變化。人類的視野將經(jīng)歷一場史詩般的進(jìn)化,我希望能為你呈現(xiàn)出這一畫面,讓你能夠身臨其境。
可能你已經(jīng)熟悉了虛擬現(xiàn)實(virtual reality,VR)的概念,熟悉了像 Oculus Quest 公司的或是 HTC 公司的 VIVE 系列這種虛擬現(xiàn)實沉浸式頭顯,這類頭顯能夠?qū)⑴宕髡邘肫婊玫?a target="_blank">游戲世界?!禔R 改變世界》這本書并不是關(guān)于虛擬現(xiàn)實的,那些可穿戴的虛擬現(xiàn)實設(shè)備讓我們遠(yuǎn)離現(xiàn)實,其中的景象都是不透明的,這會讓你的體驗脫離周遭世界。超視則將信息放置于現(xiàn)實場景之上,在現(xiàn)實的世界之上疊加了一個新的維度。正如美國參數(shù)技術(shù)公司(PTC)的首席執(zhí)行官吉姆·赫佩爾曼(Jim Heppelmann)所言:“用信息裝飾我們周圍的現(xiàn)實世界要有用得多。”吉姆在空間計算(spatial computing)[3]軟件創(chuàng)新方面頗有建樹。這種通過信息疊加結(jié)合到現(xiàn)實世界中的裝飾,通常被稱為增強(qiáng)現(xiàn)實[4]。
最初,AR 的探索性研究得到發(fā)展是出于軍事用途的考慮。20 世紀(jì) 90 年代初,在美國空軍研究實驗室,工程師們想要簡化遠(yuǎn)程操作員控制機(jī)械手臂的方式。他們使用光學(xué)組合器將使用者的實際手臂圖像疊加于機(jī)器人手臂圖像之上,并混合計算機(jī)生成的圖像與房間的視圖,以模擬物理障礙。數(shù)字信息和現(xiàn)實世界實現(xiàn)混搭,增強(qiáng)現(xiàn)實由此誕生。后來,研究人機(jī)工程學(xué)的航空航天工程師發(fā)現(xiàn)了 AR 的另一大優(yōu)勢:它可以將飛機(jī)儀表盤信息轉(zhuǎn)移到離飛行員視線更近的窗口顯示器上,從而減輕飛行員的認(rèn)知負(fù)荷。工程師們在平視顯示器(head-up display,HUD)的基礎(chǔ)上又研發(fā)了空軍飛行員頭盔,使用 HUD 進(jìn)行目標(biāo)定位和著陸引導(dǎo)。
2016 年,微軟推出了首款可廣泛使用的 AR 耳機(jī) HoloLens。它使用了最初為 Kinect 游戲的 3D 傳感器開發(fā)的跟蹤技術(shù),用于深度感知和身體跟蹤。此技術(shù)已經(jīng)在關(guān)于展示界面的學(xué)術(shù)研究中使用了一段時間。大約在同一時間,業(yè)內(nèi)人士開始使用“混合現(xiàn)實”(mixed reality,MR)這個術(shù)語來描述這些增強(qiáng)效果,因為它們變得越來越豐富,反應(yīng)也越來越靈敏。這一轉(zhuǎn)變得益于兩項技術(shù):
測距深度相機(jī),可以讀取佩戴者面前世界的各個維度。實時圖形繪制技術(shù)的改進(jìn),可以根據(jù)環(huán)境的變化定位動態(tài)的、交互式的數(shù)字覆蓋。
這意味著虛擬物體可以被放置于特定的位置,如放置于桌子上、半隱藏于門后面,或者飛躍于窗戶之上。在第一代谷歌眼鏡中,虛擬物體只能盤旋在半空中。
新興行業(yè)經(jīng)常會碰上命名的問題。2018 年的一段短暫時間里,我們嘗試將包括 VR、AR 和 MR 的所有沉浸式技術(shù)歸類為同一個名字——“擴(kuò)展現(xiàn)實”(extended reality,XR)。這種命名令人感到困惑,即使是對這個新興行業(yè)的一小部分研發(fā)者、投資者和記者來說也是如此。今時今日,我們開始使用一個更為確切的術(shù)語——空間計算,來描述這個新范式。同時也有人使用“環(huán)境計算”(ambient computing)這一術(shù)語。兩者都描述了沉浸式計算的未來方向:將現(xiàn)實世界與數(shù)字增強(qiáng)融合在一起。這與智能手機(jī)“隨時隨地”的承諾大相徑庭空間計算將重心放在了地點和環(huán)境上,信息圍繞著我們所理解和接觸到的世界的物理性質(zhì)進(jìn)行組織。
社交平臺 Snap 和 Instagram 的粉絲已經(jīng)體驗到了空間計算將數(shù)字內(nèi)容添加到現(xiàn)實世界之上的能力。每次你在自己臉上添加可愛的考拉鼻子、兔子耳朵、彩虹,或者通過伸舌頭來制作 3D 蘋果 Animoji 獨角獸玩偶動畫時,你都在使用計算機(jī)視覺和縮放數(shù)字投影技術(shù)。很多品牌也毫不猶豫地加入了進(jìn)來,用真正的產(chǎn)品來“裝飾”你的臉,比如沃比帕克(Warby Parker)眼鏡公司和絲芙蘭化妝品公司。不久,美發(fā)沙龍會為路過的顧客提供新發(fā)型預(yù)覽服務(wù),施華洛世奇會展示與你的服裝很搭配的耳環(huán)和項鏈。齒形矯正公司 SmileDirectClub 在掃描了你牙齒的當(dāng)前排列狀況后,已經(jīng)能夠為你提供“微笑之旅”的動畫預(yù)覽。同理,社交媒體上主打“快速無痛”的整容手術(shù)廣告很快就會通過手機(jī)屏幕上的鏡子放大你的缺陷。相比鼓勵人們永久地改變自己的身體,面部濾鏡可能會平息人們對需要整容手術(shù)的焦慮。當(dāng)你可以無休止地體驗虛擬世界時,還有必要改變現(xiàn)實世界嗎?
大多數(shù) Snap 的濾鏡都是在自拍模式下使用的,但你手機(jī)的另一個攝像頭,即后置攝像頭同樣也具有增強(qiáng)功能,不僅僅在手機(jī)游戲《寶可夢 GO》(Pokémon Go)中是這樣。一些商品,比如樂高,當(dāng)你用手機(jī)掃描它們的包裝盒時,手機(jī)就會彈出“構(gòu)建者體驗”的延時動畫。很快,更多的產(chǎn)品公司將使用超視來優(yōu)化它們的包裝,以顯得“更加用心”。它們會將場景制作成動畫,激發(fā)顧客的想象力,講好產(chǎn)品線的故事,交叉銷售[5],并最終贏得顧客的青睞。
在今天的研究和創(chuàng)新實驗室中,各個智能手機(jī)制造商、社交媒體巨頭、游戲工作室和無線運營商都在競相創(chuàng)新、演示、獲取專利,旨在“掌握”這一未來平臺,或者至少是掌握軟件或硬件堆棧[6]的關(guān)鍵部分。在新一輪超視浪潮中,各家公司爭相創(chuàng)新,研發(fā)抓人眼球的軟件應(yīng)用程序、可穿戴設(shè)備及商業(yè)模式,形成一片新的氣象。各家科技公司則像一個巨大的多層蛋糕,依托彼此的軟件平臺和工具,發(fā)現(xiàn)各種新的應(yīng)用及其局限性,并尋求新的途徑和解決方案。例如,具身多模態(tài)交互設(shè)計就是通過研究徒手手勢(如捏、伸展和滑動)[7]、頭部姿勢、語音命令和凝視等動作的組合來告訴系統(tǒng)你想要做什么,這些研究將結(jié)合我們所看到的情況,決定我們與這些數(shù)字層互動時所使用的詞匯。
這一波即將到來的計算技術(shù)的市場是巨大的。即使是保守的金融分析師也會給出下列預(yù)測:2019—2024 年,AR 市場的復(fù)合年均增長率為 46.6%,到 2024 年行業(yè)收入將增長至 727 億美元,到 2028 年將超過 3 000 億美元。而市場最重要的驅(qū)動力則來自幾乎所有科技巨頭不斷增加的投資,包括美國的亞馬遜、谷歌、蘋果、IBM、微軟、英特爾、康卡斯特、高通和 Facebook,中國的百度、阿里巴巴和騰訊,韓國的三星、LG,日本的索尼、佳能和松下。搶先諸多科技巨頭一步進(jìn)入該市場的是嗅覺靈敏的初創(chuàng)企業(yè),如 nReal 公司。該公司的 AR 眼鏡視野清晰、質(zhì)量較輕,售價 500 美元,而且能夠綁定手機(jī),利用手機(jī)的計算能力和網(wǎng)絡(luò)連接。有些公司甚至更為雄心勃勃,正在試驗具備超視功能的隱形眼鏡,其中Mojo Vision 公司推出的樣品已經(jīng)可以投入使用。圖1展示的是一種增強(qiáng)現(xiàn)實眼鏡的大致情況。
圖1 一種增強(qiáng)現(xiàn)實眼鏡的大致情況
注:各大型平臺都在開發(fā)超視,谷歌、蘋果和三星等公司越來越多的相關(guān)專利就是極有力的證明。
每 10年就會出現(xiàn)一項新的技術(shù),集諸多創(chuàng)新于一體,使我們的生活和工作方式實現(xiàn)跨越式發(fā)展。10年前,只有最具先見之明的未來學(xué)家才會預(yù)見智能手機(jī)(多點觸摸屏 + 攝像頭 + 電話)、無人機(jī)(傳感器 + 飛行控制算法 + 遠(yuǎn)程無線電發(fā)射和接收系統(tǒng))、基于語音的數(shù)字助手(自然語言處理+語音識別+云服務(wù))、門鈴攝像頭及聯(lián)網(wǎng)恒溫器等技術(shù)未來發(fā)展的無限可能性。
超視就是這一個 10年的融合新技術(shù)。它繼承了過去 30多年的使能技術(shù)(enabling technology)[8],如機(jī)器學(xué)習(xí)、計算機(jī)視覺、可穿戴設(shè)備、邊緣計算、5G、深度定制化、情感計算,以及手勢和語音等新的交互范式等,所有這些技術(shù)都融合于我們所熟悉的日常佩戴的眼鏡中(如圖2 所示的North公司的眼鏡)。這些組件技術(shù)日趨成熟、實現(xiàn)微型化,并能很好地融于智能眼鏡中,它們帶來的影響將涉及生活的各個領(lǐng)域,并將改變我們與信息及彼此之間的互動方式。智能眼鏡將像今天的智能手機(jī)一樣變得常態(tài)化且無處不在。
圖2 North公司的眼鏡
注:眼鏡制造商North 公司的眼鏡能夠提供導(dǎo)航、個人提詞器和優(yōu)步網(wǎng)約車預(yù)計到達(dá)時間等服務(wù),該公司已被谷歌收購。
增強(qiáng)世界,不可阻擋。在《AR改變世界》的每一章中,我都會梳理增強(qiáng)世界中的一個領(lǐng)域:包括我們的聯(lián)系方式、飲食方式、購物方式及合作方式,甚至是學(xué)習(xí)的未來及想象力的未來。如果成功的話,我希望能幫助你預(yù)見這種轉(zhuǎn)變,甚至是激發(fā)你的想象力,幫助你研發(fā)出一個新產(chǎn)品或是開創(chuàng)一家新公司。
——摘自《AR改變世界》
麻省理工學(xué)院媒體實驗室導(dǎo)師、知名智能硬件公司Vitality聯(lián)合創(chuàng)始人
戴維·羅斯重磅新作
揭示最新科技趨勢,探索潛在行業(yè)機(jī)遇
[美]戴維·羅斯(David Rose)著
2023年4月
湛廬文化/四川科學(xué)技術(shù)出版社
蘇格蘭人指的是該部電影中的短跑名將利德爾。——編者注 ↑
洛奇是電影《洛奇》(Rocky)中通過晨跑鍛煉體能的拳擊手。——編者注 ↑
空間計算:思考數(shù)字信息的組織方式的新方法,遵守位置優(yōu)先原則。信息和服務(wù)錨定在現(xiàn)實世界或與有形物體相連。 ↑
增強(qiáng)現(xiàn)實:疊加于現(xiàn)實世界之上的數(shù)字信息層。它不同于虛擬現(xiàn)實,虛擬現(xiàn)實中你看到的都是不透明的投影。 ↑
交叉銷售指利用產(chǎn)品在使用上的伴隨性進(jìn)行銷售的營銷活動。包括將彼此伴隨使用的兩個產(chǎn)品在商店內(nèi)放在一起銷售,或者銷售與顧客已經(jīng)購買的產(chǎn)品具有伴隨使用特點的新產(chǎn)品。——編者注 ↑
在計算機(jī)領(lǐng)域,堆棧指一端固定、另一端浮動的存儲區(qū)或寄存器。——編者注 ↑
一個相關(guān)概念是徒手手勢界面,即支持手語的交互方式,用于同數(shù)字代理溝通。我們最開始是用鍵盤之類的控制器與電腦互動,然后是鼠標(biāo)和筆。在過去的10 年里,語音技術(shù)得到了改善并主導(dǎo)了許多日?;印,F(xiàn)在,計算機(jī)視覺系統(tǒng)可以看到手指和手,并能以令人難以置信的精度識別手勢,即使是從遠(yuǎn)處。 ↑
一項可以使一個用戶或一種文化的能力獲得徹底改變的發(fā)明或創(chuàng)新。——編者注 ↑