Facebook詳細(xì)分享：用精確HRTF可擴(kuò)展解決方案構(gòu)建AR空間音頻未來

VR/AR

2020

09/11

16:54

映維網(wǎng)

評(píng)論

來源：映維網(wǎng) 作者夢(mèng)秋

FRLR日前分享了關(guān)于沉浸式音頻研究方面的最新進(jìn)展，并表示所述研究“與Facebook實(shí)現(xiàn)AR眼鏡的工作直接相關(guān)”。概括而言，團(tuán)隊(duì)的目標(biāo)是將相關(guān)技術(shù)應(yīng)用到AR頭顯中，并允許你在嘈雜的環(huán)境中輕松地隔離人聲，同時(shí)再現(xiàn)虛擬聲音，使其聽起來像是來自周圍的真實(shí)世界。一個(gè)定制的頭相關(guān)傳輸函數(shù)（HRTF）是提供這種體驗(yàn)的關(guān)鍵，但涉及過程耗時(shí)且昂貴。所以，F(xiàn)RLR團(tuán)隊(duì)正在研究一種能夠根據(jù)耳朵照片生成精確HRTF的可擴(kuò)展解決方案。

對(duì)于這項(xiàng)研究，F(xiàn)acebook德技術(shù)通訊經(jīng)理麗莎·布朗·賈洛薩（Lisa Brown Jaloza）在一篇名為“音頻的未來”的博文對(duì)其進(jìn)行了詳細(xì)介紹。下面是映維網(wǎng)的具體整理：

正如著名科幻作家阿瑟·克拉克所言：“任何卓越的先進(jìn)技術(shù)都和魔法相差無幾。”我最近有幸見證了Facebook施展的最神奇魔術(shù)，而下面我將與大家一起分享個(gè)中的神奇。

但首先，我們先進(jìn)行一定的背景介紹。

無論是甜美的愛人言語，抑或是激昂澎湃的歌曲樂章，聲音都包含著不同于其他感官體驗(yàn)的豐富情感。然而，這種體驗(yàn)常常會(huì)遭到噪音淹沒，因距離而減損，或因我們自身聽力的局限而喪失。

世界不需要是這樣。請(qǐng)想象這樣一個(gè)未來：穿戴一副VR頭顯或AR眼鏡后你將能運(yùn)送到千里之外的地點(diǎn)，然后上課、上班或參加親戚的生日聚會(huì)，而一切仿佛就好像是現(xiàn)實(shí)生活一樣。這種體驗(yàn)稱為“社交臨場(chǎng)”。今天的技術(shù)尚未實(shí)現(xiàn)這一承諾，部分原因是聲音不夠逼真。有多少次你因?yàn)猷须s的背景而不得不重復(fù)自己的話語，或是因?yàn)榉植磺逭l在說什么而感到糊里糊涂？

即便是身處同一地理位置，環(huán)境的類型同樣會(huì)影響人際關(guān)系的質(zhì)量。嘈雜的背景會(huì)妨礙我們，令我們感到沮喪，或者最終不得不大喊大叫?，F(xiàn)在想象一下，同樣的一副AR眼鏡能夠?qū)⒛愕穆犃μ嵘饺碌乃?，允許你在諸如餐館、咖啡店和音樂會(huì)等嘈雜的空間里清晰地聽到你希望聽到的聲音。對(duì)于你的面對(duì)面交流，這將會(huì)產(chǎn)生什么影響呢？

Facebook Reality Labs Research（FRLR）正在構(gòu)建增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)的未來。FRLR匯集了一支由研究科學(xué)家、工程師、設(shè)計(jì)師等組成的跨學(xué)科音頻團(tuán)隊(duì)，并致力于通過激進(jìn)的音頻創(chuàng)新來改善人類交流。這個(gè)小組的任務(wù)包括兩個(gè)：創(chuàng)造在感知方面無法與現(xiàn)實(shí)區(qū)分的虛擬音效；重新定義人類的聽覺能力。為了做到這一點(diǎn)，研究人員致力于提供兩種新功能：第一，音頻臨場(chǎng)感，亦即虛擬音效的來源仿佛是與聽者存在于同一空間，其保真度之高以至于你無法將真實(shí)世界的聲源區(qū)分開來；第二，感知超能力，亦即即便是在嘈雜的環(huán)境中，你將能夠?qū)⒔涣鲗?duì)方的音量調(diào)大，并對(duì)不需要的背景噪音調(diào)低，從而提升我們的交流體驗(yàn)。

這支世界最大的音頻研究團(tuán)隊(duì)之一正在探索各種相互關(guān)聯(lián)的研究問題。在短短六年的時(shí)間里，原本只有一個(gè)人的隊(duì)伍已經(jīng)成長(zhǎng)為世界級(jí)的專家團(tuán)隊(duì)。由拉維什·梅赫拉（Ravish Mehra）領(lǐng)導(dǎo)的FRLR音頻研究團(tuán)隊(duì)致力于解決新穎的研究問題，提出解決方案，并通過令人信服的體驗(yàn)來證明它們。我有幸體驗(yàn)了其中的一些體驗(yàn)，而它們對(duì)未來音頻通信的影響十分驚人。這是一個(gè)關(guān)于未來通信的故事，并需要發(fā)明一套全新的硬件和軟件技術(shù)，從而提供逼真的具現(xiàn)體驗(yàn)。

1. 耳聽為實(shí)：音頻臨場(chǎng)感

盡管小時(shí)候希望長(zhǎng)大后能夠成為一名搖滾明星，但研究科學(xué)家帕布羅·霍夫曼（Pablo Hoffman）如今更接近于一名魔術(shù)師。他成功地開發(fā)了一個(gè)始終在線的音頻校準(zhǔn)系統(tǒng)，并且可以有效地允許你通過一對(duì)耳機(jī)聽到超高保真度的聲音。這個(gè)演示采用了FRLR的全新算法和軟件處理技術(shù)，以及現(xiàn)成的硬件來展示個(gè)性化音頻和重現(xiàn)房間的聲學(xué)效果。

我坐在他位于華盛頓州雷德蒙德的辦公桌旁?；舴蚵f給我一副耳機(jī)，而麥克風(fēng)專門放到我耳朵的入口處。在接下來的兩分鐘里，所述麥克風(fēng)將從我的視覺記錄房間的聲音。這位研究科學(xué)家從不同的地方大聲而溫柔地說話，他甚至?xí)椉⑶乙欢劝谚€匙丟到我的身后。

然后霍夫曼播放了錄音。音效非常逼真，和真實(shí)幾乎沒有什么區(qū)別。事實(shí)上，對(duì)于坐在他旁邊的我而言，我敢打賭當(dāng)我瞄到他的時(shí)候他一定有在說話。但當(dāng)我正眼看著他時(shí)，我能看到霍夫曼的嘴唇?jīng)]有動(dòng)。來自霍夫曼方向的聲音完全是人工合成。這是兩分鐘長(zhǎng)的既視感（Deja-vu）。

這正是感知方面與現(xiàn)實(shí)無法區(qū)分的虛擬音效。當(dāng)你親身見證的時(shí)候，它就像是一種為善的魔法。研究負(fù)責(zé)人菲利普·羅賓遜（Philip Robinson）解釋說：“‘感知方面無法區(qū)分’說起來十分簡(jiǎn)單。但當(dāng)你親耳聽到的時(shí)候，這會(huì)是一種無比神奇的感覺。”

2. 逼真音頻的秘方

當(dāng)有人在房間里跟你說話時(shí)，你的一只耳朵會(huì)先于另一只耳朵聽到聲音。每只耳朵的音量不同。另外，耳朵的形狀改變了我們每個(gè)人聽到聲音的方式。所有這些信號(hào)都在告訴大腦聲音來自哪里。聲音與你的環(huán)境相互作用，在進(jìn)入你的耳朵之前從墻壁反彈。這一切都是核心要素。如果能精確再現(xiàn)，虛擬聲音就能復(fù)制真實(shí)聲音。

2017年，音頻研究團(tuán)隊(duì)幫助研發(fā)了空間化音頻，亦即一種模擬真實(shí)聲音來源的虛擬音效。團(tuán)隊(duì)同時(shí)發(fā)明了能夠提高虛擬環(huán)境可信度的高質(zhì)量聲學(xué)模擬技術(shù)。這些技術(shù)推動(dòng)了空間音頻技術(shù)的發(fā)展，并驅(qū)動(dòng)著當(dāng)今Quest和Rift平臺(tái)的眾多體驗(yàn)，包括《First Steps》和《Oculus First Contact》。下一個(gè)前沿領(lǐng)域是個(gè)性化的空間音頻，以及模擬聲音與真實(shí)環(huán)境交互的方式。在我參觀雷德蒙德實(shí)驗(yàn)室的后面兩站旅程中，團(tuán)隊(duì)向我展示了他們?cè)趦蓚€(gè)方面的進(jìn)展。

3. 個(gè)性化空間音頻

一位研究人員帶我進(jìn)入一個(gè)消聲室。這是一個(gè)價(jià)值數(shù)百萬美元的設(shè)施，它與周圍的建筑相隔3英尺寬的空氣間隙，而四周4英寸厚的鋼板可吸收所有回聲。房間非常安靜，你甚至可以聽到自己的心跳。一個(gè)包含54個(gè)揚(yáng)聲器的機(jī)械臂從上到下地進(jìn)行360度的自由旋轉(zhuǎn)，并且一邊播放音調(diào)，從而測(cè)量聲音對(duì)我耳朵的獨(dú)特幾何形狀的反應(yīng)。整個(gè)過程大約需要半個(gè)小時(shí)。最后，我可以看到我的個(gè)人聽覺空間化音頻體驗(yàn)的數(shù)字表示，亦即頭相關(guān)傳輸函數(shù)（HRTF）。目前用于游戲和虛擬現(xiàn)實(shí)的解決方案屬于“通用式”HRTF，它不能為每個(gè)人提供完美的空間精度。個(gè)性化的HRTF測(cè)量克服了這一局限性，并允許每個(gè)人真正聽到仿佛真實(shí)聲音一般的虛擬聲音。

盡管消聲室顯然不是捕獲個(gè)性化HRTF的可擴(kuò)展解決方案，但音頻研究小組正在考慮幾種全新的方法。作為一個(gè)例子，他們希望有一天能開發(fā)出一種可以根據(jù)耳朵照片來近似一個(gè)可行的個(gè)性化HRTF的算法。

4. 為房間的聲學(xué)建模

理解聲音如何在特定空間中傳播，并在到達(dá)耳朵之前從相關(guān)表面反彈，這是另一個(gè)幫助虛擬聲音復(fù)制真實(shí)聲音的有力工具。就如同視覺AR使用SLAM技術(shù)來獲取虛擬對(duì)象的幾何和光照一樣，我們?cè)诼曇舴矫嫱瑯有枰斫夥块g的聲學(xué)特性，以便將虛擬聲源無縫地放置到真實(shí)的空間之中。團(tuán)隊(duì)邀請(qǐng)我嘗試一款游戲，并確定哪些聲音來自房間中的物理揚(yáng)聲器，哪些是來自我所穿戴的耳機(jī)。我可以在空間中移動(dòng)，并感受相應(yīng)的聲音響應(yīng)。我感覺自己有點(diǎn)像是音頻發(fā)燒友，但對(duì)于我區(qū)分哪些聲音是真實(shí)，哪些聲音是虛擬的努力，我只能做到50-50的水平。盡管是來自耳機(jī)，但空間化的音頻和模擬的聲音是如此逼真，我的大腦完全相信我聽到的聲音是來自于房間的揚(yáng)聲器。我甚至不得不拔下耳機(jī)來確認(rèn)聲音的真正來源。

羅賓遜表示：“想象一下，如果你在打電話，你會(huì)認(rèn)為對(duì)方就在身邊，你會(huì)忘記你們實(shí)際上是相隔兩地。這就是我們正在開發(fā)的技術(shù)的愿景。”

為了明確這里的利害關(guān)系，團(tuán)隊(duì)向我展示了一個(gè)關(guān)于遠(yuǎn)程臨場(chǎng)感的演示，即感覺你仿佛是置身于另一個(gè)的位置。我坐在一個(gè)房間里并穿戴一個(gè)定制的Oculus Rift頭顯和一副耳機(jī)，但我感覺自己是在另一個(gè)地方，和眾多研究人員和同事圍坐在一張桌子旁。我可以通過頭顯看到會(huì)議室。32個(gè)麥克風(fēng)陣列會(huì)捕獲會(huì)議室的聲音，并將空間化的音頻直接傳送到我的耳機(jī)中，這樣每個(gè)人的聲音聽起來都像是來自桌子旁邊的特定位置。我發(fā)現(xiàn)自己能夠十分自然地轉(zhuǎn)向每一個(gè)人。這有助于我跟蹤和參與談話，令我感覺自己就在房間里面（即使我實(shí)際上不在那里）。

這可能會(huì)顛覆你與遠(yuǎn)方家人，朋友或同事所進(jìn)行的視頻通話。對(duì)于今天的通話，對(duì)方的聲音聽起來像是從電話里傳來，所以大腦否定了對(duì)方可能和你位于同一位置的想法?？臻g音頻模擬現(xiàn)實(shí)生活中的聲音和環(huán)境聲學(xué)的方向，所以你可以更為充分地感受社交臨場(chǎng)感。

當(dāng)空間音頻與Codec Avatars（可實(shí)時(shí)動(dòng)畫化的超逼真人類表示），超現(xiàn)實(shí)的三維重建，全身追蹤，共享虛擬空間等結(jié)合在一起時(shí)，我們將能夠解鎖真正的社交臨場(chǎng)感。通過允許你和對(duì)自己最為重要的家人或朋友置身于同一空間，我們可以從根本上改變你的生活、工作和娛樂方式。

羅賓遜說：“我一直牢記Facebook的總體使命，亦是聯(lián)結(jié)彼此。我們需要令虛擬音效如同現(xiàn)實(shí)一般的唯一原因是，我可以令一個(gè)虛擬人類出現(xiàn)在面前，并與其進(jìn)行社交互動(dòng)，就像對(duì)方真的是和你置身于同一空間。對(duì)于遠(yuǎn)程交流或面對(duì)面交流，即便只是改善一點(diǎn)點(diǎn)，它都能夠真正促成更為深入、更具影響力的社交關(guān)系。”

盡管逼真的空間化音頻和逼真的室內(nèi)聲學(xué)令人感到心曠神怡，但這只是FRLR音頻團(tuán)隊(duì)任務(wù)的第一塊拼圖。梅赫拉解釋道：“當(dāng)我們開始在虛擬現(xiàn)實(shí)中進(jìn)行這項(xiàng)研究時(shí)，隨著虛擬現(xiàn)實(shí)技術(shù)的發(fā)展，我們意識(shí)到我們?cè)谶@里構(gòu)建的所有技術(shù)都是致力于實(shí)現(xiàn)一個(gè)更高的目標(biāo)：改善人類的聽覺能力。”

5. AR眼鏡和感知超能力

對(duì)于FRLR音頻團(tuán)隊(duì)的使命，第二塊拼圖是重新定義人類聽覺能力。當(dāng)然，這是一個(gè)雄心勃勃的目標(biāo)。不過，這同時(shí)與Facebook的AR眼鏡努力直接相關(guān)。

負(fù)責(zé)硬件研究的托尼·米勒（Tony Miller）解釋道。“人類聽覺是一種驚人的感覺，它允許我們通過口頭語言和音樂表達(dá)進(jìn)行聯(lián)系。FRLR正在探索可以擴(kuò)展、保護(hù)和提高聽覺能力，加強(qiáng)注意力，同時(shí)支持你與你關(guān)心的人和信息無縫互動(dòng)的全新技術(shù)。這項(xiàng)研究的核心是致力于構(gòu)建深深植根于聽覺感知，并通過信號(hào)處理和人工智能的最新發(fā)展加以增強(qiáng)的硬件。”

想象一下，你可以在擁擠的餐廳或酒吧里自由交談，不必提高嗓門或緊張兮兮地過分關(guān)注別人的言語。通過眼鏡搭載的多個(gè)麥克風(fēng)，系統(tǒng)可以捕捉到你周圍的聲音。然后，利用你的頭部和眼睛運(yùn)動(dòng)模式，系統(tǒng)可以確定你最感興趣的聲音，從而為你增強(qiáng)正確的聲音，并衰減其他聲音。通過這樣的方式，團(tuán)隊(duì)希望確保你真正希望聽到的聲音是清晰明朗，即使周圍充斥著吵鬧的背景噪音。

6. 所見即所聞

為了體驗(yàn)這一點(diǎn)，我和研究科學(xué)家歐文·布里米金（Owen Brimijoi）坐在一間模擬餐廳的房間里。我戴著耳機(jī)和現(xiàn)成的眼動(dòng)追蹤裝置，而眼動(dòng)追蹤是FRLR正在探索的幾種解決方案之一。布里米金開始講話時(shí)，研究小組提高了背景噪音水平。令我驚訝的是，我依然可以很容易地聽到他的話語，而且交談十分自然。當(dāng)我看著角落里的電視時(shí)，它正在播放的廣告聲音會(huì)越來越響，而其他聲音則變得越來越安靜。當(dāng)布里米金再次開口說話時(shí)，我再次轉(zhuǎn)向他，然后我們的談話又重新開始。與霍夫曼的演示一樣，所述演示是將FRLR的軟件與現(xiàn)成硬件配對(duì)以說明增強(qiáng)聽力的體驗(yàn)。

喧鬧的餐廳不僅令人討厭，同時(shí)會(huì)給員工帶來潛在的健康風(fēng)險(xiǎn)。事實(shí)上，如果長(zhǎng)時(shí)間暴露在85分貝以上的噪音環(huán)境中（現(xiàn)在不少餐館和酒吧都超過了這一水平），這會(huì)造成我們的聽力會(huì)下降。通過降低噪音，我們或許可以幫助保護(hù)人們的聽力。

7. 新穎的輸入：捕捉聲音

接下來，團(tuán)隊(duì)向我展示了一種叫做近場(chǎng)波束形成技術(shù)的創(chuàng)新應(yīng)用，而它再次令我感覺自己仿佛時(shí)在見證一個(gè)魔術(shù)。但這次他們使用了FRLResearch開發(fā)的定制硬件。研究科學(xué)家弗拉基米爾·圖爾巴賓(Vladimir Tourbabin)戴著一副簡(jiǎn)單的3D打印眼鏡，但其搭載了一個(gè)特殊的麥克風(fēng)陣列，一種輸入原型。房間里有幾個(gè)物理揚(yáng)聲器以最大音量播放音樂。我在另一個(gè)房間，圖爾巴賓打電話給我。我拿起話筒，他開始用正常的聲音誦讀一篇在線文章，而嘈雜的房間里的噪音非常容易淹沒圖爾巴賓的聲音。

然后圖爾巴賓打開了一個(gè)開關(guān)，突然之間，我清能夠晰地聽到他的聲音傳來，仿佛某人將背景音量調(diào)低了一樣。就像在搖滾音樂會(huì)或地鐵站接到一個(gè)朋友的電話，但不知怎么回事，我居然可以清晰地、明白地聽到對(duì)方的聲音。這一切都是因?yàn)樯厦嫣岬降柠溈孙L(fēng)陣列將他的聲音與周圍的噪音隔離開來。你可以想象未來這項(xiàng)技術(shù)可允許我在嘈雜的房間里與人工智能助理清晰地通話，這可以為我提供更多的隱私和安全，并防止我的助手意外地拾取周遭人和物的聲音。

8. 輸出：控制音量

音頻團(tuán)隊(duì)的目標(biāo)是覆蓋人類能聽到的所有聲音，從20赫茲到20000赫茲。FRLR目前正在開發(fā)一種特殊的入耳式監(jiān)聽器（in-ear monitor；IEM）。這種輸出原型將允許我們使用主動(dòng)降噪技術(shù)來有效地降低背景噪聲的音量，從而幫助人們?cè)卩须s的環(huán)境中更清晰地、更安全地聽到聲音。當(dāng)與FRLR的輸入原型（包括麥克風(fēng)陣列）相結(jié)合時(shí)，這將能夠提供聽覺超能力的全面體驗(yàn)。

音頻體驗(yàn)負(fù)責(zé)人斯科特·賽爾豐（Scott Selfon）解釋說：“我們的IEM同時(shí)具有感知透明的聽覺功能，仿佛我耳朵里什么都沒有，而我能夠安全地聽到周圍的整個(gè)世界。”類似于霍夫曼早期的演示，但這次只是使用了一個(gè)小小的耳機(jī)。

9. 改善生活

這項(xiàng)研究的潛能十分巨大。盡管大多數(shù)感知超能力研究都集中在改變每個(gè)人的交流，但團(tuán)隊(duì)相信其中一些可以為聽力科學(xué)領(lǐng)域的新研究提供支持。據(jù)約翰斯·霍普金斯大學(xué)研究稱，美國(guó)有大約五分之一的人口存在聽力損失問題。他們中的許多人都不使用助聽器，原因有很多，包括費(fèi)用，社會(huì)恥辱感，不適和缺乏可靠性。

最近，研究小組迎來了著名的聽力科學(xué)家托馬斯·倫納（Thomas Lunner）。他早前的研究為1995年世界第一臺(tái)數(shù)字助聽器奠定了基礎(chǔ)，而他將進(jìn)一步探索這條研究道路。倫納表示說：“通過將聽力受損人口與聽力正常的人員至于平等的地位，我們可以幫助他們更積極地參與社交活動(dòng)。這與Facebook的使命非常契合，因?yàn)槭敵３Ｖ率谷藗冞h(yuǎn)離社交場(chǎng)合。”

技術(shù)項(xiàng)目經(jīng)理阿曼達(dá)·巴里（Amanda Barry）補(bǔ)充道：“我從小就戴著助聽器。能夠在人們變老且聽力衰退時(shí)幫助他們與家人保持聯(lián)結(jié)的能力令人感到無比興奮。”

聽力科學(xué)是Facebook獨(dú)立于AR研究所探索的一個(gè)領(lǐng)域。它具有獨(dú)特的挑戰(zhàn)，而團(tuán)隊(duì)希望能夠幫助推動(dòng)科學(xué)前進(jìn)。FRL計(jì)劃在日后分享更多的研究成果進(jìn)步。

10. 我們十分關(guān)注隱私

要幫助智能AR眼鏡取得成功，我們需要深思熟慮地、負(fù)責(zé)任地開發(fā)技術(shù)。盡管依然處于研究的早期階段，但FRLR已經(jīng)開始探索確保用戶隱私和安全的方法。當(dāng)我們努力提高人們的聲音體驗(yàn)時(shí)，我們必須保持對(duì)社會(huì)規(guī)范的認(rèn)識(shí)和尊重。

梅赫拉指出：“我們的目標(biāo)是在我們的創(chuàng)新周圍設(shè)置護(hù)欄，以負(fù)責(zé)任的方式進(jìn)行創(chuàng)新，所以我們已經(jīng)在考慮我們可以采取的潛在保障措施。例如，在我提高某人的聲音之前，我的眼鏡可能需要遵循一個(gè)協(xié)議并請(qǐng)求對(duì)方眼鏡的允許。”

研究小組強(qiáng)烈意識(shí)到的另一個(gè)問題是，敏感耳朵數(shù)據(jù)的捕獲，包括研究階段及以外。今天，在我們將收集到的任何數(shù)據(jù)提供給研究人員之前，所有數(shù)據(jù)都會(huì)經(jīng)過加密，研究參與者的身份與數(shù)據(jù)分離。一旦收集，數(shù)據(jù)將存儲(chǔ)在安全的內(nèi)部服務(wù)器中，只有少數(shù)擁有明確權(quán)限的研究人員能夠訪問相關(guān)服務(wù)器。團(tuán)隊(duì)同時(shí)定期與隱私、安全和IT專家進(jìn)行審查，以確保遵守協(xié)議并實(shí)施適當(dāng)?shù)谋Ｗo(hù)措施。

“Deepfake”是我們正在思考的另一個(gè)問題。這種技術(shù)可以使用人工智能和預(yù)先存在的鏡頭來編造一個(gè)場(chǎng)景，比如一個(gè)人會(huì)說出實(shí)際上從未說過的話語。例如，我們正在討論在耳機(jī)和眼鏡中構(gòu)建強(qiáng)大的身份驗(yàn)證技術(shù)（如面部分析），從而確保只有你本人可以通過你的設(shè)備訪問與你的聲音綁定的虛擬化身。”

梅赫拉說道：“顯然，我們離在眼鏡和耳機(jī)中實(shí)現(xiàn)這類技術(shù)尚有一段距離，但我們希望思考這些技術(shù)的影響，以及與更廣泛社會(huì)相關(guān)的潛在解決方案。這同時(shí)是我們現(xiàn)在討論這項(xiàng)研究的原因之一。我們致力于將其公開化，并就這項(xiàng)技術(shù)的可接受用途進(jìn)行公開討論。”

假如你可以忽視背景噪音或距離并輕松地聽到對(duì)方說話，假如你不必因?yàn)椴盥脝栴}而錯(cuò)過特殊活動(dòng)，假如你能用一個(gè)可穿戴設(shè)備取代你的高端立體聲系統(tǒng)、電視、手機(jī)……

這是我們相信的未來，我們正在努力使之成為現(xiàn)實(shí)。

11. 下一個(gè)前沿：聽覺機(jī)器感知

最終，我們的主要目標(biāo)之一是提供一款時(shí)尚的AR眼鏡。它不僅可以理解周圍的視覺世界，同時(shí)可以理解周圍的聲學(xué)世界，并利用相關(guān)知識(shí)和背景幫助你在世界各地導(dǎo)航。為此，我們將使用一個(gè)包含共享和私有組件的虛擬地圖LiveMaps。對(duì)聲學(xué)聲景的理解可以為地圖添加信息，這樣人工智能就可以改善你的音頻體驗(yàn)，同時(shí)能以其他方式幫助你。例如，當(dāng)你走進(jìn)一家餐館時(shí)，你的AR眼鏡能夠識(shí)別出發(fā)生在你周圍的不同類型的事件：人們?cè)诮徽?，空調(diào)的噪音，盤子和銀器的叮當(dāng)聲。然后利用情境化的人工智能，你的AR眼鏡將能夠做出明智的決定，比如消除分散注意力的背景噪音。

賽爾豐補(bǔ)充說：“我們的AR眼鏡的另一個(gè)機(jī)遇是，它不僅可以幫助我們更好地聽到，而且可以幫助我們更好地理解。如果我因?yàn)楸尘霸胍艋蛘Z言障礙而無法跟蹤對(duì)話，我們可以使用情境化人工智能和語音識(shí)別來幫助我進(jìn)行實(shí)時(shí)的視覺轉(zhuǎn)錄或翻譯。而且，與家里柜臺(tái)的語音助手不同，隨身攜帶的AI助手將具有完整的情景意識(shí)。因此，當(dāng)你身處嘈雜的環(huán)境中時(shí)，它可以自動(dòng)提高聲音，或者在圖書館等需要安靜的地方輕聲說話。”

這是我們剛剛開始探索的另一個(gè)領(lǐng)域，而我們將在日后分享更多的消息。

梅赫拉表示：“我們現(xiàn)在正處于AR/VR技術(shù)發(fā)展史上的關(guān)鍵時(shí)刻。如果是5年或10年后加入這個(gè)領(lǐng)域，他們只是跟在我們屁股后面。對(duì)于這一刻，我們實(shí)際上正在定義未來。我們可以提高體驗(yàn)的真實(shí)感，以至于你不必為了參加會(huì)議或與你所愛的人聯(lián)系而旅行數(shù)百或數(shù)千英里。我們可以制造出用來改善人類聽力的技術(shù)。如果你對(duì)這一點(diǎn)充滿激情，我們就是你要加入的團(tuán)隊(duì)，而且現(xiàn)在是時(shí)候讓它成為現(xiàn)實(shí)了。”

原文鏈接：https://yivian.com/news/77794.html

THE END

廣告、內(nèi)容合作請(qǐng)點(diǎn)擊這里尋求合作

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；旨在傳遞信息，不代表砍柴網(wǎng)的觀點(diǎn)和立場(chǎng)。

相關(guān)熱點(diǎn)

畢馬威報(bào)告：企業(yè)正加大VR投資，提高業(yè)務(wù)效率、安全

新冠疫情給世界呈現(xiàn)了一個(gè)全新的現(xiàn)實(shí)，根據(jù)畢馬威日前公布的《KPMG 2020 Technology Industry Innovation（畢馬威2020科技行業(yè)創(chuàng)新）》報(bào)告，59%的全球科技企業(yè)高管相信自己公司的商業(yè)模式將在未來三年內(nèi)...

LiDAR加持，新品發(fā)布會(huì)首秀AR Logo，iPhone AR功能

蘋果秋季新品發(fā)布會(huì)將在北京時(shí)間9月16日凌晨1點(diǎn)/美國(guó)當(dāng)?shù)貢r(shí)間9月15日上午10點(diǎn)進(jìn)行直播，而蘋果發(fā)布邀請(qǐng)函表示：時(shí)候又到了？時(shí)候又到了。

Facebook公布23場(chǎng)Connect 7大會(huì)主題演講安排

Facebook的年度增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)大會(huì)Facebook Connect（原Oculus Connect）計(jì)劃在9月16日以線上方式舉行，并且免費(fèi)向所有人開放。日前，這家公司正式公布了具體的活動(dòng)時(shí)間：北京時(shí)間9月17日凌晨1點(diǎn)/太平...

斯坦福大學(xué)在Siggraph演示最先進(jìn)AR/VR全息顯示技術(shù)

VR/AR顯示器的歷史就是一種折衷權(quán)衡。市場(chǎng)中的大多數(shù)產(chǎn)品都屬于單平面模型，無論場(chǎng)景中的對(duì)象有多遠(yuǎn)，用戶都只能不自然地聚焦于單一的距離。

VR冒險(xiǎn)游戲《最后的迷宮》正式登陸 Pico Neo 2

這是一場(chǎng)通過VR體驗(yàn)的奇妙之旅。作為被困在神秘宅邸中的玩家，你需要與神秘少女卡蒂婭齊心協(xié)力，通過解決各種謎題來嘗試逃脫迷宮。名為《最后的迷宮（Last Labyrinth）》的全新冒險(xiǎn)游戲已于日前正式登陸Pi...

精品国产第一福利网站,麻豆免费版,国语熟妇乱人乱A片久久,又黄又爽又色视频

Facebook詳細(xì)分享：用精確HRTF可擴(kuò)展解決方案構(gòu)建AR空間音頻未來

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒跑了！

iPhone 13機(jī)模曝光：值得等！

蘋果計(jì)劃在美國(guó)生產(chǎn) Apple Car 汽車電池

關(guān)注我們

精品国产第一福利网站,麻豆免费版,国语熟妇乱人乱A片久久,又黄又爽又色视频

Facebook詳細(xì)分享：用精確HRTF可擴(kuò)展解決方案構(gòu)建AR空間音頻未來

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒跑了！

iPhone 13機(jī)模曝光：值得等！

蘋果計(jì)劃在美國(guó)生產(chǎn) Apple Car 汽車電池

關(guān)注我們

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒跑了！

iPhone 13機(jī)模曝光：值得等！