国精产品一区一区三区有限公司杨,国产激情久久久久影院老熟女,国产裸体裸拍在线观看,国产人妻熟女在线观看,国产美女视频国产视视频

不出聲也能命令Siri!康奈爾大學(xué)華人團隊開發(fā)無聲語言識別項鏈,中文英文都行

2022-02-16 14:52:09    來源:量子位 微信號

金磊 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

這,或許是現(xiàn)在跟Siri交流最潮的方式了——

只需要動動嘴皮子,就能讓它under你的control。

沒錯,就是不需要出任何聲音的那種。

這就是來自康奈爾華人團隊的最新研究成果SpeeChin,無聲語音識別。

像這樣:

在沒有聲音的情況下,你能猜出來他在說什么嗎(文末揭曉答案

)?

但在SpeeChin的加持下,現(xiàn)在的Siri、Alexa等就已經(jīng)可以識別,而且還支持普通話和英文!

是有種“此時無聲勝似有聲”的感覺了。

不說話,怎么控制語音助手?

康奈爾團隊研發(fā)的SpeeChin,其實是一條神奇的項鏈。

戴上這條項鏈,就能開啟無聲語音控制的大門了。

例如對著電腦默念一句“Next”,音樂就會自動切換成下一首歌:

或許你會說一個單詞過于簡單了,別急,現(xiàn)在就來加大難度:

“Switch to Taylor Swift.”

可見,SpeeChin即便是面對一句完整的話術(shù),也可以做到精準(zhǔn)識別。

而這條“無聲識別”項鏈的關(guān)鍵,就在于安裝在項鏈下方的紅外攝像機。

它可以捕捉到人物頸部和面部皮膚的變形圖像,從而進(jìn)行分析識別工作,確定從“嘴皮子”傳達(dá)的是什么命令。

而且這條項鏈不僅能無聲識別英文,連中文(普通話)也能夠hold住。

在最初的實驗中,有20人參與到了測試中,其中10人講英文,另外10人說普通話。

研究人員讓測試者分別用英文和中文發(fā)出數(shù)十條指令,包括數(shù)字、互動指令、語音輔助指令、標(biāo)點指令和導(dǎo)航指令。

最后的實驗結(jié)果,“無聲識別”的準(zhǔn)確率分別達(dá)到了90.5%和91.6%。

來自康奈爾大學(xué)的華人團隊

這項研究來自康奈爾大學(xué),一作是Ruidong Zhang。

其中,Cheng Zhang是這項研究的通訊作者。

他是康奈爾大學(xué)信息科學(xué)系的助理教授,他的研究聚焦在如何獲取人體及其周圍的信息,以應(yīng)對各種應(yīng)用領(lǐng)域中的現(xiàn)實世界挑戰(zhàn),如交互、健康感知和活動識別。

研究的一作Ruidong Zhang,他是Cheng Zhang教授的一名博士生,本科畢業(yè)于清華大學(xué)。

他的研究興趣在于人機交互和普適計算(ubiquitous computing),特別是建立新型的可穿戴設(shè)備,用來促進(jìn)互動體驗并加深我們對人類行為的理解。

至于為什么他們要做SpeeChin這項工作,據(jù)Ruidong Zhang解釋:

主要是考慮到在某些特定場合中,人們可能不適合發(fā)出聲音;還考慮到一些不能說話的人群。

最后,來揭曉一下開頭GIF的答案:

你猜對了嗎?

參考鏈接:

[1]https://techxplore.com/news/2022-02-smart-necklace-silent-english-mandarin.html

[2]https://www.youtube.com/watch?v=pDf86dSPYYI

[3]https://infosci.cornell.edu/content/zhang-0

[4]https://infosci.cornell.edu/content/zhang-1

本文首發(fā)于微信公眾號:量子位。文章內(nèi)容屬作者個人觀點,不代表和訊網(wǎng)立場。投資者據(jù)此操作,風(fēng)險請自擔(dān)。

關(guān)鍵詞:

上一篇:
下一篇:

熱點話題

熱點推薦

頭條

?