×

掃碼關(guān)注微信公眾號

未來智能胡郁出席達沃斯科學(xué)峰會:下一代人機交互方式是什么?

2024/7/19 18:20:48      企業(yè)供稿

7月11日-12日,聚集了世界學(xué)術(shù)頂尖學(xué)者、科學(xué)精英、創(chuàng)新者和企業(yè)家的iCANX Davos Summit 達沃斯科學(xué)峰會在瑞士達沃斯圓滿舉辦。同期,由iCANX Association主辦、未來智能協(xié)辦的“人工智能+:探索發(fā)展前沿與引領(lǐng)趨勢,培育新質(zhì)生產(chǎn)力論壇”,也邀請了全球范圍內(nèi)的人工智能交叉學(xué)科領(lǐng)域的科學(xué)家齊聚一堂,共同探討人工智能的前沿和趨勢。


image.png


未來智能董事長胡郁在論壇上發(fā)表了主題演講,分享了他對AIoT時代人機交互方式的理解與展望——“經(jīng)歷了圖形交互界面、觸摸交互界面,下一個革命性的人機交互方式會是什么? ”


image.png


在漫長的人機交互歷程中,人與實物如何產(chǎn)生自然、舒適的交互,一直是科學(xué)家和工程師們研究的重點,而近年來隨著人工智能和物聯(lián)網(wǎng)的興起、深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)的發(fā)展,人機交互也逐步從圖形、觸摸到語音不斷進階,到如今,人類自然便捷的溝通方式——語音,早已成為人機交互的主流趨勢。

在胡郁看來,“語音之所以厲害,是因為機器有顯示屏,可以把文字、圖片、音頻和視頻直接播放給人看。而人并沒有顯示屏,要將大腦里的想法告訴機器,除了跳舞、畫畫、寫字、打手勢,還有一個直接的辦法就是講話,而這就需要機器剛好聽得懂我們講話。”

但事實上,要讓機器聽清、聽懂人類語言并不是一件容易的事,在噪聲干擾、多人語音混疊的情況下如何精準(zhǔn)識別?在多語種情境下如何準(zhǔn)確翻譯?都是語音交互發(fā)展的關(guān)鍵瓶頸。

未來智能作為一家AI硬件公司,核心團隊成員在AI語音領(lǐng)域已經(jīng)深耕超10年,從智能語音助手到AI會議辦公,訊飛會議耳機不僅可以在多人語音混疊的會議場景中智能識別出不同人物的聲紋特性,實現(xiàn)說話人角色區(qū)分;還支持32種語言同傳翻譯,在多種語境下也可以實現(xiàn)面對面實時翻譯以及同傳聽譯。5月剛發(fā)布的訊飛會議耳機Pro 2全新升級“紅點閃錄”,無需連接App即可一鍵開啟,為用戶帶來更便捷的錄音使用體驗。

更重要的是,訊飛會議耳機搭載的viaim AI,可一鍵生成摘要總結(jié)和待辦事項,內(nèi)置的“萬姆”助理有問必答,通過對話形式了解用戶需求,為其提供或有目的重點、或全面普適的方法與建議。


image.png


在本次達沃斯科學(xué)峰會上,胡郁就帶領(lǐng)專家學(xué)者們一同體驗了未來智能會議耳機的同傳翻譯功能,相關(guān)學(xué)者們也“現(xiàn)學(xué)現(xiàn)用”,迅速將耳機的“同傳聽譯”和“摘要總結(jié)提取”功能用在了論壇的交流現(xiàn)場。


image.png


近年來,“大模型+語音”的發(fā)展模式,正在為智能語音技術(shù)和產(chǎn)業(yè)帶來新一輪的革命性突破,在胡郁看來,對于人機交互場景而言,這還只是一個開始——“隨著人工智能和機器人核心技術(shù)的發(fā)展,我們可以看到,以語音語言交互為主,以感知運動交互為輔的下一代人機交互系統(tǒng)的發(fā)展已經(jīng)迫在眉睫?!焙粽f。