人機語音交互 | 靈云麥克風(fēng)陣列聲卡,給機器人賦予靈敏雙耳
前幾天,谷歌發(fā)布的GoogleHomeMini/Max智能音箱,均內(nèi)置麥克風(fēng)陣列技術(shù),以實現(xiàn)遠(yuǎn)距離的語音交互。在人與機器人、空調(diào)、車載等設(shè)備的語音交互場景中,通過麥克風(fēng)陣列技術(shù)處理聲學(xué)信號,為語音識別引擎提供高質(zhì)量的聲音,已成為物聯(lián)網(wǎng)設(shè)備語音交互的必需。
通過在機器人領(lǐng)域的產(chǎn)業(yè)應(yīng)用與技術(shù)積累,近期,捷通華聲推出一款適用于機器人的聲卡——靈云麥克風(fēng)陣列聲卡。該聲卡具備回聲消除、實時定向增強、實時降噪等功能,可高效處理機器人所在的大廳、窗口、家庭等場景中的環(huán)境噪音,進行遠(yuǎn)距離定向人聲拾取,輸出高質(zhì)量的聲音信號,提升機器人在應(yīng)用環(huán)境中的語音識別率。

在機器人語音交互場景中,靈云麥克風(fēng)陣列聲卡通過如下方法來處理聲學(xué)信號:
-
消除機器人自己說的話
通過一路聲音信號的輸入作為消回聲參考信號,把來自麥克中的此聲音信號濾除,同時可實現(xiàn)語音打斷功能;
-
消除環(huán)境噪音
根據(jù)聲音頻譜段,去掉環(huán)境噪音,提取有效人聲,以提升語音識別的準(zhǔn)確率;
-
實時定向增強說話人聲音
通過各個麥克風(fēng)對接收到的聲音相位差,計算得出聲源(說話人)位置,并實時指向性接收某一個方向(說話人)的聲音,抑制其他方向的聲音。

(90度方向語音增強,點擊放大查看圖片)
相比傳統(tǒng)聲卡,靈云麥克風(fēng)陣列聲卡聲音信號處理能力優(yōu)越,功耗更低、即插即用,且成本約為市場上同類產(chǎn)品的一半,已成功應(yīng)用于新松、木爺?shù)却髲d服務(wù)機器人,阿U兔、派寶等家庭服務(wù)機器人,累計出貨量近萬套。

靈云麥克風(fēng)陣列聲卡已上線靈云商城(shop.aicloud.com),個人開發(fā)者和企業(yè)開發(fā)商可上線靈云商城購買使用。同時,靈云平臺提供包括麥克風(fēng)陣列軟硬件、語音識別、語義理解、語音合成以及客服云服務(wù)等全面的語音交互SDK與云服務(wù),助力個人開發(fā)者和企業(yè)開發(fā)商快速打造具備語音交互功能的智能硬件。

