中文字幕一本到无线,日韩欧美中文字幕精品,日本不无在线一区二区三区,亚洲аv天堂无码

記者專欄
當前位置首頁 > 科技新聞 > 正文

一大波“預演未來”的創新應用來了

2022-12-05 07:11 來源:科技日報

  ◎本報記者 吳長鋒

  近日,在2022科大訊飛全球1024開發者節發布會上,科大訊飛股份有限公司(以下簡稱科大訊飛)AI研究院副院長高建清以“AI新紀元,訊飛超腦2030”為主題,詳解“訊飛超腦2030計劃”階段性技術突破,一大波“預演未來”的創新應用將走入日常生活。

  高建清表示,實施“訊飛超腦2030計劃”,旨在突破人工智能共性基礎算法,攻克多模態感知、多維表達、認知智能、運動智能等核心技術,研究軟硬一體的機器人關鍵技術,探索虛擬人交互、機器人等方面的示范應用。

  突破兩個關鍵算法讓AI更好地學習、推理

  “‘訊飛超腦2030計劃’的發展,離不開兩個關鍵算法的突破,無監督學習和知識推理。”高建清說,前者需要實現實用化、場景化的預訓練技術,后者需要構建基于知識檢索、決策以及融合的推理系統。

  科大訊飛設計了基于無監督學習的預訓練模型,并創新地使用了少量有監督數據進行優化,大幅提升訓練效率。高建清說:“預訓練模型支持語音識別、聲紋識別、情感識別、多模態語音識別等多個任務,參數量少于業界公開模型,但訓練效果卻十分顯著。”

  以回答“面包在低溫下會馬上發霉嗎”這一問題為例,機器要理解“低溫變質慢”等常識,在引入海量知識的基礎上,要用預訓練模型進行知識重要性排序,也要融合知識與問題進行推理,才能與人暢聊“面包變質的二三事”。

  科大訊飛還探索將神經網絡與符號推理相結合,打造了知識推理系統,實現推理過程的可解釋性。在小學平面幾何題上,這個推理系統讓AI答題的正確率提升到90%的水平,顯著優于傳統推理系統。

  多模態語音增強技術讓AI的聲音有感情

  在“訊飛超腦2030計劃”中,“唇形+語音”的多模態語音增強技術,實現了智能語音交互新模式。

  “想要讓機器更自然地與人類進行交互,就需要通過聽覺、視覺、語義以及各種傳感器的組合讓機器獲取更多的有用信息,AI的感知方式必然要從單模態發展到多模態,逐步擬人化。”高建清表示。

  如何讓機器的聲音媲美人類?高建清分享了科大訊飛在語音合成技術領域的新突破——多風格多情感合成系統SMART-TTS。

  高建清介紹,SMART-TTS可提供高興、抱歉、撒嬌、嚴肅、悲傷、困惑、害怕、鼓勵、生氣、安慰、寵溺等11種情感模式,每種情感模式依程度強弱不同分為20檔;SMART-TTS還具備對機器聲音的“個性化”設置功能,如停頓、重音、語速等,用戶可以根據自己的喜好調節。

  當你漫步林蔭路,TA可以用字正腔圓的“播音腔”為你讀新聞;當你結束一天工作準備入睡,TA可以輕聲細語為你讀散文;當你驅車去公司上班,TA可以用你最喜歡的歌手的聲音告訴你走哪條路不堵車;當你和家人一起觀看紀錄片,TA還可以為紀錄片不同人物配音,人機交互表達自然、情感飽滿。

(責任編輯:歐云海)

友情鏈接:

一大波“預演未來”的創新應用來了

2022-12-05 07:11 來源:科技日報
查看余下全文