站長之家(ChinaZ.com) 7月19日 消息:據(jù)外媒報道,谷歌人工智能部門一直在開發(fā)專門針對語言障礙人士的新軟件。
Big G在一篇最新的文章中提出一種新的語音轉換成文本軟件“Parrotron”,專門為有語言障礙人士設計。Parrotron在一個深度神經網絡運行,該神經網絡被訓練用來將非典型的語音模式轉換成流暢的合成語音。有趣的是,這項技術不依賴唇形變化等視覺效果。
未來提高準確率,谷歌給神經網絡提供了“近30, 000 小時由數(shù)百萬個匿名話語對組成的語料庫。這項技術從本質上把“聾啞人的單詞錯誤率從89%降低到25%”,但是谷歌希望能進一步改善結果。
目前,完整的研究已經發(fā)布在ArXiv上,感興趣的網友還可以在GitHub庫中找到更多的Parrotron的例子。
相關文章:
(舉報)