北京墻體廣告 英國東英
吉利大學日前發布的新成果顯示,該校研究人員開發的新型視覺語音識別系統能像專業人員那樣識別唇語,且識別度更精確,未來在案件偵查以及輔助聽力和語,言有障礙的人士方面具有廣泛用途。
據研究人員介紹,無論是專業人,士還是現有的視覺語音電腦識別系統,在讀唇語時一個最大挑戰是如何區別容易混淆的發音,如英文中“p”、“b”、“m”發音時,唇部動作,都非常相似,很難區別。但最新開發的電腦系統利用特別設計的程序,能分辨出圖像中唇部最細微的變化,并且完全不需要語音信息輔助。
參與這項研究的東英,
吉利大學學者海倫·貝爾說,發“p”、“b”、“m”這樣的音時,唇部動作還是會有肉眼不易察覺的差別,這款電腦程序會不斷學習和積累相似發音的唇部動作,并進行相關分類,從而不斷提高識別的精確度。
貝爾說,未來經過進一步優化,這一系統能夠運用在多個領域中,除了用來幫助有聽力和語言障礙的人士,相關技術也會對人工智能的發展起到很好的助推作用。