The Chinese University of Hong Kong
events & news

【好人好事】李丹電子工程學團隊 以AI還原舌癌婦聲線



李丹電子工程學團隊 以AI還原舌癌婦聲線

(左起)團隊成員博士生譚達新、李丹教授、博士生馬敬恆和校友潘楚騫。

母親的一聲叮嚀、安慰或囑咐都包含着無限暖意,假如無法再聽見其聲音,你會怎辦呢?校友潘楚騫Jackson(16崇基信息工程學)的母親Jody因患上舌癌,須切除舌頭及聲帶組織。他希望留住母親的聲線,在討論區求助,引起中大電子工程學系教授李丹團隊的關注。團隊透過人工智能(AI)語音合成技術,把Jody的聲音還原,配合特別開發的手機應用程式(apps),令手術後喪失說話能力的她,透過手機輸入文字,以自己的聲音與人溝通。

在連登求助 48小時內行動
去年6月中,Jackson女朋友代他在連登討論區發出一個求助帖,博士生馬敬恆(15聯合生物醫學工程學)獲悉後,將情況轉告老師李丹(88新亞電子 / 90研究院電子工程 / 96研究院電子工程哲學博士)。近兩年李教授及其團隊以AI語音合成技術,開發兒童故事創作讀書計劃,他相信自己的技術應用可協助Jody,馬上聯絡Jackson。當時距離Jody接受手術的日子不足兩星期,他立即安排翌日為Jody錄音,「她的決心很大,那時她在教會工作,放工後來到中大的錄音室,分4至5次完成十數小時的錄音。我們要求她以日常的語氣錄音,但她說話速度較快,錄音要放慢語速。錄音內容包括日常對話、朗讀聖經及講兒童故事,前兩者是生活需要,後者是因為語氣變化較多。」

「Voice of Jody」apps獨一無二
團隊採集真人發音數據後,編寫代碼,並設計和訓練AI語音合成模組,「AI模組要學習的是字的發音和Jody的語氣,但廣東話的多音字很多,例如:花『錢』與金『錢』的『錢』字,讀音便不同。」幸好中大具備龐大的廣東話數據庫,經反覆測試及修正,8月中初見成果,輸入文字後,AI模組能以十分接近Jody的聲線播放語句。李教授再找軟件工程公司花約兩星期開發專屬的apps「Voice of Jody」。Apps將常用語句分為問候、疑問、反應、禮貌、回答和行動六類,有選單快速點選,Jody亦可以自行輸入文字,再轉化成自己的聲音發聲,更可以分享至WhatsApp等通訊軟件。此apps尚有部分多音字及停頓位未夠準確,李教授希望可新增定位偵測功能,按Jody身處地方,作出語句建議選單。

專屬apps「Voice of Jody」,內置常用語句可選,亦可以自行輸中文字再轉化成「真人」發聲,更可以選擇語速。

Jackson對李教授團隊的幫忙感激不已,「時間緊迫,工作量大又困難,他們很着緊和用心,媽媽亦感到開心和感動。」李教授指今次是機緣巧合下促成的好事,Jody試用後不久,透過WhatsApp發送了四段語音訊息感激團隊,他們深受觸動。李教授一直專注研究語音合成技術,認為語音是很個人化的,希望研究能真正幫助到聲音或語言機能障礙者,而不是畫蛇添足的應用。

訪問原文:《中大校友》季刊第一百零九期.中大校友事務處 2022

網上閱讀《中大校友》3月號
pdf版本:http://alumni.cuhk.edu.hk/zh-Hant/magazine/categories/pdfversion/202203
揭頁式ISSUU版本:http://www.alumni.cuhk.edu.hk/magazine/issuu/