中大製中文檢測系統 錯別字簡體字全現形

20170612
東網電視
更多新聞短片
中文大學花約2年時間,研發一套中文錯字和粵語檢測系統,左為馮沛璋。(周翠怡攝)
隨着即時通訊軟件的普及,年輕人慣常以口語、縮寫和網絡語言與人溝通,或會影響他們正規寫作能力。中文大學研發一套中文錯字和粵語檢測系統,透過大數據和人工智能(AI)等技術,讓系統可辨認句子中的錯別字、簡體字,並向用戶提供修改建議。研究團隊指,系統將逐步開放予全港中、小學使用,提升學生中文水平。
該檢測系統由中文大學系統工程與工程管理學系與香港應用科技研究院合作,花約2年時間研發。檢測系統利用大數據、人工智能和深度學習等技術,「學習」中、小學課本、中文字典等合共過百萬個中文字。應科院亦提供了數千份歷屆文憑試中文科寫作卷的學生答卷,以及學校模擬試卷,讓系統「學習」當中的詞語及語法規則,完善其檢測功能。
檢測系統有4個主要功能;檢測常用錯別字、簡體字、倒裝詞以及檢測句子是否符合粵語用法。只需幾秒,系統便可分析一篇數百字的文章。研究團隊成員、中大系統工程與工程管理學系研究員馮沛璋指,系統可辨識簡體字一字多義,以及粵語獨有的倒裝詞,例如「質素」與「素質」,「私隱」與「隱私」等。
現時檢測系統正在幾間學校及補習社進行測試,準確率逾八成。研究團隊指,系統會逐步開放予全港中、小學使用,以成為中文科教師輔助教學及學生自學的工具,提升學生中文水平。同時,研究團隊計劃在今年內,將系統轉化為辦公室軟件的插件,開放予公眾使用。