udn 願景工程 願景夥伴 g0v 零時政府
工程師吳家銘將台語文獻數位化,並整合市面上的台語字詞數位資料,開發一款線上台語辭典網站「ChhoeTaigi 找台語」。圖/吳家銘提供

工程師吳家銘將台語文獻數位化,並整合市面上的台語字詞數位資料,開發一款線上台語辭典網站「ChhoeTaigi 找台語」。圖/吳家銘提供

官方台語辭典查不到學生名…工程師動手做個新的

越來越多學者指出台語式微,現在20至30歲的年輕人,會聽、說台語的不到5成;若依照聯合國教科文組織標準來看,30年以後,台語可能消失。

但工程師吳家銘指出,「台語相關資源與經費,是全台所有語言中最弱勢的」,既無專屬的公共媒體,也沒有專責委員會,行政資源遠遠不及客家語、原住民族語。雖然今年初,行政院通過「國家語言發展法」草案,但何時三讀上路仍是未知數。

為了搶救台語文,吳家銘展開「ChhoeTaigi 找台語」,將挑選台語文相關文獻,將其數位化;再整合市面上的台語字詞數位資料(如線上辭典)進行規格化,開發一款能夠查閱所有資料的線上辭典網站與手機辭典App。專案獲今年度g0v公民科技創新獎助金。

「沒有文字的語言,是難以傳播的。」吳家銘多年來投身台語教育工作,在高雄社區大學當台語老師,也同時運用所長,設計手機上的台語輸入法「Phah Tâi-gí」與詞典軟體。但越是深入專研,他越發現台語在推廣工作上的基礎建設,大大不足。

以初學者最常使用的線上台語字辭典為例,吳家銘指出,像是政府公布的教育部台語常用詞辭典,字詞量太少,「隨便舉個日常常見的詞bah-sò(肉燥)就沒有收」「連學校孩子的姓名怎麼唸都查不到。」光是官方辭典就不敷使用,更別提相關的語言復振工作。

另一方面,民間開發的台語辭典,種類繁多,例如日治時期所編的「台日大辭典」,收錄約七萬字詞,將近是官方辭典的三倍;而十九世紀末,由長老教會傳教士甘為霖編撰的「甘字典」,則是歷史最悠久。儘管字詞總量大,民眾卻未必知道各辭典的屬性與查詢訣竅,「找一個字,可能就要花好多時間。」

「我現在是要把這些產品,整合成一個服務。」吳家銘近日打算與各家平台洽談,先取得授權,再將資訊統一規格,發揮開源精神,開發一款「集大成」的台語數位辭典,未來使用者只要鍵入關鍵字,系統就會自動從雲端資料庫中撈出相對應的資訊。

至於其他尚未數位化的「落網之詞」,吳家銘打算探勘台語文獻,將版權許可的紙本資料,進行數位化。前期鎖定一九二八年的《台灣植物名彙》與一九五六年的《台灣白話基礎語句》,將從兩本著作中搜尋目前相當匱乏的植物名詞與常用字詞。

「這項工程需要大量人力和時間投入,因此這只能算是開個頭。」吳家銘說,未來的台語復振工程,需要此刻打上良好的地基,「老實說,我做的基礎工作真的是很枯燥乏味,但卻是不得不做。」

工欲善其事,必先利其器。吳家銘率先為台語保存行動,貢獻一分力,期盼「ChhoeTaigi 找台語」專案有了初步成果後,能吸引更多人投入,讓更多台灣人在台語學習之路上,事半功倍。

相關文章

More
TOP