aiai

破解語言學習迷思:AI時代的自學之道

成年後學習語言的理論眾多,但不少方法均缺乏實踐基礎,甚至是憑空想像,與現實差距甚遠。這篇文章提出兩個成人學習語言的常見迷思,均出自筆者實際經驗。

兩種迷思

迷思一:長期生活在目標語言環境中,即能自然習得語言。

只要看看香港,即發現不少在港生活數年或更久的人,可以半句香港語都不懂。或說是香港人懂英語者眾,但環觀世界各地,類似情況絕不罕見,例如泰國、越南等。

或多或少證明,日常生活其實用手語或「意會」,已能應付。我有次問一位與家人移英的長者如何應付英語,她通常去超市,笑說:「我攞張信用卡出嚟就得啦!」不少與家人移居英國的香港長者應該心領神會。

迷思二:當地人不願跟我用當地語言交流。

有些外國人說,自己也曾「努力」學習港語,但怪香港人回應時寧願用英文。其實香港人大多愛以港語交流,但有時聽到外國人發音太過怪異,如把「食飯」說成「sick fan」,禮貌上可能還是會讚對方說得不錯,但實際上很快就會改回英文交流。

日常交流,其目的並非學習語言,而是內容溝通。

所以不是當地人不願以當地語交流,而往往只是自己達不到讓人放心以當地語言溝通的水平。不過正正因為主要問題在自身,所以有辦法解決。

兩種詞庫

與人溝通時,如果無法明白對方所說,最大問題往往不是語法,而是詞彙不足。一句話中九成字詞認不出來,何能有效溝通?所以學習語言的重要策略,是要儘快建立強大的詞庫。

新詞彙有兩類,一是自用,可稱之為「主動字詞」;另一種他人所用,自己聽得明白即可,可稱之為「被動字詞」。例如我雖然平時比較少講粗口,但完全聽得明白,算是我的被動字詞,聽得明白,亦不會打冷震。

如果無法掌握大量被動字詞,對於閱讀及聆聽等都會極為艱難。

— 

兩種記憶

單靠日常生活來學習單詞,是極為低效的方式。因為日常對答都很簡單,亦很膚淺。筆者認為較有效快速建立詞𢑥的方法,最好還是靠閱讀,較聆聽為佳。

靠閱讀來學習新字詞,就有兩種學法,一是死記爛背生詞表,二是閱讀不同題材的文章並記下內容及句式。兩種學法,以後者為佳。

不過兩者界線其實有些模糊,因為即使是以後者方式學習,還是需要靠反複記憶,重點是學習句式及應用場景,而非當是腦力遊戲般,每天學習生詞一百,卻不知其用處。

— 

兩種困難

以閱讀方式來吸收詞匯雖然有效,卻有另一困擾之處。如果找一般成年人讀物,往往難以掌握,讀幾句又要查字典,查字典後又要做記錄,記下單字,又最好記下句子,非常耗時。

坊間有些適合不同程度的外語讀物,不外乎兩種:一是童書,用字顯淺,間中看幾本當然有趣,但絕不想整個書架也是童書;二是專為學習者而設的輔助讀物,通常有雙語輔助,列明生詞表,部份還會有文法解釋。

讀物的兩種困難之處,正是成人讀物雖好,但程度過高;兒童或學習教教材雖然顯淺,但看多覺悶。

— 

兩種學法

其中一種學習方法,是請私人補習,個別指導閱讀,邊讀邊解釋,遠勝傳統教學,即所謂「2 Sigma 問題」。然而聘請私人教練,一來人夾人緣可遇不可求;二來還要看你想學的語種,例如筆者想進修藏語,尋找老師較難。

另一方法,就是使用 AI。

一直以來,總是談理 AI 如何幫助人類,對筆者而言,最近使用 AI 最多的場景,正是用來學習藏語。針對藏語的電腦資源一直較其他語種少,筆者過往學習藏文,用的電腦資料,大多就是網上字詞(不是翻譯)。

最近一個月,開始有些變化,Google 翻譯忽然在 2024 年 6 月 27 日包括了藏語及港語(Google 目前稱之為 Cantonese)。

不過在此前一個星期,即 2024 年 6 月 21 日,Anthropic 推出一款新的 AI 模型,叫 Claude 3.5 Sonnet。在其官方任何宣傳中都沒有提及其支援藏文文字,筆者也只是抱著一試無妨的心態輸入,結果卻極為出人意表,出奇地準確。

Claude 3.5 Sonnet最新支援支援藏語

我找了十多位專業的藏人藏語老師來做初步校對(老師當中有幾位更是專門教授經典藏文及佛法,藏語水平極好),大家異口同聲說 AI 神奇,準確率已達「可用水平」。在此做一個簡單對比,以藏語支援來說,Claude AI 3.5 Sonnet 最神奇,其次是 OpenAI ChatGPT 4.0o,至於 Google Translate 則是三者中最差。

自製輔助讀本

筆者最近就利用 Claude 3.5 Sonnet 的 AI 模型,輔助閱讀了一本完整的藏文書。書名為《བདེ་སྐྱིད་ཀྱི་གསང་བ།》(THL 簡易拼音為:dé kyi kyi sangwa),意思是《幸福的秘密》(出版社:Tibetan Translation & Research Institute),書只有155 頁,筆錄達賴喇嘛尊者的不同講座。

由於篇幅所限,在此示範無法過度詳細,只會提及所用工具及功能。

目標:把手頭上的藏語書,用 AI 幫手加上輔助說明,之後提取詞𢑥及例句,匯出成為學習資料庫。

材料:手機相機,Google Drive,Claude AI 3.5 Sonnet,助記字卡應用程式 Anki(使用官方開源版本,不建議使用其他以 Anki 命名的軟體)。*對香港用戶還需要有外國電話卡,外國 App Store 戶口,網站版需要 VPN(Claude 在審查 VPN 時沒有 OpenAI 那麼嚴格)。

Google Drive

Claude AI 3.5 Sonnet

Anki 應用程式

・VPN(如Proton VPN

・外國電話卡:如Giffgaff 英國卡(有時在北角森記、深水埗一拳或旺角留下書舍,會有些 Giffgaff 電話卡存貨)

步驟(約略講解):

1. 先為書本拍照,拍照時只拍一頁,而不是拍兩頁或一頁半,否則認字會較不準確。

2. 上傳照片去 Google Drive,在網站版(不是手機版)開啟該照片檔案,以 Google Doc 開啟。

3. 等待片刻即能擷取其文字,Google Drive 是筆者目前用過最方便的藏文 OCR 工具。對其他語言的支援都極好,包括手寫。

4. 在 Claude 3.5 Sonnet 上開一個戶口,需要電話驗證,香港用戶需要使用 VPN 或外國的 App Store 戶口,可免費使用,但若將來想使用付費版,要有外國支付方式。

5. 把剛才提取的文字放入 Claude,按自己要求及理想中的輔助閱讀格式,輸入適當的 prompt。

6. 提取生字,製作成為 Anki 檔,為純文字檔,稍後再匯入 Anki,用電腦做此步驟較為方便。

 
能夠直接閱讀尊者的法會文本,在學習旅途中收穫甚深,亦覺無限滿足。這種人類的幸福感,正是區別人與機器的分別。祝願大家在學習路上,都能找到屬於自己的方法。