2.1. 答案集程式設計 (ASP)
ASP是一種基於邏輯程式設計的穩定模型(答案集)語義的宣告式程式設計範式。它擅長表徵預設推理、不完全資訊與動態領域——這些正是模擬人類認知過程的核心特徵。ASP中的規則形式為:head :- body.,當主體(body)被滿足時,頭部(head)即為真。預設可以優雅地使用失敗即否定(not)來表示。
本文提出一種新穎的跨學科應用,利用答案集程式設計 (ASP) 來形式化並分析第二語言習得 (SLA) 中的一個關鍵理論:VanPatten的輸入處理 (IP) 理論。所解決的核心挑戰在於,將一個描述語言學習者所用預設認知策略的、基於自然語言的定性理論,轉化為一個精確、可計算的模型。此形式化過程使得理論預測的自動化測試、其原則的精煉,以及實用工具(如PIas系統)的開發成為可能,以協助語言教師。
ASP是一種基於邏輯程式設計的穩定模型(答案集)語義的宣告式程式設計範式。它擅長表徵預設推理、不完全資訊與動態領域——這些正是模擬人類認知過程的核心特徵。ASP中的規則形式為:head :- body.,當主體(body)被滿足時,頭部(head)即為真。預設可以優雅地使用失敗即否定(not)來表示。
由VanPatten提出的IP理論認為,第二語言學習者,尤其是初學者,由於處理資源(工作記憶)有限且文法知識不完全,會使用一套預設啟發法來從輸入中提取意義。一個關鍵原則是第一名詞原則:學習者傾向於將施事者/主語角色指派給他們在句子中遇到的第一個名詞或代名詞。這導致系統性的誤解,例如將被動句「The cat was bitten by the dog」理解為「貓咬了狗」。
IP原則被編碼為ASP規則。例如,第一名詞原則可以表示為一個預設規則,當文法線索(如被動語態標記)因資源限制未被處理時適用:
% 預設:將施事者角色指派給第一個名詞
assign_agent(FirstNoun, Event) :-
sentence_word(FirstNoun, Position1, Noun),
sentence_word(Verb, Position2, VerbLex),
Position1 < Position2,
event(Event, VerbLex),
not processed(grammatical_cue(passive, Verb)),
not overridden_by_grammar(Event).
not processed(...) 條件捕捉了資源限制,使該規則成為非單調的。
該模型整合了學習者狀態的動態表徵:
knows_word(learner, 'dog', noun, animal). 的事實。預設策略與習得文法知識之間的互動,是透過規則優先級或取消規則來建模的。
PIas(Processing Input as a System)是一個原型系統,它以一個英文句子和一個學習者檔案(近似熟練度、已知詞彙/文法)作為輸入。它使用形式化的ASP模型來生成一個或多個預測解讀(答案集)。
系統流程圖說明: 工作流程始於輸入句子和學習者檔案資料。這些資料輸入到ASP知識庫,其中包含形式化的IP規則、詞彙事實和文法規則。一個ASP求解器(例如 Clingo)計算穩定模型。產生的答案集被解析為預測解讀,然後透過教師使用者介面以可讀格式呈現,並突顯可能的誤解。
本文展示了系統針對經典範例的輸出。對於被動句「The cat was bitten by the dog」和一個初學者檔案:
processed(grammatical_cue(passive, 'bitten')))以覆蓋預設時,才會產生正確的被動解讀。這些計算預測與SLA研究中的實證觀察相符,驗證了模型的表面效度。此形式化過程也揭示了自然語言理論中潛在的模糊性,提出了改進方向。
模型的核心可以使用邏輯約束進行抽象。令 $L$ 為學習者的知識狀態,$S$ 為輸入句子,$R$ 為可用處理資源。一個解讀 $I$ 是一組語義角色和關係的集合。IP理論 $T$ 定義了一個受預設 $D$ 約束的映射函數 $F_T$:
$I = F_T(S, L, R) \quad \text{subject to} \quad \sum_{g \in G(S)} \text{cost}(g) \leq R$
其中 $G(S)$ 是 $S$ 中文法特徵的集合,$\text{cost}(g)$ 是處理 $g$ 的認知負荷。如果 $g \notin \text{processed}(L, R, S)$,則預設 $D$ 適用。
案例分析:不同句法結構中的第一名詞原則。
輸入: 「The book was given to Mary by John.」(含雙及物動詞的複雜被動句)。
學習者檔案: 初學者;認識單字「book」、「give」、「Mary」、「John」;未處理被動形態或與格結構。
ASP模型執行:
1. 詞彙檢索:BOOK, GIVE, MARY, JOHN。
2. 對被動語態('was given')和間接受詞('to Mary')的文法處理失敗。
3. 預設第一名詞原則觸發:將BOOK指派為施事者角色。
4. 預設線性順序策略:序列被解讀為施事者-動作-接受者-?(JOHN的角色不明確)。
預測輸出: 可能產生多個答案集,例如 {agent(BOOK), action(GIVE), recipient(MARY), other_participant(JOHN)},導致一個混亂的解讀,如「書給了瑪麗某樣東西(而約翰參與其中)」。這精確指出了學習者可能產生混淆的特定領域,教師可以針對此進行教學。
核心洞見: 這項工作不僅僅是將一個酷炫的AI工具應用於語言學;它更是對一個基礎SLA理論的嚴謹壓力測試。透過將輸入處理理論中模糊、描述性的規則強行置入ASP不容妥協的語法中,Inclezan揭示了該理論隱含的假設和預測邊界。真正的價值在於利用計算不僅僅是為了自動化,更是為了批判和精煉人類生成的科學模型——這種方法呼應了Balduccini和Girotto在其他領域對定性理論的研究。
邏輯流程: 本文的邏輯具有說服力:(1) IP理論是定性的且基於預設 → (2) ASP是專為預設和非單調推理設計的形式體系 → (3) 因此,ASP是適合的形式化工具 → (4) 形式化實現了預測,從而導向 (a) 理論精煉和 (b) 實際應用(PIas)。這個流程是計算社會科學的藍圖。
優點與缺陷: 主要優點在於問題與工具之間的優雅契合。使用ASP的「失敗即否定」來模擬「因資源有限而處理失敗」是極具啟發性的。PIas的開發超越了純理論,邁向了具體的實用性。然而,缺陷也很顯著。模型被高度簡化,將人類認知混亂、機率性的本質簡化為確定性規則。它缺乏一個強大的記憶或注意力認知架構,不像更全面的認知建模框架(如ACT-R)。驗證主要是邏輯上的(「表面效度」),而非實證性的,缺乏針對真實學習者資料的大規模測試。相較於教育自然語言處理中現代的資料驅動方法(例如使用BERT預測學習者錯誤),這種符號方法精確但可能缺乏可擴展性和適應性。
可行建議: 對研究者而言,立即的下一步是實證驗證與模型擴展。必須使用大型、帶註釋的學習者語料庫(例如來自NLP4CALL社群等共享任務)來測試ASP模型的預測。應使用機率性ASP或混合神經符號技術擴展模型,以處理學習者知識中的不確定性和漸變性,類似於其他結合邏輯與機器學習領域的進展。對實務工作者而言,應將PIas原型發展為一個即時課程規劃助手,整合到像Duolingo或課堂管理軟體等平台中,以自動標記出可能導致特定班級程度學生誤解的句子。最終願景應是建立一條雙向通道:利用來自此類應用的學習者互動資料,持續精煉和參數化底層的習得計算模型。