ASP-Anwendung auf den Zweitspracherwerb: Formalisierung der Input-Verarbeitungstheorie

1. Einleitung

Dieses Papier stellt eine neuartige interdisziplinäre Anwendung von Answer Set Programming (ASP) vor, um eine Schlüsseltheorie im Zweitspracherwerb (SLA) zu formalisieren und zu analysieren: VanPattens Input-Verarbeitungstheorie (IP-Theorie). Die zentrale Herausforderung besteht darin, eine qualitative, auf natürlicher Sprache basierende Theorie, die Standardkognitionsstrategien von Sprachenlernenden beschreibt, in ein präzises, berechenbares Modell zu übersetzen. Die Formalisierung ermöglicht die automatisierte Überprüfung von Theorienvorhersagen, die Verfeinerung ihrer Prinzipien und die Entwicklung praktischer Werkzeuge wie des PIas-Systems, um Sprachlehrkräfte zu unterstützen.

2. Hintergrund & Theoretischer Rahmen

2.1. Answer Set Programming (ASP)

ASP ist ein deklaratives Programmierparadigma, das auf der stabilen Modell- (Answer-Set-) Semantik der Logikprogrammierung basiert. Es eignet sich hervorragend zur Darstellung von Standardfolgerungen, unvollständigen Informationen und dynamischen Domänen – Merkmale, die für die Modellierung menschlicher Kognitionsprozesse zentral sind. Eine Regel in ASP hat die Form: head :- body., wobei der Kopf wahr ist, wenn der Rumpf erfüllt ist. Standardannahmen können elegant durch Negation als Scheitern (not) dargestellt werden.

2.2. Input-Verarbeitungstheorie

Die von VanPatten vorgeschlagene IP-Theorie postuliert, dass Zweitsprachenlernende, insbesondere Anfänger, aufgrund begrenzter Verarbeitungsressourcen (Arbeitsgedächtnis) und unvollständiger grammatikalischer Kenntnisse eine Reihe von Standardheuristiken verwenden, um Bedeutung aus dem Input zu extrahieren. Ein Schlüsselprinzip ist das First-Noun-Prinzip: Lernende neigen dazu, die Agenten-/Subjektrolle dem ersten Nomen oder Pronomen zuzuweisen, auf das sie in einem Satz stoßen. Dies führt zu systematischen Fehlinterpretationen, wie z.B. die Interpretation des Passivsatzes "Die Katze wurde vom Hund gebissen" als "Die Katze biss den Hund".

3. Formalisierung der Input-Verarbeitung in ASP

3.1. Modellierung von Standardstrategien

Die IP-Prinzipien werden als ASP-Regeln kodiert. Zum Beispiel kann das First-Noun-Prinzip als eine Standardregel dargestellt werden, die angewendet wird, wenn grammatikalische Hinweise (wie Passivmarker) aufgrund von Ressourcenbeschränkungen nicht verarbeitet werden:

% Standard: Weise Agentenrolle dem ersten Nomen zu
assign_agent(FirstNoun, Event) :-
    sentence_word(FirstNoun, Position1, Noun),
    sentence_word(Verb, Position2, VerbLex),
    Position1 < Position2,
    event(Event, VerbLex),
    not processed(grammatical_cue(passive, Verb)),
    not overridden_by_grammar(Event).

Die Bedingung not processed(...) erfasst die Ressourcenbeschränkung und macht die Regel nicht-monoton.

3.2. Darstellung von Lernerwissen & Ressourcen

Das Modell beinhaltet eine dynamische Darstellung des Lernzustands:

Lexikalisches Wissen: Fakten wie knows_word(learner, 'dog', noun, animal).
Grammatikalisches Wissen: Verinnerlichte Regeln (z.B. für das Passiv).
Verarbeitungsressourcen: Modelliert als Einschränkungen, die die Anzahl gleichzeitig verarbeitbarer grammatikalischer Merkmale in einem gegebenen Satz begrenzen.

Die Interaktion zwischen Standardstrategien und erworbenem grammatikalischem Wissen wird über Regelprioritäten oder Aufhebungsregeln modelliert.

4. Das PIas-System: Anwendung & Ergebnisse

4.1. Systemarchitektur

PIas (Processing Input as a System) ist ein Prototyp, der einen englischen Satz und ein Lernerprofil (ungefähres Kompetenzniveau, bekannter Wortschatz/Grammatik) als Eingabe nimmt. Er verwendet das formalisierte ASP-Modell, um eine oder mehrere vorhergesagte Interpretationen (Answer Sets) zu generieren.

Beschreibung des Systemablaufdiagramms: Der Arbeitsablauf beginnt mit den Daten Eingabesatz und Lernerprofil. Diese speisen die ASP-Wissensbasis, die die formalisierten IP-Regeln, lexikalischen Fakten und Grammatikregeln enthält. Ein ASP-Solver (z.B. Clingo) berechnet die stabilen Modelle. Die resultierenden Answer Sets werden in Vorhergesagte Interpretationen geparst, die dann über eine Benutzeroberfläche für Lehrkräfte in einem lesbaren Format präsentiert werden, wobei wahrscheinliche Fehlinterpretationen hervorgehoben werden.

4.2. Experimentelle Vorhersagen & Validierung

Das Papier demonstriert die Systemausgabe für klassische Beispiele. Für den Passivsatz "Die Katze wurde vom Hund gebissen" und ein Anfängerprofil:

Vorhergesagte Interpretation 1 (Standard): Agent=KATZE, Aktion=BEISSEN, Patiens=HUND. (Falsche aktive Interpretation).
Bedingung für korrekte Interpretation: Das Modell sagt die korrekte Passivlesart nur dann voraus, wenn das Lernerprofil verarbeitetes Wissen über die Passivmorphologie (processed(grammatical_cue(passive, 'bitten'))) enthält, das die Standardannahme außer Kraft setzt.

Diese rechnerischen Vorhersagen stimmen mit empirischen Beobachtungen aus der SLA-Forschung überein und validieren die Augenscheinvalidität des Modells. Die Formalisierung deckte auch potenzielle Mehrdeutigkeiten in der natürlichen Sprachtheorie auf und legte Verfeinerungen nahe.

5. Technische Analyse & Rahmenwerk

5.1. Kernformalismus der Logik

Der Kern des Modells kann mit logischen Einschränkungen abstrahiert werden. Sei $L$ der Wissenszustand des Lerners, $S$ der Eingabesatz und $R$ die verfügbaren Verarbeitungsressourcen. Eine Interpretation $I$ ist eine Menge semantischer Rollen und Relationen. Die IP-Theorie $T$ definiert eine Abbildungsfunktion $F_T$, die durch Standardannahmen $D$ eingeschränkt ist:

$I = F_T(S, L, R) \quad \text{unter der Bedingung} \quad \sum_{g \in G(S)} \text{cost}(g) \leq R$

wobei $G(S)$ die Menge der grammatikalischen Merkmale in $S$ ist und $\text{cost}(g)$ die kognitive Belastung zur Verarbeitung von $g$ darstellt. Standardannahmen $D$ gelten, wenn $g \notin \text{processed}(L, R, S)$.

5.2. Beispiel für das Analyse-Framework

Fallanalyse: Das First-Noun-Prinzip in verschiedenen syntaktischen Strukturen.

Eingabe: "Das Buch wurde Maria von John gegeben." (Komplexes Passiv mit ditransitivem Verb).
Lernerprofil: Anfänger; kennt die Wörter 'Buch', 'geben', 'Maria', 'John'; verarbeitet weder Passivmorphologie noch Dativkonstruktion.
ASP-Modellausführung:
1. Lexikalischer Abruf: BUCH, GEBEN, MARIA, JOHN.
2. Grammatikalische Verarbeitung scheitert für Passiv ('wurde gegeben') und indirektes Objekt ('Maria').
3. Standard-First-Noun-Prinzip greift: BUCH erhält die Agentenrolle.
4. Standard-Linearitätsstrategie: Die Abfolge wird interpretiert als Agent-Aktion-Empfänger-? (JOHNs Rolle ist unklar).
Vorhergesagte Ausgabe: Es können mehrere Answer Sets entstehen, z.B. {agent(BUCH), action(GEBEN), recipient(MARIA), other_participant(JOHN)}, was zu einer verwirrten Interpretation wie "Das Buch gab Maria etwas (und John war beteiligt)." führt. Dies identifiziert einen spezifischen Bereich der Verwirrung für Lernende, den Lehrkräfte gezielt angehen können.

6. Kritische Analyse & Zukünftige Richtungen

Analystenperspektive: Kernidee, Logischer Ablauf, Stärken & Schwächen, Handlungsempfehlungen

Kernidee: Diese Arbeit beschränkt sich nicht darauf, ein cooles KI-Werkzeug auf die Linguistik anzuwenden; es ist ein rigoroser Stresstest für eine grundlegende SLA-Theorie. Indem die vagen, deskriptiven Regeln der Input-Verarbeitung in die unnachgiebige Syntax von ASP gezwungen werden, legt Inclezan die verborgenen Annahmen und Vorhersagegrenzen der Theorie offen. Der wahre Wert liegt darin, die Berechnung nicht nur zur Automatisierung, sondern zur Kritik und Verfeinerung von menschengemachten wissenschaftlichen Modellen zu nutzen – eine Methodik, die an die Arbeit von Balduccini und Girotto zu qualitativen Theorien in anderen Feldern erinnert.

Logischer Ablauf: Die Logik des Papiers ist überzeugend: (1) Die IP-Theorie ist qualitativ und basiert auf Standardannahmen → (2) ASP ist ein Formalismus, der für Standardannahmen und nicht-monotones Schließen entwickelt wurde → (3) Daher ist ASP ein geeignetes Werkzeug zur Formalisierung → (4) Formalisierung ermöglicht Vorhersage, was zu (a) Theorieverfeinerung und (b) praktischer Anwendung (PIas) führt. Diese Pipeline ist ein Blaupause für die computergestützte Sozialwissenschaft.

Stärken & Schwächen: Die primäre Stärke ist die elegante Passung zwischen Problem und Werkzeug. Die Verwendung von ASPs Negation-als-Scheitern zur Modellierung von "Verarbeitungsversagen aufgrund begrenzter Ressourcen" ist genial. Die Entwicklung von PIas geht über reine Theorie hinaus hin zu greifbarem Nutzen. Die Schwächen sind jedoch erheblich. Das Modell ist stark vereinfacht und reduziert die chaotische, probabilistische Natur menschlicher Kognition auf deterministische Regeln. Es fehlt eine robuste kognitive Architektur für Gedächtnis oder Aufmerksamkeit, anders als in umfassenderen kognitiven Modellierungsframeworks wie ACT-R. Die Validierung ist primär logisch ("Augenscheinvalidität") und nicht empirisch; es fehlt eine groß angelegte Überprüfung anhand echter Lerner*innendaten. Verglichen mit modernen datengetriebenen Ansätzen im pädagogischen NLP (z.B. die Verwendung von BERT zur Vorhersage von Lerner*innenfehlern) ist dieser symbolische Ansatz präzise, aber möglicherweise weniger skalierbar und anpassungsfähig.

Handlungsempfehlungen: Für Forschende ist der unmittelbare nächste Schritt die empirische Validierung und Modellerweiterung. Die Vorhersagen des ASP-Modells müssen an großen, annotierten Lerner*innenkorpora getestet werden (z.B. aus Shared Tasks der NLP4CALL-Community). Das Modell sollte mit probabilistischem ASP oder hybriden neuro-symbolischen Techniken erweitert werden, um Unsicherheit und Gradualität im Lerner*innenwissen zu handhaben, ähnlich wie bei Fortschritten in anderen Domänen, die Logik und maschinelles Lernen kombinieren. Für Praktiker*innen sollte der PIas-Prototyp zu einem Echtzeit-Unterrichtsplanungsassistenten weiterentwickelt werden, der in Plattformen wie Duolingo oder Classroom-Management-Software integriert ist, um automatisch Sätze zu kennzeichnen, die für ein bestimmtes Klassenlevel wahrscheinlich Fehlinterpretationen verursachen. Die ultimative Vision sollte eine Zweibahnstraße sein: die Nutzung von Lerner*inneninteraktionsdaten aus solchen Anwendungen, um das zugrundeliegende rechnerische Erwerbsmodell kontinuierlich zu verfeinern und zu parametrisieren.

Zukünftige Anwendungen & Forschungsrichtungen

Personalisiertes Lernmaterial: Dynamische Generierung von Übungen, die auf die vorhergesagten Fehlinterpretationsmuster eines bestimmten Lernenden abzielen.
Automatisierte Aufsatz- & Antwortanalyse: Erweiterung des Modells zur Interpretation von lerner*innengenerierter Sprache, nicht nur des Verständnisses, um die Ursachen von Fehlern zu diagnostizieren.
Integration mit kognitiven Modellen: Kombination des regelbasierten ASP-Systems mit rechnerischen kognitiven Architekturen (z.B. ACT-R) für ein psychologisch plausibleres Modell von Gedächtnis und Verarbeitung.
Kreuzsprachliche Modellierung: Anwendung des Frameworks zur Modellierung von IP-Strategien für Lernende von Sprachen mit anderen Wortstellungen (z.B. SOV wie Japanisch), um die Universalität der Prinzipien zu testen.
Probabilistische Erweiterungen: Übergang von kategorialem zu probabilistischem Answer Set Programming (z.B. P-log), um die Wahrscheinlichkeit verschiedener Interpretationen zu modellieren.

7. Literaturverzeichnis

Gelfond, M., & Lifschitz, V. (1991). Classical negation in logic programs and disjunctive databases. New Generation Computing, 9(3/4), 365-386.
Niemelä, I. (1999). Logic programs with stable model semantics as a constraint programming paradigm. Annals of Mathematics and Artificial Intelligence, 25(3-4), 241-273.
Balduccini, M., & Girotto, S. (2010). Formalization of psychological knowledge in Answer Set Programming and its application. Theory and Practice of Logic Programming, 10(4-6), 725-740.
VanPatten, B. (2004). Input Processing in Second Language Acquisition. In B. VanPatten (Ed.), Processing Instruction: Theory, Research, and Commentary (pp. 5-31). Lawrence Erlbaum Associates.
Anderson, J. R., Bothell, D., Byrne, M. D., Douglass, S., Lebiere, C., & Qin, Y. (2004). An integrated theory of the mind. Psychological Review, 111(4), 1036–1060. (ACT-R-Architektur)
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019. (Referenz für datengetriebenen NLP-Kontrast)