تطبيق البرمجة بمجموعات الإجابة على اكتساب اللغة الثانية: إضفاء الطابع الرسمي على نظرية معالجة المدخلات

1. المقدمة

يقدم هذا البحث تطبيقًا جديدًا متعدد التخصصات للبرمجة بمجموعات الإجابة (ASP) لإضفاء الطابع الرسمي وتحليل نظرية أساسية في اكتساب اللغة الثانية (SLA): نظرية معالجة المدخلات (IP) لفان باتن. التحدي الأساسي الذي يتم معالجته هو ترجمة نظرية وصفية نوعية قائمة على اللغة الطبيعية تصف الاستراتيجيات المعرفية الافتراضية التي يستخدمها متعلمو اللغة إلى نموذج دقيق وقابل للحساب. يتيح هذا الإضفاء للطابع الرسمي الاختبار الآلي للتنبؤات النظرية، وتحسين مبادئها، وتطوير أدوات عملية مثل نظام PIas لمساعدة معلمي اللغة.

2. الخلفية والإطار النظري

2.1. البرمجة بمجموعات الإجابة (ASP)

ASP هي نموذج برمجة تصريحي يعتمد على دلالات النموذج المستقر (مجموعة الإجابة) في البرمجة المنطقية. تتفوق في تمثيل الاستدلال الافتراضي، والمعلومات غير الكاملة، والمجالات الديناميكية—وهي ميزات جوهرية لنمذجة العمليات المعرفية البشرية. قاعدة في ASP تأخذ الشكل: head :- body.، حيث يكون الرأس صحيحًا إذا تحقق الشرط. يمكن تمثيل الافتراضات بأناقة باستخدام النفي كفشل (not).

2.2. نظرية معالجة المدخلات

تقترح نظرية IP، التي قدمها فان باتن، أن متعلمي اللغة الثانية، وخاصة المبتدئين، يستخدمون مجموعة من الاستدلالات الافتراضية لاستخلاص المعنى من المدخلات بسبب محدودية موارد المعالجة (الذاكرة العاملة) والمعرفة النحوية غير الكاملة. أحد المبادئ الأساسية هو مبدأ الاسم الأول: يميل المتعلمون إلى إسناد دور الفاعل/المبتدأ إلى أول اسم أو ضمير يواجهونه في الجملة. وهذا يؤدي إلى سوء تفسير منهجي، مثل تفسير الجملة المبني للمجهول "The cat was bitten by the dog" على أنها "The cat bit the dog."

3. إضفاء الطابع الرسمي على معالجة المدخلات في ASP

3.1. نمذجة الاستراتيجيات الافتراضية

يتم ترميز مبادئ IP كقواعد ASP. على سبيل المثال، يمكن تمثيل مبدأ الاسم الأول كقاعدة افتراضية تنطبق عندما لا تتم معالجة الإشارات النحوية (مثل علامات المبني للمجهول) بسبب محدودية الموارد:

% الافتراضي: إسناد دور الفاعل إلى الاسم الأول
assign_agent(FirstNoun, Event) :-
    sentence_word(FirstNoun, Position1, Noun),
    sentence_word(Verb, Position2, VerbLex),
    Position1 < Position2,
    event(Event, VerbLex),
    not processed(grammatical_cue(passive, Verb)),
    not overridden_by_grammar(Event).

شرط not processed(...) يلتقط محدودية الموارد، مما يجعل القاعدة غير رتيبة.

3.2. تمثيل معرفة المتعلم والموارد

يتضمن النموذج تمثيلًا ديناميكيًا لحالة المتعلم:

المعرفة المعجمية: حقائق مثل knows_word(learner, 'dog', noun, animal).
المعرفة النحوية: قواعد مستوعبة داخليًا (مثل قواعد المبني للمجهول).
موارد المعالجة: يتم نمذجتها كقيود تحد من عدد السمات النحوية التي يمكن معالجتها في وقت واحد في جملة معينة.

يتم نمذجة التفاعل بين الاستراتيجيات الافتراضية والمعرفة النحوية المكتسبة عبر أولويات القواعد أو قواعد الإلغاء.

4. نظام PIas: التطبيق والنتائج

4.1. بنية النظام

PIas (معالجة المدخلات كنظام) هو نموذج أولي يأخذ جملة إنجليزية وملف تعريف للمتعلم (مستوى الكفاءة التقريبي، المفردات/القواعد المعروفة) كمدخلات. يستخدم نموذج ASP المُضفى عليه الطابع الرسمي لتوليد تفسير واحد أو أكثر متوقع (مجموعات إجابة).

وصف مخطط تدفق النظام: يبدأ سير العمل ببيانات الجملة المدخلة وملف تعريف المتعلم. يتم تغذية هذه البيانات إلى قاعدة معرفة ASP، التي تحتوي على قواعد IP المُضفى عليها الطابع الرسمي، والحقائق المعجمية، والقواعد النحوية. يقوم محلل ASP (مثل Clingo) بحساب النماذج المستقرة. يتم تحليل مجموعات الإجابة الناتجة إلى تفسيرات متوقعة، والتي تُعرض بعد ذلك في شكل مقروء عبر واجهة مستخدم للمعلمين، مع إبراز سوء التفسيرات المحتمل.

4.2. التنبؤات التجريبية والتحقق

يوضح البحث مخرجات النظام للأمثلة الكلاسيكية. بالنسبة للجملة المبني للمجهول "The cat was bitten by the dog" وملف تعريف المبتدئ:

التفسير المتوقع 1 (الافتراضي): الفاعل=القط، الفعل=عض، المفعول به=الكلب. (تفسير مبني للمعلوم خاطئ).
شرط التفسير الصحيح: يتوقع النموذج القراءة الصحيحة للمبني للمجهول فقط إذا تضمن ملف تعريف المتعلم معرفة معالجة لصيغة المبني للمجهول (processed(grammatical_cue(passive, 'bitten')))، مما يتجاوز الافتراضي.

تتوافق هذه التنبؤات الحسابية مع الملاحظات التجريبية من أبحاث اكتساب اللغة الثانية، مما يؤكد صلاحية النموذج الظاهري. كما كشف الإضفاء للطابع الرسمي عن غموضات محتملة في النظرية القائمة على اللغة الطبيعية، مما يقترح تحسينات.

5. التحليل الفني والإطار

5.1. الصياغة المنطقية الأساسية

يمكن تجريد جوهر النموذج باستخدام القيود المنطقية. لنفترض أن $L$ هي حالة معرفة المتعلم، و$S$ هي الجملة المدخلة، و$R$ هي موارد المعالجة المتاحة. التفسير $I$ هو مجموعة من الأدوار والعلاقات الدلالية. تحدد نظرية IP $T$ دالة تعيين $F_T$ مقيدة بالافتراضات $D$:

$I = F_T(S, L, R) \quad \text{subject to} \quad \sum_{g \in G(S)} \text{cost}(g) \leq R$

حيث $G(S)$ هي مجموعة السمات النحوية في $S$، و$\text{cost}(g)$ هو الحمل المعرفي لمعالجة $g$. تنطبق الافتراضات $D$ إذا كان $g \notin \text{processed}(L, R, S)$.

5.2. مثال على إطار التحليل

تحليل حالة: مبدأ الاسم الأول في تراكيب نحوية مختلفة.

المدخل: "The book was given to Mary by John." (مبني للمجهول معقد مع فعل يتعدى لمفعولين).
ملف تعريف المتعلم: مبتدئ؛ يعرف الكلمات 'كتاب'، 'أعطى'، 'ماري'، 'جون'؛ لا يعالج صيغة المبني للمجهول أو تركيب المفعول غير المباشر.
تنفيذ نموذج ASP:
1. استرجاع معجمي: كتاب، أعطى، ماري، جون.
2. فشل المعالجة النحوية للمبني للمجهول ('was given') والمفعول غير المباشر ('to Mary').
3. ينطلق مبدأ الاسم الأول الافتراضي: يُسند دور الفاعل إلى الكتاب.
4. استراتيجية الترتيب الخطي الافتراضية: يتم تفسير التسلسل على أنه فاعل-فعل-متلق-؟ (دور جون غامض).
المخرجات المتوقعة: قد تنشأ مجموعات إجابة متعددة، على سبيل المثال، {agent(BOOK), action(GIVE), recipient(MARY), other_participant(JOHN)} مما يؤدي إلى تفسير مشوش مثل "أعطى الكتاب شيئًا لماري (وكان جون مشاركًا)." وهذا يحدد منطقة محددة من الارتباك للمتعلمين يمكن للمعلمين استهدافها.

6. التحليل النقدي والاتجاهات المستقبلية

منظور المحلل: الفكرة الأساسية، التدفق المنطقي، نقاط القوة والضعف، رؤى قابلة للتنفيذ

الفكرة الأساسية: هذا العمل ليس مجرد تطبيق لأداة ذكاء اصطناعي رائعة على اللسانيات؛ بل هو اختبار إجهاد صارم لنظرية أساسية في اكتساب اللغة الثانية. من خلال إجبار القواعد الوصفية الغامضة لنظرية معالجة المدخلات على الانصياع للتركيب الصارم لـ ASP، يكشف إنسليزان الافتراضات الخفية للنظرية وحدودها التنبؤية. تكمن القيمة الحقيقية في استخدام الحوسبة ليس فقط لأتمتة النماذج العلمية التي يولدها البشر، بل لنقدها وتحسينها—وهي منهجية تردد صدى عمل بالدوتشيني وجيروتو على النظريات النوعية في مجالات أخرى.

التدفق المنطقي: منطق البحث مقنع: (1) نظرية IP نوعية وتقوم على افتراضات → (2) ASP هي صياغة مصممة للافتراضات والاستدلال غير الرتيب → (3) لذلك، ASP هي أداة مناسبة للإضفاء للطابع الرسمي → (4) الإضفاء للطابع الرسمي يتيح التنبؤ، مما يؤدي إلى (أ) تحسين النظرية و(ب) التطبيق العملي (PIas). هذا المسار هو مخطط للعلوم الاجتماعية الحسابية.

نقاط القوة والضعف: القوة الأساسية هي الملاءمة الأنيقة بين المشكلة والأداة. استخدام نفي الفشل في ASP لنمذجة "الفشل في المعالجة بسبب محدودية الموارد" هو فكرة ملهمة. تطوير PIas يتجاوز النظرية البحتة إلى فائدة ملموسة. ومع ذلك، فإن العيوب كبيرة. النموذج مبسط للغاية، حيث يختزل الطبيعة الفوضوية الاحتمالية للإدراك البشري إلى قواعد حتمية. يفتقر إلى بنية معرفية قوية للذاكرة أو الانتباه، على عكس أطر نمذجة المعرفة الشاملة مثل ACT-R. التحقق أساسًا منطقي ("صلاحية ظاهرية") وليس تجريبيًا، ويخلو من الاختبار واسع النطاق مقابل بيانات متعلمين حقيقية. مقارنة بالمناهج الحديثة القائمة على البيانات في معالجة اللغة الطبيعية التعليمية (مثل استخدام BERT للتنبؤ بأخطاء المتعلمين)، فإن هذا النهج الرمزي دقيق ولكنه قد يفتقر إلى القابلية للتوسع والتكيف.

رؤى قابلة للتنفيذ: بالنسبة للباحثين، الخطوة التالية المباشرة هي التحقق التجريبي وتوسيع النموذج. يجب اختبار تنبؤات نموذج ASP مقابل مجموعات كبيرة من نصوص المتعلمين المشروحة (مثل تلك من المهام المشتركة لمجتمع NLP4CALL). يجب توسيع النموذج باستخدام ASP الاحتمالي أو تقنيات هجينة عصبية-رمزية للتعامل مع عدم اليقين والتدرج في معرفة المتعلم، على غرار التطورات في مجالات أخرى تجمع بين المنطق والتعلم الآلي. بالنسبة للممارسين، يجب تطوير النموذج الأولي PIas ليصبح مساعدًا للتخطيط للدروس في الوقت الفعلي، ودمجه في منصات مثل Duolingo أو برامج إدارة الفصول الدراسية، للإشارة تلقائيًا إلى الجمل التي من المحتمل أن تسبب سوء تفسير لمستوى صف معين. يجب أن تكون الرؤية النهائية هي طريق ذو اتجاهين: استخدام بيانات تفاعل المتعلمين من مثل هذه التطبيقات لتحسين ومعايرة النموذج الحسابي الأساسي للاكتساب بشكل مستمر.

التطبيقات المستقبلية واتجاهات البحث

مواد تعليمية مخصصة: توليد ديناميكي للتمارين التي تستهدف أنماط سوء التفسير المتوقعة لمتعلم معين.
تحليل المقالات والاستجابات الآلي: توسيع النموذج لتفسير اللغة المنتجة من قبل المتعلم، وليس فقط الفهم، لتشخيص الأسباب الجذرية للأخطاء.
التكامل مع النماذج المعرفية: دمج نظام ASP القائم على القواعد مع البنى المعرفية الحسابية (مثل ACT-R) للحصول على نموذج أكثر معقولية نفسيًا للذاكرة والمعالجة.
النمذجة عبر اللغات: تطبيق الإطار لنمذجة استراتيجيات معالجة المدخلات لمتعلمي لغات ذات ترتيب كلمات مختلف (مثل SOV مثل اليابانية)، واختبار عالمية المبادئ.
التوسعات الاحتمالية: الانتقال من البرمجة بمجموعات الإجابة الفئوية إلى الاحتمالية (مثل P-log) لنمذجة احتمالية التفسيرات المختلفة.

7. المراجع

Gelfond, M., & Lifschitz, V. (1991). Classical negation in logic programs and disjunctive databases. New Generation Computing, 9(3/4), 365-386.
Niemelä, I. (1999). Logic programs with stable model semantics as a constraint programming paradigm. Annals of Mathematics and Artificial Intelligence, 25(3-4), 241-273.
Balduccini, M., & Girotto, S. (2010). Formalization of psychological knowledge in Answer Set Programming and its application. Theory and Practice of Logic Programming, 10(4-6), 725-740.
VanPatten, B. (2004). Input Processing in Second Language Acquisition. In B. VanPatten (Ed.), Processing Instruction: Theory, Research, and Commentary (pp. 5-31). Lawrence Erlbaum Associates.
Anderson, J. R., Bothell, D., Byrne, M. D., Douglass, S., Lebiere, C., & Qin, Y. (2004). An integrated theory of the mind. Psychological Review, 111(4), 1036–1060. (ACT-R architecture)
Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019. (Reference for data-driven NLP contrast)