2.1 背景:課程與任務開發
核心挑戰在於設計能超越照本宣科的對話、促進自發且有意義的口語互動的任務。教學上的選擇是將任務建立在衝突情境(例如:意見分歧、協商、解決問題)之上,這類情境本質上要求學習者運用說服性語言、掌握話輪轉換並表達觀點——這些都是口語互動能力的關鍵組成部分。
人工智慧(AI),特別是像 ChatGPT 這類生成式模型,融入語言教學法代表著重大的轉變。本文探討一個具體應用:運用 ChatGPT 協助為大學級對外華語教學(TCFL)口語表達課程設計衝突型溝通任務。本研究採用描述性方法,分析課程開發過程中教師與 AI 的互動,並評估其對最終教學方案的影響。
本研究立足於對外華語口語表達課程大綱的實際開發情境,教師旨在創造能激發真實互動的任務。
核心挑戰在於設計能超越照本宣科的對話、促進自發且有意義的口語互動的任務。教學上的選擇是將任務建立在衝突情境(例如:意見分歧、協商、解決問題)之上,這類情境本質上要求學習者運用說服性語言、掌握話輪轉換並表達觀點——這些都是口語互動能力的關鍵組成部分。
本研究遵循描述性方法論(Olivier de Sardan, 2008; Catroux, 2018)。主要語料庫包含教師研究者在任務設計階段與 ChatGPT 的互動紀錄。分析此紀錄旨在識別互動的顯著特徵,並追溯 AI 建議如何被整合、修改或拒絕於最終課程中。
溝通任務定義為一種以意義為首要、具有溝通目標,並根據結果評估成功與否的活動。整合衝突理論為任務設計提供了一個穩健的框架。衝突情境創造了「資訊落差」和「溝通理由」,驅使學習者策略性地使用語言以達成目標(例如:解決爭端、贏得辯論、找到妥協方案),從而發展語用和互動能力。
這些任務的設計考量了多項準則:衝突情境的真實性、符合學習者程度的認知與語言需求、參與者明確的角色與目標,以及評估任務成功與否的明確成果。本研究運用 ChatGPT 來針對這些準則進行腦力激盪、精煉和評估情境。
互動是迭代且對話式的。教師以具體的提示啟動過程(例如:「為中級華語學習者生成一個關於規劃團體旅行的衝突情境」)。ChatGPT 以敘事大綱、潛在對話開場白和角色描述作為回應。教師隨後根據回應精煉提示,要求變化、簡化或文化調整。AI 扮演了協作腦力激盪夥伴和快速原型生成器的角色。
分析顯示 ChatGPT 的影響是多方面的:1) 效率: 加速了構思和草擬階段。2) 多樣性: 增加了所提議衝突情境的種類和創意。3) 鷹架作用: 提供了一個起點,讓專家教師能夠批判性地評估和調整。最終方案反映了 AI 生成想法與專家教學判斷的綜合,而非直接採用 AI 的輸出。
輸入(教師提示) → AI 處理(情境生成) → 人類評估與調整 → 整合輸出(最終任務)。教師專業知識的關鍵過濾器確保了教學的合理性與文化適切性。
本文並非關於 AI 取代教師,而是關於 AI 增強專家課程設計的創造性和認知負荷。真正的重點在於一種人機協同、提示工程驅動的教學法的出現。其價值不在於 ChatGPT 的原始輸出,而在於教師能夠設計提示,引導 AI 走向符合教學原理的建構——例如衝突型任務——然後批判性地篩選結果。這呼應了創意產業的發現,即像 DALL-E 或 GPT-3 這樣的 AI 工具,在強大的人類創意總監指導下才能發揮最大威力(Ammanabrolu 等人,2021,關於敘事生成)。
本文的邏輯是合理的,但揭示了一種張力:它提倡描述性方法來展示「發生了什麼」,但其潛在的承諾卻是規範性的——暗示這是一個可複製的模式。流程從背景(教育中的 AI)到特定問題(任務設計),接著詳述方法(分析對話紀錄),最後評估影響。然而,它未能為提示工程過程本身提供一個形式化的框架,而這才是最可轉移的知識產物。
優點: 聚焦於高價值、高認知需求的教學任務(設計,而不僅僅是內容傳遞)是明智的。選擇衝突型任務非常出色,因為它測試了 AI 處理細微差別和人際動態的能力。描述性方法論適合此早期探索階段。
缺陷: 分析本質上是事後且主觀的,基於單一教師的互動紀錄。沒有對照組(不使用 AI 的設計)或可衡量的學習成果數據來證實其正面「影響」的主張。關於「影響」的討論,在實際學生學習成效方面仍屬推測。它可能混淆設計過程效率與教學效果。
對教育工作者和機構的建議:1) 投資提示素養: 教師培訓應從「如何使用 AI」轉向「如何設計教學提示」。2) 開發評估量規: 建立評估 AI 生成教育內容的共享標準,聚焦於教學原理,而不僅僅是語言正確性。3) 以明確假設進行試點: 不僅描述過程,更要設計 A/B 測試,比較 AI 輔助與傳統設計方法在效率指標,以及關鍵的後續學生參與度/表現上的差異。4) 記錄提示鏈: 真正的智慧財產是產生最佳結果的提示序列。這應被系統性地歸檔和分享。
人機協作可以建模為一系列迭代循環。一個關鍵技術層面是提示的演進。初始提示 $P_0$(例如:「一個衝突情境」)會根據輸出 $O_n$ 和教學目標 $G$ 進行精煉。這可以概念化為:$P_{n+1} = f(P_n, O_n, G, C)$,其中 $C$ 代表限制條件(語言程度、文化背景)。函數 $f$ 代表教師的提示工程技能。最終任務 $T_{final}$ 的品質是初始 AI 輸出以及精煉迭代次數和品質的函數:$T_{final} \approx \sum_{i=1}^{n} (\alpha \cdot O_i + \beta \cdot H_i)$,其中 $\alpha$ 是 AI 權重,$\beta$ 是人類專家權重,$H_i$ 是第 $i$ 次迭代中的人類輸入。
情境: 為 B1 級學習者設計關於「協商工作排班」的任務。
應用分析框架:
1. 提示解構: 教師提示:「生成一段對話,其中兩位同事對週末值班排班有不同意見。包含表達偏好、建議和溫和反對的用語。使用 B1 級詞彙。」此提示指定了情境、衝突、語言功能與程度。
2. 輸出評估矩陣: AI 的輸出根據以下標準評估:
- 教學適配性: 目標語言功能是否存在?
- 語言適切性: 詞彙/句法是否符合 B1 程度?
- 情境真實性: 衝突是否可信?
- 任務潛力: 這是否能轉化為具有明確目標的角色扮演?
3. 迭代追蹤: 教師注意到 AI 的第一稿使用了過於正式的反對用語。下一個提示進行精煉:「…使用更常見的口語反對用語,像是『我覺得可能不太行』,而不是『我堅決反對』。」這展示了該框架的實際運作。
發展軌跡超越了任務設計。未來應用包括:1) 動態難度調整: AI 可以根據學習者表現,即時生成衝突情境的多個版本。2) 個人化衝突情境: 利用學習者興趣(來自問卷或先前互動)來啟動情境生成。3) AI 作為角色扮演模擬器: 學習者與 AI 角色練習協商,AI 角色會根據學習者的語言熟練度和說服力調整其策略,此概念接近於互動式敘事 AI 的研究(Riedl & Bulitko, 2012)。
關鍵研究方向: 衡量學習成果的縱貫性研究;開發標準化的「教學提示庫」;探索多模態任務設計(將 AI 生成的圖像/影片整合到情境中);以及認真探討倫理議題——確保 AI 不會在其生成的衝突敘事中強化刻板印象。