中文動詞偏好 vs. 英文名詞偏好：基於語料庫的研究及其對第二語言學習者的啟示

1. 緒論
2. 名詞/動詞偏好與本體論隱喻
3. 基於語料庫的比較研究
4. 結果與討論
- 4.1 母語報紙比較
- 4.2 第二語言學習者寫作分析
5. 教學啟示與建議
6. 結論與未來研究
7. 關鍵洞察與統計摘要
8. 原創分析：核心洞察、邏輯脈絡、優點與缺陷、可行建議
9. 技術細節與數學框架
10. 實驗結果與圖表說明
11. 分析框架：案例示範
12. 未來應用與研究方向
13. 參考文獻

1. 緒論

名詞與動詞是人類所有語言中最基本的詞彙類別。語言習得研究，例如 Gentner (1982) 的著作，指出它們是兒童最早習得的詞類之一。一個普遍的理論提出了「名詞普遍優勢」，認為名詞通常直接對應具體物體，因此比動詞更容易習得。然而，跨語言研究對此普遍性提出了挑戰。依賴輸入的觀點認為，語言特有的結構，例如中文、日文和韓文的代詞脫落特性及簡化的動詞形態，可能有助於更早習得動詞。實證證據，包括 Tardif 等人 (1999) 的研究，顯示以中文為母語的兒童比以英語為母語的兒童表現出更強的動詞偏好。本研究以此為基礎，探討這種動詞-名詞偏好二分法在現代書面語篇中的表現，及其對第二語言學習者的影響。

2. 名詞/動詞偏好與本體論隱喻

本文將本體論隱喻（Lakoff & Johnson, 1980）的不同使用方式確定為一個關鍵的解釋因素。本體論隱喻涉及將抽象概念、情感或過程概念化為具體的實體或物質，使其更容易討論和量化。例如，英文片語「Thanks for your time」將時間視為可轉移的物體。

Link (2013) 認為，英語表現出強烈的名詞化本體論隱喻偏好。它經常將過程（動詞）轉化為名詞形式（例如「fear」、「development」、「understanding」），將動作視為可操作的物體。相比之下，中文則表現出動詞偏好，傾向於直接透過動詞片語來描述狀態和過程，而非將其名詞化。本文提供了一個清晰的例子：

英文（名詞化）：「My fear of insects is driving my wife crazy.」
中文（動詞化）：「我這麼怕昆蟲，讓妻子很受不了。」

這種根本的認知語言學差異，構成了觀察到的詞類使用統計差異的基礎。

3. 基於語料庫的比較研究

3.1 研究材料來源

為確保代表性和現代性，本研究從具影響力的報紙建構了兩個語料庫：

中文語料庫： 來自《人民日報》的文章。
英文語料庫： 來自《紐約時報》的文章。

第三個語料庫則彙編自英語母語的中級至高級中文學習者的寫作樣本，以調查母語遷移效應。

3.2 語料庫建構與處理

本研究從每個來源抽取了大量隨機文本樣本。使用標準的自然語言處理工具對文本進行詞性標註處理：

中文： 可能使用如 Jieba 或帶有中文模型的 Stanford CoreNLP 等工具。
英文： 使用如 NLTK 或 spaCy 等工具。

所有詞語均被標註為名詞或動詞（包括英文中的動名詞和不定詞）。專有名詞被排除在外，以聚焦於詞彙選擇。

3.3 統計分析方法

核心指標是為每個文本樣本計算並在整個語料庫中平均的名詞-動詞比率：

$N/V\ Ratio = \frac{Total\ Count\ of\ Nouns}{Total\ Count\ of\ Verbs}$

使用推論統計方法，如t檢定或變異數分析，來檢驗語料庫之間差異的統計顯著性，確保觀察到的模式並非隨機產生。

4. 結果與討論

4.1 母語報紙比較

分析結果證實了假設：

《紐約時報》（英文）： 展現出較高的名詞-動詞比率，顯示出明顯的名詞偏好。這與 Biber 等人 (1998) 關於名詞密集的學術/正式書面英語的研究結果一致。
《人民日報》（中文）： 展現出顯著較低的名詞-動詞比率，顯示出明顯的動詞偏好。這支持了 Link (2013) 對中文語言風格的觀察。

此差異具有統計顯著性，有力地驗證了跨語言的二分法。

4.2 第二語言學習者寫作分析

研究揭示了清晰的母語遷移效應：

英語母語的中文學習者所產出的中文寫作，其名詞-動詞比率顯著高於中文母語寫作者。
與中文母語基準相比，他們的寫作表現出較低的動詞偏好（或較高的名詞偏好）。

這表明學習者內化的英語風格（透過名詞化表現的名詞偏好）干擾了他們對目標中文風格（動詞偏好）的習得，導致語篇可能聽起來不自然或帶有「翻譯腔」。

5. 教學啟示與建議

本研究超越診斷，提出了具體的教學介入措施：

明確的意識提升： 教師應明確教授本體論隱喻的概念，以及名詞偏好（英文）與動詞偏好（中文）的二分法。建議進行平行文本的對比分析。
聚焦的輸出練習： 設計強制使用動詞的練習。例如，「去名詞化」任務，讓學習者將生硬、名詞密集的翻譯句子轉換為自然、以動詞為中心的中文句子。
基於語料庫的教材： 開發教學材料，重點突出來自《人民日報》等母語語料庫的高頻動詞搭配和句型。
高階文體訓練： 對於高階學習者，納入透過動詞使用來達成簡潔性和動態感的訓練，這是有效中文散文的特徵。

6. 結論與未來研究

本研究為現代新聞體裁中假設的中文動詞偏好與英文名詞偏好提供了強有力的量化證據。它成功將這種表層語言模式與 Lakoff & Johnson 及 Link 所理論化的更深層認知機制——本體論隱喻——聯繫起來。此外，它實證地展示了這種類型學差異對第二語言習得的具體影響，揭示了英語母語中文學習者一個特定的母語干擾領域。研究結果強調了教學不僅要關注語法和詞彙，還要關注語言特有的修辭和認知風格的重要性。

7. 關鍵洞察與統計摘要

核心二分法

中文： 動詞偏好語言
英文： 名詞偏好語言

根本原因

本體論隱喻（Lakoff & Johnson, 1980）的差異應用。

對第二語言學習者的影響

強烈的母語遷移效應：英語母語學習者在中文寫作中動詞使用不足。

教學需求

需要對認知-文體差異進行明確指導，而不僅僅是語法。

8. 原創分析：核心洞察、邏輯脈絡、優點與缺陷、可行建議

核心洞察： 這篇論文以數據驅動的方式，有力地衝擊了「普遍主義」語言理論的核心。不僅僅是中文使用更多動詞；而是英文和中文體現了根本不同的認知包裝策略。根據 Link 的論點，英語是一個「名詞化」引擎，不斷將過程壓縮成靜態、可操作的實體——這種傾向在正式和學術語域中被放大，正如《朗文英語語法》（Biber 等人，1999）等語料庫研究所記載的。相比之下，中文更傾向於讓過程以動詞形式展開，從而形成一種更動態、以事件為導向的語篇風格。這不是一個次要的文體特點；而是一種根深蒂固的修辭習慣，對跨語言理解和第二語言習得具有實際影響。

邏輯脈絡： 論證結構優雅。它從既定的理論框架（Lakoff & Johnson 的隱喻理論）開始，將其與特定的語言觀察（Link 的名詞/動詞偏好）聯繫起來，然後用現代、可比較的數據（報紙語料庫）嚴格檢驗假設。最後一步——展示這種抽象差異如何具體地阻礙學習者——非常出色。它將理論語言學的發現轉化為一個迫切的應用語言學問題。研究方法使用標準化的自然語言處理工具進行詞性標註和統計驗證，反映了計算語言學的最佳實踐，使本研究超越了小規模手動分析的可信度。

優點與缺陷： 本研究的主要優勢在於其實證清晰度和教學相關性。它從軼事（Link 的文學例子）轉向系統性證據。然而，一個關鍵缺陷是其對名詞和動詞的二元聚焦。現代語料庫語言學，如 BYU 語料庫等項目所見，強調多維度分析。中文的動詞偏好是否與其他特徵相關，例如更高的代詞使用率或不同的子句連接策略？本研究也忽略了每種語言內部潛在的文體變異。中文的學術摘要與新聞報導中，動詞偏好是否同樣強烈？使用像中文學術寫作語料庫這樣的專門語料庫進行比較，可能會揭示細微差別。此外，雖然第二語言的發現具有顯著性，但它是描述性的。下一步需要進行實驗介入研究，以測試所提教學解決方案的有效性。

可行建議： 對於語言教育者來說，這是一項改變我們教學方式的指令。我們必須將對比修辭學和認知文體學整合到課程中。可以使用像Sketch Engine或LancsBox這樣的工具來創建自製的語境共現索引，讓學習者視覺化地比較母語文本和自己文本中的名詞-動詞比率。對於研究者而言，前進的道路包括：(1) 進行多特徵分析，以建立每種語言「偏好組合」的更完整圖像；(2) 進行神經語言學研究（使用功能性磁振造影或腦電圖），觀察處理名詞密集的中文句子是否會激活學習者大腦的不同區域；(3) 開發專門訓練的人工智慧寫作助手，用於標記學習者中文中的「過度名詞化」，類似於英文的文體檢查器。這項研究提供了診斷；業界的任務是建立治療方法。

9. 技術細節與數學框架

核心分析操作是名詞-動詞比率的計算和比較。對於給定的文本或語料庫 $T$：

$$NVR(T) = \frac{N_T}{V_T}$$

其中 $N_T$ 是名詞總數，$V_T$ 是動詞總數。

為了比較兩個語料庫 $C1$（例如，中文母語）和 $C2$（例如，學習者），本研究可能採用了獨立樣本 t 檢定。虛無假設 ($H_0$) 和對立假設 ($H_1$) 為：

$$ H_0: \mu_{NVR_{C1}} = \mu_{NVR_{C2}} $$ $$ H_1: \mu_{NVR_{C1}} \neq \mu_{NVR_{C2}} $$

檢定統計量計算為：$t = \frac{\bar{X}_1 - \bar{X}_2}{s_p \sqrt{\frac{2}{n}}}$，其中 $s_p$ 是合併標準差，$n$ 是每組的樣本大小（假設大小相等）。一個顯著的 p 值（通常 $p < 0.05$）導致拒絕 $H_0$，得出組間動詞-名詞偏好存在統計顯著差異的結論。

10. 實驗結果與圖表說明

圖 1（基於描述結果的假想視覺化）：各語料庫的平均名詞-動詞比率

[想像一個有三個長條的長條圖：]

長條 1（《紐約時報》）： 最高的長條。標籤：「高 NVR (~2.5:1?)」。代表強烈的名詞偏好。
長條 2（《人民日報》）： 最短的長條。標籤：「低 NVR (~0.8:1?)」。代表強烈的動詞偏好。
長條 3（學習者中文）： 中等高度的長條，顯著高於長條 2 但低於長條 1。標籤：「中等 NVR」。代表母語遷移效應——學習者的 NVR 介於母語英文和母語中文之間，傾向於其母語模式。

每個長條頂端的誤差線將表示每個語料庫內的變異性。長條 2 和長條 3 之間的雙星號 (**) 將表示統計顯著差異 (p < 0.01)。此圖將簡潔地概括本研究的兩個主要發現：跨語言分歧和第二語言干擾效應。

11. 分析框架：案例示範

情境： 分析學習者一個聽起來不自然的中文作文句子。

學習者句子（顯示母語遷移）： 「我對這個複雜問題的理解的缺乏導致了我的困惑的持續。」
名詞：理解、缺乏、困惑、持續。動詞：導致。此子句的 N/V 比率 = 4。

框架應用：

識別名詞化： 標記源自動詞/形容詞的抽象名詞：理解（來自理解）、缺乏（來自缺乏）、持續（來自持續）。
應用本體論隱喻視角： 該句子將四個抽象過程/狀態包裝為「實體」（理解、缺乏、困惑、持續）。這是一種英文風格、名詞密集的包裝方式。
為動詞偏好重組結構： 將名詞化「解包」成動詞/子句結構。
近似母語的修訂： 「因為我不太理解這個複雜的問題，所以一直感到很困惑。」
名詞：問題。動詞：理解、感到。N/V 比率 ≈ 0.5。

這個簡單的診斷和修訂框架直接將本研究的核心洞察應用於實際的錯誤修正。

12. 未來應用與研究方向

人工智慧用於語言學習與評估： 開發超越語法準確性、能評估文體和認知流利度的自然語言處理模型。人工智慧導師可以提供如下的回饋：「你的句子比該主題典型的母語寫作名詞密集度高 40%。請考慮使用更多動詞重寫。」
跨語言搜尋引擎優化與在地化： 對於內容行銷和在地化專家而言，這項研究至關重要。將英文行銷文案逐字翻譯成中文，可能會產生語義正確但修辭無效的文本。未來的工具可以根據目標語言的文體偏好（例如，為中文降低 NVR）來優化翻譯內容。
神經語言學與臨床研究： 調查特定的語言障礙或失語症是否會影響以類型學一致的方式處理或產出語言的能力（例如，中文失語症患者是否會失去動詞偏好？）。
擴展到其他語言對： 在其他語系中（例如，德文 vs. 泰文，阿拉伯文 vs. 日文）檢驗名詞/動詞偏好假設及其與本體論隱喻的聯繫。這可能導致繪製出「名詞化」與「動詞化」語言的類型學地圖。
縱向學習者研究： 追蹤學習者在不同教學介入（明確的文體訓練 vs. 隱性接觸）下隨時間變化的 N/V 比率，以找出克服母語遷移最有效的方法。

13. 參考文獻

Biber, D., Conrad, S., & Reppen, R. (1998). Corpus linguistics: Investigating language structure and use. Cambridge University Press.
Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman grammar of spoken and written English. Pearson Education.
Choi, S., & Gopnik, A. (1995). Early acquisition of verbs in Korean: A cross-linguistic study. Journal of Child Language, 22(3), 497-529.
Gentner, D. (1982). Why nouns are learned before verbs: Linguistic relativity versus natural partitioning. In S. A. Kuczaj II (Ed.), Language development: Vol. 2. Language, thought, and culture (pp. 301-334). Erlbaum.
Lakoff, G., & Johnson, M. (1980). Metaphors we live by. University of Chicago Press.
Link, P. (2013). An anatomy of Chinese: Rhythm, metaphor, politics. Harvard University Press.
Tardif, T. (1996). Nouns are not always learned before verbs: Evidence from Mandarin speakers' early vocabularies. Developmental Psychology, 32(3), 492-504.
Tardif, T., Gelman, S. A., & Xu, F. (1999). Putting the "noun bias" in context: A comparison of English and Mandarin. Child Development, 70(3), 620-635.
Yee, K. (2020). Cross-linguistic comparison of noun bias in early vocabulary development: Evidence from Wordbank. Proceedings of the 44th Annual Boston University Conference on Language Development.

目錄