Содержание
1. Введение
Существительные и глаголы — это основные части речи, общие для всех человеческих языков. Исследования в области усвоения языка, такие как теория универсального преимущества существительных Гентнера (1982), предполагают, что существительные концептуально легче и усваиваются раньше. Однако сопоставительные исследования выявляют значительные различия в предпочтениях использования. Английский язык демонстрирует сильное предпочтение существительным, особенно в официальной и академической письменной речи, в то время как китайский язык проявляет явное предпочтение глаголам. Данное исследование эмпирически изучает этот контраст с использованием современных газетных корпусов и исследует его последствия для англоговорящих изучающих китайский язык.
2. Предпочтение существительных/глаголов и онтологическая метафора
Теоретически, расхождение в использовании существительных и глаголов проистекает из различной зависимости от онтологических метафор (Лакофф и Джонсон, 1980). Онтологическая метафора предполагает концептуализацию абстрактных идей, эмоций или процессов как конкретных сущностей. Английский язык часто номинализирует процессы (например, "my fear", "her decision"), рассматривая их как манипулируемые объекты. Китайский язык, напротив, склонен сохранять глагольную форму для прямого описания состояний и процессов (например, "我害怕", "她决定了"). Линк (2013) предоставил предварительные доказательства через литературные отрывки, но его выборка была ограничена. Данное исследование опирается на эту теоретическую основу для систематического количественного анализа.
3. Сравнительное исследование на основе корпусов
3.1 Источник исследовательских материалов
Для обеспечения репрезентативности современного языкового использования были созданы два корпуса:
- Китайский корпус: Статьи из «Жэньминь жибао» (《人民日报》), ведущей официальной газеты Китая.
- Английский корпус: Статьи из The New York Times, крупной американской газеты.
Были отобраны статьи за один и тот же период времени и на схожие темы (например, политика, экономика, культура), чтобы контролировать вариативность предметной области.
3.2 Метод исследования и обработка данных
Тексты были обработаны с использованием инструментов обработки естественного языка для морфологической разметки (POS-теггинга):
- Китайский язык: Использовалась китайская модель Stanford CoreNLP или POS-теггер Jieba.
- Английский язык: Использовалась английская модель Stanford CoreNLP.
Существительные (включая нарицательные и собственные) и глаголы (включая основные глаголы и вспомогательные в соответствующих контекстах) были автоматически идентифицированы и подсчитаны. Ключевым рассчитанным показателем было Соотношение существительных к глаголам (NVR):
$NVR = \frac{Count(Nouns)}{Count(Verbs)}$
Для определения значимости различий между корпусами проводились статистические тесты (например, t-тесты).
3.3 Результаты и анализ
Анализ подтвердил предполагаемый контраст:
Ключевые статистические результаты
- The New York Times (английский): Средний NVR ≈ 2.4 : 1 (Существительных значительно больше, чем глаголов).
- «Жэньминь жибао» (китайский): Средний NVR ≈ 1.1 : 1 (Существительные и глаголы более сбалансированы, с лёгким уклоном в сторону глаголов).
Различие было статистически значимым (p < 0.01), что убедительно подтверждает теорию о предпочтении существительных в английском языке по сравнению с предпочтением глаголов в китайском языке в современной журналистской прозе.
4. Влияние на англоговорящих изучающих китайский язык
Исследование дополнительно проанализировало письменные работы изучающих китайский язык среднего и продвинутого уровня, для которых английский является родным. Результаты показали, что средний NVR в их китайских сочинениях составляет приблизительно 1.8 : 1. Это соотношение значительно выше, чем у носителей китайского языка (ближе к 1.1:1), и тяготеет к английской модели. Это указывает на негативный перенос из их родного языка (английского), ведущий к недостаточному использованию глаголов и чрезмерной зависимости от номинализированных структур в их письменной речи на китайском как иностранном.
5. Обсуждение и педагогические выводы
Результаты имеют прямое значение для преподавания китайского языка как иностранного (TCFL):
- Повышение осведомлённости: Преподаватели должны явно обучать концепции предпочтения глаголов в китайском языке, противопоставляя её предпочтению существительных в английском.
- Обогащение входных данных: Предоставлять учащимся достаточное количество аутентичных материалов, подчёркивающих естественное использование глаголов в китайском языке.
- Целенаправленная практика: Разрабатывать упражнения, требующие преобразования неуклюжих номинализированных фраз (переводческого стиля) в более естественные глагольные конструкции.
- Коррекция ошибок: Систематически обращать внимание на "субстантивный" стиль письма в обратной связи для учащихся.
6. Ключевые выводы
- Эмпирическое подтверждение: Предоставляет убедительные, основанные на корпусах доказательства теоретической дихотомии предпочтения глаголов/существительных между китайским и английским языками.
- Перенос из родного языка: Ясно демонстрирует, как глубоко укоренившиеся грамматические паттерны родного языка (предпочтение существительных) сохраняются в речи на иностранном языке, влияя на стилистическую естественность.
- За пределами синтаксиса: Подчёркивает, что различие между языками не только синтаксическое, но и укоренено в когнитивных стилях (использование онтологической метафоры).
- Педагогический пробел: Выявляет конкретную, измеримую область (частотность использования глаголов), часто упускаемую из виду в традиционном обучении, сфокусированном на грамматике.
7. Оригинальный анализ и комментарий эксперта
Основная идея: Эта статья не просто о подсчёте слов; это криминалистический анализ когнитивного стиля, окаменевшего в грамматике. Реальная история заключается в том, как "субстанцентричное" мировоззрение английского языка, наследие его предпочтения онтологической метафоре, создаёт устойчивый стилистический акцент у изучающих китайский язык — акцент, который такие метрики, как NVR, теперь могут количественно оценивать с хирургической точностью. Исследование успешно соединяет часто разделяемые миры теоретической когнитивной лингвистики (Лакофф и Джонсон) и прикладных корпусных исследований усвоения второго языка.
Логическая последовательность: Аргументация элегантно линейна: Теория (Онтологическая метафора) -> Предварительное наблюдение (Литературный анализ Линка) -> Гипотеза (Современные медиа покажут то же разделение) -> Эмпирическая проверка (Корпусный анализ NYT vs. «Жэньминь жибао») -> Подтверждение -> Расширение (Влияет ли перенос из родного языка на речь на иностранном?) -> Вторая эмпирическая проверка (Анализ корпуса учащихся) -> Подтверждение -> Практические выводы. Это хрестоматийный пример прочного, поступательного дизайна исследования.
Сильные стороны и недостатки: Основная сила — методологическая строгость и чёткая операционализация (NVR). Использование сопоставимых газетных жанров контролирует регистр, что является частым недостатком в сопоставительных исследованиях. Однако анализ имеет слепые пятна. Во-первых, он рассматривает "существительное" и "глагол" как монолитные категории. Как показывают исследования проекта Universal Dependencies, важны тонкие различия (например, отглагольные существительные, лёгкие глаголы). Использует ли китайский язык больше конструкций с лёгкими глаголами (например, 进行讨论), которые технически содержат существительное, но функционируют как глаголы? Это может завышать подсчёт существительных. Во-вторых, исследование учащихся, вероятно, фиксирует способность, а не базовую компетенцию. Учащиеся злоупотребляют номинализацией, потому что не могут справиться со сложными глагольными цепочками, или это чистый перенос из родного языка? Протокол "думай вслух" мог бы это распутать.
Практические идеи: Для преподавателей: Это исследование предоставляет диагностический инструмент (NVR) и план лечения (контрастивное осознание). Для технологов: Это золотая жила для ИИ. Большие языковые модели (LLM), такие как GPT-4, всё ещё борются с генерацией стилистически естественного текста на втором языке. Включение функции потерь "предпочтения глаголов" или дообучение на корпусах со сбалансированным NVR может значительно улучшить естественность машинно-переведённого или сгенерированного ИИ китайского текста, выходя за рамки простой грамматической правильности. Для исследователей: Следующий шаг — динамический анализ. Инструменты вроде LIWC (Linguistic Inquiry and Word Count) или аналогичные пользовательские словари могут отслеживать, как NVR учащегося развивается со временем при целенаправленном обучении, предлагая чёткую метрику для педагогической эффективности.
8. Технические детали и математическая формулировка
Ключевая метрика, Соотношение существительных к глаголам (NVR), — это простая, но мощная описательная статистика:
$\text{NVR}_{corpus} = \frac{\sum_{i=1}^{n} N_i}{\sum_{i=1}^{n} V_i}$
Где $N_i$ — количество существительных в текстовом образце $i$, а $V_i$ — количество глаголов в текстовом образце $i$, по всем $n$ образцам в корпусе.
Для проверки значимости различий между двумя корпусами (например, носители китайского vs. изучающие китайский) обычно используется t-тест для независимых выборок:
$t = \frac{\bar{X}_1 - \bar{X}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$
где $\bar{X}_1$ и $\bar{X}_2$ — средние значения NVR двух групп, $n_1$ и $n_2$ — размеры выборок, а $s_p$ — объединённое стандартное отклонение.
9. Экспериментальные результаты и описание диаграммы
Описание диаграммы (представленной): Сгруппированная столбчатая диаграмма наглядно визуализирует результаты. На оси X три категории: "Носители английского (NYT)", "Носители китайского («Жэньминь жибао»)" и "Изучающие китайский как иностранный". Ось Y представляет Среднее соотношение существительных к глаголам (NVR).
- Столбец "Носители английского" самый высокий, достигает ~2.4.
- Столбец "Носители китайского" самый низкий, ~1.1.
- Столбец "Изучающие китайский как иностранный" находится посередине, ~1.8, наглядно демонстрируя эффект переноса — ближе к английскому, чем к родному китайскому.
Полоски погрешностей (представляющие стандартное отклонение) на каждом столбце показывают вариативность внутри каждой группы. Звёздочки над столбцами указывают на статистически значимые различия (p < 0.01) между всеми тремя группами.
10. Аналитическая структура: пример из практики
Пример: Анализ предложения учащегося
Результат учащегося (Переводческий стиль): "我对失败的可能性有考虑。" (Букв.: "У меня есть рассмотрение возможности неудачи.")
Анализ NVR: Существительные: 我 (я-местоимение, часто учитывается), 可能性 (возможность), 考虑 (рассмотрение-существительное). Глаголы: 有 (иметь). Приблизительный NVR = 3/1 = 3.0 (Очень высокий, похоже на английский).
Реформация, близкая к речи носителя (Предпочтение глаголов): "我考虑过可能会失败。" ("Я подумал, что могу потерпеть неудачу.")
Анализ NVR: Существительные: 我, 可能 (возможность?). Глаголы: 考虑过 (подумал), 会 (могу), 失败 (потерпеть неудачу). Приблизительный NVR = 2/3 ≈ 0.67 (Низкий, с преобладанием глаголов).
Этот микро-пример показывает, как аналитическая структура точно определяет место интерференции родного языка — номинализацию "考虑" (рассмотрение) и использование притяжательной конструкции — и направляет её исправление в сторону более естественной глагольной конструкции.
11. Будущие применения и направления исследований
- ИИ и NLP: Интегрировать NVR и подобные стилистические метрики в оценочные эталоны для машинного перевода и генерации текста. Разработать модели трансфера стиля, специально обученные корректировать "субстантивность" выходного текста в соответствии с нормами целевого языка.
- Адаптивные обучающие платформы: Создать помощники для письма, предоставляющие обратную связь в реальном времени по стилистическим метрикам, таким как NVR, помогая учащимся постепенно смещать свою речь к нормам целевого языка.
- Нейролингвистика: Использовать фМРТ или ЭЭГ для исследования, активирует ли обработка китайских предложений с высоким NVR (субстантивных) у изучающих второй язык иные области мозга по сравнению с носителями, связывая поведенческие паттерны с нейронной обработкой.
- Более широкие сопоставительные исследования: Применить эту структуру к другим языковым парам (например, немецкий vs. испанский, японский vs. корейский), чтобы составить типологию "субстантивно-ориентированных" vs. "глагольно-ориентированных" языков и усовершенствовать теорию онтологической метафоры.
- Лонгитюдные исследования: Отслеживать учащихся в течение многих лет, чтобы увидеть, сходится ли NVR естественным образом с нормами носителей через погружение или для устойчивого изменения необходимо явное обучение.
12. Список литературы
- Biber, D., Conrad, S., & Reppen, R. (1998). Corpus linguistics: Investigating language structure and use. Cambridge University Press.
- Gentner, D. (1982). Why nouns are learned before verbs: Linguistic relativity versus natural partitioning. In S. A. Kuczaj II (Ed.), Language development: Vol. 2. Language, thought, and culture (pp. 301–334). Erlbaum.
- Lakoff, G., & Johnson, M. (1980). Metaphors we live by. University of Chicago Press.
- Link, P. (2013). An anatomy of Chinese: Rhythm, metaphor, politics. Harvard University Press.
- Tardif, T. (1996). Nouns are not always learned before verbs: Evidence from Mandarin speakers' early vocabularies. Developmental Psychology, 32(3), 492–504.
- Tardif, T., Gelman, S. A., & Xu, F. (1999). Putting the "noun bias" in context: A comparison of English and Mandarin. Child Development, 70(3), 620–635.
- Zhu, Y., Yan, S., & Li, S. (2021). International Journal of Chinese Language Teaching, 2(2), 32-43. (Анализируемая статья).
- Universal Dependencies Consortium. (2023). Universal Dependencies. https://universaldependencies.org/
- Pennebaker, J.W., Boyd, R.L., Jordan, K., & Blackburn, K. (2015). The development and psychometric properties of LIWC2015. University of Texas at Austin.