Skip to main content

Что такое корпусная лингвистика?

Корпус лингвистики - изучение языка на реальных примерах. Это не раздел лингвистики, а методология или подход. Корпус , латинское слово «тело», относится к телу естественных текстов, и этот подход включает в себя обнаружение закономерностей использования языка посредством анализа корпуса. Корпус-лингвистика переживает возвращение, так как компьютерные программы произвели революцию в подходе.

Родительские дневники речи ребенка, когда он впервые овладевает языком, являются простым примером корпуса, который затем можно изучить для изучения языковых моделей. Преподавание иностранных языков в первой половине 20-го века часто использовало корпуса целевого языка для составления словарных списков для студентов. Выдающийся лингвист Ноам Хомский не считает использование корпусов эффективным инструментом, так как считает, что языковая компетенция важнее данных о производительности. Ранняя корпусная лингвистика в значительной степени основывалась на предположении, что на естественном языке существует ограниченное количество предложений и что эти предложения можно собирать и оценивать.

После того, как в 60-х и 70-х годах он потерял популярность, корпусное языкознание переживает возрождение из-за методологического использования компьютера. Программа согласования - это название программного обеспечения, наиболее часто используемого лингвистами. Хотя поиск шаблонов в корпусе из миллионов слов потребует слишком много времени для человека, а результаты будут менее точными, компьютер может искать и извлекать информацию за считанные секунды. Он может рассчитывать частоту, сортировать данные и эксплуатировать корпуса способами, которые были невозможны в прошлом.

Анализ на основе корпусов может изучить, как регистр влияет на язык; модели использования языка, например, как мужчины и женщины по-разному используют вопросы с тегами; степень использования языковых моделей; и факторы, которые влияют на вариативность использования языка. Преподавание может извлечь пользу из корпусной лингвистики при разработке учебного плана, разработке используемых материалов и видов деятельности, используемых в классе. Студенты могут извлечь выгоду из этого подхода, имея возможность более четко определить различные варианты использования и значения общих слов, различия, присущие письменному и устному языку, а также фразы и словосочетания, которые они могут использовать. Объем данных, который является корпусом, постоянно обновляется и является продуктом реальных социальных взаимодействий. Таким образом, корпуса представляют собой натуралистические данные, к которым можно легко получить доступ, и результаты могут быть обобщены.