Co to jest językoznawstwo korpusowe?
Językoznawstwo korpusowe badanie języka na rzeczywistych przykładach. To nie jest dziedzina językoznawstwa, ale metodologia lub podejście. Corpus , łacińskie słowo „ciało”, odnosi się do treści tekstów naturalnych, a podejście polega na odkrywaniu wzorców używania języka poprzez analizę korpusu. Językoznawstwo korpusów powraca, ponieważ programy komputerowe zrewolucjonizowały to podejście.
Dzienniki rodziców wypowiedzi dziecka, gdy po raz pierwszy uczy się języka, jest prostym przykładem korpusu, który można następnie zbadać, aby poznać wzorce językowe. Nauczanie języków obcych w pierwszej połowie XX wieku często wykorzystywało korpusy języka docelowego do sporządzania list słownictwa dla studentów. Wybitny językoznawca Noam Chomsky nie uważał korzystania z korpusu za ważne narzędzie, ponieważ uważał, że kompetencje językowe są ważniejsze niż dane dotyczące wydajności. Wczesna językoznawstwo korpusowe opierało się w dużej mierze na założeniu, że w języku naturalnym istnieje ograniczona liczba zdań oraz że zdania te można gromadzić i oceniać.
Po upadku z łask w latach 60. i 70. lingwistyka korpusowa przeżywa renesans z powodu metodologicznego korzystania z komputera. Program zgodności to nazwa oprogramowania najczęściej używanego przez lingwistów. Podczas gdy wyszukiwanie wzorców w korpusie milionów słów zajęłoby człowiekowi zbyt dużo czasu, a wyniki byłyby mniej niż dokładne, komputer może wyszukiwać i pobierać informacje w zaledwie kilka sekund. Może obliczać częstotliwość, sortować dane i wykorzystywać ciała w sposób, który był niemożliwy w przeszłości.
Analiza oparta na korpusie może sprawdzić, w jaki sposób rejestr wpływa na język; wzorce używania języka, takie jak mężczyźni i kobiety w różny sposób wykorzystują pytania z tagami; zakres, w jakim stosowane są wzorce językowe; oraz czynniki wpływające na zmienność użycia języka. Nauczanie może skorzystać z lingwistyki korpusowej przy projektowaniu programu nauczania, rozwoju wykorzystywanych materiałów i rodzaju zajęć wykorzystywanych w klasie. Uczniowie mogliby skorzystać z tego podejścia, umożliwiając bardziej jednoznaczne określenie różnych zastosowań i znaczeń popularnych słów, różnic związanych z językiem pisanym i mówionym oraz zwrotów i kolokacji, z których mogliby korzystać. Zbiór danych, który jest ciałem, jest stale aktualizowany i jest produktem rzeczywistych interakcji społecznych. Korpusy są zatem naturalistycznymi danymi, do których można łatwo uzyskać dostęp, a wyniki można uogólnić.