Co je lingvistika korpusu?
Korpusová lingvistika studium jazyka pomocí příkladů z reálného života. Nejedná se o odvětví lingvistiky, ale o metodologii nebo přístup. Corpus , latinské slovo pro „tělo“, odkazuje na tělo přírodních textů a tento přístup zahrnuje objevování vzorců užívání jazyka prostřednictvím analýzy korpusu. Korpusová lingvistika prochází comebackem, protože počítačové programy revolucionizovaly tento přístup.
Rodičovské deníky dětské řeči, když poprvé získá jazyk, jsou jednoduchým příkladem korpusu, který lze poté studovat a naučit se jazykové vzorce. Výuka cizích jazyků v první polovině 20. století často používala korpusy cílového jazyka ke sestavování seznamů slovníků pro studenty. Významný lingvista Noam Chomsky nepovažoval použití korpusů za platný nástroj, protože věřil, že jazyková kompetence je důležitější než výkonnostní data. Časná korpusová lingvistika byla z velké části založena na předpokladu, že v přirozeném jazyce existuje omezený počet vět a že tyto věty mohou být shromažďovány a hodnoceny.
Po upadnutí laskavosti v 60. a 70. letech zažívá korpusová lingvistika oživení díky metodologickému použití počítače. Program shody je název softwaru, který lingvisté nejčastěji používají. Zatímco hledání vzorů v korpusu milionů slov by člověku trvalo příliš dlouho a výsledky by byly méně přesné, počítač dokáže vyhledávat a získávat informace za pouhé sekundy. Může vypočítat frekvenci, třídit data a využívat korpusy způsoby, které byly v minulosti nemožné.
Analýza založená na korpusu může zkoumat, jak registr ovlivňuje jazyk; vzorce používání jazyka, například to, jak muži a ženy různě používají otázky týkající se značek; rozsah, v jakém se používají jazykové vzorce; a faktory, které ovlivňují variabilitu používání jazyka. Výuka může těžit z korpusové lingvistiky při tvorbě učebních osnov, vývoji použitých materiálů a typu aktivit používaných ve třídě. Studenti by mohli mít z tohoto přístupu prospěch tím, že budou schopni jasněji určit různá použití a významy běžných slov, rozdíly související s psaným a mluveným jazykem a fráze a kolokace, které by mohli využít. Soubor dat, který je korpusem, je neustále aktualizován a je produktem sociálních interakcí v reálném životě. Korpusy jsou tedy naturalistická data, ke kterým lze snadno získat přístup, a zjištění lze zobecnit.