Wat is Corpus-taalkunde?
Corpuslinguïstiek de studie van taal met behulp van real-life voorbeelden. Het is geen tak van de taalkunde, maar een methodologie of aanpak. Corpus , het Latijnse woord voor 'lichaam', verwijst naar het lichaam van natuurlijke teksten, en de benadering omvat het ontdekken van patronen van taalgebruik door analyse van het corpus. Corpus-taalkunde maakt een comeback door, omdat computerprogramma's een revolutie teweeg hebben gebracht in de aanpak.
Ouderlijk dagboeken van de spraak van een kind wanneer het eerst taal verwerft, is een eenvoudig voorbeeld van een corpus dat vervolgens kan worden bestudeerd om taalpatronen te leren. Vreemdetalenonderwijs gebruikte in de eerste helft van de 20e eeuw vaak corpora van de doeltaal om woordenlijsten voor studenten samen te stellen. De eminente taalkundige Noam Chomsky beschouwde het gebruik van corpora niet als een geldig hulpmiddel, omdat hij geloofde dat taalcompetentie belangrijker was dan prestatiegegevens. Vroege corpuslinguïstiek was grotendeels gebaseerd op de veronderstelling dat er een beperkt aantal zinnen in een natuurlijke taal is en dat die zinnen kunnen worden verzameld en geëvalueerd.
Na in de jaren '60 en '70 uit de gratie te zijn geraakt, beleeft de corpuslinguïstiek een opleving door het methodologische gebruik van de computer. Het concordantieprogramma is de naam van de software die het meest wordt gebruikt door taalkundigen. Hoewel het doorzoeken van patronen in een corpus van miljoenen woorden te lang zou duren voor een mens en de resultaten minder dan nauwkeurig zouden zijn, kan een computer binnen enkele seconden informatie zoeken en ophalen. Het kan frequentie berekenen, gegevens sorteren en corpora exploiteren op manieren die in het verleden onmogelijk waren.
Op Corpus gebaseerde analyse kan onderzoeken hoe register taal beïnvloedt; patronen van taalgebruik, zoals hoe mannen en vrouwen verschillend gebruik maken van tagvragen; de mate waarin taalpatronen worden gebruikt; en de factoren die de variabiliteit van taalgebruik beïnvloeden. Lesgeven kan baat hebben bij corpuslinguïstiek bij het ontwerpen van de syllabus, de ontwikkeling van de gebruikte materialen en het soort activiteiten dat in de klas wordt gebruikt. Studenten zouden van de aanpak kunnen profiteren door beter in staat te zijn om de verschillende gebruiken en betekenissen van veelvoorkomende woorden, de verschillen die inherent zijn aan geschreven en gesproken taal, en zinnen en collocaties die ze zouden kunnen gebruiken te bepalen. Het geheel van gegevens dat het corpus is, wordt voortdurend bijgewerkt en is het product van real-life sociale interacties. De corpora zijn dus naturalistische gegevens die gemakkelijk toegankelijk zijn en de bevindingen kunnen worden gegeneraliseerd.