코퍼스 언어학이란?
코퍼스 언어학은 실제 사례를 사용하여 언어를 연구합니다. 그것은 언어학의 한 가지가 아니라 방법론이나 접근법입니다. "본문"의 라틴어 인 코퍼스 (Corpus )는 자연 본문의 본문을 말하며, 그 접근 방식은 코퍼스 분석을 통해 언어 사용 패턴을 발견하는 것입니다. 컴퓨터 프로그램이 이러한 접근 방식에 혁명을 일으켜 코퍼스 언어학이 복귀하고 있습니다.
아이가 처음 언어를 습득했을 때의 부모의 일기는 언어 패턴을 배우기 위해 공부할 수있는 간단한 말뭉치입니다. 20 세기 전반의 외국어 교육은 종종 대상 언어의 코 도라를 사용하여 학생들을위한 어휘 목록을 작성했습니다. 저명한 언어학자인 노암 촘스키 (Nam Chomsky)는 언어 능력이 성능 데이터보다 중요하다고 믿었 기 때문에 코 도라의 사용을 유효한 도구로 간주하지 않았습니다. 초기 코퍼스 언어학은 주로 자연 언어로 제한된 수의 문장이 있으며 이러한 문장을 수집하고 평가할 수 있다는 가정에 기반을두고있었습니다.
60 년대와 70 년대에 호의를 잃은 후 코퍼스 언어학은 컴퓨터의 방법 론적 사용으로 인해 부흥을 경험하고 있습니다. 일치 프로그램은 언어학자가 가장 일반적으로 사용하는 소프트웨어의 이름입니다. 수백만 단어의 모음에서 패턴을 검색하는 것은 인간에게는 너무 많은 시간이 걸리고 결과는 정확하지는 않지만 컴퓨터는 단 몇 초 만에 정보를 검색하고 검색 할 수 있습니다. 과거에는 불가능했던 방식으로 빈도를 계산하고, 데이터를 정렬하고, corpora를 이용할 수 있습니다.
코퍼스 기반 분석은 레지스터가 언어에 미치는 영향을 조사 할 수 있습니다. 남성과 여성이 태그 질문을 다르게 사용하는 방법과 같은 언어 사용 패턴; 언어 패턴이 사용되는 정도; 언어 사용의 가변성에 영향을 미치는 요소. 교육은 강의 계획서 디자인, 사용 된 자료의 개발 및 강의실에서 사용되는 활동의 유형에있어서 코퍼스 언어학의 혜택을받을 수 있습니다. 학생들은 일반적인 단어의 다른 용도와 의미, 서면 및 구어에 내재 된 차이점, 사용할 수있는 구와 배열을보다 명확하게 결정할 수있어 접근 방식의 이점을 얻을 수 있습니다. 말뭉치 인 데이터 본문은 지속적으로 업데이트되며 실제 사회적 상호 작용의 결과물입니다. 따라서 코도라는 자연스럽게 접근 할 수있는 자연 데이터이며 결과를 일반화 할 수 있습니다.