Co je zpracování přirozeného jazyka?
Zpracování přirozeného jazyka (NLP) je způsob překladu mezi počítačovými jazyky a lidskými jazyky. Cílem tohoto pole je umožnit počítačům porozumět tomu, co text říká, aniž by jim byly dány přesné hodnoty a rovnice pro data, která text obsahuje. Zpracování přirozeného jazyka v podstatě automatizuje proces překladu mezi lidským a počítačovým jazykem. Zatímco většina z tohoto pole se spoléhá na statistiky a modely, aby určila pravděpodobné významy věty, existuje a existuje mnoho různých přístupů k tomuto problému. Nálezy v této oblasti mají uplatnění v oblasti rozpoznávání řeči, překladu v lidském jazyce, získávání informací a dokonce i umělé inteligence.
Zpracování přirozeného jazyka, vycházející z pozadí v informatice a lingvistice, čelí mnoha problémům, protože jazyk není vždy konzistentní a ne všechna vodítka k významu jsou obsažena v samotném jazyce. Dokonce ani úplný popis celé gramatiky jazyka včetně všech výjimek neumožňuje počítači analyzovat informace obsažené v textu. Některé věty jsou syntakticky nejednoznačné, slova často mají více než jeden význam a některé kombinace zvuků nebo symbolů mění svůj význam v závislosti na hranicích slov - to vše může být problém pro počítač, který nerozumí kontextu. Ještě důležitější je, že hodně jazyka závisí na spojení s fyzickým a sociálním vesmírem - některé věty, jako jsou řečové akty, nepřinášejí informace tolik, jako jednání o světě. I když počítač dokonale rozumí syntaxi a sémantice lidského jazyka, musí být analyzovaný text prostý lidských zařízení, jako je sarkazmus nebo pasivní agrese, aby počítač mohl správně zjistit, co text znamená.
Ideologicky je zpracování přirozeného jazyka systém interakce člověk-počítač, který je řízen myšlenkou, že většina uživatelů počítačů pohodlněji pracuje s počítači v lidském jazyce, který již znají, než se přizpůsobit jazyku počítače. Využívá také skutečnosti, že velká část lidských znalostí je již zakódována v lidském jazyce a texty, které tyto znalosti obsahují, lze převést do logických struktur, které lze pro počítač zefektivnit. Zatímco mnoho projektů v této oblasti pracuje na extrahování počítačem čitelných dat z textů lidského jazyka, zpracování přirozeného jazyka se také používá ke generování textů čitelných člověkem z počítačových dat. Obě tato zařízení pro porozumění a generování mohou být použita stejnou technologií, jako například v případě aplikací, které se překládají z jednoho lidského jazyka do jiného nejprve dekódováním textu do počítačového jazyka a poté kódováním v jiném lidském jazyce. Inovace získané ve snahách o zpracování přirozeného jazyka jsou také nápadně aplikovatelné na projekty umělé inteligence kvůli míře, do jaké je lidská inteligence definována zvládnutím složitosti lidského jazyka.