Qu'est-ce que la linguistique informatique?
La linguistique computationnelle est un domaine général qui englobe de nombreux aspects de la psychologie, de la linguistique, de la logique et de l'informatique. Il s'agit d'aider les ordinateurs à comprendre les problèmes linguistiques afin de mieux automatiser les aspects de la traduction, de la génération, de la parole et de la compréhension.
La linguistique informatique est née après plusieurs tentatives infructueuses de traduction automatique. À la fin des années 1940, le gouvernement des États-Unis a estimé qu'il était nécessaire de procéder à une traduction automatique des textes, en particulier des textes russes. Compte tenu de la facilité avec laquelle les ordinateurs ont été adaptés pour traiter des problèmes mathématiques, on a supposé que leur apprendre à traduire une langue serait une simple affaire. Il devint rapidement évident que le problème était beaucoup plus difficile, cependant, et la discipline de la linguistique informatique fut créée.
Aux débuts de la linguistique informatique, le domaine était dominé par les informaticiens. Cependant, depuis les années 1970, la complexité du langage est devenue une évidence. La linguistique informatique contemporaine fait appel à des experts de nombreux domaines.
La traduction automatique a toujours été un objectif majeur de la linguistique informatique et un domaine dans lequel le domaine a fait d’énormes progrès. La tâche est très complexe et nécessite l'identification de parties du discours, une compréhension de la grammaire, un vocabulaire étendu et des mécanismes permettant de gérer les expressions familières et l'argot. La traduction automatique est loin d'être parfaite, mais chaque année, les traductions deviennent plus précises et moins forcées.
La reconnaissance de la parole est un autre domaine de la linguistique informatique qui a suscité beaucoup d'intérêt du public. Après quelques tentatives infructueuses avec un logiciel de reconnaissance vocale grand public au milieu des années 90, le champ est resté silencieux pendant un certain temps. Au début du 21e siècle, cependant, un certain nombre de nouvelles suites logicielles de reconnaissance vocale sont arrivées sur le marché, dotées de systèmes d’apprentissage étendus et de taux de précision élevés. Cela a suscité un regain d'intérêt du grand public pour les logiciels de reconnaissance vocale, ainsi qu'une augmentation des financements et de la recherche.
La génération de la parole est un domaine connexe de la linguistique informatique qui a connu un développement constant depuis les années 1980. Obtenir une lecture naturelle du texte écrit est un problème très difficile, mais qui offre d’énormes avantages potentiels. Pour les utilisateurs non-voyants, un logiciel de génération de parole peut être essentiel pour profiter des fruits de l'ère numérique.
La linguistique informatique joue également un rôle important dans les systèmes automatisés de correction grammaticale, tels que ceux intégrés aux traitements de texte les plus courants. Un vérificateur de grammaire précis requiert une capacité sophistiquée d'identification de parties du discours ainsi qu'une liste complète de règles grammaticales et d'exceptions. Bien que la plupart des vérificateurs de grammaire traditionnels aient encore de nombreux problèmes, ils deviennent déjà indispensables pour beaucoup de la nouvelle génération.
La linguistique informatique est un domaine passionnant qui fait appel à un large éventail de disciplines. Les problèmes auxquels il doit faire face sont nombreux et aucun n'est simple. Les visions futuristes qu’il attend avec impatience en font cependant une lutte qui en vaut la peine. Du rêve d’un traducteur universel à la reconnaissance vocale parfaite, les objectifs de la linguistique informatique ne peuvent que susciter un sentiment d’émerveillement.