Qu'est-ce que la technologie sémantique?
La technologie sémantique est un concept en informatique qui vise à apporter la sémantique - la signification et le contexte des mots et des phrases - au monde des ordinateurs. Un certain nombre d'approches pour la mise en œuvre du concept ont été développées, allant de l'intelligence artificielle avancée aux descriptions formelles de contenu lisibles par machine. Le Web est un élément clé de la technologie sémantique, même s'il peut également profiter aux entreprises et aux milieux universitaires.
Bien que les ordinateurs excellent en calcul mathématique, ils luttent contre de nombreux aspects du langage humain, en particulier la sémantique. Un programme informatique peut vaincre même les plus habiles des humains dans une partie d'échecs, mais serait moins rentable dans un jeu-questionnaire contre un enfant car il lui est impossible d'interpréter avec précision le contexte, la signification et les subtilités du langage dans les questions. Cela a des implications pour un grand nombre d'applications et de services: sans une compréhension approfondie du contexte, un moteur de recherche peut ne pas donner des résultats précis pour des mots ayant plusieurs significations, tels que désert et froid, et un logiciel de reconnaissance vocale peut avoir des difficultés avec les mots idem, sch comme "sorcière" et "qui".
Pour donner aux ordinateurs un meilleur aperçu de la signification des mots et de leurs relations, les chercheurs et les promoteurs de la technologie sémantique ont mis au point un certain nombre d'approches, dont beaucoup se répartissent en deux grandes catégories: améliorer la capacité des ordinateurs à analyser et à comprendre le langage, et rendre le contenu existant plus lisible par machine. Parmi les exemples de la première approche, citons l'intelligence artificielle avancée et les technologies de traitement parallèle conçues pour donner aux ordinateurs les capacités de pensée critique de style humain nécessaires pour discerner le contenu pertinent et non pertinent. La deuxième catégorie comprend les techniques d'étiquetage de contenu sur le Web, ainsi que les ontologies - des descriptions formelles de concepts pouvant être uniques à un domaine spécialisé, tel que la biologie ou l'ingénierie.
Le World Wide Web est un point central pour la technologie sémantique et beaucoup espèrent voir émerger un Web de nouvelle génération dans lequel des connaissances sous différentes formes pourront être plus facilement manipulées, découvertes et partagées par les agents logiciels. Ce Web sémantique, comme on l'appelle maintenant, a été imaginé par les forces à l'origine du Web original dès la fin des années 1990. Bien que le Web sémantique n’ait pas encore exploité tout son potentiel, certains aspects de la technologie sémantique sont déjà banalisés en ligne. De nombreux moteurs de recherche, par exemple, examinent maintenant les pages Web à la recherche de types spéciaux de métadonnées, un type d'informations décrivant d'autres informations. Un type de métadonnées peut spécifier à un moteur de recherche qu'une série de chiffres est un numéro de téléphone ou une adresse physique, tandis qu'un autre type peut marquer un bloc de texte en tant qu'examen d'utilisateur d'une entreprise ou d'un produit.
La technologie sémantique pourrait également profiter à un grand nombre d'industries et de disciplines universitaires. Les annonceurs en ligne se tournent vers ce que l’on appelle le ciblage sémantique pour analyser le contenu d’une page Web et diffuser des annonces pertinentes. Les grandes entreprises et les grandes entreprises souhaitent éliminer les problèmes de compatibilité entre différents systèmes de technologie de l’information, avec des architectures logicielles et de bases de données qui permettent de mieux comprendre la signification et le contexte de différents contenus. Pour les universitaires et les chercheurs, des ontologies spécifiques à certaines disciplines permettraient aux ordinateurs de rechercher et de regrouper des recherches pertinentes sur des sujets très spécialisés, tels qu'un marqueur protéique particulier, permettant ainsi aux humains de passer plus de temps à analyser et à mener des recherches plutôt que de les rechercher.