O que é reconhecimento de entidade nomeada?
Embora, na perspectiva do usuário final, o processo de entrada de dados em um computador seja bastante simples, na verdade, o processo inicia vários outros processos menores. Para cada pedaço de dados, o computador deve traduzir essas informações para o idioma que entender. Os computadores usam um idioma interno conhecido como binário, no qual uma coleção de caracteres "1" e "0" se forma para informar ao computador o que fazer. O reconhecimento de entidade nomeada é um método de otimizar o processo de conversão de entrada para dados, ajudando o computador a dividir frases em suas partes componentes.
Quando você insere dados usando a maioria dos programas ou páginas da Web, o programa ou a página da Web geralmente solicita que você insira uma informação específica em cada campo, como os campos "Nome" ou "Endereço". Um programa de reconhecimento de entidade nomeado acaba com a maior parte disso, permitindo que o usuário final insira seqüências de caracteres - frases - de texto, fornecendo uma interface mais natural. O programa pega os dados que você inseriu e os classifica em partes que eles podem entender mais facilmente.
Tome uma frase como "Joe pediu quatro alqueires de bananas". Em um programa tradicional, o usuário final teria que inserir "Joe" no campo "Nome do funcionário", "Bananas" no campo "Tipo de compra", "quatro" no campo "Quantidade" e "alqueires" em o campo "Unidades". Em uma configuração de reconhecimento de entidade nomeada, o usuário final simplesmente inseria a frase inteira como escrita. Assim que o usuário clica em enviar, o computador classifica a sentença em partes, realizando o mesmo detalhamento dos dados que o usuário usaria anteriormente.
Embora isso seja muito mais simplificado do que um programa de entrada tradicional projetado a partir de campos, há uma desvantagem substancial: falha potencial do algoritmo de conversão. Algoritmos de reconhecimento de entidade nomeados menos inteligentes podem apenas "entender" a sentença de uma maneira específica. Em outras palavras, se o funcionário reformulasse a frase e escrevesse "Quatro alqueires de bananas foram encomendados por Joe", o programa poderá ter dificuldade em entender e classificar as peças. Por esse motivo, mesmo que o usuário final não seja mais responsável por inserir dados nos campos, ele ainda não é tão livre como o sistema pode parecer à primeira vista.