Skip to main content

Что такое распознавание именованных сущностей?

Хотя с точки зрения конечного пользователя процесс ввода данных в компьютер довольно прост, этот процесс фактически инициирует несколько других более мелких процессов. Для каждой части данных компьютер должен перевести эту информацию на язык, который он понимает. Компьютеры используют внутренний язык, известный как двоичный, в котором совокупность символов «1» и «0» формируется вместе, чтобы сообщать компьютеру, что делать. Распознавание именованных объектов - это метод оптимизации процесса перевода от ввода к данным, помогающий компьютеру разбивать предложения на составные части.

Когда вы вводите данные с использованием большинства компьютерных программ или веб-страниц, программа или веб-страница обычно запрашивают ввод определенной части информации в каждое поле, например в поля «Имя» или «Адрес». Программа распознавания именованных сущностей устраняет большинство из этого, позволяя конечному пользователю вместо этого вводить строки - предложения - текста, обеспечивая более естественный интерфейс. Программа берет введенные вами данные и сортирует их по частям, чтобы их было легче понять.

Возьмите такое предложение, как «Джо заказал четыре бушеля бананов». В традиционной программе конечный пользователь должен будет ввести «Джо» в поле «Имя сотрудника», «Бананы» в поле «Тип покупки», «четыре» в поле «Количество» и «Бушели» в поле «Единицы». В настройке распознавания именованного объекта конечный пользователь просто вводит все предложение, как написано. Как только пользователь нажимает кнопку «Отправить», компьютер сортирует предложение на части, выполняя ту же разбивку данных, которую ранее использовал пользователь.

Хотя это гораздо более упорядочено, чем традиционная входная программа, разработанная из полей, есть один существенный недостаток: потенциальная ошибка алгоритма перевода. Менее интеллектуальные алгоритмы распознавания именованных сущностей могут «понимать» предложение только одним конкретным способом. Другими словами, если сотрудник перефразировал предложение и написал «Джо заказал четыре бушеля бананов», программе может быть сложно понять и разобрать части. По этой причине, хотя конечный пользователь больше не отвечает за ввод данных в поля, он все еще не так свободен, как может показаться вначале.