Skip to main content

Что такое распознавание образов?

Распознавание образов - это способность системы распознавать шаблоны в наборах данных, опираясь как на запрограммированные, так и на усвоенные знания. Это важная часть информатики, поскольку она позволяет разрабатывать системы, способные к сложному анализу данных. Это может помочь исследователям быстро отсортировать данные, чтобы найти значимую информацию, поскольку им не нужно вручную просматривать данные, чтобы найти интересные места. Распознавание образов также может быть полезно для выявления ошибок, мошенничества и других проблем в наборах данных.

Это отличается от сопоставления с образцом, в котором система может точно сопоставлять материалы, используя известную базу данных. Яркий пример этого различия можно увидеть в фильтрах электронной почты. Многие сетевые учетные записи электронной почты поставляются с папкой для спама. Провайдер электронной почты сканирует входящую почту и использует распознавание образов для выявления спама и размещения его в этой папке. Пользователь может также отфильтровать свою электронную почту, попросив клиента удалить электронную почту от определенного отправителя или с определенным содержимым в определенную папку.

Для проверки на спам требуется способность распознавать общие шаблоны, такие как наличие определенных слов, известные подозрительные адреса интернет-протокола (IP) и другие красные флажки, которые могут пометить письмо как поддельное. Это более продвинутый, чем фильтр, который просто просит систему сопоставить шаблоны. Если система видит слово или отправителя, которые соответствуют шаблону, она может переместить электронное письмо в соответствующую папку.

Сложные алгоритмы поддерживают распознавание образов. Система может использовать несколько средств для изучения поступающих данных и определения наилучших способов их обработки. Он может быть запрограммирован на выполнение определенных функций, таких как маршрутизация подозрительных или поврежденных данных в определенное место, содержательная классификация данных и так далее. Система способна к обучению и использует это как инструмент для улучшения распознавания образов. Например, каждый раз, когда пользователь отмечает электронную почту как спам, система сканирует электронную почту, чтобы узнать о ней больше, и система не будет продолжать совершать ошибку, помещая подобные электронные письма в папку «Входящие».

Компьютерные ученые разрабатывают новые методы распознавания образов в лабораторных и исследовательских условиях. Они могут быть применены к различным задачам и требуют построения нейронных сетей, способных взаимодействовать с данными и изменяться во времени. Некоторые программы чрезвычайно сложны и способны к очень детальному распознаванию образов, а другие более просты. Такие программы сокращают количество человеко-часов, необходимых для анализа данных, и могут отлавливать вещи, которые человек может упустить, например, доказательства мошенничества в виде нарушений, охватывающих тысячи страховых случаев.