Skip to main content

Каковы наиболее важные концепции интеллектуального анализа данных?

Наиболее важные концепции интеллектуального анализа данных используются для анализа собранной информации, прежде всего в целях наблюдения за поведением. Неизвестные взаимодействия между данными исследуются различными способами, чтобы установить критические отношения между субъектами и агрегированной информацией. Одна из проблем в области интеллектуального анализа данных заключается в том, что фактическая собранная информация может не напоминать весь домен. В попытках устранить этот факт корреляции между данными могут методично контролироваться различными концепциями интеллектуального анализа данных.

Стандарты для концепций интеллектуального анализа данных применяются Специальной группой по вычислительным машинам для обнаружения знаний и интеллектуального анализа данных (SIGKDD). Эта организация публикует «Международный журнал информационных технологий и принятия решений», а также журнал SIGKDD Explorations. Обеспечение соблюдения этических норм и базовых принципов интеллектуального анализа данных обеспечивает эффективную работу отрасли и ограниченные правовые проблемы.

Предварительная обработка информации является одним из наиболее важных аспектов интеллектуального анализа данных. Необработанные данные должны быть добыты и интерпретированы. Для выполнения этого действия необходимо определить процесс, собрать целевые данные и найти шаблоны. Этот процесс известен как « Знание знаний в базах данных» и был разработан Григорием Пятецким-Шапиро в 1989 году.

Четыре различных класса концепций интеллектуального анализа данных позволяют осуществлять этот процесс. Кластеризация использует алгоритм, созданный в процессе интеллектуального анализа данных, для объединения элементов в похожие группы. В отличие от кластеризации, классификация информации - это когда данные собираются в предварительно определенные группы и анализируются. Ассоциация пытается найти отношения между переменными, определяя, какие группы данных обычно связаны. Последний тип интеллектуального анализа данных - это регрессия , основанная на методе определения функции в рамках сбора данных.

Проверка информации - это последний шаг в поиске того, что представляет собой приложение для интеллектуального анализа данных. Когда не все алгоритмы представляют допустимый набор данных, возникающие шаблоны могут привести к ситуации, называемой переоснащением. Чтобы преодолеть эту проблему, данные сравниваются с тестовым набором. Это концепция, в которой измерения согласованы с рядом алгоритмов, которые обеспечили бы правдоподобный набор наборов данных. Если полученная информация не соответствует тестовому набору, то предполагаемые шаблоны в данных должны быть неточными.

Некоторые из наиболее важных концепций интеллектуального анализа данных встречаются в различных отраслях. В играх, бизнесе, маркетинге, науке, технике и надзоре используются методы интеллектуального анализа данных. Проводя эти методы, каждая область может определить лучшие методы или лучшие способы найти результаты.