Skip to main content

Что такое Data Stream Mining?

Анализ потока данных - это стратегия, которая включает в себя идентификацию и извлечение информации из активного потока данных. При таком подходе идея заключается в извлечении данных без какого-либо прерывания в самом потоке, что позволяет другим также использовать данные даже во время извлечения. Этот тип анализа данных может включать в себя все виды данных, от передачи голоса до видео через Интернет и даже повседневных задач, таких как снятие денег с банковского счета с помощью банкомата или проведение телефонного разговора.

Одной из характеристик интеллектуального анализа потока данных является способность точно спроектировать или предсказать, как найти требуемую информацию и какие инструменты обнаружения знаний помогут найти и успешно извлечь нужную информацию. Например, когда клиент инициирует транзакцию, используя банкомат, программирование для автомата инициирует поиск соответствующей информации об учетной записи, находит данные и затем определяет, уменьшит ли сумма транзакции остаток на счете ниже допустимой суммы, в зависимости от структуры счета. После этого программирование может возвращать соответствующие данные пользователю, например, документировать успешное завершение запрошенной транзакции и предоставлять остаток на счете, оставшийся после записи кредита или дебета, связанных с транзакцией.

Другим распространенным примером интеллектуального анализа потоков данных является базовый веб-поиск с использованием браузера. С помощью этого приложения конечный пользователь вводит значения поиска в поле, а программное обеспечение, которое управляет браузером, пытается интерпретировать эти значения и возвращать данные, которые имеют некоторое отношение к критериям поиска. В зависимости от того, как настроен браузер, это может также включать в себя функцию, которая стремится предвидеть цель проводимого поиска и предлагать дополнительные слова или фразы, которые могут помочь улучшить поиск по вкусу пользователя. Как только пользователь выбрал поисковую фразу, браузер возвращает результаты в порядке ранжирования, используя алгоритмы, которые имеют отношение к конфигурации самого браузера.

Одним из главных преимуществ интеллектуального анализа потоков данных является возможность доступа к данным и их поиска без фактического запрета другим лицам использовать эти же данные. Поскольку потоки данных постоянно обновляются, результаты извлечения могут время от времени меняться. Например, проведение веб-поиска с использованием определенной поисковой фразы может дать сегодня один набор результатов, но завтра будет несколько иной набор результатов, в зависимости от того, какая новая информация поступила в поток данных и как поисковая система оценивает эти данные.