Skip to main content

Что такое добыча пространственных данных?

Анализ пространственных данных - это процесс поиска шаблонов в географических данных. Наиболее широко используемый в розничной торговле, он вырос из области интеллектуального анализа данных, которая первоначально была направлена ​​на поиск шаблонов в текстовой и числовой электронной информации. Интеллектуальный анализ данных считается более сложной задачей, чем традиционный анализ данных, из-за трудностей, связанных с анализом объектов с конкретным существованием в пространстве и времени.

Как и в случае стандартного интеллектуального анализа данных, пространственный интеллектуальный анализ данных используется главным образом в мире маркетинга и розничной торговли. Это методика принятия решений о том, где открывать какой магазин. Это может помочь в принятии этих решений путем обработки ранее существующих данных о том, какие факторы мотивируют потребителей переходить в одно место, а не в другое.

Скажите, что Эшли хочет открыть ночной клуб в определенном квартале города. Если бы у нее был доступ к соответствующим данным, она могла бы использовать анализ пространственных данных, чтобы выяснить, какие пространственные факторы делают ночные клубы успешными. Она может задавать такие вопросы, как: придет ли больше людей в клуб, если рядом будет общественный транспорт? Какое расстояние от других мест ночной жизни максимизирует покровительство? Плюс или минус близость к заправке?

Эшли может также пожелать, чтобы люди, приходящие в ее ночной клуб, приходили равномерно в течение отдельной ночи. Она также может использовать интеллектуальный анализ пространственных данных - возможно, более точно - пространственно-временной анализ данных - чтобы выяснить, как люди перемещаются по городу в определенное время. Один и тот же процесс может применяться к покровительству в разные ночи недели.

Трудности добычи пространственных данных являются результатом сложности мира за пределами Интернета. В то время как прошлые усилия по интеллектуальному анализу данных, как правило, дорабатывались для анализа, базы данных, доступные для пространственного анализа данных, представляют собой не информационные сетки, а карты. Эти карты имеют различные типы объектов, таких как дороги, население, предприятия и т. Д.

Определение того, является ли что-то «близким» к чему-то другому, превращается из дискретной в непрерывную переменную. Это значительно увеличивает сложность, необходимую для анализа. Невероятно, но это один из самых простых типов отношений, доступных для тех, кто пытается добывать пространственные данные.

Интеллектуальный анализ данных также сталкивается с проблемой ложных срабатываний. В процессе поиска данных для поиска взаимосвязей, многие явные тенденции будут возникать в результате статистических ложных срабатываний. Эта проблема также существует для задачи разработки более простой базы данных, но она усиливается величиной данных, доступных для майнера пространственных данных. В конечном счете, тенденция, выявленная в результате анализа пространственных данных, должна быть подтверждена в процессе объяснения и дополнительных исследований.