Was ist räumliches Data Mining?
Beim räumlichen Data Mining wird versucht, Muster in geografischen Daten zu finden. Am häufigsten im Einzelhandel verwendet, ist es aus dem Bereich des Data Mining herausgewachsen, der sich zunächst darauf konzentrierte, Muster in textuellen und numerischen elektronischen Informationen zu finden. Spatial Data Mining wird aufgrund der Schwierigkeiten bei der Analyse von Objekten mit konkreten räumlichen und zeitlichen Existenzen als kompliziertere Herausforderung als traditionelles Mining angesehen.
Wie beim Standard-Data-Mining wird das räumliche Data-Mining hauptsächlich in der Welt des Marketings und des Einzelhandels eingesetzt. Es ist eine Technik, um Entscheidungen darüber zu treffen, wo welche Art von Geschäft eröffnet werden soll. Es kann dazu beitragen, diese Entscheidungen zu informieren, indem bereits vorhandene Daten verarbeitet werden, die angeben, welche Faktoren die Verbraucher dazu motivieren, sich an einen anderen Ort zu begeben und nicht an einen anderen.
Angenommen, Ashley möchte einen Nachtclub in einem bestimmten Stadtviertel eröffnen. Wenn sie Zugriff auf die entsprechenden Daten hätte, könnte sie mithilfe von Geodaten-Mining herausfinden, welche räumlichen Faktoren Nachtclubs erfolgreich machen. Sie könnte Fragen stellen wie: Kommen mehr Leute in den Club, wenn die öffentlichen Verkehrsmittel in der Nähe sind? Welche Entfernung zu anderen Nachtlokalen maximiert die Schirmherrschaft? Ist die Nähe zu Tankstellen ein Plus oder ein Minus?
Ashley möchte vielleicht auch sicherstellen, dass die Leute, die in ihren Nachtclub kommen, im Verlauf einer einzelnen Nacht gleichmäßig verteilt ankommen. Sie könnte auch das räumliche Data Mining - vielleicht genauer das räumlich-zeitliche Data Mining - verwenden, um herauszufinden, wie sich die Menschen zu bestimmten Zeiten durch die Stadt bewegen. Das gleiche Verfahren könnte für die Schirmherrschaft an verschiedenen Abenden der Woche angewendet werden.
Die Schwierigkeiten beim räumlichen Data Mining sind auf die Komplexität der Welt jenseits des Internets zurückzuführen. Während in der Vergangenheit beim Data Mining in der Regel Datenbanken zur Analyse reif waren, handelt es sich bei den für das Geodaten-Mining verfügbaren Eingaben nicht um Informationsraster, sondern um Karten. Diese Karten enthalten verschiedene Arten von Objekten wie Straßen, Bevölkerungsgruppen, Unternehmen usw.
Die Bestimmung, ob etwas "nahe" an etwas anderem liegt, geht von einer diskreten zu einer stetigen Variablen über. Dies erhöht den Aufwand für die Analyse massiv. Unglaublicherweise ist dies eine der einfacheren Arten von Beziehungen, die jemandem zur Verfügung stehen, der versucht, Geodaten zu gewinnen.
Spatial Data Mining ist auch mit dem Problem der Fehlalarme konfrontiert. Beim Durchsuchen von Daten nach Beziehungen treten viele offensichtliche Trends als Folge statistischer Fehlalarme auf. Dieses Problem besteht auch für die Aufgabe des Mining einer einfacheren Datenbank, es wird jedoch durch die Größe der Daten verstärkt, die dem Geodaten-Miner zur Verfügung stehen. Letztendlich sollte ein durch Geodaten-Mining identifizierter Trend durch den Prozess der Erklärung und zusätzliche Forschung bestätigt werden.