Hvad er datastrømminedrift?
Data stream mining er en strategi, der involverer identifikation og udtræk af information fra en aktiv datastrøm. Med denne tilgang er ideen at trække dataene uden at skabe nogen form for afbrydelse i selve strømmen, hvilket gør det muligt for andre også at gøre brug af dataene, selv når udvindingen finder sted. Denne type datastrøm-minearbejde kan involvere alle mulige data, lige fra tale til videooverførsel via Internettet og endda til daglige opgaver som at trække penge fra en bankkonto ved hjælp af en automatiseret tellermaskine eller holde en telefonsamtale.
En af karakteristikkerne ved minedrift af datastrøm er evnen til nøjagtigt at projicere eller forudsige, hvordan man finder den ønskede information, og hvilken type videnopdagelsesværktøjer, der hjælper med at lokalisere og med succes udtrække den ønskede information. Når en kunde for eksempel initierer en transaktion ved hjælp af en automatisk tellermaskine, starter programmeringen af maskinen en søgning efter relevant kontoinformation, lokaliserer dataene og bestemmer derefter, om transaktionens størrelse vil reducere kontosaldoen under et tilladt beløb, baseret på den måde, kontoen er struktureret på. Derfra kan programmeringen returnere relevante data til brugeren, såsom at dokumentere den vellykkede gennemførelse af den anmodede transaktion og give den kontosaldo, der er tilbage, efter at den kredit eller debet, der er involveret i transaktionen, er registreret.
Et andet almindeligt eksempel på minedrift af datastrømme er den grundlæggende websøgning ved hjælp af en browser. Med denne applikation indtaster slutbrugeren søgeværdier i et felt, og softwaren, der driver browseren, søger at fortolke disse værdier og returnere data, der har en vis relevans for søgekriterierne. Afhængig af hvordan browseren er konfigureret, kan dette også omfatte en funktion, der søger at foregribe intensionen af den søgning, der udføres, og tilbyde flere ord eller sætninger, der kan hjælpe med at finjustere søgningen mere efter brugerens smag. Når brugeren har lagt sig til søgeudtrykket, returnerer browseren resultater i rækkefølgen af placering ved hjælp af algoritmer, der er relevante for konfigurationen af selve browseren.
En af de største fordele ved datastream mining er muligheden for at få adgang til og søge data uden faktisk at forbyde andre at gøre brug af de samme data. Da datastrømme konstant opdateres, kan resultatet af ekstraktionen ændre sig fra tid til anden. For eksempel kan udførelse af en websøgning ved hjælp af en bestemt søgesætning give et sæt resultater i dag, men give et lidt andet sæt resultater i morgen, baseret på hvilke nye oplysninger, der er kommet ind i datastrømmen, og hvordan søgemaskinen rangerer disse data.