Hva er datastreaming?

Datastrømbrytning er en strategi som innebærer å identifisere og trekke ut informasjon fra en aktiv datastrøm. Med denne tilnærmingen er ideen å trekke dataene uten å skape noen form for avbrudd i selve strømmen, noe som gjør det mulig for andre å også benytte seg av dataene selv når utvinningen finner sted. Denne typen gruveinnsats for datastrømmer kan involvere alle slags data, alt fra tale til videooverføring over Internett og til daglige oppgaver som å ta ut penger fra en bankkonto ved hjelp av en automatisert tellermaskin eller holde en telefonsamtale.

Et av kjennetegnene ved gruvedrift av datastrømmer er muligheten til nøyaktig å projisere eller forutsi hvordan man finner informasjonen ønsket og hvilken type kunnskapsoppdagelsesverktøy som vil hjelpe til med å finne og utvinne ønsket informasjon. Når en kunde for eksempel initierer en transaksjon ved hjelp av en automatisk tellermaskin, starter programmeringen for maskinen et søk etter relevant kontoinformasjon, lokaliserer dataene og bestemmer deretter om transaksjonsbeløpet vil redusere kontosaldoen under et tillatt beløp, basert på måten kontoen er strukturert på. Derfra kan programmeringen returnere relevante data til brukeren, for eksempel å dokumentere vellykket gjennomføring av den forespurte transaksjonen og gi kontosaldoen som gjenstår etter at kreditt eller debet involvert i transaksjonen er registrert.

Et annet vanlig eksempel på gruvedrift av datastrømmer er det grunnleggende websøket ved hjelp av en nettleser. Med denne applikasjonen legger sluttbrukeren inn søkeverdier i et felt, og programvaren som driver nettleseren søker å tolke verdiene og returnere data som har en viss relevans for søkekriteriene. Avhengig av hvordan nettleseren er konfigurert, kan dette også omfatte en funksjon som søker å forutse intensjonen med søket som skal gjennomføres, og tilbyr flere ord eller uttrykk som kan bidra til å avgrense søket mer etter brukerens smak. Når brukeren har funnet seg til rette i søkefrasen, returnerer nettleseren resultater i rekkefølgen av rangering ved å bruke algoritmer som er relevante for konfigurasjonen av nettleseren selv.

En av hovedfordelene med gruvedrift av datastrømmer er muligheten til å få tilgang til og søke etter data uten å faktisk forby andre å benytte seg av de samme dataene. Siden datastrømmer kontinuerlig oppdateres, kan resultatene av ekstraksjonen endres fra tid til annen. For eksempel kan det å utføre et websøk ved hjelp av en spesifikk søkefrase gi ett sett med resultater i dag, men gi et litt annet sett med resultater i morgen, basert på hvilken ny informasjon som har kommet inn i datastrømmen og hvordan søkemotoren rangerer disse dataene.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?