Hva er de forskjellige metodene for utvinning av data?
Det er en rekke forskjellige data mining metoder som brukes i både programvarealternativer og teoretiske konsepter. Disse lar brukerne hente ut informasjon fra data samlet av enkeltpersoner og selskaper ved å bruke en rekke verktøy. Store datamengder kan brukes til å bestemme forskjellige faktorer i et enkelt individ eller forskjellige fag. Disse data mining-metodene brukes ofte innen feltene beskyttelse, markedsføring og overvåking.
I hundrevis av år har data mining-metoder blitt brukt for å hente ut informasjon fra forsøkspersoner. Moderne teknikker bruker imidlertid automatiserte konsepter for å gi betydelige data via datastyrte ressurser. Da datavitenskapene dukket opp i løpet av det 20. århundre, utviklet konseptet med data mining metoder i et forsøk på å overvinne skjulte mønstre i store skår av innsamlede data. Et godt eksempel på dette er når et reklamefirma analyserer handlemønstrene til en online kunde. Dette selskapet kan deretter markedsføre visse produkter som den enkelte kan være interessert i å kjøpe.
En data mining-teknikk som ofte brukes i bransjen kalles Knowledge Discovery in Databases (KDD). KDD ble utviklet i 1989 av Gregory Piatetsky-Shapiro, og lar brukere behandle rå data, analysere informasjonen for nødvendige data og tolke resultatene. Denne metoden lar brukerne finne mønstre i algoritmene, men de generelle dataene er ikke alltid nøyaktige og kan settes sammen på kompromitterende måter. Dette er kjent som overmontering .
Grunnleggende data mining-metoder involverer fire spesielle typer oppgaver: klassifisering, gruppering, regresjon og tilknytning. Klassifisering tar informasjonen som er til stede og slår den sammen i definerte grupperinger. Clustering fjerner de definerte grupperingene og lar dataene klassifisere seg etter lignende elementer. Regresjon fokuserer på informasjonenes funksjon, modellerer dataene om konseptet. Den endelige data mining-metoden, assosiasjon , prøver å finne sammenhenger mellom de forskjellige datafeedene.
Når du bruker de forskjellige data mining-metodene, brukes visse standarder for å bestemme hvilke parametere som kan brukes i prosessen. Association for Computing Machinery's Special Interest Group on Knowledge Discovery and Data Mining (SIGKDD) holder et årlig møte for å bestemme hvilke prosesser som er aktuelle. Etiske faktorer veies sammen med praktiske anvendelser for å finne den beste informasjonen om enkeltpersoner og selskaper. Denne informasjonen er publisert i et bransjeblad kalt SIGKDD Explorations.