Hvad er algoritmer til minedrift af data?
Data mining algoritmer er programmerede forespørgsler og programmer, der bruges til at identificere mønstre og tendenser i datasæt. Den primære brug af data mining er at bestemme kundernes behov og præferencer baseret på deres faktiske aktivitet. Selvom informationen er baseret på tidligere resultater, kan den være en fremragende indikator for kundeadfærd og tendenser.
To fremragende eksempler på algoritmer til datamining er clustering og nærmeste nabo-prediktorer. Clustering er et udtryk, der bruges til at beskrive en aktivitet, hvor individuelle enheder eller data deler vigtige attributter. Adskillelse af vaskeriet er et logisk eksempel på denne opførsel. Personen, der sorterer vaskeriet, fungerer som algoritmen. Han eller hun adskiller tøjet i bunker ved attributter: farver, renseri og hvide er alle adskilt.
Den faktiske beslutningsproces involveret i denne aktivitet er detaljerne i algoritmen. For det første skal datasættet være begrænset til emner, der er relevante for øvelsen. Sko er ikke inkluderet i vaskesortering, selvom de måske befinder sig i det samme fysiske rum. Beslutningen skal træffes på forhånd om, hvilke egenskaber der vil blive brugt til at adskille vasketøjet og størrelsen på hver bunke.
Den nærmeste nabo-prediktor er baseret på identifikationen af tæt matchende eksempler. Kriterierne skal angives i de indledende trin med angivelse af, hvad emnet eller dataene er, og hvad definitionen på det nærmeste inkluderer. Denne type algoritme følger et lignende mønster som en logisk tankeproces.
Den primære fordel ved data mining-algoritmer er programmets evne til at skabe og identificere mønstre inden for et enormt datamængde. Evnen til at identificere naboer i en bestemt indstilling er let at gøre i en lille gruppe. Data, der er indsamlet fra alle de salgstransaktioner, der er gennemført inden for året eller i et distrikt, kræver dog specielle programmer og logik med enhver nøjagtighed.
Mennesker, der kan oprette data mining algoritmer for at imødekomme brugere, har brug for arbejde inden for business intelligence eller data mining. Dette er en meget kompleks udvidelse af statistikker, der vokser i popularitet, da organisationer forsøger at give et mere håndgribeligt afkast fra de data, de har indsamlet. En effektiv udvikler kan oprette et sæt data mining algoritmer, der nøjagtigt identificerer mønstre i adfærd og bruge disse oplysninger til at forudsige fremtidige handlinger. Denne information er meget værdifuld for virksomheder, organisationer og regeringer.