Hva er algoritmer for gruvedrift?
Data mining algoritmer er programmerte spørringer og programmer som brukes til å identifisere mønstre og trender i datasett. Den primære bruken av data mining er å bestemme kundens behov og preferanser, basert på deres faktiske aktivitet. Selv om informasjonen er basert på tidligere resultater, kan den være en utmerket indikator på kundeatferd og trender.
To utmerkede eksempler på algoritmer for data mining er klynger og nærmeste nabo-prediktorer. Clustering er et begrep som brukes for å beskrive en aktivitet der individuelle enheter eller data deler viktige attributter. Å skille vaskeriet er et logisk eksempel på denne oppførselen. Personen som sorterer tøyet fungerer som algoritmen. Han eller hun skiller vaskeriet opp i hauger etter attributter: farger, renseri og hvite er alle skilt.
Selve beslutningsprosessen som er involvert i denne aktiviteten er detaljene i algoritmen. For det første må datasettet være begrenset til elementer som er relevante for øvelsen. Sko er ikke inkludert i klesvaskesortering, selv om de kan være i samme fysiske rom. Avgjørelsen må tas på forhånd om hvilke egenskaper som skal brukes til å skille tøyet og størrelsen på hver haug.
Nærmeste nabo-prediktor er basert på identifisering av nær samsvarende eksempler. Kriteriene må oppgis i de innledende trinnene, og spesifisere hva varen eller dataene er og hva definisjonen av nærmeste vil omfatte. Denne typen algoritmer følger et lignende mønster som logisk tankeprosess.
Den primære fordelen med algoritmer for data mining er programmets evne til å lage og identifisere mønstre innenfor et stort datamengde. Evnen til å identifisere naboer i en bestemt setting er lett å gjøre i en liten gruppe. Imidlertid krever data samlet inn fra alle salgstransaksjoner som er gjennomført i løpet av året eller i et distrikt, spesielle programmer og logikk for å gjøre noe nøyaktig.
Mennesker som kan lage data mining-algoritmer for å møte brukere, trenger arbeid i forretningsintelligens eller data mining. Dette er en veldig kompleks utvidelse av statistikk som øker i popularitet når organisasjoner søker å gi en mer håndgripelig avkastning fra dataene de har samlet inn. En effektiv utvikler kan lage et sett med data mining-algoritmer som nøyaktig identifiserer mønstre i atferd, og bruker denne informasjonen til å forutsi fremtidige handlinger. Denne informasjonen er svært verdifull for næringslivet, organisasjoner og myndigheter.