Vad är Data Mining?

Data mining använder en relativt stor mängd datorkraft som fungerar på en stor uppsättning data för att bestämma regelbundenhet och anslutningar mellan datapunkter. Algoritmer som använder teknik från statistik, maskininlärning och mönsterigenkänning används för att automatiskt söka i stora databaser. Data mining är också känd som Knowledge-Discovery in Databases (KDD).

Liksom termen artificiell intelligens , är data mining en paraplybegrepp som kan tillämpas på ett antal olika aktiviteter. I företagsvärlden används datamining oftast för att bestämma riktningen på trender och förutsäga framtiden. Det används för att bygga modeller och beslutssupportsystem som ger människor information de kan använda. Databehandling tar en främsta roll i kampen mot terrorism. Det användes förmodligen för att bestämma ledaren för attackerna den 11 september.

Datavetare är statistiker som använder tekniker med namn som nästan grannmodeller , k-betyder klustering , uthållningsmetod , k-faldig korsvalidering , metoden för att lämna en-ut , och så vidare. Regressionstekniker används för att subtrahera irrelevanta mönster, vilket bara lämnar användbar information. Termen Bayesian ses ofta i fältet, med hänvisning till en klass av inferensstekniker som förutsäger sannolikheten för framtida händelser genom att kombinera tidigare sannolikheter och sannolikheter baserade på villkorade händelser. Skräppostfiltrering är utan tvekan en form av data mining, som automatiskt för med sig relevanta meddelanden till ytan från ett kaotiskt hav av phishingförsök och Viagra-pitcher.

Beslutsträd används för att filtrera berg med data. I ett beslutsträd passerar all data genom en ingångsnod, där den vetter mot ett filter som delar upp data i strömmar beroende på dess egenskaper. Till exempel kommer information om konsumentbeteende sannolikt att filtreras baserat på demografiska faktorer. Data mining handlar inte främst om snygga grafer och visualiseringstekniker, men de använder dem för att visa vad den har hittat. Det är känt att vi kan ta upp mer statistisk information visuellt än muntligt och detta format för presentation kan vara mycket övertygande och kraftfullt om det används i rätt sammanhang.

När vår civilisation blir allt mer datamättad och sensorer distribueras massor i våra lokala miljöer, kommer vi oavsiktligt att upptäcka saker som kan missa vid första gången. Data mining kommer att låta oss korrigera dessa misstag och upptäcka nya insikter baserade på tidigare data, vilket kommer att ge oss mer knep för vår datalagringsbock.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?