Vad är data mining?

Data Mining använder en relativt stor mängd datorkraft som arbetar på en stor uppsättning data för att bestämma regelbundenhet och anslutningar mellan datapunkter. Algoritmer som använder tekniker från statistik, maskininlärning och mönsterigenkänning används för att söka i stora databaser automatiskt. Data mining är också känd som kunskapsupptäckt i databaser (KDD).

Som termen Artificial Intelligence , är data mining ett paraplybegrepp som kan tillämpas på ett antal olika aktiviteter. I företagsvärlden används data mining oftast för att bestämma trendernas riktning och förutsäga framtiden. Det används för att bygga modeller och beslutsstödssystem som ger människor information de kan använda. Data mining tar en frontlinjeroll i kampen mot terrorism. Det användes förmodligen för att bestämma ledaren för attackerna den 9/11.

Data gruvarbetare är statistiker som använder tekniker med namn som Near-Neighbor-modeller , K-Means ClustaRing , holout-metod , K-Fold Cross Validation , ledig-en-out-metoden och så vidare. Regressionstekniker används för att subtrahera irrelevanta mönster, vilket bara lämnar användbar information. Termen Bayesian ses ofta i fältet, med hänvisning till en klass av inferensstekniker som förutsäger sannolikheten för framtida händelser genom att kombinera tidigare sannolikheter och sannolikheter baserade på villkorade händelser. Skräppostfiltrering är utan tvekan en form av data mining, som automatiskt ger relevanta meddelanden till ytan från ett kaotiskt hav av phishingförsök och viagra -tonhöjder.

beslutsträd används för att filtrera berg av data. I ett beslutsträd passerar alla data genom en ingångsnod, där den vetter mot ett filter som separerar data i strömmar beroende på dess egenskaper. Till exempel kommer data om konsumentbeteende sannolikt att filtreras baserat på Demografiska faktorer. Data mining handlar inte främst om snygga grafer och visualiseringstekniker, men den använder dem för att visa vad den har hittat. Det är känt att vi kan absorbera mer statistisk information visuellt än muntligt och detta format för presentation kan vara mycket övertygande och kraftfullt om det används i rätt sammanhang.

När vår civilisation blir allt mer datamättad och sensorer distribueras i massa i våra lokala miljöer, kommer vi oavsiktligt att upptäcka saker som kan missa vid första passet. Data mining kommer att låta oss korrigera dessa misstag och upptäcka nya insikter baserade på tidigare data, vilket ger oss mer slag för vår datalagringsbuck.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?