Wat is een classificatie van datamining?

Classificatie van datamining is een stap in het proces van datamining. Het wordt gebruikt om items te groeperen op basis van bepaalde sleutelkenmerken. Er zijn verschillende technieken die worden gebruikt voor dataminingclassificatie, waaronder de classificatie van de dichtstbijzijnde buur, beslissingsbomen leren en ondersteuning van vectormachines.

Datamining is een methode die onderzoekers gebruiken om patronen uit gegevens te extraheren. Over het algemeen wordt een representatief monster gekozen uit de pool van gegevens en vervolgens gemanipuleerd en geanalyseerd om patronen te vinden. Naast de classificatie van datamining, kunnen onderzoekers ook clustering, regressie en regleren gebruiken om de gegevens te analyseren.

Er zijn verschillende algoritmen die kunnen worden gebruikt bij de classificatie van datamining. De classificatie van de dichtstbijzijnde buur is een van de eenvoudigste van de datamining classificatie -algoritmen. Het vertrouwt op een trainingsset. Een trainingsset is een set gegevens die worden gebruikt om de computer te trainen om aandacht te schenken aan bepaalde variabelen. In de classificatie van de dichtstbijzijnde buurSSIFS alle gegevens als onderdeel van de groep die gegevens die het dichtst in waarde staan voor de invoer bevat.

Decision Tree Learning gebruikt een vertakkingsmodel om de gegevens te classificeren. De computer stelt in principe een reeks vragen over de gegevens. Als het antwoord op de eerste vraag waar is, stelt het vraag 2a. Als het antwoord onjuist is, stelt het vraag 2b. Wanneer het wordt uitgetrokken, vormt deze methode een boom van vertakkingspaden.

Naïeve Bayes -classificatie is gebaseerd op waarschijnlijkheid. Het stelt een reeks vragen over elk stuk gegevens en gebruikt vervolgens de antwoorden om de kans te bepalen dat de gegevens in een bepaalde classificatie horen. Dit is anders dan het leren van beslissingsbomen, omdat het antwoord op de eerste vraag geen invloed heeft op welke vraag hierna zal worden gesteld.

Meer gecompliceerde methoden voor dataminingclassificatie omvatten neurale netwerken en ondersteuningsvectormachines. Deze methoden zijn computergebaseerde models die moeilijk met de hand zouden zijn. Neurale netwerken worden vaak gebruikt in kunstmatige intelligentieprogrammering omdat het het menselijk brein nabootst. Het filtert informatie via een reeks knooppunten die patronen vinden en vervolgens de informatie classificeren.

Ondersteuning vectormachines gebruiken trainingsmonsters om een model te bouwen dat informatie zal classificeren, meestal gevisualiseerd als een spreidingsplot met een brede ruimte tussen categorieën. Wanneer nieuwe informatie in de machine wordt ingevoerd, wordt deze in de grafiek uitgezet. De gegevens worden vervolgens geclassificeerd op basis van welke categorie de informatie het dichtst in de buurt van de grafiek ligt. Deze methode werkt alleen als er twee opties zijn om uit te kiezen.

Wat is een classificatie van datamining?

ANDERE TALEN