O que é uma classificação de mineração de dados?
A classificação de mineração de dados é uma etapa no processo de mineração de dados. É usado para agrupar itens com base em certas características -chave. Existem várias técnicas usadas para a classificação de mineração de dados, incluindo classificação vizinha mais próxima, aprendizado de árvores de decisão e máquinas vetoriais de suporte.
A mineração de dados é um método que os pesquisadores usam para extrair padrões dos dados. Geralmente, uma amostra representativa é escolhida do pool de dados e depois manipulada e analisada para encontrar padrões. Além da classificação de mineração de dados, os pesquisadores também podem usar o clustering, a regressão e o aprendizado de regras para analisar os dados.
Existem vários algoritmos que podem ser usados na classificação de mineração de dados. A classificação vizinha mais próxima é um dos mais simples dos algoritmos de classificação de mineração de dados. Ele depende de um conjunto de treinamento. Um conjunto de treinamento é um conjunto de dados usados para treinar o computador para prestar atenção a determinadas variáveis. Na classificação do vizinho mais próximo, o computador simplesmente CLASsifi todos os dados como parte do grupo que contém dados mais próximos em valor da entrada.
O aprendizado de árvore de decisão usa um modelo de ramificação para classificar os dados. O computador basicamente faz uma série de perguntas sobre os dados. Se a resposta para a primeira pergunta for verdadeira, ela faz a pergunta 2a. Se a resposta for falsa, ele faz a pergunta 2b. Quando desenhado, esse método forma uma árvore de caminhos ramificados.
A classificação ingênua Bayes depende da probabilidade. Ele faz uma série de perguntas sobre cada peça de dados e, em seguida, usa as respostas para determinar a probabilidade de que os dados pertencem a uma classificação específica. Isso é diferente do aprendizado de árvores de decisão porque a resposta para a primeira pergunta não influencia qual pergunta será feita a seguir.
Métodos mais complicados de classificação de mineração de dados incluem redes neurais e máquinas vetoriais de suporte. Esses métodos são M baseados em computadorOdels que seriam difíceis de fazer manualmente. As redes neurais são frequentemente usadas na programação de inteligência artificial porque imita o cérebro humano. Ele filtra informações através de uma série de nós que encontram padrões e depois classificam as informações.
Máquinas vetoriais de suporte usam amostras de treinamento para criar um modelo que classifique as informações, geralmente visualizadas como um gráfico de dispersão com um amplo espaço entre as categorias. Quando novas informações são alimentadas na máquina, elas são plotadas no gráfico. Os dados são classificados com base em qual categoria as informações ficam mais próximas no gráfico. Este método funciona apenas quando há duas opções para escolher.