Quais são os diferentes métodos de mineração de dados?
Existem vários métodos diferentes de mineração de dados usados nas opções de software e nos conceitos teóricos. Isso permite que os usuários extraiam informações dos dados coletados por indivíduos e empresas utilizando uma variedade de ferramentas. Grandes quantidades de dados podem ser usadas para determinar vários fatores em um único assunto ou variedade de assuntos. Esses métodos de mineração de dados são mais comumente utilizados nos campos de proteção, marketing e vigilância de fraudes.
Por centenas de anos, os métodos de mineração de dados foram usados para extrair informações de assuntos. Técnicas modernas, no entanto, usam conceitos automatizados para fornecer dados substanciais através de recursos informatizados. À medida que as ciências da computação surgiram durante o século 20, o conceito de métodos de mineração de dados se desenvolveu em um esforço para superar padrões ocultos em grandes faixas de dados coletados. Um bom exemplo disso é quando uma empresa de publicidade analisa os padrões de compra de um cliente on-line. Essa empresa pode comercializar determinados produtos que o indivíduo pode estar interessado em comprar.
Uma técnica de mineração de dados usada comumente no setor é chamada KDD (Knowledge Discovery in Databases). Desenvolvido em 1989 por Gregory Piatetsky-Shapiro, o KDD permite que os usuários processem dados brutos, analisem as informações para os dados necessários e interpretem os resultados. Esse método permite que os usuários encontrem padrões nos algoritmos, no entanto, os dados gerais nem sempre são precisos e podem ser reunidos de maneiras comprometedoras. Isso é conhecido como sobreajuste .
Os métodos básicos de mineração de dados envolvem quatro tipos específicos de tarefas: classificação, clustering, regressão e associação. A classificação pega as informações presentes e as mescla em agrupamentos definidos. O cluster remove os agrupamentos definidos e permite que os dados se classifiquem por itens semelhantes. A regressão se concentra na função da informação, modelando os dados no conceito. O método final de mineração de dados, associação , tenta encontrar relacionamentos entre os vários feeds de dados.
Ao usar os vários métodos de mineração de dados, certos padrões são usados para determinar quais parâmetros podem ser usados no processo. O Grupo de Interesse Especial da Association for Computing Machinery em Descoberta de Conhecimento e Mineração de Dados (SIGKDD) realiza uma reunião anual determinando quais processos são adequados. Fatores éticos são ponderados junto com aplicações práticas para encontrar as melhores informações sobre indivíduos e empresas. Esta informação é publicada em um jornal do setor chamado SIGKDD Explorations.