Skip to main content

O que são ferramentas de mineração de dados?

As ferramentas de mineração de dados são componentes e teorias de software que permitem aos usuários extrair informações dos dados. As ferramentas fornecem aos indivíduos e empresas a capacidade de coletar grandes quantidades de dados e usá-los para fazer determinações sobre um usuário ou grupos de usuários específicos. Alguns dos usos mais comuns das ferramentas de mineração de dados estão nos campos de marketing, proteção contra fraudes e vigilância.

A extração manual de dados existe há centenas de anos. No entanto, a automação da mineração de dados tem sido mais prevalente desde o início da era do computador. Durante o século 20, várias ciências da computação surgiram para ajudar a apoiar o conceito de desenvolvimento de ferramentas de mineração de dados. O objetivo geral da utilização das ferramentas é descobrir padrões ocultos. Por exemplo, se uma empresa de marketing descobrir que uma pessoa faz uma viagem mensal de Nova York a Los Angeles, torna-se vantajoso para ela anunciar detalhes do destino ao indivíduo.

No setor de mineração de dados, foram estabelecidos padrões para definir os parâmetros do uso de ferramentas de mineração de dados. Anualmente, o Grupo de Interesse Especial da Association for Computing Machinery em Descoberta de Conhecimento e Mineração de Dados (SIGKDD) realiza uma reunião para determinar quais processos são usados. O mesmo grupo também é responsável por avaliar as implicações éticas da análise de dados de indivíduos e empresas. Uma revista semestral é publicada pelo grupo SIGKDD Explorations.

A ferramenta mais prevalente usada na mineração de dados é o processo chamado Knowledge Discovery in Databases (KDD). O KDD foi desenvolvido em 1989 por Gregory Piatetsky-Shapiro. Usando essa ferramenta de mineração de dados, os usuários podem processar dados brutos, extrair os dados para obter informações e interpretar os vários resultados na forma de gerenciamento de informações.

Uma das formas mais importantes de ferramentas de mineração de dados é usada no combate ao terrorismo no século XXI. Nos Estados Unidos, o Conselho Nacional de Pesquisa usa os conceitos de mineração de padrões e mineração de dados com base em assuntos para identificar atividades terroristas no grande conjunto de informações em todo o mundo. A mineração de padrões é definida pelo processo de localização de padrões em um grande volume de dados. A mineração de dados baseada em assuntos tenta identificar os relacionamentos entre indivíduos. Ambas as técnicas também podem ser utilizadas na prática comercial geral, definindo a mentalidade de uma base de clientes e o relacionamento interativo entre os clientes.