Qual é a diferença entre mineração de dados e data warehousing?
Os termos mineração de dados e armazenamento de dados geralmente são confundidos pela equipe comercial e técnica. Todo o campo do gerenciamento de dados experimentou um crescimento fenomenal com a implementação de programas de software de coleta de dados e o custo reduzido da memória do computador. O objetivo principal por trás dessas duas funções é fornecer as ferramentas e metodologias para explorar os padrões e o significado em grande quantidade de dados.
As principais diferenças entre a mineração de dados e o data warehousing são os projetos do sistema, a metodologia usada e a finalidade. A mineração de dados é o uso da lógica de reconhecimento de padrões para identificar tendências em um conjunto de dados de amostra e extrapolar essas informações no conjunto de dados maior. O data warehousing é o processo de extração e armazenamento de dados para permitir relatórios mais fáceis.
Mineração de dados é um termo geral usado para descrever uma variedade de processos de negócios que derivam padrões de dados. Normalmente, um pacote de software de análise estatística é usado para identificar padrões específicos, com base no conjunto de dados e nas consultas geradas pelo usuário final. Um uso típico da mineração de dados é criar programas de marketing direcionados, identificar fraudes financeiras e sinalizar padrões incomuns de comportamento como parte de uma revisão de segurança.
Um excelente exemplo de mineração de dados é o processo usado pelas empresas de telefonia para comercializar produtos para clientes existentes. A companhia telefônica usa o software de mineração de dados para acessar seu banco de dados de informações do cliente. Uma consulta é escrita para identificar os clientes que se inscreveram no pacote básico do telefone e no serviço da Internet durante um período de tempo específico. Depois que esse conjunto de dados é selecionado, outra consulta é gravada para determinar quantos desses clientes aproveitaram os recursos adicionais gratuitos do telefone durante uma promoção de avaliação. Os resultados desse exercício de mineração de dados revelam padrões de comportamento que podem orientar ou ajudar a refinar um plano de marketing para aumentar o uso de serviços telefônicos adicionais.
É importante observar que o objetivo principal da mineração de dados é identificar padrões nos dados. As especificações usadas para definir o conjunto de amostras têm um enorme impacto na relevância do resultado e na precisão da análise. Voltando ao exemplo acima, se o conjunto de dados for limitado a clientes em uma área geográfica específica, os resultados e padrões serão diferentes de um conjunto de dados mais amplo. Embora a mineração de dados e o data warehousing funcionem com grandes volumes de informações, os processos usados são bem diferentes.
Um data warehouse é um produto de software usado para armazenar grandes volumes de dados e executar consultas e relatórios projetados especificamente. A inteligência de negócios é um campo de estudo crescente que se concentra no armazenamento de dados e na funcionalidade relacionada. Essas ferramentas são projetadas para extrair dados e armazená-los em um método projetado para fornecer desempenho aprimorado do sistema. Grande parte da terminologia na mineração de dados e no data warehousing é a mesma, levando a mais confusão.