O que é mineração na Web?
A mineração na Web é uma forma de coleta de informações que se aplica aos dados coletados de fontes online. A coleta de dados de fontes na Internet permite que os usuários agregem grandes volumes de informações para análise, para tomar as principais decisões de negócios em um ambiente online. Por exemplo, um pesquisador pode usar a mineração na web para coletar informações sobre o uso de palavras-chave específicas no conteúdo da web. Como alternativa, varejistas e outros profissionais de marketing usam a mineração de dados on-line para identificar tendências no tráfego da Web, a conversão de visitantes do site em compradores e outros usos da Web.
Em termos de coleta, classificação e análise de dados, a mineração na web imita as atividades tradicionais de mineração de dados. Comparativamente, as atividades de mineração da Web concentram-se em informações baseadas na Web, em vez de uma grande seção transversal de fontes de informações, como bancos de dados offline de computadores, registros de clientes ou dados contábeis impressos, como normalmente ocorre na mineração de dados tradicional. O foco exclusivo na coleta de dados de fontes on-line fornece análises direcionadas, necessárias para estratégias de marketing on-line, decisões sobre a estrutura do site e tomada de decisão semelhante relacionada ao comércio eletrônico. A coleta de dados via mineração na web também oferece o benefício adicional de uma ampla demografia internacional, uma vez que sites de todo o mundo estão disponíveis para pesquisadores e coletores de informações.
Profissionalmente, a mineração da web é dividida em três categorias específicas: mineração da estrutura da web, mineração de uso e mineração de conteúdo da web. Cada área se concentra em informações específicas, como a estrutura e os links de um site específico, informações de log do servidor sobre o uso do visitante e conteúdo específico disponível online. Os pacotes e serviços de software analítico do site são um excelente exemplo da mineração de uso da web, fornecendo aos webmasters informações sobre tráfego de visitantes, resultados de pesquisa usados, links clicados e tempo gasto interagindo com páginas específicas. A mineração de estrutura, por outro lado, fornece informações detalhadas sobre a estrutura interna de um site específico, incluindo hiperlinks, bancos de dados e funções de consulta.
Para o profissional de marketing, a mineração na web oferece diversos usos em relação às atividades de marketing. Saber como os visitantes usam um site específico, como os concorrentes criam um site concorrente e que conteúdo já está online são informações valiosas. Essas informações ajudam os principais tomadores de decisão a elaborar uma estratégia de marketing baseada em técnicas previamente comprovadas e em informações documentadas.
Faculdades e universidades também utilizam mineração na web por meio de software que verifica se os documentos dos alunos são únicos e não são plagiados. Utilizando os princípios de mineração de conteúdo da Web, esses auxiliares de classificação pesquisam na Internet por conteúdo semelhante. Os instrutores carregam o texto de um documento do aluno e depois instruem o software de plágio a verificar na Internet frases semelhantes ou texto copiado on-line. Os resultados geralmente são expressos como porcentagem do texto correspondente. Links para resultados semelhantes são fornecidos para permitir que os instrutores visitem os sites para determinar se as correspondências são realmente plagiadas.