¿Qué es la minería web?
La minería web es una forma de recolección de información que se aplica a los datos recopilados de fuentes en línea. La recopilación de datos de fuentes en Internet permite a los usuarios agregar grandes volúmenes de información para su análisis y tomar decisiones comerciales clave en un entorno en línea. Por ejemplo, un investigador podría usar la minería web para recopilar información sobre el uso de palabras clave específicas en el contenido web. Alternativamente, los minoristas y otros profesionales de marketing utilizan la minería de datos en línea para detectar tendencias en el tráfico web, la conversión de visitantes del sitio a compradores y otros usos de la web.
En términos de recopilación, clasificación y análisis de datos, la minería web imita las actividades tradicionales de minería de datos. Comparativamente, las actividades de minería web se centran en la información basada en la web, en lugar de una gran sección transversal de fuentes de información, como bases de datos informáticas fuera de línea, registros de clientes o datos contables impresos, como suele ocurrir con la minería de datos tradicional. Centrarse únicamente en la recopilación de datos de fuentes en línea proporciona un análisis específico necesario para las estrategias de marketing en línea, las decisiones de estructura del sitio web y la toma de decisiones similares relacionadas con el comercio electrónico. La recopilación de datos a través de la minería web también proporciona el beneficio adicional de un amplio grupo demográfico internacional, ya que los sitios web de todo el mundo están disponibles para los investigadores y recolectores de información.
Profesionalmente, la minería web se divide en tres categorías específicas: minería de estructura web, minería de uso y minería de contenido web. Cada área se centra en información específica, como la estructura y los hipervínculos de un sitio web en particular, la información de registro del servidor con respecto al uso de los visitantes y el contenido específico disponible en línea. Los paquetes y servicios de software de análisis de sitios web son un excelente ejemplo de minería de uso web, ya que proporcionan a los webmasters información sobre el tráfico de visitantes, los resultados de búsqueda utilizados, los enlaces en los que se hizo clic y el tiempo dedicado a interactuar con páginas específicas. La minería de estructuras, por otro lado, proporciona información detallada sobre la estructura interna de un sitio web específico, incluidos hipervínculos, bases de datos y funciones de consulta.
Para el profesional de marketing, la minería web ofrece una gran cantidad de usos en relación con las actividades de marketing. Saber cómo los visitantes del sitio usan un sitio web en particular, cómo los competidores configuran un sitio competitivo y qué contenido ya está en línea es información valiosa. Dicha información ayuda a los tomadores de decisiones clave a elaborar una estrategia de marketing basada en técnicas previamente probadas e información documentada.
Los colegios y universidades también utilizan la minería web a través de un software que verifica que los documentos de los estudiantes sean únicos y no plagiados. Utilizando principios de minería de contenido web, tales asistentes de calificación buscan en toda Internet contenido similar. Los instructores cargan el texto de un documento del estudiante y luego le indican al software de plagio que busque en Internet frases similares o texto copiado en línea. Los resultados a menudo se expresan como porcentaje de texto coincidente. Se proporcionan enlaces a resultados similares para permitir a los instructores la posibilidad de visitar sitios para determinar si las coincidencias están plagiadas.