O que é mineração de dados?
A mineração de dados usa uma quantidade relativamente grande de energia de computação operando em um grande conjunto de dados para determinar regularidades e conexões entre os pontos de dados. Algoritmos que empregam técnicas de estatísticas, aprendizado de máquina e reconhecimento de padrões são usados para pesquisar grandes bancos de dados automaticamente. A mineração de dados também é conhecida como descoberta de conhecimento em bancos de dados (KDD). No mundo corporativo, a mineração de dados é usada com mais frequência para determinar a direção das tendências e prever o futuro. É empregado para criar modelos e sistemas de suporte à decisão que fornecem informações às pessoas que eles podem usar. A mineração de dados assume um papel de linha de frente na batalha contra o terrorismo. Foi supostamente usado para determinar o líder dos ataques do 11 de setembro.Ring , Método de Holdout , K-Fold Cross Validation , o método Leave-one-out e assim por diante. As técnicas de regressão são usadas para subtrair padrões irrelevantes, deixando apenas informações úteis. O termo bayesiano é visto com frequência em campo, referindo -se a uma classe de técnicas de inferência que prevê a probabilidade de eventos futuros combinando probabilidades e probabilidades anteriores com base em eventos condicionais. A filtragem de spam é sem dúvida uma forma de mineração de dados, que traz automaticamente mensagens relevantes para a superfície de um mar caótico de tentativas de phishing e arremessos de viagra.
Árvores de decisão são usadas para filtrar montanhas de dados. Em uma árvore de decisão, todos os dados passam por um nó de entrada, onde enfrenta um filtro que separa os dados em fluxos, dependendo de suas características. Por exemplo, é provável que dados sobre o comportamento do consumidor sejam filtrados com base em DFatores emográficos. A mineração de dados não é principalmente sobre gráficos sofisticados e técnicas de visualização, mas os emprega para mostrar o que encontrou. Sabe -se que podemos absorver mais informações estatísticas visualmente do que verbalmente e esse formato para apresentação pode ser muito persuasivo e poderoso se usado no contexto certo.
À medida que nossa civilização se torna cada vez mais saturada de dados e os sensores são distribuídos em massa em nossos ambientes locais, descobriremos inadvertidamente coisas que podem ser perdidas no primeiro passe. A mineração de dados nos permitirá corrigir esses erros e descobrir novos insights com base em dados anteriores, dando -nos mais estrondo para o nosso buck de armazenamento de dados.