Hvad er sekvensminedrift?
Sekvensminedrift er en type struktureret datamining, hvor databasen og administratoren ser efter sekvenser eller tendenser i dataene. Denne datamining er opdelt i to felter. ElementSet -sekvensminedrift bruges typisk i markedsføring, og strengsekvensminedrift bruges i biologisk forskning. Sekvensminedrift adskiller sig fra almindelig trendminedrift, fordi dataene er mere specifikke, hvilket gør opbygningen af en effektiv database vanskelig for databasedesignere, og det kan undertiden gå galt, hvis sekvensen er forskellig fra den almindelige sekvens.
På et eller andet tidspunkt bruges alle databaser til mine til data. Denne minedrift hjælper virksomheder og forskningspartier med at finde noget, de har brug for. Normalt leder de efter en slags tendens, men hvad den tendens er, og hvor specifik informationen er, afhænger af databasedesignet. I sekvensminedrift er databasen bygget til at finde meget specifikke sekvenser med ringe eller ingen variation. Dette er en unik form for struktureret datamining i WHICH Databasen ser gennem de strukturerede data for ligheder.
Sekvensminedrift kan opdeles i to kategorier. ElementSet Mining bruges i markedsføring og forretning til at finde specifikke tendenser inden for salgsnumre, produkttyper, produktplacering i en butik og brugen af et produkt. Disse tal tages og anvendes til markedsføringsalgoritmer for at hjælpe med at strategisere et marketingprojekt og til at styrke salget. Oplysninger om et produkt og hvordan det typisk gøres fra databasen, men det definerende aspekt af varesekvensudvikling er, at sekvensen er taget fra multisymbol-databaseceller.
String Mining er det modsatte af ElementSet Mining, fordi det ser på hvert symbol individuelt snarere end som en klynge. I strengminedrift kan databasen være indstillet til at finde en sekvens fra en proteinkilde eller genprøver. Dette hjælper med at sammenligne mange genprøver for at se, om de er ens ellerat nedbryde store sekvenser og finde hvilke sekvenser de indeholder. Mest biologiske og medicinske forskerhold bruger dette.
Oprettelse af en database til sekvensminedrift kan være vanskelig, fordi sekvenserne i modsætning til trendminedrift og anden struktureret datamining specifikt skal matche hinanden. Dette fører også til problemet med minedrift til sekvenser. Hvis sekvensen er anderledes, genkendes den ikke, hvilket kan gøre det vanskeligere at minedrift af genstande. Strengminedrift drager typisk fordel af dette, fordi den mindste forskel i en vævsprøve kunne gøre organismen - eller hvad forskerteamet undersøger - helt adskilt fra andre prøver.