Hva er sekvensgruvedrift?

Sequence mining er en type strukturert data mining hvor databasen og administratoren ser etter sekvenser eller trender i dataene. Denne datagruppen er delt inn i to felt. Elementset sekvensgruvedrift brukes vanligvis i markedsføring, og strengsekvensgruvedrift brukes i biologiforskning. Sekvensgruvedrift er forskjellig fra vanlig trendgruvedrift, fordi dataene er mer spesifikke, noe som gjør det vanskelig å bygge en effektiv database for databasedesignere, og det kan noen ganger gå galt hvis sekvensen er noe annerledes enn den vanlige sekvensen.

På et eller annet tidspunkt blir alle databaser brukt til å gruve for data. Denne gruvedriften hjelper bedrifter og forskningspartier med å finne noe de trenger. Vanligvis leter de etter en slags trend, men hva denne trenden er og hvor spesifikk informasjonen er vil avhenge av databasedesign. I sekvensbryting er databasen bygget for å finne veldig spesifikke sekvenser, med liten eller ingen variasjon. Dette er en unik form for strukturert datamining hvor databasen ser gjennom strukturerte data for likheter.

Sekvensgruvedrift kan deles inn i to kategorier. Itemset gruvedrift brukes i markedsføring og virksomhet for å finne spesifikke trender i salgstall, produkttyper, produktplassering i en butikk og bruk av et produkt. Disse tallene tas og brukes på markedsføringsalgoritmer for å hjelpe med å strategisere et markedsføringsprosjekt og for å styrke salget. Informasjon om et produkt og hvordan det gjør det typisk er hentet fra databasen, men det definerende aspektet ved gruvedrift av artikelsekvens er at sekvensen er hentet fra databaser med flere symboler.

Strengbryting er det motsatte av gruvedrift av gjenstander fordi det ser på hvert symbol individuelt i stedet for som en klynge. I strengbryting kan databasen være satt til å finne en sekvens fra en proteinkilde eller genprøver. Dette hjelper med å sammenligne mange genprøver for å se om de er de samme eller for å bryte ned store sekvenser og finne hvilke sekvenser de inneholder. De fleste biologiske og medisinske forskerteam bruker dette.

Det kan være vanskelig å opprette en database for sekvensgruvedrift, i motsetning til trendgruvedrift og annen strukturert datamining, må sekvensene spesifikt samsvare med hverandre. Dette fører også til problemet med gruvedrift for sekvenser. Hvis sekvensen er noe annerledes, blir den ikke gjenkjent, noe som kan gjøre gruvedrift av elementer vanskeligere. Strengbryting har typisk fordel av dette, fordi den minste forskjellen i en vevsprøve kan gjøre organismen - eller hva forskerteamet forsker - helt forskjellig fra andre prøver.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?