Vad är sekvensbrytning?
Sequence mining är en typ av strukturerad data mining där databasen och administratören letar efter sekvenser eller trender i data. Denna datakommunikation är uppdelad i två fält. Objektsekvensbrytning används vanligtvis i marknadsföring och strängsekvensbrytning används i biologiforskning. Sekvensbrytning skiljer sig från vanlig gruvdrift, eftersom uppgifterna är mer specifika, vilket gör att en effektiv databas är svår för databasdesigners, och det kan ibland gå fel om sekvensen skiljer sig från den vanliga sekvensen.
Vid en eller annan punkt används alla databaser för att bryta för data. Denna gruvdrift hjälper företag och forskarpartier att hitta något de behöver. Vanligtvis letar de efter någon form av trend, men vad den trenden är och hur specifik informationen är beror på databasdesignen. Vid sekvensbrytning är databasen byggd för att hitta mycket specifika sekvenser, med liten eller ingen variation. Det här är en unik form av strukturerad dataanläggning där databasen tittar igenom strukturerade data för likheter.
Sekvensbrytning kan delas in i två kategorier. Itemset gruvdrift används i marknadsföring och företag för att hitta specifika trender i försäljningsnummer, produkttyper, produktplacering i en butik och användningen av en produkt. Dessa siffror tas och tillämpas på marknadsföringsalgoritmer för att hjälpa till att strategisätta ett marknadsföringsprojekt och för att stärka försäljningen. Information om en produkt och hur den gör det vanligtvis tas från databasen, men den definierande aspekten av gruvdrift av artikelsekvens är att sekvensen är hämtad från databaser med flera symboler.
Strängbrytning är motsatsen till gruvdrift eftersom den ser på varje symbol individuellt snarare än som ett kluster. Vid strängbrytning kan databasen ställas in för att hitta en sekvens från en proteinkälla eller genprover. Detta hjälper till att jämföra många genprover för att se om de är desamma eller att bryta ner stora sekvenser och hitta vilka sekvenser de innehåller. De flesta biologiska och medicinska forskargrupper använder detta.
Att skapa en databas för sekvensbrytning kan vara svårt, eftersom till skillnad från trendbrytning och annan strukturerad datamining måste sekvenserna specifikt matcha varandra. Detta leder också till problemet med gruvdrift för sekvenser. Om sekvensen är annorlunda kommer den inte att känna igen, vilket kan göra gruvdrift av artiklar svårare. Strängbrytning drar vanligtvis nytta av detta, eftersom den minsta skillnaden i ett vävnadsprov kan göra att organismen - eller vad forskargruppen forskar - helt skiljer sig från andra prover.