Wat is sequentiemining?
Sequention mining is een type gestructureerde datamining waarin de database en beheerder op zoek zijn naar sequenties of trends in de gegevens. Deze datamining is opgesplitst in twee velden. Itemset -sequentiemining wordt meestal gebruikt in marketing en stringsequentiemining wordt gebruikt in biologieonderzoek. Sequentiemining verschilt van reguliere trend mining, omdat de gegevens specifieker zijn, waardoor het bouwen van een effectieve database moeilijk is voor databaseontwerpers, en het kan soms mis gaan als de reeks anders is dan de gemeenschappelijke volgorde.
Op een of ander punt worden alle databases gebruikt om te mijnen voor gegevens. Deze mijnbouw helpt bedrijven en onderzoekspartijen iets te vinden dat ze nodig hebben. Meestal zijn ze op zoek naar een soort trend, maar wat die trend is en hoe specifiek de informatie is, hangt af van het databaseontwerp. In sequentiemining is de database gebouwd om zeer specifieke sequenties te vinden, met weinig tot geen variatie. Dit is een unieke vorm van gestructureerde datamining in whiCH De database kijkt door de gestructureerde gegevens voor overeenkomsten.
Sequention mining kan worden onderverdeeld in twee categorieën. Itemset -mining wordt gebruikt in marketing en bedrijven om specifieke trends te vinden in verkoopnummers, producttypen, productplaatsing in een winkel en het gebruik van een product. Deze cijfers worden genomen en toegepast op marketingalgoritmen om een marketingproject te helpen strategiseren en de verkoop te versterken. Informatie over een product en hoe het meestal wordt gehaald uit de database, maar het bepalende aspect van itemset-sequentiemining is dat de sequentie is afkomstig van multi-symboldatabasecellen.
String mining is het tegenovergestelde van Itemset Mining omdat het naar elk symbool afzonderlijk wordt beschouwd in plaats van als een cluster. In string mining kan de database worden ingesteld om een sequentie te vinden uit een eiwitbron of genmonsters. Dit helpt bij het vergelijken van veel genmonsters om te zien of ze hetzelfde zijn ofOm grote sequenties af te breken en te vinden welke sequenties ze bevatten. Meestal gebruiken biologische en medische onderzoeksteams dit.
Het maken van een database voor sequentiemining kan moeilijk zijn omdat, in tegenstelling tot trend mining en andere gestructureerde datamining, de sequenties specifiek moeten overeenkomen met elkaar. Dit leidt ook tot het probleem van mijnbouw voor sequenties. Als de volgorde anders is, wordt deze niet herkend, waardoor de mijnbouw moeilijker kan worden. Stringwinning profiteert meestal hiervan, omdat het minste verschil in een weefselmonster het organisme - of wat het onderzoeksteam ook onderzoekt - volledig verschillend van andere monsters kan maken.