Sıra madenciliği, veritabanının ve yöneticisinin verideki dizileri veya eğilimleri aradığı bir tür yapılandırılmış veri madenciliğidir. Bu veri madenciliği iki alana bölünmüştür. Itemset dizisi madenciliği tipik olarak pazarlamada ve string dizisi madenciliği biyoloji araştırmalarında kullanılır. Dizi madenciliği normal eğilim madenciliğinden farklıdır, çünkü veriler daha belirgindir, bu da veritabanı tasarımcıları için etkili bir veritabanı oluşturmayı zorlaştırır ve dizi, genel dizilimden farklıysa, bazen kötüye gidebilir.
Bir noktada veya başka bir yerde, tüm veritabanları veriler için madencilik yapmak için kullanılır. Bu madencilik, işletmelerin ve araştırma partilerinin ihtiyaç duydukları bir şeyi bulmalarına yardımcı oluyor. Genellikle, bir tür trend ararlar, ancak bu trendin ne olduğu ve bilgilerin ne kadar spesifik olduğu, veritabanı tasarımına bağlı olacaktır. Sekans madenciliğinde, veri tabanı çok az çeşitlilik gösteren ya da hiç değişmeyen çok spesifik dizileri bulmak için oluşturulmuştur. Bu, veritabanının benzerlikler için yapılandırılmış veriye baktığı benzersiz bir yapılandırılmış veri madenciliği şeklidir.
Sıra madenciliği iki kategoriye ayrılabilir. Itemset madenciliği, satış sayıları, ürün tipleri, bir mağazada ürün yerleştirme ve bir ürünün kullanımında belirli eğilimleri bulmak için pazarlama ve işletmede kullanılır. Bu rakamlar bir pazarlama projesini stratejiye almak ve satışları desteklemek için pazarlama algoritmalarına çekilir ve uygulanır. Bir ürün ve bunun tipik olarak nasıl yapıldığıyla ilgili bilgiler veritabanından alınır, ancak itemset dizisi madenciliğinin belirleyici yönü, dizinin çok sembollü veritabanı hücrelerinden alınmasıdır.
Dize madenciliği, itemet madenciliğinin tam tersidir, çünkü her sembole küme yerine tek tek bakar. Dize madenciliğinde, veritabanı bir protein kaynağından veya gen örneklerinden bir sekans bulacak şekilde ayarlanabilir. Bu, aynı olup olmadıklarını görmek veya büyük dizileri parçalamak ve içerdikleri hangi dizileri bulmak için birçok gen örneğinin karşılaştırılmasına yardımcı olur. Çoğunlukla biyolojik ve tıbbi araştırma ekipleri bunu kullanır.
Dizi madenciliği için bir veritabanı oluşturmak zor olabilir, çünkü trend madenciliği ve diğer yapılandırılmış veri madenciliğinin aksine, dizilerin özel olarak birbiriyle eşleşmesi gerekir. Bu aynı zamanda diziler için madencilik sorununa da yol açar. Sıra farklıysa, tanınmaz ve madde madenciliğini zorlaştırabilir. Yaylı madencilik tipik olarak bundan faydalanır, çünkü bir doku örneğindeki en küçük fark organizmayı - veya araştırma ekibinin ne araştırıyorsa - diğer örneklerden tamamen farklı olmasını sağlayabilir.


