Yapı madenciliği, yarı yapılandırılmış bir veri kaynağının tarandığı ve yapısının unsurlarının keşfedildiği ve vurgulandığı bir tür veri madenciliğidir. Yarı yapılandırılmış bir veri kaynağı, tabloların geleneksel veritabanı yapısını kullanmayan, ancak bilgileri etiketler ve işaretleyicilerle ayıran semantik bir öğeye sahip olandır. Yapı madenciliği, yapı elemanlarını keşfetmek için veritabanlarını, web sitelerini ve diğer birçok bilgisayar bilgisi formunu madencilik yapmak için kullanılabilir. Kullanıcıların, parçaların birbirleriyle nasıl etkileşime girdiğini ya da belirli etiketler altında nasıl bilgi bulabileceklerini anlamalarına yardımcı olur. Bu madencilik aynı zamanda, kullanıcının yazdığı kurallara dayanarak bir öğenin ne olduğunu tahmin etmek için de kullanılabilir.
Birçok farklı türde veri madenciliği vardır ve çoğu geleneksel olarak yapılandırılmış bir kaynak olan madencilikle ilgilidir. Bu, çoğu veritabanında tipik olan tabloları ve düğümleri kullanan tüm kaynakları içerir. Yapı madenciliğinde sadece yarı yapılandırılmış veriler kullanılır. Bu örnekte, veriler, geleneksel veritabanı kurallarına uyan bir yapıya sahip değil, bir yapıya sahip web sitelerinden veya basit veritabanlarından alınmıştır. Veri, her bir öğeyi ayrı ayrı kazınacak şekilde düzenleyen etiketlere veya işaretçilere ihtiyaç duyar.
Yarı yapılandırılmış veri setini okuyarak, yapı madenciliği yapının nasıl etkileşime girdiğini keşfedebilir. Örneğin, her web sitesinin gezinme modeli vardır ve sayfaların nasıl etkileşeceğini belirleyen modeldir. Kullanıcı, yapıyı inceleyerek, bu gezinmenin nasıl çalıştığını keşfederek, benzer bir gezinme şeması oluşturmaya yardımcı olabilir.
Yapı madenciliği, madencilik programına kural yazarak madde bulmak için de kullanılabilir. Örneğin, bir kitap veri seti varsa, kullanıcı, dizini olmayan kitapların kurgu olarak dönmesi ve dizini olanların kurgu dışı olarak dönmesi gerektiği konusunda bir kural yazabilir. Çoğu kurgu kitabı bir endeks içermez, bu nedenle bu kural verilerin ne olduğunu yüksek doğrulukla tahmin eder. Bu, kullanıcıların örgütsel bir yönteme sahip, ancak kullanıcının aradığı şeylere uygun olmayan yarı yapılandırılmış bir kümeye bakarken yardımcı olur.
Yarı yapılandırılmış birimin yapısını tespit ettikten sonra, kullanıcı tipik olarak başka bir yarı yapılandırılmış birim ile karşılaştıracaktır. Kullanıcının bir işletme web sitesi varsa, gezinme ve bağlantılar için başka bir işletme web sitesini açabilir ve web sitesinin nasıl göründüğünü görebilir. Kullanıcı mayınlı bilgileri karşılaştırarak yapının verimliliğini arttırmanın yollarını bulabilir.


