Co je to těžba na webu?
Web mining je forma sběru informací, která se vztahuje na data získaná z online zdrojů. Shromažďování dat ze zdrojů přes internet umožňuje uživatelům agregovat velké objemy informací pro analýzu, aby se v online prostředí mohla provádět klíčová obchodní rozhodnutí. Například výzkumný pracovník může pomocí web mining těžit informace týkající se použití konkrétních klíčových slov ve webovém obsahu. Maloobchodníci a další marketingoví profesionálové alternativně využívají online těžbu dat ke zjištění trendů ve webovém provozu, konverzi návštěvníků webu na kupující a další využití webu.
Pokud jde o shromažďování, třídění a analýzu dat, webová těžba napodobuje tradiční činnosti v oblasti těžby dat. Činnosti těžby webu se spíše zaměřují spíše na informace na webu než na velký průřez informačními zdroji, jako jsou offline počítačové databáze, zákaznické záznamy nebo účetní data v tištěné podobě, jak se obvykle vyskytuje u tradiční těžby dat. Zaměření výhradně na sběr dat z online zdrojů poskytuje cílenou analýzu potřebnou pro online marketingové strategie, rozhodnutí o struktuře webových stránek a podobné rozhodování související s elektronickým obchodem. Sběr dat prostřednictvím webové těžby také přináší další výhodu široké mezinárodní demografické skupiny, protože webové stránky z celého světa jsou dostupné pro výzkumné pracovníky a sběratele informací.
Těžba webu je profesionálně rozdělena do tří specifických kategorií: dolování struktury webu, dolování využití a těžba webového obsahu. Každá oblast se zaměřuje na konkrétní informace, jako je struktura a hypertextové odkazy konkrétního webu, informace o protokolu serveru týkající se využití návštěvníků a konkrétní obsah dostupný online. Softwarové balíčky a služby pro analýzu webových stránek jsou ukázkovým příkladem těžby využití webu, protože poskytují webmasterům informace týkající se provozu návštěvníků, použitých výsledků vyhledávání, kliknutí na odkazy a času stráveného interakcí s konkrétními stránkami. Důlní struktura na druhé straně poskytuje podrobné informace o vnitřní struktuře konkrétního webu, včetně hypertextových odkazů, databází a funkcí dotazů.
Pro marketingového profesionála nabízí web mining rozsáhlé využití ve srovnání s marketingovými aktivitami. Cennou informací je vědět, jak návštěvníci webu používají konkrétní web, jak konkurenti nastavují konkurenční web a jaký obsah je již online. Tyto informace pomáhají klíčovým činitelům s rozhodováním vytvořit marketingovou strategii založenou na dříve ověřených technikách a dokumentovaných informacích.
Vysoké školy a univerzity také využívají web mining pomocí softwaru, který ověřuje, že studentské práce jsou jedinečné a nejsou plagiát. Při použití principů těžby webového obsahu vyhledávají takovéto pomocné nástroje pro klasifikaci celý obsah internetu. Instruktoři nahrají text studentského dokumentu a poté instruují softwaru plagiátorství, aby na internetu zkontroloval podobná fráze nebo zkopírovaný text online. Výsledky jsou často vyjádřeny jako procento odpovídajícího textu. Odkazy na jakékoli podobné výsledky jsou poskytovány, aby instruktoři mohli navštívit stránky a určit, zda jsou zápasy skutečně plagiáty.