Co je to extrakce znalostí?
Získávání znalostí je proces využívání různých zdrojů informací k vytvoření soudržné znalostní banky. V rámci tohoto přístupu bude těžba často čerpat z řady strukturovaných i nestrukturovaných zdrojů. Pokud je úspěšný, extrakce znalostí vede k pevným datům, která lze snadno přečíst a interpretovat daným programem, což koncovému uživateli umožňuje využít tyto formální znalosti pro jakýkoli účel, který si přeje.
Při extrakci znalostí lze použít několik různých zdrojů. V rámci strukturovaných zdrojů mohou být data extrahována z různých typů relačních databází nebo z nějakého typu rozšiřitelného značkovacího jazyka nebo zdroje XML. Jako součást procesu extrakce lze využít nestrukturované zdroje, jako jsou obrázky, různé formy textových dokumentů, tabulek a dokonce i text zachycený v programech typu Poznámkový blok. Dokud jsou zdroje čitelné pro program používaný k řízení procesu extrakce znalostí, mohou být použity jako zdroje, které rozšiřují potenciál pro projekt, který se rozvíjí pomocí extrakce, a umožňují použitelné výsledné znalosti. .
S extrakcí znalostí se vyskytuje několik běžných aplikací. Jedním častým příkladem je schopnost zachytit data z nestrukturovaného zdroje a začlenit je do nějakého typu strukturovaného zdroje znalostí. Extrahování dat nalezených v relačních databázích a jejich použití k vytváření nových dokumentů nebo využívání elektronických dokumentů k importu dat do relačních databází je dalším příkladem toho, jak tento typ extrakce může urychlit sdílení formálních znalostí, aniž by bylo nutné ručně vkládat data. který je již k dispozici z jiného zdroje. Toto opětovné použití existujících znalostí v nějakém novém formátu je často velmi užitečné v řadě scénářů, což umožňuje využít tyto znalosti způsoby, které možná nebyly možné u stávajícího zdroje. Tímto způsobem může uživatel vytvářet zdroje, které jsou ideální pro řadu různých aplikací, nikoli pouze pro zdroje relevantní pro původní domov formálních znalostí.
S využitím extrakce dat je možné využít rozsáhlý datový sklad, snadno importovat a exportovat data jako způsob vytvoření nějakého nového zdroje, který je použitelný pro konkrétní účel. Tyto nově vytvořené zdroje zase nacházejí také místo v datovém skladu a mohou být nakonec použity při vytváření nových extrakcí, které slouží k uspokojení novějších potřeb využití. S ohledem na to lze na extrakci znalostí pohlížet jako na velmi užitečný nástroj, který napomáhá co nejvíce využívat všechny zdroje, které jsou v současné době k dispozici, což zjednodušuje mnoho úkolů spojených se sdílením těchto formálních znalostí.