Co je těžba softwaru?
Softwarová těžba je proces, při kterém osoba nebo skupina, obvykle zapojená do odvětví informačních technologií (IT), vyhledává zdrojový kód softwarového programu, aby určila informace o něm. To lze provést řadou různých způsobů, i když se k usnadnění a urychlení procesu často používá jiný software. Informace nalezené touto metodou pak mohou být použity různými způsoby a jsou běžně využívány při vytváření modelů pro budoucí vývoj softwaru. Softwarová těžba je v některých ohledech podobná těžbě dat, i když typ získaných informací a jejich použití se mohou docela lišit.
Proces těžby softwaru je často používán společnostmi a vývojáři softwaru k extrahování dat z programu pro použití při vývoji nového softwaru. To se obvykle děje vývojáři softwaru, kteří procházejí různými řádky kódu, které tvoří program a extrahují data z tohoto kódu. Jiné programy se často používají k usnadnění těžby softwaru, často hledáním určitých termínů nebo segmentů v samotném kódu. Informace nalezené tímto způsobem mohou být použity mnoha způsoby, často jako model pro vývoj nových programů.
Dolování softwaru obvykle provádí společnost nebo jednotlivec na softwaru, který byl vyvinut touto společností, je právně vlastněn společností nebo který je poskytován na základě licence pro otevřený zdroj. Díky tomu jsou všechna data získaná procesem těžby legální. Softwarová těžba prováděná na programu vlastněném jinou osobou nebo společností však může porušovat autorská práva, která chrání software jako duševní vlastnictví. V některých případech to však může být něco jako nejasná právní oblast, takže těžbu by měl provádět pečlivě programátor nebo vývojář.
V mnoha ohledech je těžba softwaru podobná jinému procesu známému jako těžba dat. Dolování dat často používá podobné techniky a aplikace jako ty, které se používají v těžebním softwaru, ačkoli se to děje spíše do databází a jiných velkých množství nezpracovaných dat než do konkrétního softwarového programu. Někteří odborníci v oblasti IT však oba pojmy používají zaměnitelně, a proto lze „těžbu dat“ použít také v souvislosti se softwarovým programem. Zatímco dolování dat se obvykle snaží získat užitečná a konkrétní data z velké sady dat, často se provádí software mining, aby se zjistilo, jak byly v první řadě vytvořeny datové tabulky a kód.