Wat is conceptmining?
Concept mining is een proces dat zich richt op het extraheren van ideeën en concepten uit documenten. De aanpak is enigszins vergelijkbaar met text mining, met het belangrijkste verschil dat het minen van een tekst zich richt op het extraheren van informatie in plaats van ideeën. Concept mining is nuttig in een aantal toepassingen, waaronder de evaluatie van softwareprogramma's en in verschillende toepassingen die over het algemeen worden geclassificeerd als onderdeel van de kunstmatige intelligentie in de informatica.
Het gebruik van concept mining kan plaatsvinden met elk type documenten, ongeacht hoe ze zijn opgemaakt. Deze strategie werkt goed met kleinere documenten, maar is vooral effectief met langere documenten, omdat de ideeën in de loop van het document kunnen worden geëxtraheerd. Dit in tegenstelling tot het extraheren van specifieke secties tekst, vooral als de woorden in de geëxtraheerde sectie verschillende betekenissen kunnen hebben op basis van de context van het gebruik. Aangezien concept mining de hele tekst als een geheel beschouwt, neemt de mogelijkheid om intentie en betekenis te achterhalen op basis van de algehele stroom van het document toe.
Werkelijke toepassingen van concept mining zijn onder meer de mogelijkheid om meerdere documenten in een bedrijfsdatabase te scannen en deze te relateren op basis van de concepten in vergelijkbare documenten. Dit helpt te bereiken is de mogelijkheid om naar een groot aantal documenten te verwijzen op een manier die niet mogelijk is met behulp van een text mining of andere vormen van datamining. Het is niet ongebruikelijk dat bedrijven deze aanpak samen met andere strategieën gebruiken om de meest efficiënte en uitgebreide processen te regelen voor toegang tot gerelateerde documenten met een minimum aan vertraging.
Hoewel het idee van concept mining al tientallen jaren bestaat, is dit proces steeds belangrijker geworden omdat bedrijven en instellingen in alle soorten en maten meer afhankelijk zijn van elektronische gegevens dan van papieren documenten. Daartoe is ook de ontwikkeling van softwaretoepassingen die kunnen worden aangepast om de relatie tussen verschillende documenten vanuit een conceptueel oogpunt mogelijk te maken, gebruikelijker geworden. De meeste van deze softwareprogramma's zijn geconfigureerd om een zekere mate van intuïtieve activiteit mogelijk te maken om concepten te vinden die met tekst worden gevonden en logische verbindingen met andere documenten te vinden. Wanneer concept mining efficiënt wordt beheerd, kan deze benadering van documentorganisatie en -ophaling het vermogen om de documenten die in de opslag zijn opgeslagen optimaal benutten en het ophalen van ideeën en relevante taken veel sneller en gemakkelijker maken.