Wat is tekstwinning?
Text mining is het proces waarbij computertechnologie wordt gebruikt om tekstdocumenten te doorzoeken voor onderzoek en analyse. Het wordt vaak beschouwd als zeer vergelijkbaar met het proces dat datamining wordt genoemd, maar het is afhankelijk van speciale programmering om in niet-gecategoriseerde tekst te kijken en betekenis of patronen te vinden in plaats van het analyseren van vooraf gecategoriseerde database-informatie. Text mining heeft veel toepassingen op gebieden zoals wetenschap, marketing en data-organisatie.
De complexiteit van het organiseren van woorden in taal is veel te extreem voor computers, maar wetenschappers hebben hard gewerkt om dit soort programmering te verbeteren. Veel methoden zijn ontwikkeld waarmee wetenschappers zinnen kunnen identificeren en feiten over tekst kunnen ontdekken. Dit is meestal niet hetzelfde als het volledig ontcijferen van de betekenis, maar het biedt snelkoppelingen die veel van dezelfde doelen bereiken. Tekstmining maakt gebruik van enkele van deze technieken, en naarmate deze technologie verbetert, wordt in het algemeen verwacht dat tekstmining ook zal verbeteren.
Experts gebruiken tekstinformatie-analyse voornamelijk om onderzoek te doen naar geschreven documenten. Grote hoeveelheden geschreven gegevens kunnen moeilijk te analyseren zijn vanwege de enorme hoeveelheid tijd die nodig is. Computers kunnen deze tekst veel sneller doornemen, maar ze kunnen het niet begrijpen. Met technieken voor tekstmining kunnen computers nuttige trends in tekst vinden, waarbij de gegevens worden gepresenteerd op een manier die nieuwe feiten kan onthullen of waarmee experts ontdekkingen kunnen doen.
Een voorbeeld van een gebruik voor deze technologie zou marktonderzoek zijn. Experts kunnen zoekresultaten op een productnaam analyseren en het programma laten zoeken naar uitdrukkingen die het gebruikersgevoel uitdrukken. Op deze manier kunnen ze op een zeer gedetailleerde manier ontdekken hoe mensen echt over hun product denken. Ze kunnen ook eenvoudig naar hun product zoeken en zien welke zinnen het vaakst opdoken, en dit kan hen helpen nieuwe ideeën te ontwikkelen over hoe ze hun klanten kunnen behagen.
Een ander gebruik voor het minen van tekst is het analyseren van wetenschappelijke artikelen over vergelijkbare onderwerpen op zoek naar nieuwe trends of overeenkomsten. Dit heeft sommige wetenschappers in staat gesteld voorspellende veronderstellingen te maken die nuttig zijn gebleken op gebieden zoals eiwitanalyse. Sommige experts denken dat dit soort toepassingen uiteindelijk voor onverwachte ontdekkingen kunnen zorgen.
Een proces dat datamining wordt genoemd, is eigenlijk vrij gelijkaardig aan het minen van tekst, maar het is over het algemeen minder ingewikkeld om te doen omdat het afhankelijk is van tekst die al in categorieën is opgemaakt. De software kan bijvoorbeeld alle informatie voor sollicitanten in een database doornemen, op zoek naar trends. Tekst mining is moeilijker voor computers omdat zuivere tekst moeilijker te analyseren is dan gegevens met categorieën.