Wat is gegevensstreammijnbouw?
Gegevensstream mining is een strategie waarbij informatie wordt geïdentificeerd en extraheren uit een actieve gegevensstroom. Met deze aanpak is het idee om de gegevens te trekken zonder enige vorm van onderbreking in de stream zelf te creëren, waardoor anderen ook de gegevens kunnen gebruiken, zelfs als de extractie plaatsvindt. Dit soort data -stream -mijnbouwinspanning kan allerlei gegevens met zich meebrengen, variërend van spraak tot video -transmissie via internet en zelfs tot dagelijkse taken zoals het opnemen van geld van een bankrekening met behulp van een geautomatiseerde teller -machine of een telefoongesprek voeren.
Een van de kenmerken van gegevensstreammijnbouw is de mogelijkheid om nauwkeurig te projecteren of te voorspellen hoe de gewenste informatie te vinden en wat voor soort kennisontdekkingstools zullen helpen bij het lokaliseren en succesvol extraheren van de gewenste informatie. Wanneer een klant bijvoorbeeld een transactie initieert met behulp van een geautomatiseerde teller -machine, wordt de programmering voor de machine een zoekopdracht gestartVoor relevante accountinformatie, lokaliseert de gegevens en bepaalt vervolgens of het bedrag van de transactie het rekeningsaldo onder een toegestane bedrag zal verminderen, op basis van de manier waarop de rekening is gestructureerd. Van daaruit kan de programmering relevante gegevens aan de gebruiker retourneren, zoals het documenteren van de succesvolle voltooiing van de gevraagde transactie en het verstrekken van het evenwichtsaldo dat is overgebleven nadat het krediet of de debet die bij de transactie betrokken is is geregistreerd.
Een ander veel voorkomend voorbeeld van gegevensstreammijnbouw is de basisweb zoekopdracht met behulp van een browser. Met deze toepassing voert de eindgebruiker zoekwaarden in een veld in, en de software die de browser aandrijft, probeert deze waarden te interpreteren en gegevens terug te retourneren die enige relevantie hebben voor de zoekcriteria. Afhankelijk van hoe de browser is geconfigureerd, kan dit ook een functie bevatten die probeert te anticiperen op de bedoeling van de uitgevoerd zoekopdracht enBied aanvullende woorden of zinnen die kunnen helpen om de zoekopdracht meer naar de voorkeur van de gebruiker te verfijnen. Zodra de gebruiker zich heeft gevestigd op de zoekzin, retourneert de browser resultaten in volgorde van rangorde, met behulp van algoritmen die relevant zijn voor de configuratie van de browser zelf.
Een van de belangrijkste voordelen van datstreammijnbouw is de mogelijkheid om toegang te krijgen tot en te zoeken zonder anderen te verbieden om gebruik te maken van dezelfde gegevens. Omdat gegevensstromen voortdurend bijwerken, kunnen de resultaten van de extractie van tijd tot tijd veranderen. Het uitvoeren van een webzoekopdracht met behulp van een specifieke zoekzin kan bijvoorbeeld vandaag één set resultaten opleveren, maar morgen een iets andere reeks resultaten bieden, op basis van welke nieuwe informatie de gegevensstroom heeft ingevoerd en hoe de zoekmachine die gegevens rangschikt.