Che cos'è l'estrazione del flusso di dati?
Il mining del flusso di dati è una strategia che prevede l'identificazione e l'estrazione di informazioni da un flusso di dati attivo. Con questo approccio, l'idea è quella di estrarre i dati senza creare alcun tipo di interruzione nel flusso stesso, rendendo possibile ad altri di utilizzare i dati anche durante l'estrazione. Questo tipo di attività di mining del flusso di dati può coinvolgere tutti i tipi di dati, che vanno dalla trasmissione vocale a quella video su Internet e persino alle attività quotidiane come il prelievo di denaro da un conto bancario utilizzando un bancomat o una conversazione telefonica.
Una delle caratteristiche dell'estrazione del flusso di dati è la capacità di proiettare o prevedere con precisione come individuare le informazioni desiderate e che tipo di strumenti di scoperta della conoscenza aiuteranno a localizzare ed estrarre con successo le informazioni desiderate. Ad esempio, quando un cliente avvia una transazione utilizzando un bancomat, la programmazione della macchina avvia una ricerca delle informazioni relative all'account, individua i dati e quindi determina se l'importo della transazione ridurrà il saldo del conto al di sotto di un importo consentito, in base al modo in cui è strutturato l'account. Da lì, la programmazione può restituire all'utente dati rilevanti, come documentare il corretto completamento della transazione richiesta e fornire il saldo del conto rimanente dopo la registrazione del credito o dell'addebito relativo alla transazione.
Un altro esempio comune di mining del flusso di dati è la ricerca Web di base mediante un browser. Con questa applicazione, l'utente finale inserisce i valori di ricerca in un campo e il software che guida il browser cerca di interpretare quei valori e restituire dati che hanno una certa rilevanza per i criteri di ricerca. A seconda di come è configurato il browser, questo può includere anche una funzione che cerca di anticipare l'intento della ricerca condotta e di offrire parole o frasi aggiuntive che potrebbero aiutare a perfezionare la ricerca in base alle preferenze dell'utente. Una volta che l'utente ha stabilito la frase di ricerca, il browser restituisce i risultati in ordine di classificazione, utilizzando algoritmi che sono rilevanti per la configurazione del browser stesso.
Uno dei principali vantaggi dell'estrazione del flusso di dati è la possibilità di accedere e cercare dati senza vietare ad altri di utilizzare gli stessi dati. Poiché i flussi di dati vengono costantemente aggiornati, i risultati dell'estrazione possono cambiare di volta in volta. Ad esempio, condurre una ricerca web usando una specifica frase di ricerca può produrre oggi un insieme di risultati, ma domani fornire un insieme leggermente diverso di risultati, in base alle nuove informazioni inserite nel flusso di dati e al modo in cui il motore di ricerca classifica tali dati.