Co to jest prywatność, która chroni eksplorację danych?
Eksploracja danych z zachowaniem prywatności to proces współpracy w zakresie eksploracji danych bez ujawniania poufnych szczegółów związanych z informacjami zawartymi w dowolnej wydobywanej bazie danych. Jest tradycyjnie stosowany, gdy osoba lub organizacja współpracuje z konkurencją branżową. Podczas gdy konkurenci mogą czasem wzajemnie korzystać z dzielenia się zasobami, wszystkie strony mają interes w zachowaniu potencjalnie prywatnych lub poufnych informacji o swoich bieżących projektach. Eksploracja danych z zachowaniem prywatności chroni zaufanie wszystkich stron, generując wyniki eksploracji danych, bez faktycznego ujawniania źródła jakiejkolwiek konkretnej informacji.
Eksploracja danych to proces gromadzenia dużej ilości danych i skanowania ich w poszukiwaniu ogólnych trendów. Jednym z podstawowych przykładów eksploracji danych byłoby przejrzenie bazy danych sprzedaży, aby dowiedzieć się, w których sezonach sprzedaż danego produktu jest najwyższa. Analiza biznesowa pochodząca z tego wydobycia pomogłaby firmie w osiągnięciu sprzedaży poza godzinami szczytu i wprowadzeniu innych modyfikacji w celu zwiększenia zysków brutto. Kolejnym bardziej złożonym przykładem byłoby skanowanie baz danych w poszukiwaniu trendów konsumenckich w decyzjach zakupowych. Pozwoliłoby to producentom dokładnie przewidzieć, jakie rodzaje produktów stają się popularne, umożliwiając im wiedzieć, gdzie skoncentrować swoje ograniczone zasoby.
Poprzez połączenie informacji przechowywanych w bazie danych z informacjami przechowywanymi w bazach danych przez konkurentów, wydajność eksploracji danych jest drastycznie zwiększona. Im więcej danych jest do zbadania, tym łatwiej jest znaleźć i wykorzystać trendy. Innymi słowy, gdy pojedyncza organizacja ma 10 000 przykładów, z których można czerpać, zazwyczaj może złapać wzorce, które nie stałyby się widoczne na podstawie zaledwie 100 przykładów tego samego typu. Oczywiście jednak zawsze istnieją informacje, które firmy niechętnie dzielą się ze swoimi konkurentami. W tym momencie ma miejsce eksploracja danych z zachowaniem prywatności.
Eksploracja danych z zachowaniem prywatności polega na umożliwieniu konkurującym firmom dostarczania tylko tych danych, które chcą udostępnić, do centralnej „wspólnej” bazy danych. Ograniczając eksplorację danych do ściśle dobrowolnych informacji, prywatność jest utrzymywana po obu stronach, nie podważając głównego celu wysiłków w zakresie eksploracji danych. Prywatność można również chronić, wykorzystując bezinteresowną stronę pośredniczącą do przeprowadzenia faktycznej eksploracji, umożliwiając firmom łączenie zasobów bazy danych bez żadnej firmy mającej bezpośredni dostęp do prywatnych danych innych firm.