Skip to main content

Что такое конфиденциальный майнинг данных?

Сохранение конфиденциальности при извлечении данных - это процесс совместной работы по извлечению данных без раскрытия конфиденциальной информации, связанной с информацией, содержащейся в любой из добываемых баз данных. Он традиционно используется, когда человек или организация работают с отраслевыми конкурентами. Хотя конкуренты могут иногда получать взаимную выгоду от совместного использования ресурсов, все стороны заинтересованы в сохранении потенциально частной или конфиденциальной информации о своих текущих проектах. Сохранение конфиденциальности данных интеллектуального анализа защищает конфиденциальность всех сторон, предоставляя результаты интеллектуального анализа данных, фактически не раскрывая источник какой-либо конкретной информации.

Интеллектуальный анализ данных - это процесс сбора большого количества данных и сканирования их на предмет общих тенденций. Одним из основных примеров интеллектуального анализа данных может быть просмотр базы данных продаж, чтобы выяснить, в какие сезоны продажи определенного продукта являются самыми высокими. Бизнес-аналитика, полученная в результате этого майнинга, поможет компании увеличить продажи в непиковые периоды и внести другие изменения, чтобы увеличить их валовую прибыль. Еще один более сложный пример - сканирование баз данных на предмет потребительских тенденций в принятии решений о покупке. Это позволило бы производителям точно предсказать, какие типы продуктов становятся популярными, и дать им возможность узнать, на что направить свои ограниченные ресурсы.

Благодаря объединению информации, хранящейся в базе данных, с информацией, хранящейся в базах данных конкурентами, эффективность интеллектуального анализа данных резко возрастает. Чем больше данных нужно изучить, тем легче становится находить и использовать тенденции. Другими словами, когда у отдельной организации есть 10 000 примеров, из которых они могут извлечь, они обычно могут поймать шаблоны, которые не станут очевидными только с 100 примерами одного и того же типа. Естественно, однако, что всегда некоторые информационные компании неохотно делятся со своими конкурентами. Именно здесь в игру вступает интеллектуальный анализ данных.

Сохранение конфиденциальности данных работает, позволяя конкурирующим компаниям передавать только те данные, которыми они хотят поделиться, в центральную «общую» базу данных. Ограничивая интеллектуальный анализ данных исключительно добровольной информацией, конфиденциальность поддерживается с обеих сторон без ущерба для основной цели усилий по интеллектуальному анализу данных. Конфиденциальность также может быть защищена путем использования незаинтересованной посреднической стороны для проведения фактического майнинга, что позволяет компаниям объединять ресурсы своих баз данных, при этом ни одна из компаний не имеет прямого доступа к частным типам данных другой компании.