Обезличивание персональных данных с сохранением их смысла

Разработка и эксплуатация информационных и бизнес-систем, оперирующих персональными сведениями, требует особого подхода к обеспечению защиты чувствительных данных, особенно когда речь идёт о предоставлении доступа к такому ПО сторонним организациям: внешним подрядчикам, тестировщикам, аудиторам, аналитическим службам и т. д. Предотвратить утечки конфиденциальных сведений в подобных случаях можно путём их обезличивания. Такая модификация данных без изменения их типов и структуры позволяет, с одной стороны, не замедлять процессы разработки, тестирования и обслуживания приложений, а с другой — избежать рисков утечки важной информации и соответствовать требованиям безопасной разработки. С решением этой задачи позволяет справиться «Маскировщик» — продукт российской компании HFLabs.

Программный комплекс «Маскировщик» доступен как коробочное решение и как SaaS-сервис. Он обезличивает разные типы данных: ФИО, даты рождения, адреса, телефоны, e-mail, ИНН, СНИЛС, банковские карты и счета, ПТС и водительские удостоверения, паспортные данные, а также сведения об индивидуальных предпринимателях и юридических лицах. Другие типы данных можно маскировать, выбрав из преднастроенных правил несложные мутации. Поддерживается работа с СУБД PostgreSQL, Oracle Database, MS SQL, MySQL, SQLite, Clickhouse, GreenPlum.

Обезличивание персональных данных с сохранением их смысла
Пример работы «Маскировщика» (представленные на скриншоте данные — вымышленные и не соответствуют действительности; источник изображения: hflabs.ru)

Используя логику умной замены, «Маскировщик» при обезличивании сохраняет качество и контекст данных и делает их максимально похожими на настоящие. При маскировании не теряются социально-демографические характеристики, географическое распределение, родственные связи и даже форматно-логический контроль документов. Благодаря такому подходу обезличенные с помощью «Маскировщика» данные могут использоваться для корректного построения аналитических моделей. Например, «Маскировщик» заменяет ФИО с учётом его популярности и пола клиента. Номера телефонов при умном маскировании не теряют привязку к оператору или региону, адреса остаются валидными в пределах региона или города, а люди, проживающие по одному и тому же адресу, получают другой реальный адрес.

Для сохранения социально-демографических признаков даты рождения меняются в пределах небольшого интервала (например, 1991 год на 1992-й). Отдельные возрастные рамки, значимые для маркетинга, могут быть заданы жёстко: например, человек младше 18 лет не станет совершеннолетним. Также «Маскировщик» сохраняет особенности документов — валидность паспортов, ИНН, СНИЛС. Он учитывает их формат, контрольные суммы и действительность. Все замены подбираются случайным образом, сохраняются в зашифрованном виде и удаляются по окончанию процесса обезличивания. Такой подход позволяет соблюсти консистентность между всеми маскируемыми базами и исключить возможность обратного восстановления исходных значений.