Бытует мнение, что можно обеспечить безопасность больших данных при условии персональной приватности и невозможности идентификации объектов: имена, адреса и номера договоров, как правило, не требуются для анализа больших данных, поэтому такую информацию нужно либо «хешировать», либо удалять из источников анализа, либо шифровать. Однако представляется, что такое мнение ошибочно ввиду необходимости обеспечения безопасности данных во время всего жизненного цикла работы с ними — сбора, записи, хранения и перемещения.

При этом следует учитывать, что технологии работы с большими данными зачастую построены на открытом коде, в который по умолчанию не может быть заложена никакая безопасность. Одновременно с этим целесообразно изолировать базы типа Hadoop и на сетевом уровне, чтобы исключить возможность несанкционированного доступа.

И, конечно же, необходимо уделять должное внимание и защите контура организации, выстраиванию правильных процессов управления ролями доступов в системы и приложения, применению современных интеллектуальных систем мониторинга и обеспечения информационной безопасности.