Вчера мы писали, что cybersecurity биометрии пока не слишком надежна: обмануть можно как дактилоскопический сканер на смартфоне, так и крупную систему больших данных (Big Data). Сегодня поговорим о мерах обеспечения информационной безопасности биометрических данных: многофакторной аутентификации, защите цифровых шаблонов и кратной верификации. А также расскажем, когда государственная цифровизация в России намерена заменить бумажные паспорта пластиковыми карточками с биометрическими чипами.
Что такое биометрический шаблон и зачем он нужен в Big Data системе
Напомним, что шаблон биометрических персональных данных (БПД), который генерируется при регистрации пользователя в системе биометрии, по сути, является паролем для входа в среду. Он создается при регистрации в системе, а при последующем использовании текущие БПД сравниваются с заранее сохраненным образцом. Поэтому цифровой шаблон должен быть защищен так, чтобы его невозможно было украсть и подделать. Для этого в cybersecurity для биометрии выделяют 3 основных требования к шаблону БПД [1]:
- необратимость – невозможность воссоздания исходных биометрических данных из сохраненного шаблона путем цифровых вычислений или генерацией физической подделки;
- различимость, чтобы схема информационной защиты шаблона не ухудшала точность распознавания биометрии;
- отменяемость – возможность генерации нескольких защищенных шаблонов из одних и тех же исходных биометрических данных на случай утечки одного из них. Это позволит Big Data системе отзывать и выдавать новые биометрические шаблоны и предотвратит перекрестное сопоставление между разными биометрическими базами, сохраняя приватность пользовательской информации.
Как хранятся биометрические шаблоны: 2 основных метода защиты
Одно из элементарных правил информационной безопасности гласит, что в информационных системах пароли никогда не хранятся в чистом виде, чтобы их нельзя было напрямую подсмотреть и неправомерно использовать. На практике для этого используется механизм хэширования, когда с помощью криптографических алгоритмов создается его зашифрованное отображение, которое и записывается в базу данных. Аналогично биометрические БПД после их оцифровки маскируются для защищенного хранения.
Чтобы по шаблону было невозможно подделать БПД, используются следующие методы cybersecurity [1]:
- трансформация биометрических параметров, когда к исходным данным применяется необратимая функция, изменяющая их. При аутентификации выполняется обратное преобразование и используемые в системе алгоритмы распознавания сопоставляют текущие БПД с уже трансформированным шаблоном.
- биометрические криптосистемы, которые хранят только часть информации из биометрического шаблона – защищенный эскиз (secure sketch), данных в котором недостаточно для восстановления оригинального образца. При этом защищенный эскиз содержит информацию, необходимую для идентификации личности. Как правило, защищенный эскиз получают с помощью криптографического ключа и функций нечеткой логики. При этом в защищенном шаблоне содержится одновременно и сами биометрические данные и криптографический ключ. Однако, ни ключ, ни шаблон БПД нельзя восстановить по одному лишь защищенному эскизу. Когда системе биометрии предоставляют БПД, похожие на шаблон, она может восстановить сам исходный образец и его криптографический ключ с помощью стандартных методов распознавания ошибок, например, машины опорных векторов (SVM, Support Vector Machine).
Другие 3 метода cybersecurity в биометрии: многофакторные аутентификация и верификация с комплексными шаблонами
Еще одним способом обеспечения информационной безопасности в Big Data системах на базе биометрии, является кратная верификация. При этом выполняется проверка не только биометрических параметров идентифицируемой личности, но и сопоставление этой информации с данными из других источников. Это предполагает, что цифровизация будет реализована не локально в рамках отдельной Big Data системы, а на общегосударственном уровне. Например, двойная верификация предполагает сверку биометрического шаблона, записанного в электронном паспорте или визе, с биометрическими характеристиками проверяемого гражданина. А тройная верификация означает дополнительную сверку двух параметров с цифровых шаблоном, хранящимся в государственной биометрической системе. В этом случае любая попытка подделать документ, удостоверяющий личность, обречена на провал. Такая тройная проверка включена в рекомендации Международной организации гражданской авиации ICAO по применению биометрических систем. Однако, на практике этот вариант еще мало где реализован из-за отсутствия в большинстве стран глобальных систем биометрии [2]. Пока наиболее ярким примером подобной системы можно назвать индийский проект AADHAAR на базе MapR, Apache Hadoop и других технологий Big Data. Но кратные верификации не гарантируют полной защиты от злоупотреблений с биометрическими данными, включая утечки такой информации, о чем мы писали здесь.
В России, помимо единой биометрической системы, введенной в эксплуатацию с 2018 года, государственная цифровизация также предполагает вносить БПД в новые удостоверения личности. Согласно нацпрограмме «Цифровая экономика», с 2023 года они должны заменить ранее выдаваемые бумажные паспорта. С 2020 года в Москве запущен пилотный проект по выдаче электронных паспортов в виде пластиковых карточек с чипами. Такие удостоверения личности будут интегрированы с мобильным приложением для удаленной идентификации. Также, помимо основных сведений о гражданине (ФИО, дата и место рождения, пол, личный номер и подпись), связаны с БПД человека – отпечатками пальцев и электронной подписью. Ожидается, что такие документы упростят взаимодействие с госорганами, сократив время на получение государственных и коммерческих услуг. Кроме того, подобные удостоверения личности на базе биометрии помогут снизить число преступлений, связанных с кражей и неправомерным использованием персональных данных [3].
Похожим способом защиты информации в Big Data системах на базе биометрии является многофакторная аутентификация. При этом, для подтверждения личности, помимо соответствия текущих БПД заранее сохраненному шаблону, используется еще один внешний ключ, не привязанный напрямую к проверяемым биологическим параметрам. Например, это может быть ответ на специфический вопрос. Такая мера позволит в какой-то степени снизить риск нелегитимного использования современных технологий машинного обучения – Deep Fake, которые позволяют генерировать реалистичные видео и аудио в режиме онлайн. Об этом мы рассказывали здесь.
Наконец, поскольку ни один биометрический метод не может гарантировать 100% точность распознавания, современные Big Data системы работают с сочетанием нескольких идентификационных параметров. При этом используется комбинация статических и динамических характеристик. Например, цифровой шаблон БПД может содержать сведения об отпечатках пальцев и ладонях человека, снимки его лица, глаз (радужка и сетчатка) и поведенческие характеристики (голос, походка, манера печати на клавиатуре и т.д.). Такая тотальная цифровизация снижает вероятность ложных решений, но повышает жесткость требований к информационной безопасности подобной Big Data биометрии.
Что такое биометрическая цифровизация и как выгодно использовать большие данные с надежной гарантией информационной безопасности своего бизнеса, вы узнаете на наших образовательных курсах в лицензированном учебном центре обучения и повышения квалификации ИТ-специалистов (менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data) в Москве:
Источники