Продолжая рассматривать уязвимости биометрических систем, сегодня мы поговорим про отличия разных методов биометрии. Проанализируем быстроту их работы и устойчивость к фальсификации, а также используемые технологии Big Data и Machine Learning. Кроме того, сравним ставшие привычными способы идентификации личности по фотографии лица, снимкам глаз, отпечаткам пальцев и ладоней с более «экзотическими» методами: по запаху, сердцебиению и внутренним вибрациям.
Cравнительный анализ 5 самых популярных способов биометрической идентификации
Прежде всего, перечислим современные методы биометрии [1]:
- распознавание физиологических признаков человеческого тела, которые не существенно меняются со временем и остаются с их носителем в течение всей его жизни (отпечатки пальце, лицо, радужная оболочка и сетчатка глаза, ладони, уши, ДНК);
- исследование поведенческих характеристик, динамика которых постоянна на протяжении долгого времени вследствие постоянного повторения этих процессов (речь, почерк, манера печати на клавиатуре, походка).
На практике чаще всего используются следующие методы биометрии [1]:
- отпечатки пальцев;
- распознавание лица (двумерное и трехмерное);
- снимки радужной оболочки и сетчатки глаза;
- рисунок вен на ладони.
Сравним эти методы биометрии по следующим критериям:
- средние показатели эффективности (FAR и FRR) [1];
- возможность фальсификации;
- практическая распространенность;
- стоимость решения с учетом программных и аппаратных компонентов.
Метод биометрии |
FAR |
FRR |
Фальсификация |
Распространенность |
Стоимость |
Отпечаток пальца |
0,001% |
0,6% |
возможна |
высокая |
низкая |
Распознавание лица 2D |
0,1% |
2,5% |
возможна |
высокая |
низкая |
Распознавание лица 3D |
0,0005% |
0,1% |
проблематична |
средняя |
средняя |
Радужная оболочка глаза |
0,00001% |
0,016% |
проблематична |
средняя |
средняя |
Сетчатка глаза |
0,0001% |
0,4% |
невозможна |
низкая |
высокая |
Рисунок вен |
0,0008% |
0,01% |
невозможна |
низкая |
высокая |
От ушей до хвоста: краткий обзор других биометрических методов
Разумеется, в вышеприведенной таблице рассмотрены далеко не все методы биометрии. Развитие науки и техники приводит к появлению новых способов установления личности по физиологическим характеристикам и особенностям поведения. В частности, в 2017 году было научно доказано, что потовые выделения уникальны для каждого человека и подделать химический состав этих аминокислот невозможно. Поэтому пот, как и кровь, может точно и безошибочно идентифицировать личность.
В 2013 и 2014 годах были также предложены методы биометрии по запаху изо рта и даже с чисто вымытых ладоней. В 2017 году был разработан метод определения людей по микровибрациям пальцев, который почти также точен, как дактилоскопия или сканирование сетчатки глаза, но стоит в 10 раз дешевле.
В 2019 году на рынок вышел инфракрасный сканер Jetson, с помощью которого можно идентифицировать человека по скорости его сердцебиения на расстоянии до 200 метров с точностью до 95%. Это надежнее систем распознавания лиц и отпечатков пальцев, которые можно подделать, но гораздо медленнее. Для анализа сердцебиения нужно примерно полминуты, при этом человек должен быть легко одет и неподвижен. Похожие методы биометрии на основе анализа сердечной активности пользователя были предложены в 2017 и 2014 годах.
Ушные раковины также могут выступать в качестве уникальных идентификаторов личность, т.к. эта часть тела не повторяется даже у однояйцевых близнецов. Такой биометрический метод с точностью 99,6% целесообразно применять в бытовых индивидуальных задачах, например, для разблокировки смартфонов. Начиная с 2015 года стали активно развиваться Big Data системы поведенческой биометрии, основанные на анализе походки, движения губ при разговоре, голоса и манеры речи и даже особенностях работы на клавиатуре. Как правило, такие когнитивные характеристики используются в качестве дополнительных, а не основных параметров биометрической идентификации [2]. К поведенческой биометрии также относится сбор данных о пользовательском поведении в интернете, осуществляемый с помощью файлов cookies. Напомним, что в соответствии с требованиями GDPR и №ФЗ-152 «О персональных данных», необходимо предупредить пользователя о сборе такой информации и получить его согласие. Подробнее об этом мы рассказывали здесь.
10 важнейших критериев для выбора биометрии на базе Big Data и Machine Learning
Эффективность методов биометрии зависит от условий его применения. Поэтому при выборе биометрических параметров для идентификации личности стоит учитывать следующие факторы [3]:
- время идентификации – сколько минут потребуется для корректного сбора биометрических данных и их распознавания.
- удобство сбора биометрической информации: например, анализ крови или пота позволит точно идентифицировать человека, однако, процедура взятия этих биологических жидкостей требует специального оборудования и времени.
- широта охвата, например, пропускная способность Big Data системы биометрии на основе видеоаналитики потока людей в режиме онлайн значительно выше, чем при сканировании пальцев, ладоней, глаз или других частей тела каждого человека в отдельности.
- способ сбора биоданных – пока контактные способы точнее, чем бесконтактные, но первые требуют больше времени и отличаются меньшей пропускной способностью.
- устойчивость к фальсификациям, которая предполагает низкие показатели FAR и FMR. Это значит, что маловероятна ошибка 1-го рода (ложноположительное решение) когда, ML-модель ошибочно идентифицирует личность, распознав реальные БПД соответствующими шаблону другого человека.
- устойчивость к помехам, которая означает низкие показатели FRR и FNMR и небольшую вероятность ошибок 2-го рода и отказов в обслуживании из-за того, что алгоритм Machine Learning не смог распознать легитимного пользователя в связи с помехами или низким качеством представленных данных.
- необходимая инфраструктура – Big Data средства для хранения биометрических шаблонов (например, HBase в Apache Hadoop или другие NoSQL-СУБД), фреймворки аналитической обработки с помощью алгоритмов Machine Learning (Apache Spark, Flink), а также сенсоры и другие интеллектуальные устройства интернета вещей (Internet of Things, IoT), которые будут собирать и передавать оцифрованные биометрические данные для их сверки с шаблонами в базе. Иногда вся эта инфраструктура может уместиться в рамках одного смартфона, а для крупных биометрических систем типа индийского AADHAAR или российской ЕБС требуются масштабные распределенные решения на базе высоконадежных кластеров.
- общая надежность системы биометрии, которая характеризуется низким значением всех метрик качества распознавания (FAR, FRR, FMR, FNMR, FER, FTC), а малыми значениями RTO, RPO и другими SRE-показателями. Здесь следует учитывать не только алгоритмы Machine Learning, но и работу IoT/IIoT-оборудования, каналов передачи данных, технологии маршрутизации, инструменты резервирования информации, балансировки нагрузки на кластер и прочие компоненты масштабной Big Data системы.
- контекст приложения, что включает в себя место и особенности использования системы биометрии, например, видеокамеры уличного наблюдения, контроль в аэропортах, пропускные пункты на режимных объектах, онлайн-банкинг, телемедицина и пр.
- стоимость реализации – самыми точными, но и самыми дорогими являются многофакторные системы, которые используют сочетание нескольких методов биометрии, например, сканирование ладоней, сетчатки глаз и особенности движения.
В следующей статье мы расскажем, насколько методы биометрии устойчивы к фальсификации, рассмотрев несколько реальных кейсов обхода биометрических систем на базе Big Data и Machine Learning. Другие практические вопросы информационной безопасности больших данных, включая методы биометрии на базе машинного обучения, рассматриваются на наших образовательных курсах в лицензированном учебном центре обучения и повышения квалификации ИТ-специалистов (менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data) в Москве:
Источники