7 этических проблем отечественной цифровизации и пути их решения

цифровизация, цифровая трансформация, цифровая экономика, управление, утечки данных, Security, защита информации, Big Data, Machine Learning, искусственный интеллект, большие данные, безопасность, Большие данные, предиктивная аналитика

Вчера мы говорили о том, какие организационные барьеры мешают реализации запланированных проектов национальной программы «Цифровая экономика РФ». Сегодня рассмотрим основные этические риски, которые сдерживают развитие цифровой трансформации в России и разберем некоторые возможности их обхода.

Чем страшна цифровизация: 7 ключевых проблем с точки зрения этики

16 января 2020 года Центр подготовки руководителей цифровой трансформации на базе Высшей школы государственного управления РАНХиГС совместно с ВШЭ представил доклад о главных этических проблемах и рисках внедрения цифровых технологий в России цифровыми технологии. Ключевыми проблемами работы с большими данными, методами искусственного интеллекта (ИИ) и интернетом вещей эксперты назвали следующие [1]:

  1. инфляция приватных данных, когда бизнес и государство собирает все больше данных о своих пользователях (гражданах) за тот же объем предоставляемых услуг. К примеру, обязательная регистрация на сайтах с указанием личного email и номера телефона, а также настоятельные рекомендации установить конкретное мобильное приложение для пользования сервисом. Сюда можно отнести проблему скрытого сбора данных, когда информация, нужная для каких-то дополнительных, а не основных функций системы (того же мобильного приложения), генерируется автоматически, например, путем отслеживания онлайн-активности, а не предоставляется пользователями сознательно.
  2. отсутствие прозрачности в операциях сбора, обработки, хранения и удаления персональных данных. В частности, несмотря на требования 152-ФЗ и GDPR, о которых мы писали здесь, пользователям не всегда точно и однозначно сообщаются цели, для чего нужны их персональные данные. Более того, пользователь не может проверить, насколько надежно защищена его приватная информация, а запрос на ее удаление порой занимает слишком много времени и усилий.
  3. дискриминация отдельных групп населения из-за недостаточно продуманных процедур формирования датасетов для обучения алгоритмов Machine Learning и других систем принятия решений. Например, привязка приложения заказа такси Uber к профилю в Facebook, который до сих пор есть далеко не у каждого [2].
  4. неприятие цифровых инициатив из-за отсутствия информационной поддержки и предварительной работы с общественным мнением;
  5. отсутствие ответственности за поведение ИИ-систем, включая принятие ошибочных решений, причинение ущерба из-за сбоев, некачественных датасетов и пр. Особенности этой проблемы мы рассматривали здесь, на примере беспилотных автомобилей и машин с интеллектуальной тормозной системой.
  6. предвзятость систем искусственного интеллекта, возникающая из-за переноса человеческих предубеждений в скоринговые алгоритмы или другие модели Machine Learning. Например, всего за сутки общения с молодежью чат-бот Tay от Microsoft, запущенный в марте 2016 года в Twitter, научился ругаться и стал делать расистские высказывания [3].
  7. сложность интерпретации и непрозрачность решений, принятых алгоритмами машинного обучения, когда люди не могут объяснить решения ИИ-систем и не доверяют им.

Что делать: 5 путей решения цифровых проблем

Для решения вышеперечисленных проблем эксперты Центра подготовки руководителей цифровой трансформации предлагают следующие меры [1]:

  • четкие механизмы правового регулирования по использованию данных с учетом интересов бизнеса и самих пользователей. Здесь важно соблюдать баланс между возможностями легитимного применения данных и строгими наказаниями за утечки конфиденциальной информации с ее неправомерным использованием. Судя по количеству новостей об утечках персональных данных, сегодня нельзя сказать о том, что существующие законы надежно защищают население. Недобросовестных операторов не пугают даже высокие штрафы GDPR. Однако, сегодня все больше компаний стремятся стать data-driven, принимая управленческие решения на основе больших данных о своих клиентах. Чтобы позволить бизнесу делать это на легальной основе с разрешения самих пользователей, весной 2020 года российский Фонд развития интернет-инициатив и компания Нuman Digital Capital создали маркетплейс пользовательских данных «Датамания», инвестировав около 250 миллионов рублей в онлайн-платформу компании IDX. Здесь россияне могут за деньги (не более 60 тысяч рублей в год) предоставлять бизнесу доступ к своим персональным данным [4]. Примечательно, что сама Датамания подчеркивает, что проект полностью соответствует требованиям главного российского закона 152-ФЗ «О персональных данных». Напомним, по этому закону персональные данные граждан РФ могут использоваться только с их согласия, которое Датамания спрашивает у пользователя при каждом запросе на его данные [5].
  • наличие этических кодексов и руководств по применению цифровых технологий в различных сферах деятельности как на отраслевом уровне, так и в рамках отдельно взятых компаний.
  • доступность цифровых услуг для всех категорий граждан и наличие альтернатив, когда люди, не имеющие возможности воспользоваться услугой в цифровом виде, могут получить ее посредством личного или «аналогового» обращения, например, по почте.
  • разбор этических вопросов работы с данными в рамках ИТ-образования, чтобы учащиеся школ, ВУЗов и специализированных курсов знали об этических рисках и последствиях применения цифровых технологий.

Дополнительно к вышеотмеченным рекомендациям следует активнее внедрять так называемый «объясняемый ИИ» (Explainable AI), который аналитическое агентство Gartner включило в ТОП-10 трендов 2020 года в области Data&Analytics. Этот набор возможностей, который описывает модель Machine Learning с указанием ее сильных и слабых аспектов, поможет точнее спрогнозировать поведение моделей и выявить потенциальные ошибки. В целом это повысит прозрачность и надежность ИИ-решений, снижая нормативные и репутационные риски. На практике это реализуется с помощью специальных библиотек и пакетов для визуализации данных и интерпретации прогнозов, например, Yellowbrick, ELI5, MLxtend, LIME и SHAP [6].

В следующей статье мы продолжим разговор про цифровизацию и рассмотрим концепцию DaaS (Data as a Service), которая позволяют получать бонусы data-driven управления без существенных инвестиций в ИТ-инфраструктуру для сбора, обработки, хранения и аналитики больших данных. А как избежать этических проблем в проектах цифровизации своего бизнеса или цифровой трансформации государственных и муниципальных предприятий, вы узнаете в рамках нашего обновленного курса «Аналитика больших данных для руководителей» в лицензированном учебном центре обучения и повышения квалификации разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.

Источники

  1. https://www.tadviser.ru/index.php/Статья:Сквозные_технологии_цифровой_экономики
  2. https://help.uber.com/ru-RU/riders/article/зачем-нужно-подтверждать-аккаунт-с-помощью-facebook?nodeId=fc267a07-2867-4d9f-add6-54639e9d6a67
  3. https://www.interfax.ru/world/500152
  4. https://quote.rbc.ru/news/article/5e39680a9a79472b12bc581b
  5. https://datamania.me/faq.php
  6. https://chernobrovov.ru/articles/interpretiruj-eto-metod-shap-v-data-science.html
Поиск по сайту