Сегодня рассмотрим, как методы графовой аналитики больших данных помогают бороться с эпидемией финансовых мошенничеств: выявлять номера злоумышленников, идентифицировать фрод-транзакции, выявлять и предотвращать схемы отмывания денег. Читайте далее, что под капотом AML-систем и как инструменты Data Science предотвращают злоупотребление методами социальной инженерии.
Немного истории: что такое социальная инженерия и чем это опасно
Социальная инженерия – это психологическое манипулирование людьми с целью совершения определенных действий или разглашения конфиденциальной информации. Первые примеры такого манипулирования можно найти еще в библейской истории, однако, несмотря на древность этого подхода, он эффективно применяется и по сей день.
В 2020 году мошенники вывели у клиентов банков более 150 миллиардов рублей, при этом большая часть хищений была совершена с использованием методов социальной инженерии. А в 1-м квартале 2021 года объем похищенных средств вырос в 1.5 раза по сравнению с прошлогодними показателями. Сегодня средний чек успешной мошеннической операции составляет около 8 тысяч рублей, а новостные сайты каждого региона России пестрят объявлениями о множестве пострадавших. Получается, эпидемия финансовых мошенничеств по охвату и понесенным последствиям сравнима с пандемией COVID-19, о чем мы писали в прошлой статье.
Однако, современные инструменты Data Science, в частности, графовая аналитика больших данных, помогают и здесь. Борьба с эпидемией финансовых мошенников происходит по трем основным направлениям:
- нахождение мошеннических номеров;
- идентификация подозрительных и/или злонамеренных транзакций, называемых фрод-операциями от английского fraud;
- обнаружение и предотвращение схем вывода украденных средств, т.е. «отмывание денег» (AML).
Рассмотрим, как анализ графов работает в каждом из этих направлений подробнее.
Графовые алгоритмы. Бизнес-приложения
Код курса
GRAF
Ближайшая дата курса
по запросу
Продолжительность
24 ак.часов
Стоимость обучения
54 000 руб.
Нахождение мошеннических номеров
В настоящее время практикуются два основных подхода для обнаружения мошеннических номеров:
- на основе базы пользовательских отзывов, где мошеннические номера добавляются в соответствующие справочники. Основным недостатком подхода является задержка — в справочниках пользовательских отзывов номера появляются в среднем через три дня после их появления в сети. За это время мошенники успевают вывести большое количество денежных средств и поменять номер телефона, с которого происходят противоправные действия.
- использование алгоритмов машинного обучения (Machine Learning), которые позволяют находить мошеннические номера уже через час после их появления в сети с высокой точностью обнаружения (от 80%).
Также ML-алгоритмы, в отличие от базы пользовательских отзывов, позволяют реализовать регулярную автоматическую верификацию, корректировку и обновление списка. Для построения модели рассчитываются факторы, характеризующие профиль поведения мошеннических номеров. Например, средняя продолжительность разговора, отношение количества входящих и исходящих звонков с номера и пр. Также высокую значимость показывают факторы на базе графовой меры связности, поскольку мошенники охотятся «стаями» и жертвы обычно подвергаются атакам сразу с нескольких мошеннических номеров.
Идентификация фрод-транзакций
Если система безопасности банка не смогла зафиксировать факт звонка с мошеннического номера, следующей стадией защиты является система обнаружения мошеннической транзакции. Эта система учитывает следующий набор факторов:
- информации о платежах с анализируемой карты за прошлые периоды;
- характеристики анализируемой транзакции;
- категория компании, в которой проходит анализируемая транзакция (определяется модельным путем).
Определение категории анализируемой транзакции является самостоятельной задачей, требующей специального подхода, в том числе на базе анализа графовых характеристик. Об этом мы расскажем в нашей новой статье.
Обнаружение и предотвращение схем вывода украденных средств (AML)
Если мошенническая транзакция все же была совершена, то следующим этапом борьбы с мошенниками является идентификация факта обналичивания украденных денежных средств с последующей поимкой преступников и разрушением сетей обнальщиков.
Действенным подходом для обнаружения новых обнальщиков является нахождение графовых метрик пересечения между лицами, осуществляющими переводы. Например, в одном реальном кейсе этот подход позволил обнаружить 552 новых обнальщиков по 82 известным.
Рис1. Граф лиц, осуществляющих обналичивание украденных денежных средств
Обнаружение лиц, играющих центральную роль в сетях обнальщиков, и их поимка позволяют разрушить всю сеть преступников. Например, сообщество платежей из 195 участников распалось на изолированные вершины после удаления 6 узлов с наибольшем значением меры центральности.
Рис2. Исходное сообщество платежей из 195 участников
Рис3. Преобразованный граф сообщества после удаления 6 узлов с наибольшем значением меры центральности
Вместо заключение
Эпидемия финансовых мошенников захлестнула Россию и лишь благодаря современным аналитическим технологиям нам удается сдерживать преступников. Основное преимущество подходов на базе графовых алгоритмов в том, что их работу практически невозможно смоделировать со стороны мошенников. Ведь построение графовых метрик требует огромного объема данных и видения всей картины целиком. Эта целая картина есть у банка, но ее нет у злоумышленников. Как еще алгоритмы на графах можно использовать для решения реальных бизнес-задач, читайте в нашей следующей статье про разметку данных с помощью человека и ИИ.
Графовые алгоритмы. Бизнес-приложения
Код курса
GRAF
Ближайшая дата курса
по запросу
Продолжительность
24 ак.часов
Стоимость обучения
54 000 руб.
Освойте практику применения алгоритмов кластеризации, меры центральности узлов графа, нахождения путей и выявления сообществ средствами графовой аналитики больших данных на нашем новом курсе «Графовые алгоритмы. Бизнес-приложения» в лицензированном учебном центре обучения и повышения квалификации для разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.