Вообразите, что вам нужно просмотреть все документы, электронные письма и сообщения огромной транснациональной компании.
Юср Халил (Yousr Khalil) не нужно воображать. Судебный бухгалтер входила в команду, которая должна была найти доказательства правонарушений в аэрокосмическом гиганте Airbus после того, как тот признал дачу взяток через посредников.
«Airbus похожи на многоэтажный дом с 900 квартирами. Мы должны были решить, какие из них собираемся исследовать», — говорит она.
Мисс Халил работает в FRA, компании судебных расследований, которая занимается сбором улик по всему миру.
Но это был отдельный случай и крупнейшая работа FRA за всю историю.
Чтобы получить право на Соглашение об отсрочке судебного преследования (DPA), Airbus открыли свою деятельность для тщательной проверки в 2016 году.
Четырёхлетний проект по искоренению коррупции помог Airbus достичь соглашения с регулирующими органами Великобритании, США и Франции, в соответствии с которым компания выплатила 3,6 млрд евро (321,5 млрд рублей) штрафов в знак признания актов мошенничества и взяточничества.

Мисс Халил и её команда из 70 человек столкнулись с огромным количеством файлов, данных транзакций и электронных писем со всего света, большинство из которых были совершенно безобидными.
Итак, какой они выбрали план?
Искусственный интеллект (ИИ) и сделанный на заказ компьютер, не похожий ни на один ПК, на котором вы когда-либо работали, сыграли большую роль в этом эпическом выискивании данных.
Огромную коллекцию из 500 миллионов документов и сделок пришлось сократить.
Поскольку объёмы данных растут в геометрической прогрессии, ИИ всё чаще используется в таких исследованиях.
После того, как дубликаты и другие не относящиеся к делу материалы были удалены, следователям осталось 60 миллионов документов для проверки. ИИ искал в них шаблоны и обнаруживал неуместные фрагменты, например, сделку по спонсированию спортивного мероприятия за 100 млн долларов (7,3 млрд рублей).
Как складывались отношения с персоналом Airbus во время всего этого? «Ни один бизнес никогда не готов к полноценному судебному расследованию, — говорит мисс Халил, — но коллеги из Airbus были очень отзывчивы. Когда регулирующий орган требовал быстрой реакции на что-то, они старались сделать все возможное».
Как будто 60 миллионов бумаг было недостаточно, 800 сотрудников Airbus по всему миру были юридически назначены хранителями этих документов.
«У вас может быть информация, распределённая по разным носителям, таким как ноутбуки, устройства хранения данных, USB-накопители и т.д. Мы должны были определить, кто стал хранителем этой информации», — говорит Грег Мейсон (Greg Mason), партнёр-основатель и соруководитель отдела анализа данных в компании FRA.

Были созданы семь защищённых сайтов для расследований. Это позволяло проверять документы в полной безопасности, что является критическим моментом для Airbus. Это обширный бизнес, связанный с крупными европейскими проектами военной авиации. Таким образом, следствию пришлось найти способ не допускать попадания в кадр материалов национального значения.
Специализированное программное обеспечение позволяло собирать информацию, не просматривая весь документ, из которого она исходила, тем самым защищая секретную информацию от посторонних глаз.
Кроме того, использовались сделанные на заказ компьютеры за 100 000 долларов, с несколькими дисками и без подключения к Интернету.
Это называется воздушным зазором, обеспечивающим определённое разделение между конфиденциальными данными и внешним миром Интернета.
Обработка огромного количества бумаг становится проще и быстрее, если обращаться с ними просто как с данными. FRA извлекли метаданные, информацию, лежащую в основе каждого электронного документа, который определяет, что это такое, и использовали их для индексации материала, чтобы можно было удалить нерелевантные файлы.
ИИ лёг в основу этого обзора с привлечением технологий (TAR).
ИИ был обучен поиску неструктурированных данных, таких как электронные письма. Их сложнее сканировать, в отличие от структурированных, которые содержатся в формах и столбцах.
Используя принцип машинного обучения, согласно которому программное обеспечение ИИ видит несколько примеров сообщений определённого типа и начинает определять, к какой категории они относятся, FRA смогли быстро извлечь соответствующие документы. «Программа искусственного интеллекта искала контекст сообщений, контекст — это всё», — отмечает Мейсон.
Программа охотилась за взятками, которые организовывались с помощью кодов: например, врач выписывал лекарство. Используя примеры такого рода скрытых сообщений, программа приобрела концепцию медицины, а затем концепцию рецепта. Это означало, что она могла пробираться через неструктурированные данные и выявлять коррупционные действия.
«По мере того, как вы обнаруживаете всё больше и больше примеров скрытых платежей, ИИ учится на лету. В этом красота и магия ИИ», — говорит мистер Мейсон. Была создана система подсчёта очков, в которую добавлялись баллы за некоторые атрибуты. Любая оценка выше определённого числа считалась достойной дальнейшего расследования. Технология машинного обучения становилась всё лучше и лучше по мере своего развития.

Мистер Мейсон считает, что только около 5% отложенных документов были проверены людьми, но это всё равно составляет три миллиона файлов. «ИИ — не панацея, но удивительно, как легко он учится».
Статист по образованию, он впечатлен тем, как технология искусственного интеллекта быстро справляется с большими числами. «Даже небольшой случай сегодня связан с огромным объёмом данных».
Ему пришлось продать новую концепцию TAR регулирующим органам, таким как Управление по борьбе с серьёзным мошенничеством (SFO) Великобритании, и получить одобрение того, что не было традиционным подходом к расследованию. «Это самое сложное следствие, которое я когда-либо проводил».
Четырёхлетняя проверка утомительна. Но разоблачение мошенничества с ИИ-помощником доставило команде большое личное удовлетворение.
И их труды были одобрены законом.
Виктория Шарп (Victoria Sharp), одна из самых высокопоставленных судей гражданских судов в Англии и Уэльсе, подытожила далеко идущие последствия этого расследования с его выдающейся ролью для ИИ.
Выступая за то, чтобы британцы прекратили трёхстороннее дело в январе 2020 года, она заявила, что Airbus «действительно вывернули свои карманы и теперь превратились в компанию, которая совершила правонарушения».
Источник: https://www.bbc.com/news/business-55306139