Исследователи создали систему машинного обучения, которая, как они утверждают, может определять политическую партию человека с умеренной точностью только по его лицу. Исследование, проведённое ими, также показало, что сексуальные предпочтения могут быть выведены схожим образом, что приводит к неудобному выводу: наша внешность может выражать больше личной информации, чем мы думаем.
Исследование, опубликованное в журнале Nature Scientific Reports, было проведено Михалом Косински (Michal Kosinski) из Стэнфордского университета. Косински попал в заголовки газет в 2017 году благодаря своей работе, в которой выяснилось, что сексуальные предпочтения человека можно предсказать по данным лица.
Исследование вызвало критику не столько за его методы, сколько за саму идею о том, что таким образом можно обнаружить что-то теоретически нефизическое. Но работа Косинского, как он объяснил тогда и впоследствии, была сделана специально для того, чтобы оспорить эти предположения, и вызвала у него такое же удивление и беспокойство, как и у других. Идея заключалась не в том, чтобы создать своего рода гей-радар с ИИ, — как раз наоборот. Как тогда писала команда, публикация была необходима, чтобы предупредить других, что подобное может быть создано людьми, интересы которых выходят за рамки академических:
«Мы были очень обеспокоены этими результатами и потратили много времени на размышления о том, следует ли их вообще обнародовать. Мы не хотели допускать тех самых рисков, о которых предупреждаем. Способность контролировать, когда и кому раскрывать свою сексуальную ориентацию, имеет решающее значение не только для жизненного благополучия, но порой и для физической безопасности.
Мы чувствовали, что существует настоятельная необходимость информировать политиков и ЛГБТ-сообщества о рисках, с которыми они сталкиваются. Мы не создавали инструмент вторжения в частную жизнь, а скорее показали, что основные и широко используемые методы представляют серьёзную угрозу конфиденциальности».
Подобные предупреждения могут звучать и здесь, поскольку, хотя политическая принадлежность, по крайней мере, в США (и, по крайней мере, в настоящее время) не является таким деликатным или личным элементом, как сексуальные предпочтения, она по-прежнему остается деликатной и личной. Едва ли проходит неделя без сообщений об аресте или убийстве какого-нибудь политического или религиозного «диссидента» или другого лидера. Если репрессивные режимы смогут добиться внедрения этой программы, сказав, что «алгоритм пометил вас как возможного экстремиста», вместо, например, перехвата сообщений, это сделает такую практику более простой и масштабируемой.
Сам алгоритм — это не какая-то сверхсовременная технология. В статье Косински описывается довольно обычный процесс загрузки в систему машинного обучения изображений более миллиона лиц, собранных с сайтов знакомств в США, Канаде и Великобритании, а также у американских пользователей Facebook. Люди, чьи лица использовались, идентифицировались как политически консервативные или либеральные в рамках анкеты сайта.
Алгоритм был основан на программном обеспечении распознавания лиц с открытым исходным кодом, и после базовой обработки для кадрирования только лица (таким образом, никакие элементы фона не вкрадываются в качестве факторов) сводятся к 2048 оценкам, представляющим различные функции — как и в случае с другими алгоритмами распознавания лиц, это не обязательно интуитивные вещи, такие как «цвет бровей» и «тип носа», а более компьютерные понятия.

Системе были предоставлены данные о политической принадлежности, полученные от самих людей, и с их помощью она начала усердно изучать различия между характеристиками лиц людей, идентифицирующих себя как консерваторов, и тех, кто идентифицирует себя как либералов. Потому что, оказывается, различия есть.
Конечно, это не так просто, как «у консерваторов более густые брови» или «либералы больше хмурятся». И это не сводится к демографии, которая могла бы сделать всё слишком легко и просто. В конце концов, если идентификация политической партии коррелирует и с возрастом, и с цветом кожи, это даёт простой алгоритм прогнозирования. Но хотя программные механизмы, используемые Косински, вполне стандартны, он старался скрыть свои основы, чтобы это исследование, как и последнее, нельзя было отбросить в качестве псевдонауки.
Самый очевидный способ решить эту проблему — сделать так, чтобы система предположила, что политическая партия состоит из людей того же возраста, пола и этнической принадлежности. Тест включал представление двух лиц, по одному от каждой партии, и угадывание, кто есть кто. Очевидно, что точность шансов составляет 50%. Люди не очень хорошо справляются с этой задачей, показывая результат лишь немного лучше, около 55% точности.
Алгоритму удалось достичь 71% точности при предсказывании политической партии между двумя похожими людьми, а 73% были представлены двумя людьми любого возраста, этнической принадлежности или пола (но всё же гарантированно будет один консерватор, один либерал).

Получение трёх из четырёх может не показаться триумфом для современного ИИ, но, учитывая, что люди едва ли могут добиться большего, чем подбрасывание монеты, кажется, здесь есть кое-что, о чём стоит подумать. Косински старался прикрыть и другие базы; это не кажется статистической аномалией или преувеличением отдельного результата.
Мысль о том, что ваша принадлежность к политической партии может быть написана у вас на лице, пугает, поскольку, хотя ваши политические взгляды — далеко не самая личная информация, это также то, что очень разумно считается нефизическим. Люди могут выбрать для выражения своих политических убеждений шляпу, значок или футболку, но лицо обычно считают беспартийным.
Если вам интересно, какие именно черты лица это показывают, к сожалению, система не может об этом сообщить. В своего рода пара-исследовании Косински выделил около двадцати черт лица (растительность на лице, прямота взгляда, различные эмоции) и проверил, являются ли они хорошими предикторами политических убеждений, но ни одно из них не привело к большему, чем небольшое повышение точности по сравнению с шансом или человеческим опытом.
«Особо выделялись ориентация головы и эмоциональное выражение: либералы, как правило, смотрели в камеру более прямо, с большей вероятностью выражали удивление и реже выражали отвращение», — написал Косински в заметках автора для документа. Но то, что разработчики добавили, оставило без учета более 10 процентных пунктов: «Это указывает на то, что алгоритм распознавания лиц обнаружил многие другие особенности, раскрывающие политическую ориентацию».
Автоматическая защита «это не может быть правдой — френология была брехнёй» здесь не выдерживает критики. Страшно думать, что это правда, но невозможно отрицать то, что может быть очень важной истиной, поскольку её очень легко использовать против людей.
Как и в случае с исследованием сексуальной ориентации, цель здесь не в том, чтобы создать идеальный детектор этой информации, а в том, чтобы показать, что это можно сделать, чтобы люди начали учитывать создаваемые опасности. Если, например, деспотический теократический режим решит расправиться с нетрадиционными людьми или людьми с определёнными политическими взглядами, такая технология даёт им правдоподобный технологический метод, позволяющий сделать это «объективно». Более того, это можно сделать с очень небольшой работой или контактом с целью, в отличие от копания в их истории в социальных сетях или анализа их покупок (что тоже очень показательно).
Мы уже слышали о том, что Китай использует программное обеспечение для распознавания лиц, чтобы найти членов уйгурского религиозного меньшинства. Нетрудно представить, что полиция, используя «новейшие технологии», например, классифицирует лица на протестах, говоря, что «эти 10 были определены системой как самые либеральные», или что-то подобное.
Идея о том, что пара исследователей, использующих программное обеспечение с открытым исходным кодом и базу данных лиц среднего размера (для правительства это несложно собрать, хотя маловероятно, что у них этого ещё нет), могла бы сделать это в любой точке мира с любой целью, пугает.
«Не казните гонца, — сказал Косински. — В своей работе я предостерегаю от широко используемых алгоритмов распознавания лиц. Вызывает тревогу тот факт, что физиогномистов ИИ сейчас используют для оценки интимных черт людей, — учёные, политики и граждане должны обратить на это внимание».