Вы заметили, что на ваши телефоны поступает все больше звонков, правильно идентифицированных как спам? Hiya пытается помочь.
Стартап из Сиэтла, штат Вашингтон, с крупными клиентами в сфере телекоммуникаций, использует искусственный интеллект для обнаружения на 20% больше незаконных и нежелательных звонков, чем существующие в настоящее время технологии, сообщил VentureBeat генеральный директор и основатель фирмы Алекс Алгард.
На прошлой неделе компания представила то, что она называет адаптивным ИИ, в качестве дополнения к своему продукту Hiya Protect, который используется операторами беспроводной связи, производителями смартфонов и разработчиками приложений в рамках своих пакетов услуг. Он доступен в таких сервисах, как AT&T Call Protect, Samsung Smart Call и приложение Hiya.
Г-н Альгард сказал, что новая технология основана на потоках данных в реальном времени от операторов связи, устройств и приложений. “Адаптивный ИИ наблюдает за закономерностями, оставленными спамерами в сетевом трафике, и адаптируется в режиме реального времени, чтобы блокировать их без необходимости переподготовки людей или исторических данных”, — сообщил он.
Компания утверждает, что ее новая возможность намного эффективнее, чем обычная тактика, которая реагирует только на известные телефонные номера, используемые спамерами. Адаптивность ИИ вступает в игру, когда спамеры меняют номера или носителей, что, по словам Альгарда, происходит постоянно.
Насколько распространен телефонный спам?
Для количественной оценки масштабов телефонного спама компания Hiya, у которой около 200 миллионов активных пользователей, через своих клиентов — операторов связи, предоставила следующие статистические данные:
- Ежегодно американцам поступает более 50 миллиардов спам-звонков (16 в месяц на одного пользователя).
- Hiya анализирует более 13 миллиардов звонков в месяц
- 94% неопознанных звонков остаются без ответа
- Около трети американцев ежегодно теряют деньги из-за телефонных мошенничеств. В среднем в прошлом году каждая жертва потеряла 182 доллара. Это означает, что американцы в совокупности потеряли около 14 миллиардов долларов из-за мошеннических звонков в 2020 году.
Наиболее распространенные способы, которыми мошенники зарабатывают деньги, — это кража личной информации, продажа поддельных продуктов, услуг или получение доступа к финансовым счетам. Все большее число спамеров применяют незаконную тактику привлечения потенциальных клиентов для законных или незаконных предприятий (к примеру, звонки по гарантии автомобилей или компьютеров).
Г-н Альгард сказал, что он основал Hiya в 2016 году как филиал своей предыдущей компании, WhitePages.com.
“Белые страницы — это сайт службы каталогов. Мы определили несколько потенциальных вариантов использования, вокруг которых, как думали, мы могли бы создать бизнес-инкубатор — в основном по оказанию услуг идентификации вызывающего абонента на старых стационарных телефонах, — добавил он. — Нам показалось странным, что на мобильных устройствах не было идентификатора вызывающего абонента. Поэтому мы решили, что с появлением мобильных приложений мы действительно сможем решить эту проблему с помощью автоматической службы идентификации вызывающего абонента для людей, которые просто загружают приложение, которое мы предоставили. И это, как оказалось, вызвало большой потребительский интерес; множество людей скачали приложение”.
Как Hiya использует искусственный интеллект для работы
Алекс Алгард поделился следующими дополнительными соображениями в интервью VentureBeat о том, как технологи, архитекторы данных и разработчики программного обеспечения могут использовать адаптивный искусственный интеллект.
VentureBeat: Какие инструменты ИИ и МЛ вы используете конкретно?
Альгард: У компании Hiya есть уникальные потребности в разработке моделей, которые могут справиться с проблемами, связанными с масштабом и объемом голосовых сетей. Основная рабочая нагрузка — это анализ вызовов, который должен выполняться в режиме реального времени в потоках данных, с очень низкой задержкой и высокой пропускной способностью; достаточной быстротой для анализа вызовов по мере их выполнения; и масштабироваться для анализа более 1 миллиарда вызовов API в день.
Этот основной рабочий процесс поддерживается нашей фирменной системой Hiya MLOps, которую мы настроили на нашу проблему. Он включает в себя внутреннее управление жизненным циклом модели ML и комплексную систему прогнозирования, позволяющую охватить множество сценариев мошенничества в сфере телекоммуникаций и географий, с которыми мы имеем дело для обеспечения глобальной защиты от звонков.
Для других рабочих нагрузок мы используем множество платформ ML по мере необходимости. Например, Sagemaker для создания, обучения и развертывания систем, которые изучают сетевые характеристики robocall и анализируют записи.
VentureBeat: Используете ли вы модели и алгоритмы из готовых пакетов — например, из DataRobot или других источников?
Альгард: Из-за уникальных проблем, связанных с потоками данных в реальном времени, и масштабов сетей, в которых мы работаем, мы создаем и поддерживаем наши собственные пользовательские платформы. Готовые или автоматические решения ML не оказались жизнеспособными для размера и масштаба проблем, которые мы решаем.
VentureBeat: Какой облачный сервис вы используете в основном?
Альгард: Мы используем AWS и расширяем поддержку Microsoft Azure.
VentureBeat: Вы используете много инструментов для работы с ИИ, которые поставляются с этим облаком?
Алгард: Мы используем базовые сервисы AWS, такие как EC2 и DynamoDB, для вычислений, хранения данных и глобальной синхронизации. А для последующей обработки и подготовки данных мы используем инструменты из нескольких источников: AWS Glue, Apache Airflow, Zeppelin, Jupyter и др.
VentureBeat: Сколько вы делаете сами?
Альгард: Довольно много. Мошенники и нелегальные абоненты используют изощренную и постоянно меняющуюся тактику, чтобы избежать обнаружения. Мы инвестировали в специальную команду специалистов по обработке данных, которые сосредоточены на индустрии нелегальных звонков и постоянно повторяют и корректируют наш механизм моделей искусственного интеллекта, чтобы идти в ногу с ними. Многие из моделей, которые мы используем, относятся к пятому или шестому поколению, поскольку мы совершенствуем их, чтобы использовать определенную тактику мошенничества. Мы активно участвуем в сообществе ИИ/МЛ и используем новейшие технологии и подходы, когда можем, но часто нам приходится разрабатывать новые подходы самостоятельно. Адаптивный ИИ — это пример подхода, который нам пришлось разрабатывать самостоятельно.
VentureBeat: Как вы маркируете данные для рабочих процессов ML и AI?
Альгард: Маркировка данных — самый важный аспект того, что мы делаем, что делает Hiya настолько эффективной в борьбе с нелегальными абонентами по всему миру. Мы вложили средства, чтобы сделать это собственными силами, из-за влияния этого аспекта на нашу точность. Мы используем данные из нескольких источников, в том числе данные о событиях звонков из сети Hiya, ловушки мошенников, отчеты пользователей, данные о соответствии федеральным стандартам и пользовательские источники данных от наших партнеров по перевозкам и дистрибуции.
VentureBeat: Не могли бы вы дать нам приблизительную оценку того, сколько данных вы обрабатываете?
Альгард: Hiya имеет дело с невероятным объемом данных: 200 миллионов пользователей по всему миру, 450 000 пересчетов моделей МЛ в секунду и 20 ГБ/час изменений моделей МЛ, перенесенных в наш пограничный сервис. Для пересчета нашей модели требуется самый большой доступный экземпляр AWS EC2.
Источник: https://venturebeat.com/2021/11/29/how-hiya-taps-ai-to-kill-phone-spam/