Корпорация Microsoft объявила, что предоставит клиентам более точный контроль над тем, используются ли их голосовые данные для улучшения продуктов распознавания речи. Новая политика позволит клиентам решить, могут ли рецензенты, включая сотрудников и подрядчиков Microsoft, прослушивать записи того, что они говорили во время разговора с продуктами и службами Microsoft, использующими технологию распознавания речи, включая Microsoft Translator, SwiftKey, Windows, Cortana, HoloLens, Mixed Reality и Skype voice translation.

Сохранение конфиденциальности, когда речь заходит о распознавании голоса, является сложной задачей, учитывая, что современные методы искусственного интеллекта используются для определения таких параметров, как намерение, пол, эмоциональное состояние и идентичность по тембру, высоте тона и стилю говорящего.  Недавние сообщения показали, что случайные активации голосового помощника разоблачают частные разговоры, а исследование Школы вычислений Университета Клемсона доказало, что Политика конфиденциальности Amazon Alexa и Google Assistant voice app часто “проблематична” и нарушает базовые требования. Риск таков, что юридические фирмы, в том числе Mishcon de Reya, посоветовали сотрудникам отключать умные динамики, когда они говорят о делах клиентов дома.

Microsoft прекратила хранить голосовые клипы, обработанные ее технологиями распознавания речи, 30 октября, а Google Assistant, Siri, Cortana, Alexa и другие основные платформы распознавания голоса позволяют пользователям удалять записанные данные. Но это требует некоторых (и в некоторых случаях существенных) усилий. Вот почему Microsoft заявляет, что в течение следующих нескольких месяцев выпустит новые настройки для просмотра голосовых клипов во всех своих применимых продуктах. Если клиенты решат принять участие, то смогут просматривать эти клипы, чтобы улучшить производительность систем искусственного интеллекта Microsoft “через разнообразие людей, стилей речи, акцентов, диалектов и акустических сред.”

«Цель состоит в том, чтобы сделать технологии распознавания речи Microsoft более инклюзивными, сделав их более легкими и естественными для взаимодействия, — говорится в блоге Microsoft. — Голосовые клипы будут деидентифицированы по мере их хранения — они не будут связаны с учетной записью Microsoft или любыми другими идентификаторами Microsoft, которые могли бы связать их с клиентом. Новые голосовые данные больше не будут отображаться на панели мониторинга конфиденциальности учетных записей”.

Если клиент решает позволить сотрудникам или подрядчикам Microsoft слушать их записи, чтобы усовершенствовать технологию компании, частично вручную переписывая то, что они слышат, Microsoft говорит, что сохранит эти данные на срок до двух лет. Если внесенный голосовой клип будет отобран для транскрипции, компания говорит, что может сохранить его более чем на два года, чтобы “продолжить обучение и улучшить качество искусственного интеллекта распознавания речи».

Microsoft обещает, что клиенты, которые решат не предоставлять свои голосовые клипы для просмотра, все равно смогут использовать ее голосовые продукты и услуги. Однако компания оставляет за собой право продолжать доступ к информации, связанной с голосовой активностью пользователя, такой как транскрипции, автоматически генерируемые во время взаимодействия пользователя с ИИ распознавания речи.

Технологические гиганты, включая Apple и Google, были предметом сообщений, раскрывающих потенциальное злоупотребление записями, собранными для улучшения таких помощников, как Siri и Google Assistant. В апреле 2019 года агентство Bloomberg передало, что Amazon нанимает контрактников для аннотирования тысяч часов аудио с устройств на базе Alexa, что побудило компанию развернуть ориентированные на пользователя инструменты, которые быстро удаляют облачные данные. А в июле сторонний подрядчик слил голосовые записи Google Assistant voice для пользователей в Нидерландах, которые содержат персональные данные, такие как имена, адреса и другую личную информацию. После последнего откровения немецкий орган по защите конфиденциальности кратко приказал Google прекратить сбор голосовых данных в Европе для человеческих рецензентов.

Со своей стороны, Microsoft заявляет, что удаляет определенную личную информацию из голосовых клипов по мере их обработки в облаке, включая строки букв или цифр, которые могут быть номерами телефонов, номерами социального страхования и адресами электронной почты. Более того, компания заявляет, что не использует человеческих рецензентов для прослушивания аудиозаписей, собранных из функций распознавания речи, встроенных в ее корпоративные предложения.

Все чаще конфиденциальность — это не просто вопрос философии, но и ставки в ходе бизнеса. Законы на государственном, местном и федеральном уровнях направлены на то, чтобы сделать конфиденциальность обязательной частью комплаенс-менеджмента. Сотни законопроектов, которые касаются конфиденциальности, кибербезопасности и нарушений данных, находятся на рассмотрении или уже были приняты в 50 штатах США, территориях и округе Колумбия. Возможно, самый полный из них всех — закон о конфиденциальности потребителей Калифорнии — был подписан закон примерно два года назад. Это не говоря уже о законе о переносимости и подотчетности медицинского страхования (HIPAA), который требует, чтобы компании запрашивали разрешение, прежде чем раскрывать индивидуальную медицинскую информацию. А международные рамки, такие как Общий регламент ЕС по защите персональных данных (GDPR), направлены на то, чтобы предоставить потребителям больший контроль над сбором и использованием персональных данных.

Источник: https://venturebeat.com/2021/01/15/microsofts-new-settings-let-users-contribute-voice-clips-to-improve-its-speech-recognition-systems/

от AI_NEWS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *