Google тайно подслушивал и транскрибировал разговоры...

Опубликовано: 2019-08-08

Гамбургская комиссия по защите данных и свободе информации (HmbBfDI) приказала Google прекратить транскрибации аудиозаписей в Европе. Запрет продлится не менее трех месяцев.

В сеть попали данные о том, что Google использует контрактных работников, чтобы тайно расшифровывать разговоры пользователей со своими домашними устройствами Google.

Один из подрядчиков Google рассказал, что они расшифровывали аудиозаписи домашних разговоров Google, некоторые из них длились до минуты, и пользователи, похоже, не понимали, что они записываются. Подрядчик пожаловался, что им заплатили всего «несколько центов» за каждую транскрибацию.

По словам подрядчика, к ним попадали записи, которые фиксировали даже моменты физического насилия в семье.

Что Google записывал?

После начала скандала, в Google подтвердили, что они иногда отправляют записи, сделанные смарт-устройствами Google Home, «языковым экспертам». Записи транскрибируют, чтобы помочь улучшить производительность устройства, лучше выполнять команды на разных иностранных языках, разбираться в нюансах и акцентах. Примерно один из каждых 5 000 разговоров отправляется одному из этих экспертов. https://www.blog.google/products/assistant/more-information-about-our-processes-safeguard-speech-data/ При этом нет никакой связи с учетными записями — то есть записи обезличенные, идентифицировать голоса, записанные на них, невозможно.

Но в политике конфиденциальности компании не упоминается, что реальные люди — будь то подрядчики или сотрудники Google — будут слушать и транскрибировать аудио, записанное домашними устройствами Google.

При этом иногда, устройства распознают речь людей не правильно, некоторые обрывки речи могут быть восприняты колонками, как команда «Ок Google». Поэтому к транскрибаторам могли попасть записи, в которых люди не подозревают, что их записывают, содержащие личные и пикантные детали. Те, о которых узнал подрядчик: записи «физического насилия» между людьми в их доме; мать, ругающая ребенка; мужчины, ищущие порнографию. 

Почему это происходит?

Это особенность нейронных сетей. Дело в том, что для того, чтобы научить нейронную сеть правильно действовать нужны большие объемы информации. И на этапе обучения модели ИИ не может обойтись без помощи людей. У Яндекса также есть инструменты помощи и обучения нейронных сетей, в которых они обращаются за помощью к подрядчикам, например, https://toloka.yandex.ru/ Поисковые сети не смогли бы создать многие полезные продукты, без анализа большого количества поисковых запросов и поведения людей.

Читайте также: расшифровка аудиозаписей — полезная и востребованная услуга.

нужен
перевод?
заказать онлайн
+7 (495) 995 7253
info@swan-swan.ru