Сбор данных для бизнеса. Будущее за расшифровкой речи? Часть 1.

Опубликовано: 2020-09-04

Технология преобразования речи в текст — это одна из языковых служб на базе искусственного интеллекта, способная преобразовать бизнес и сделать работу более продуманной.

На что способны языковые службы на базе ИИ

Многочисленные телефонные звонки, посты в социальных сетях, электронные письма, аудио- и видеозаписи — это привычное информационное поле для многих компаний. Всё это — неструктурированные данные, содержащие полезную информацию. С помощью искусственного интеллекта можно выделить эти данные, проанализировать, упорядочить и использовать их в работе.

Допустим, вы заметили рост количества жалоб клиентов, которые обращаются в корпоративный колл-центр. Как прослушать все записанные разговоры, как выяснить проблему? Для этих целей нужны технологии на базе искусственного интеллекта. С помощью системы АРР можно:

  • Расшифровать все вызовы.
  • Распознать ключевые слова и проанализировать тональность сообщений для понимания потребностей и мнений ваших абонентов.
  • Выгрузить всю эту информацию в базу данных и структурировать.

Как развивалась сфера расшифровки речи

История распознавания речи началась в 1950-х годах, однако долгое время, до 1990-х, эта технология была недоступна для широкого рынка. Первый продукт — Dragon Dictate — стоил $9 000 со словарем на 80 000 слов.

С тех пор распознавание речи стало значительно дешевле и более точным, и всё еще есть куда развиваться, это сложная технология. Даже люди сами себя не понимают (взять, к примеру, мужчин и женщин, родителей и детей). А если добавить некачественный звук, акцент говорящих или местный диалект, одновременный разговор нескольких человек — всё это сбивает с толку и людей и компьютеры.

Но люди могут догадаться, о чем идет речь, благодаря пониманию контекста, а компьютеры на это были неспособны. До тех пор, пока провайдеры облачных технологий на базе ИИ (AWS и Microsoft Azure) не предложили мощные и доступные инструменты, которые действительно понимают речь, исходя из контекста.

Зачем бизнесу собирать данные?

С помощью технологий АРР можно также автоматизировать и упростить многие бизнес-процессы. Например, можно создавать заметки на собраниях, создавать субтитры к видео или транскрибировать конференции для удобного чтения.

Языковые службы на базе ИИ — это целая экосистема для выполнения разных задач. Например, с помощью сервиса Amazon Transcribe можно преобразовать голос в текст, далее перевести текст на другой язык в Amazon Translate, а потом озвучить переведенный текст, используя Amazon Polly.

Вам кажется, что это глупо и бесполезно — собирать и анализировать данные? Но для любого культурного сдвига требуется не менее 20-30 лет. Вспомните, ведь в 2000-х нам казалось дикостью ездить с незнакомцами в их автомобилях? А теперь мы называем это Uber.

Будущее приближается

Нет никаких сомнений, что технологии АРР будут развиваться и дальше, в эту сферу вкладываются огромные ресурсы, и инвестиции не прекратятся. Если вы понимаете, что технологии ИИ помогают делать вашу работу более эффективной, то почему бы вашей компании не стать первопроходцем? По мере использования облачных систем они будут совершенствоваться.

Конечно, никто не знает, что нас ждет в будущем, но эксперты прогнозируют, что через 2-3 года языковые службы на базе ИИ достигнут такого уровня, что люди свободно смогут общаться с носителями языка благодаря программам перевода в режиме реального времени. А через 3-5 лет мы получим такие технологии, которые будут понимать, что мы подразумевали — это оценят застенчивые и некоммуникабельные люди.

Источник: https://www.mindovermachines.com/speech-to-text-the-future-of-unstructured-data-part-1/

нужен
перевод?
заказать онлайн
+7 (495) 995 7253
info@swan-swan.ru