Почему программы автоматической транскрибации проигрывают людям

Опубликовано: 2020-08-07

Несмотря на разнообразие и постоянное совершенствование автоматических сервисов для распознавания речи, самые точные услуги по транскрибации предоставляют люди. 

Для сравнения: уровень ошибок программного обеспечения — около 12%, в то время как профессиональные транскрибаторы допускают не больше 4% ошибок.

Итого, точность автоматической транскрибации в лучшем случае достигает 88%. А ведь крупные компании, такие как Google, IBM и Microsoft, годами работали над улучшением искусственного интеллекта.

Вот несколько причин, почему люди транскрибируют качественнее

1. Людям не мешает фоновый шум.

Фильтрация шумовых помех — это естественная способность человека. Люди могут делать точную и качественную расшифровку, несмотря на качество аудиофайла. Программы автоматической транскрибации обрабатывают файлы с плохим звуком с множеством ошибок или отклоняют такие записи.

2. Люди понимают разные акценты и диалекты.

Еще одна естественная способность человека — понимать речь с акцентами и диалектами. Программное обеспечение не может распознать такие нюансы речи.

3. Люди легко различают омофоны.

Омофоны — это слова, которые звучат одинаково, но по-разному пишутся, и с разным значением. Человек отличает омофоны, потому что воспринимает речь в контексте, анализирует структуру предложения, поэтому способен подобрать наиболее подходящее слово. У машин таких способностей нет, поэтому расшифрованное предложение может звучать нелогично и несуразно.

4. Люди различают любое количество говорящих.

Если докладчиков больше двух, это уже слишком сложная задача для программного обеспечения. В то же время люди легко различают любое количество говорящих, даже если их голоса похожи, а также отслеживают разных спикеров на протяжении разговора.

5. В автоматизированных службах тоже работают люди.

Чтобы улучшить качество и точность автоматической транскрибации, многие службы используют гибридную модель расшифровки. Это значит, что после обработки файла с помощью программного обеспечения стенограмму вычитывает и редактирует человек. Это компромисс, но такой подход не делает программное обеспечение для автоматической транскрибации лучше.

Итого, не каждую запись можно расшифровать с помощью автоматического сервиса.

 

Источник: https://www.gmrtranscription.com/problems-with-automated-transcription.aspx

нужен
перевод?
заказать онлайн
+7 (495) 995 7253
info@swan-swan.ru