Курс на машинный перевод — новая стратегия Яндекса

Опубликовано: 2017-06-16

В феврале 2017 года «Яндекс» анонсировал создание службы машинного интеллекта и исследований (МИИ), которое возглавит Миша Биленко. До декабря 2016 года Биленко занимался исследованиями и руководил командой в Microsoft, где проработал более 10 лет.

«Яндекс» часто называют русским Google, а его основателя и генерального директора Аркадия Воложа сравнивают с Ларри Пейджем. И неудачи Google обычно идут на пользу доминирующему на российском рынке поисковику.

Яркий тому пример, когда в прошлом году российские антимонопольные органы обвинили Google в нарушении антимонопольного законодательства, наказав штрафом в 6,8 млн долларов за недостаточную доступность Android для местных конкурентов (то есть для «Яндекса»). По словам Александра Шульгина, генерального директора «Яндекса», доля компании в устройствах Android «снова начала расти… в результате новых дистрибьюторских контрактов», последовавших после постановления.

Как бы там ни было, эксперты ожидают, что «Яндекс» будет вечно вести свою неравную битву с Google; не только на поле мобильных устройств на базе Android, но, что более важно, на арене машинного перевода.

Мы связались с «Яндекс», чей представитель повторил любимый лозунг Google — «все дело в том, чтобы собрать достаточно данных», заявив при этом, что «Яндекс» — одна из немногих мировых компаний, располагающих доступом к достаточному объему данных, чтобы обеспечить требуемое сегодня качество машинного перевода.

Представитель «Яндекса»: За бесплатными услугами по переводу обращаются до 10 миллионов пользователей ежедневно.

По информации на сайте «Яндекса», компьютерный перевод станет одной из четырех основных областей машинного интеллекта, которыми и будет заниматься МИИ; также служба уделит внимание распознаванию изображений, распознаванию голоса и разработке платформы для машинного обучения.

Объединив усилия для создания дополнительного функционала, компания уже начала тестировать перевод изображений при помощи своего сервиса Yandex.Translate. Также представитель сказал, что «Яндекс» включил в свой переводчик речевые функции, так что пользователи могут задавать голосовые запросы и слышать перевод. Из того же источника нам стало известно, что за бесплатными услугами компании по переводу обращаются до 10 миллионов пользователей ежедневно.

Цены приятнее, чем у Google

Платный сервис Yandex.Translate API требует 15 долларов за миллион символов при объеме до 50 миллионов символов в месяц, со скидкой до 6 долларов после 500 миллионов.

Google получает 20 долларов за миллион символов при объеме до 1,5 миллиардов символов в месяц, снижая цену до 15 долларов за миллион после достижении 1,5 миллиардов. А вот Microsoft оценивает миллион символов в 10 долларов.

Вскоре ожидаются нейросети

По словам представителя «Яндекса», в середине 2016 года началось интегрирование модели, основанной на нейросетях, в сервисы компании, но базовая технология все еще статична. Наш источник пообещал, что вскоре «Яндексу» «будет чем поделиться» в области развития нейронных моделей.

На вопрос о новой службе нам ответили, что МИИ — это «консолидация уже существующих команд в один отдел» и, помимо привлечения Биленко, новых вакансий с его открытием не появилось. В двух словах, это скорее внутренняя реорганизация, чем крупное расширение.

Отделение Yandex.Translate находится в главном офисе в Москве, одном из 17 офисов «Яндекса», расположенных по всему миру. «Большая часть команды Yandex.Translate состоит из разработчиков, с которыми работают также аналитики, тестеры, менеджеры проектов и прочие специалисты поддержки», заявил представитель компании.

Неравная битва

Исследователь языковой отрасли Константин Дранч, ведущий российского языкового портала translationrating.ru, предполагает, что «Яндекс» стремится к лидерству на рынке бесплатных, доступных пользователям машинных переводов. Он рассказал Slator, что «у компании есть множество каналов для продвижения (браузер, порталы), так что со временем она, скорее всего, обгонит [конкурента] PROMT, но всегда будет вести неравную битву с Google».

По объему поисковых запросов «Яндекс» еле-еле обошел Google с долей в 55,2%.

Что касается другого конкурента «Яндекса», ABBYY, Дранч отметил, что их машинный перевод «не доступен для широкой публики, хотя в базовую технологию, Compreno, делались объемные вложения, и она хорошо вышла на рынок три года назад».

Зачем чеченский, если можно перейти на клингонский?

Дранч заметил, что «Яндекс» предлагает многие услуги, повторяющие сервисы Google: карты, интернет-хранилище, рынок, аналитические пакеты для сайтов и так далее.

«Если у вас есть почта на «Яндексе», вы пользуетесь Яндекс-браузером, поисковиком и каждый день просматриваете там новости, естественно, вы будете пользоваться переводчиком «Яндекса», а не Google».

Константин Дранч:«Как обстоят дела с качеством машинного перевода EN-RU у «Яндекса» по сравнению с Google? У обеих компаний они идут одинаково плохо или одинаково хорошо».

На вопрос, как обстоят дела в области качества машинного перевода в направлении английский <> русский у «Яндекса» по сравнению с Google, он ответил: «у обеих компаний они идут одинаково плохо или хорошо».

«Борьба за потребителей ведется на уровне маркетинга и возможности встроить предложение в устройства и приложения пользователя. Тут у Google есть преимущество, поскольку он контролирует ОС Android», — добавил Константин.

Что касается возможностей «Яндекса» в отношении машинного перевода, Дранч посоветовал добавить обучающие машину функции, схожие с MicrosoftTranslationHub. «Это позволит им создавать корпоративные блоки со специализированной терминологией и продвинуться в бизнес-сегменте», пояснил он.

Читать подробнее о машинном переводе в разделе Технологии Яндекса.

 

Дранч рассказал, что и «Яндекс», и Google и так работают с «крупными» языками бывшего СНГ, такими как украинский, казахский, таджикский и грузинский. Хотя помимо них существует множество малочисленных языков,  и тут «Яндекс» обладает преимуществом,  наш собеседник считает, что, с точки зрения траффика и финансовой выгоды, они не составят большой разницы, поскольку «все равно 80-90% всех запросов заключаются в переводе с русского на английский, французский и немецкий».

Возможно, «Яндекс» решит добавить чеченский прежде, чем клингонский.

Директор по развитию бизнеса PROMT Юлия Епифанцева рассказала Slator, что розничный сегмент и так уже охватывает большинство языков постсоветского пространства. Что касается корпоративного сегмента, в частности использования машинного перевода в государственных или законодательных структурах, она заявила, что «онлайн услугам тут нечего предложить, поскольку этим организациям, как правило, требуются оффлайн-решения в области переводов»,

Согласно мнению Дранча, следующим крупным языком, на котором говорят более миллиона человек, станет чеченский. «Возможно, «Яндекс» решит добавить чеченский прежде, чем клингонский или дотракийский. А возможно, нет», — добавил он, намекая на постоянное стремление «Яндекса» одержать победу в добавлении малоизвестных языков.

По поводу решения «Яндекса» включить Yandex.Translate в состав управления МИИ, Дранч подчеркнул: «Машинное обучение имеет множество применений, и перевод — лишь одно из них. Так что вполне разумно дать новому подразделению с отличным персоналом чуть больше свободы».

Перевод статьи: Мэриона Маркинга

нужен
перевод?
заказать онлайн
+7 (495) 995 7253
info@swan-swan.ru