В феврале 2017 года «Яндекс» анонсировал создание службы машинного интеллекта и исследований (МИИ), которое возглавит Миша Биленко. До декабря 2016 года Биленко занимался исследованиями и руководил командой в Microsoft, где проработал более 10 лет.
«Яндекс» часто называют русским Google, а его основателя и генерального директора Аркадия Воложа сравнивают с Ларри Пейджем. И неудачи Google обычно идут на пользу доминирующему на российском рынке поисковику.
Яркий тому пример, когда в прошлом году российские антимонопольные органы обвинили Google в нарушении антимонопольного законодательства, наказав штрафом в 6,8 млн долларов за недостаточную доступность Android для местных конкурентов (то есть для «Яндекса»). По словам Александра Шульгина, генерального директора «Яндекса», доля компании в устройствах Android «снова начала расти… в результате новых дистрибьюторских контрактов», последовавших после постановления.
Как бы там ни было, эксперты ожидают, что «Яндекс» будет вечно вести свою неравную битву с Google; не только на поле мобильных устройств на базе Android, но, что более важно, на арене машинного перевода.
Мы связались с «Яндекс», чей представитель повторил любимый лозунг Google — «все дело в том, чтобы собрать достаточно данных», заявив при этом, что «Яндекс» — одна из немногих мировых компаний, располагающих доступом к достаточному объему данных, чтобы обеспечить требуемое сегодня качество машинного перевода.
Представитель «Яндекса»: За бесплатными услугами по переводу обращаются до 10 миллионов пользователей ежедневно.
По информации на сайте «Яндекса», компьютерный перевод станет одной из четырех основных областей машинного интеллекта, которыми и будет заниматься МИИ; также служба уделит внимание распознаванию изображений, распознаванию голоса и разработке платформы для машинного обучения.
Объединив усилия для создания дополнительного функционала, компания уже начала тестировать перевод изображений при помощи своего сервиса Yandex.Translate. Также представитель сказал, что «Яндекс» включил в свой переводчик речевые функции, так что пользователи могут задавать голосовые запросы и слышать перевод. Из того же источника нам стало известно, что за бесплатными услугами компании по переводу обращаются до 10 миллионов пользователей ежедневно.
Цены приятнее, чем у Google
Платный сервис Yandex.Translate API требует 15 долларов за миллион символов при объеме до 50 миллионов символов в месяц, со скидкой до 6 долларов после 500 миллионов.
Google получает 20 долларов за миллион символов при объеме до 1,5 миллиардов символов в месяц, снижая цену до 15 долларов за миллион после достижении 1,5 миллиардов. А вот Microsoft оценивает миллион символов в 10 долларов.
Вскоре ожидаются нейросети
По словам представителя «Яндекса», в середине 2016 года началось интегрирование модели, основанной на нейросетях, в сервисы компании, но базовая технология все еще статична. Наш источник пообещал, что вскоре «Яндексу» «будет чем поделиться» в области развития нейронных моделей.
На вопрос о новой службе нам ответили, что МИИ — это «консолидация уже существующих команд в один отдел» и, помимо привлечения Биленко, новых вакансий с его открытием не появилось. В двух словах, это скорее внутренняя реорганизация, чем крупное расширение.
Отделение Yandex.Translate находится в главном офисе в Москве, одном из 17 офисов «Яндекса», расположенных по всему миру. «Большая часть команды Yandex.Translate состоит из разработчиков, с которыми работают также аналитики, тестеры, менеджеры проектов и прочие специалисты поддержки», заявил представитель компании.
Неравная битва
Исследователь языковой отрасли Константин Дранч, ведущий российского языкового портала translationrating.ru, предполагает, что «Яндекс» стремится к лидерству на рынке бесплатных, доступных пользователям машинных переводов. Он рассказал Slator, что «у компании есть множество каналов для продвижения (браузер, порталы), так что со временем она, скорее всего, обгонит [конкурента] PROMT, но всегда будет вести неравную битву с Google».
По объему поисковых запросов «Яндекс» еле-еле обошел Google с долей в 55,2%.
Что касается другого конкурента «Яндекса», ABBYY, Дранч отметил, что их машинный перевод «не доступен для широкой публики, хотя в базовую технологию, Compreno, делались объемные вложения, и она хорошо вышла на рынок три года назад».
Зачем чеченский, если можно перейти на клингонский?
Дранч заметил, что «Яндекс» предлагает многие услуги, повторяющие сервисы Google: карты, интернет-хранилище, рынок, аналитические пакеты для сайтов и так далее.
«Если у вас есть почта на «Яндексе», вы пользуетесь Яндекс-браузером, поисковиком и каждый день просматриваете там новости, естественно, вы будете пользоваться переводчиком «Яндекса», а не Google».
Константин Дранч:«Как обстоят дела с качеством машинного перевода EN-RU у «Яндекса» по сравнению с Google? У обеих компаний они идут одинаково плохо или одинаково хорошо».
На вопрос, как обстоят дела в области качества машинного перевода в направлении английский <—> русский у «Яндекса» по сравнению с Google, он ответил: «у обеих компаний они идут одинаково плохо или хорошо».
«Борьба за потребителей ведется на уровне маркетинга и возможности встроить предложение в устройства и приложения пользователя. Тут у Google есть преимущество, поскольку он контролирует ОС Android», — добавил Константин.
Что касается возможностей «Яндекса» в отношении машинного перевода, Дранч посоветовал добавить обучающие машину функции, схожие с MicrosoftTranslationHub. «Это позволит им создавать корпоративные блоки со специализированной терминологией и продвинуться в бизнес-сегменте», пояснил он.
Читать подробнее о машинном переводе в разделе Технологии Яндекса.
Дранч рассказал, что и «Яндекс», и Google и так работают с «крупными» языками бывшего СНГ, такими как украинский, казахский, таджикский и грузинский. Хотя помимо них существует множество малочисленных языков, — и тут «Яндекс» обладает преимуществом, — наш собеседник считает, что, с точки зрения траффика и финансовой выгоды, они не составят большой разницы, поскольку «все равно 80-90% всех запросов заключаются в переводе с русского на английский, французский и немецкий».
Возможно, «Яндекс» решит добавить чеченский прежде, чем клингонский.
Директор по развитию бизнеса PROMT Юлия Епифанцева рассказала Slator, что розничный сегмент и так уже охватывает большинство языков постсоветского пространства. Что касается корпоративного сегмента, в частности использования машинного перевода в государственных или законодательных структурах, она заявила, что «онлайн услугам тут нечего предложить, поскольку этим организациям, как правило, требуются оффлайн-решения в области переводов»,
Согласно мнению Дранча, следующим крупным языком, на котором говорят более миллиона человек, станет чеченский. «Возможно, «Яндекс» решит добавить чеченский прежде, чем клингонский или дотракийский. А возможно, нет», — добавил он, намекая на постоянное стремление «Яндекса» одержать победу в добавлении малоизвестных языков.
По поводу решения «Яндекса» включить Yandex.Translate в состав управления МИИ, Дранч подчеркнул: «Машинное обучение имеет множество применений, и перевод — лишь одно из них. Так что вполне разумно дать новому подразделению с отличным персоналом чуть больше свободы».
Перевод статьи: Мэриона Маркинга