Что удалось узнать об Алисе из доклада на Yet another Conference 2018?

Для тех, кто «в танке»: Алиса – это голосовой помощник от Яндекса, который способен понимать письменную и устную речь, а также вступает с пользователем в диалог.

И вот сегодня (29 мая) во время московской конференции Yet another Conference 2018 (или YaC) было поведано о «начинке» Алисы и о принципах её работы. Обо всё по порядку:

  1. Распознавание голоса пользователя. Эта функция возможна благодаря технологии Speechkit. Но система пока что не совершенна, так как Алиса иногда испытывает трудности с распознаванием. Чтобы реализовать такую технологию, сотрудниками компании Яндекс в течение трёх лет проводился сбор миллиарда голосовых сообщений.
  2. Формулировка ответа пользователю. Функция возможна благодаря технологии Turing. Это непростая технология, суть которой сводится к работе семантического пространства. Высказывания продемонстрированы как точки, а тематика высказываний как окрас точки. Обучаясь, Алиса сближает точки на основании тематики ближе друг к другу. Также учитывается и постепенный переход из одной темы в другую.
  3. Произношение ответа для пользователя. Функция возможна благодаря технологии Text-to-speech. Определившись с ответом, Алиса озвучивает его для юзера. Чтобы эта технология работала, сотрудниками компании Яндекс пригласили актёров и записали свыше 350 000 слов. Такой словарный запас позволяет отвечать на запросы юзеров с максимальной точностью. В ходе записи слов было собрано около миллиона фонем, затем проводилась адаптация звучания под человеческую речь для удобного восприятия пользователями. 

Кроме того, Алиса способна распознавать объекты на фото, а также воспроизводить музыку из сервиса Яндекс. Объекты на картинках могут быть как живыми (к примеру, кошками или собаками), так и неживыми (здания, машины или другие вещи). При этом если изображён текст, то Алиса переведёт его для пользователя. А если будет замечена обувь, то сервис подберёт похожий товар через Яндекс Маркет.  

После презентации голосового сервиса, было рассказано о том, что компания запускает платформу Яндекс.Диалоги. Это новшество позволит Алисе совершенствовать навыки общения. Стоит также упомянуть, что присутствует функция переключения между операторами и искусственными ботами. Трёхмесячное бета-тестирование Диалогов окончено, первые навыки были уже успешно опробованы. 

Затем на конференции была представлена Яндекс.Станция – мультимедийная платформа, в которую уже интегрирована Алиса и Яндекс.Плюс. Последняя вещь представляет собой подписку на все сервисы компании. Таким образом, для пользователя становятся доступны полный перечень функций из всех сервисов (Такси, Драйв, Диск, КиноПоиск и так далее) без рекламы.