Особенностью Алисы стала личность, разработанная коллективом Яндекса вместе с журналистом и бывшим руководителем группы маркетинга компании Владимиром Гуриевым. Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости.
Шёпот и эмоции в Алисе: история развития голосового синтеза Яндекса
Для настройки новостей на Яндекс Алисе необходимо открыть раздел «Интеграция» в настройках приложения. Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. «Алиса» научилась персонализировать «Утреннее шоу». Как настроить новости на Яндекс Алисе: шаг за шагом. Настройка новостей в Яндекс Алисе позволяет получать свежие новости по интересующим вас темам. В этой статье мы рассмотрим, что такое утреннее шоу от Алисы, как включить его на Яндекс Станции и как настроить. Тогда, услышав запрос «Расскажи новости», Алиса будет всегда включать новости нужного издания. Кроме этого, их можно добавить в утреннее шоу Алисы. Шоу и новости доступны в «и», «Станции Мини» и других умных колонках, где есть голосовой помощник «Алиса».
Голосовой помощник Алиса начала вести свое утреннее шоу
Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере | К слову, Алиса теперь умеет вести "утренние шоу". |
Новый формат контента в утреннем шоу Алисы: истории от навыков | Теперь навыки смогут отправлять короткий регулярный контент в утреннее шоу Алисы. |
«Алиса» научилась вести утренние шоу — Игромания | Как включить новости в Яндекс Браузере. |
Вышло апрельское обновление Алисы и умных устройств Яндекса
«Утреннее шоу» и новости радиостанций доступны во всех умных колонках с поддержкой «Алисы». Тогда, услышав запрос «Расскажи новости», Алиса будет всегда включать новости нужного издания. Кроме этого, их можно добавить в утреннее шоу Алисы. К слову, Алиса теперь умеет вести "утренние шоу". Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Теперь голосовой помощник может запускать новостные блоки с девяти станций, включая «Хит ФМ» и «Коммерсантъ FM». Утренние шоу впервые появились в апреле этого года. Чтобы выбрать тематику новостей и подкастов, нужно просто открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей». Обновление Алисы также включает в себя улучшенное утреннее шоу: теперь там не только новости и музыка, но и короткие подкасты, даты в истории, мудрости и комплименты.
Утреннее шоу Алисы стало персональным
Например, на плейлист на «Яндекс. Чтобы запустить программу, нужно сказать: «Алиса, включи утреннее шоу! Паузы между новостями и песнями голосовой помощник заполняет актуальной информацией. Например, сейчас это советы, как с пользой провести время дома, пояснили в компании.
В общей сложности у «Алисы» больше двух тысяч подкастов на разные темы. Новости радиостанций можно слушать как в утреннем шоу, так и отдельно. Причём их зачитывает ведущий. Голосовой помощник следит за новостными выпусками девяти радиостанций. А утреннее шоу — это такой формат, который позволяет собрать воедино то, что любишь.
Несложные манипуляции с настройками — и человек получает именно то, что хочет.
А команды вроде «Напомни позвонить Александру по поводу квартиры» работают с часами и даже минутами. Воспользоваться функцией можно даже в телевизоре. Правда, только если он от «Яндекса». Источник: yandex. После каждого этапа Алиса будет делать паузу, чтобы вы успели выполнить ее советы.
Вы также можете использовать навыки Алисы для игры в игры и для доступа к другим приложениям. Вы можете посмотреть на доступные навыки Алисы, чтобы узнать больше о том, что вы можете сделать с помощью Алисы. Навык «Утреннее шоу» Алисы идеально подходит для людей, которые хотят быть в курсе всех новостей и интересных мероприятий.
На колонках с Алисой появилась функция Утреннего шоу
Составить список покупок Что сказать: «Алиса, добавь в список покупок творожный сырок», «Алиса, что в списке покупок? Например, если вы обнаружили, что закончилась зубная паста, можно сразу же сказать об этом Алисе. Открыть список покупок в магазине можно со смартфона, тоже через Алису. Она составит списки задач, напомнит о них и удалит выполненные.
Просто в любой момент вызовите Алису и сформулируйте для нее список дел из одного или нескольких пунктов.
Проблема стандартных регрессионных методов глубокого обучения в том, что они ищут одну моду — «хорошее среднее» — и попадают в такие «провалы неестественности». В результате оказывается, что лучше случайно выбрать один из двух способов, чем попасть в среднее между ними. Впрочем, даже если акустическая модель и смогла бы разобраться в контексте и выдать обогащённое информацией промежуточное состояние, то с ним уже не мог справиться примитивный вокодер. Поэтому мы не остановились и стали искать более совершенные решения.
Конкатенативный синтез: рождение Алисы В 2016 году мы решили создать Алису — сразу было понятно, что это более амбициозная задача, чем всё, чем занимались раньше. Дело в том, что в отличие от простых TTS-инструментов, голосовой помощник должен звучать человечно, иначе люди просто не станут с ним или с ней общаться. Предыдущая архитектура совершенно не подходила. К счастью, был и другой подход. Точнее, даже два.
Тогда как раз набирал обороты нейропараметрический подход, в котором задачу вокодера выполняла сложная нейросетевая модель. Например, появился проект WaveNet на базе свёрточной нейросети, которая могла обходиться и без отдельной акустической модели. На вход можно было загрузить простые лингвистические данные, а на выходе получить приличную речь. Первым импульсом было пойти именно таким путём, но нейросети были совсем сырые и медленные, поэтому мы не стали их рассматривать как основное решение, а исследовали эту задачу в фоновом режиме. На генерацию секунды речи уходило до пяти минут реального времени.
Это очень долго: чтобы использовать синтез в реальном времени, нужно генерировать секунду звука быстрее, чем за секунду. Что же делать? Если нельзя синтезировать живую речь с нуля, нужно взять крошечные фрагменты речи человека и собрать из них любую произвольную фразу. Напомню, что в этом суть конкатенативного синтеза, который обычно ассоциируется с методом unit selection. Пять лет назад он уже давал наилучшее качество при достаточном количестве данных в задачах, где была нужна качественная речь в реальном времени.
И здесь мы смогли переиспользовать нейросети нашей старой параметрики. Работало это следующим образом: На первом шаге мы использовали нейросетевую параметрику, чтобы синтезировать речь с нуля — подобному тому, как делали раньше. Напомню, что по качеству звучания результат нас не устраивал, но мог использоваться как референс по содержанию. На втором шаге другая нейросеть подбирала из базы фрагментов записанной речи такие, из которых можно было собрать фразу, достаточно близкую к сгенерированной параметрикой. Вариантов комбинаций фрагментов много, поэтому модель смотрела на два ключевых показателя.
Первый — target-cost, точность соответствия найденного фрагмента гипотезе, то есть сгенерированному фрагменту. Второй показатель — join-cost, насколько два найденных соседних фрагмента соответствуют друг другу. По сути, нужно было выбрать вариант, для которого сумма target-cost и join-cost минимальна. Эти параметры можно считать разными способами — для join-cost мы использовали нейросети на базе Deep Similarity Network, а для target-cost считали расстояние до сгенерированной параметрикой гипотезы. Сумму этих параметров, как и принято в unit selection, оптимизировали динамическим программированием.
Кстати, подобный подход использовался и при создании Siri 2. Схема конкатенативного синтеза У такого подхода тоже есть плюсы и минусы. Среди достоинств — более естественное звучание голоса, ведь исходный материал не синтезирован, а записан вживую. Правда, есть и обратная сторона: чем меньше данных, тем более грубо будут звучать места склейки фрагментов. Для шаблонных фраз всё более-менее хорошо, но шаг влево или вправо — и вы замечаете склейку.
Поэтому нужно очень много исходного материала, а это требует многих часов записи голоса диктора. К примеру, в первые несколько лет работы над Алисой нам пришлось записать несколько десятков часов. Это несколько месяцев непрерывной работы с актрисой Татьяной Шитовой в студии. При этом нужно не просто «прочитать текст по листочку». Чем более нейтрально будет звучать голос, тем лучше.
Обычно от актёров ждут эмоциональности, проявления темперамента в своей речи. У нас ровно обратная задача, потому что нужны универсальные «кубики» для создания произвольных фраз. Вот характерный пример работы синтеза: В этом главный недостаток метода unit selection: несмотря на все усилия, фрагменты речи не будут идеально соответствовать друг другу по эмоциям и стилю. Из-за этого сгенерированная речь Алисы постоянно «переключалась» между ними. На коротких фразах это не всегда заметно, но если хотите услышать произвольный ответ длиной хотя бы в пару предложений например, быстрый ответ из поиска , то недостатки подхода становятся очевидны.
В общем, unit selection перестал нас устраивать и нужно было развиваться дальше. Иногда они возвращаются: опять параметрический синтез В результате мы вернулись к архитектуре из двух последовательных блоков: акустическая модель и вокодер. Правда, на более низком уровне обновилось примерно всё. Акустическая модель В отличие от старой параметрики, новую модель мы построили на основе seq2seq-подхода с механизмом внимания. Помните проблему с потерей контекста в нашей ранней параметрике?
Если нет нормального контекста, то нет и нормальной интонации в речи. Решение пришло из машинного перевода. Дело в том, что в машинном переводе как раз возникает проблема глобального контекста — смысл слов в разных языках может задаваться разным порядком или вообще разными структурами, поэтому порой для корректного перевода предложения нужно увидеть его целиком. Для решения этой задачи исследователи предложили механизм внимания — идея в том, чтобы рассмотреть всё предложение разом, но сфокусироваться через softmax-слой на небольшом числе «важных» токенов. При генерации каждого нового выходного токена нейросеть смотрит на обработанные токены фонемы для речевого синтеза или символы языка для перевода входа и «решает», насколько каждый из них важен на этом шаге.
Оценив важность, сеть учитывает её при агрегировании результатов и получает информацию для генерации очередного токена выхода. Таким образом нейросеть может заглянуть в любой элемент входа на любом шаге и при этом не перегружается информацией, поскольку фокусируется на небольшом количестве входных токенов. Для синтеза важна подобная глобальность, так как интонация сама по себе глобальна и нужно «видеть» всё предложение, чтобы правильно его проинтонировать.
В частности, система ориентируется на персональный плейлист на «Яндекс. Также голосовой помощник понимает контекст и рассказывает, к примеру, о том, как провести время дома. По словам руководителя продукта Андрея Законова, проведение утренних шоу — это первый шаг, чтобы сделать «Алису» не только помощником, но и другом, с которым приятно проводить время.
В приложениях для смартфонов такого пока нет. Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении.
А для тех, кто сидит на самоизоляции, голосовой помощник даёт советы о том, как провести время с пользой.
Похожие статьи
- «Алиса» начала проводить персональные утренние шоу в «умных» колонках — Сервисы на
- Тексты песен любимых исполнителей на «ТВ Станциях»
- Конкатенативный синтез: рождение Алисы
- У "Алисы" от Яндекса появилась новая функция - теперь она ведет "утреннее шоу"
- Тексты песен любимых исполнителей на «ТВ Станциях»
Плюсы и минусы
- Как Алиса отображает последние новости
- Алиса (голосовой помощник) — Википедия
- Новый формат контента в утреннем шоу Алисы: истории от навыков
- Топовые фишки Яндекс.Станции, о которых вы могли не знать -
- Что нового в апреле у Алисы и умных устройств
- Ключевые особенности:
Утреннее шоу Алисы – получайте новости и полезную информацию каждое утро
После работы можно послушать вечернее шоу — Алиса поделится новостями и погодой на следующий день и поставит расслабляющую музыку. Умная лампочка Яндекс с Алисой, цоколь E27, белая (YNDX-00501). «Алиса» научилась персонализировать «Утреннее шоу». Как настроить новости на Яндекс Алисе: шаг за шагом. Настройка новостей в Яндекс Алисе позволяет получать свежие новости по интересующим вас темам.
Место под большое лого и рекламу навыков
Теперь пользователи могут добавить новости в Утреннее шоу Алисы. Теперь пользователи могут добавить новости в Утреннее шоу Алисы. Тогда, услышав запрос «Расскажи новости», Алиса будет всегда включать новости нужного издания. Кроме этого, их можно добавить в утреннее шоу Алисы.
Вышло большое обновление Алисы. Смотри, что теперь умеет твоя Яндекс Станция
На колонках с Алисой появилась функция Утреннего шоу | В конце 2020 года утреннее шоу Алисы стало персонализированным. До публикации этой новости я мельком слышал про существование Алисы (видео, когда 2 телефона общаются между собой). |
Шёпот и эмоции в Алисе: история развития голосового синтеза Яндекса | Голосовой помощник «Алиса» научили проводить утренние шоу, которые подстраиваются под определённого пользователя. |
Утренняя Алиса. У голосового помощника Яндекса теперь своё шоу | Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. |
8 новых фишек «Яндекс Станций» и «Яндекс ТВ Станций», которые появились в апреле | Для настройки новостей на колонке Алиса Яндекс, найдите раздел «Новости» или «Информация» и выберите его. |