О сервисе Прессе Авторские права Связаться с нами Авторам Рекламодателям Разработчикам.
«Яндекс» научил «Алису» вести персональное утреннее шоу
Управляем голосом любым видео на «ТВ Станции» Управлять перематывать, переключать, включать субтитры и т. Просто дайте Алисе нужную команду и она все сделает. Персонализация утреннего шоу Порядок контента и его жанр можете выбрать и настроить под себя. Здесь можно выбрать мероприятия, которые хотели бы видеть у себя в рекомендациях. Радионяня mode on Теперь где бы вы ни были — в соседней комнате или отошли по делам, оставив ребенка с бабушкой, няней и т. Активируйте функцию «Радионяни» на «Яндекс Станции», чтобы слушать звуки из детской прямо на своем смартфоне, где бы вы ни находились.
Сейчас в голосовом помощнике доступны 11 новостных тематик и 21 рубрика для подкастов. В общей сложности у Алисы больше двух тысяч подкастов на разные темы.
Голосовой помощник следит за новостными выпусками девяти радиостанций. Станции, Станции Мини и других умных колонках, где есть голосовой помощник Алиса. Чтобы выбрать тематику новостей и подкастов, нужно просто открыть приложение Яндекс, выбрать пункт «Устройства», далее выбрать «Аккаунт» и перейти в «Настройки шоу Алисы».
Здесь же пригодится и функция напоминаний: при составлении списка дел вы можете указывать только день — попросить составить список на сегодня, завтра или конкретную дату. А команды вроде «Напомни позвонить Александру по поводу квартиры» работают с часами и даже минутами. Воспользоваться функцией можно даже в телевизоре. Правда, только если он от «Яндекса».
Источник: yandex.
А команды вроде «Напомни позвонить Александру по поводу квартиры» работают с часами и даже минутами. Воспользоваться функцией можно даже в телевизоре. Правда, только если он от «Яндекса». Источник: yandex. После каждого этапа Алиса будет делать паузу, чтобы вы успели выполнить ее советы.
Голосовой помощник Алиса начала вести свое утреннее шоу
«Алиса» научилась персонализировать «Утреннее шоу». Как настроить новости на Яндекс Алисе: шаг за шагом. Настройка новостей в Яндекс Алисе позволяет получать свежие новости по интересующим вас темам. Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. Чтобы выбрать тематику новостей и подкастов, нужно просто открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей». Теперь пользователи могут добавить новости в Утреннее шоу Алисы. Виртуальный ассистент Алиса поставит утреннее шоу: слушайте музыку, новости, подкасты и настраивайтесь на день. Утреннее шоу Алисы поможет настроиться на день и не забыть о важном. Алиса расскажет о погоде, представит персональную подборку новостей, включит короткий подкаст, специально подобранный трек или плейлист.
Слушать утреннее и вечернее шоу Алисы на Станции
Для этого достаточно открыть приложение Яндекс и сказать: «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей» - С умной колонкой можно слушать что угодно. А утреннее шоу — это такой формат, который позволяет собрать воедино то, что любишь. Несложные манипуляции с настройками — и человек получает именно то, что хочет. Ему даже не нужно ничего говорить, кроме одной единственной фразы: "Алиса, включи утреннее шоу", - рассказывает руководитель голосового помощника Андрей Законов.
Новый формат контента в утреннем шоу Алисы Новый формат контента в утреннем шоу Алисы: истории от навыков 19 Июня, 2021 Автор: Яндекс Теперь навыки смогут отправлять короткий регулярный контент в утреннее шоу Алисы.
Чтобы услышать историю в шоу, пользователь должен зайти в мобильное приложение Яндекса и выбрать в настройках шоу в разделе Навыки те, от которых хотел бы получать обновления. Если на момент запуска шоу у навыка есть новая история, которую пользователь еще не слышал, она будет рассказана вместе с другими интересующими его темами например, музыкой или новостями. Ключевые особенности: Участвовать в утреннем шоу могут все навыки общего типа.
Музыке — в нем собраны треки, отобранные для пользователя. Чтобы запустить программу, достаточно сказать: «Алиса, включи утреннее шоу!
Поэтому мы учим ее следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении», — говорит руководитель продукта Андрей Законов.
Проще говоря, эта штуковина показывает, какое распределение по мощностям было у различных частот звука в конкретный момент. Мел-спектрограмма непрерывна, то есть с ней можно работать как с изображением. А так звучит результат синтеза: 3. Новый вокодер Вероятно, вы уже догадались, что мы перешли к использованию нового нейросетевого вокодера. Именно он в реальном времени превращает мел-спектрограмму в голос.
Наиболее близкий аналог нашего первого решения на основе нейросетей, которое вышло в 2018 году — модель WaveGlow. Архитектура WaveGlow основана на генеративных потоках — довольно изящном методе создания генеративных сетей, впервые предложенном в статье про генерацию лиц. Сеть обучается конвертировать случайный шум и мел-спектрограмму на входе в осмысленный wav-сэмпл. За счёт случайного шума на входе обеспечивается выбор случайной wav-ки — одной из множества соответствующих мел-спектрограмме. Как я объяснил выше, в домене речи такой случайный выбор будет лучше детерминированного среднего по всем возможным wav-кам. В отличие от WaveNet, WaveGlow не авторегрессионен, то есть не требует для генерации нового wav-сэмпла знания предыдущих.
Его параллельная свёрточная архитектура хорошо ложится на вычислительную модель видеокарты, позволяя за одну секунду работы генерировать несколько сотен секунд звука. Главное отличие, за счёт которого HiFi-GAN обеспечивает гораздо лучшее качество, заключается в наборе подсетей-дискриминаторов. Они валидируют натуральность звука, смотря на сэмплы с различными периодами и на различном масштабе. Как и WaveGlow, HiFi-GAN не имеет авторегрессионной зависимости и хорошо параллелится, при этом новая сеть намного легковеснее, что позволило при реализации ещё больше повысить скорость синтеза. Кроме того, оказалось, что HiFi-GAN лучше работает на экспрессивной речи, что в дальнейшем позволило запустить эмоциональный синтез — об этом подробно расскажу чуть позже. Схема HiFi-GAN из статьи авторов модели Комбинация этих трёх компонентов позволила вернуться к параметрическому синтезу голоса, который звучал плавно и качественно, требовал меньше данных и давал больше возможностей в кастомизации и изменении стиля голоса.
Параллельно мы работали над улучшением отдельных элементов синтеза: Летом 2019 года выкатили разрешатор омографов homograph resolver — он научил Алису правильно ставить ударения в парах «зАмок» и «замОк», «белкИ» и «бЕлки» и так далее. Здесь мы нашли остроумное решение. В русском языке эти слова пишутся одинаково, но в английском написание отличается, например, castle и lock, proteins и squirrels. Из этого представления легко выделить информацию о том, как произносить омограф, ведь перевод должен различать формы для корректного подбора английского варианта. Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения.
Язык — хитрая штука. Не все знаки препинания в речи выражаются паузами Например, после вводного слова «конечно» на письме мы ставим запятую, но в речи обычно не делаем паузу. А там, где знаков препинания нет, мы часто делаем паузы. Если эту информацию не передавать в акустическую модель, то она пытается её выводить и не всегда успешно. Первая модель Алисы из-за этого могла начать вздыхать в случайных местах длинного предложения. Для этого мы взяли датасет, разметили его детектором активности голоса, сгруппировали паузы по длительности, ввели класс длины паузы, на каждое слово навесили тэг и на этом корпусе обучили ещё одну голову внимания из тех же нейросетевых эмбеддингов, что использовались для детекции омографов.
Осенью 2020 года мы перевели на трансформеры нормализацию — в синтезе она нужна, чтобы решать сложные случаи, когда символы читаются не «буквально», а по неким правилам. Например, «101» нужно читать не как «один-ноль-один», а как «сто один», а в адресе yandex. Обычно нормализацию делают через комбинацию взвешенных трансдьюсеров FST — правила напоминают последовательность замен по регулярным выражениям, где выбирается замена, имеющая наибольший вес. Мы долго писали правила вручную, но это отнимало много сил, было очень сложно и не масштабируемо. Тогда решили перейти на трансформерную сеть, «задистиллировав» знания наших FST в нейронку. Теперь новые «правила раскрытия» можно добавлять через доливание синтетики и данных, размеченных пользователями Толоки, а сеть показывает лучшее качество, чем FST, потому что учитывает глобальный контекст.
Итак, мы научили Алису говорить с правильными интонациями, но это не сделало ее человеком — ведь в нашей речи есть еще стиль и эмоции. Работа продолжалась. С чувством, толком, расстановкой: стили голоса Алисы Один и тот же текст можно произнести десятком разных способов, при этом сам исходный текст, как правило, никаких подсказок не содержит. Если отправить такой текст в акустическую модель без дополнительных меток и обучить её на достаточно богатом различными стилями и интонациями корпусе, то модель сойдёт с ума — либо переусреднит всё к металлическому «голосу робота», либо начнёт генерировать случайный стиль на каждое предложение. Это и произошло с Алисой: в начале она воспроизводила рандомные стили в разговоре. Казалось, что у неё менялось настроение в каждом предложении.
Вот пример записи с явными перебоями в стилях: Чтобы решить проблему, мы добавили в акустическую модель стили: в процессе обучения нейросети специально ввели «утечку». Суть в том, что через очень lossy-пространство всего 16 чисел на всё предложение разрешаем сетке посмотреть на ответ — истинную мел-спектрограмму, которую ей и нужно предсказать на обучении. За счёт такой «шпаргалки» сеть не пытается выдумывать непредсказуемую по тексту компоненту, а для другой информации не хватит размерности шпаргалки. На инференсе мы генерируем стилевую подсказку, похожую на те, что были в обучающем сете. Это можно делать, взяв готовый стиль из обучающего примера или обучив специальную подсеть генерировать стили по тексту. Если эту подсеть обучить на особом подмножестве примеров, можно получить специальные стили для, скажем, мягкого или дружелюбного голоса.
Или резкого и холодного. Или относительно нейтрального. Чтобы определиться со стилем по умолчанию, мы устроили турнир, где судьями выступали пользователи Толоки. Там не было разметки, мы просто нашли кластеры стилей и провели между ними соревнование. Победил кластер с очень мягкой и приятной интонацией. Дальше началось самое интересное.
Мы взяли образцы синтезированной «мягкой» речи Алисы и фрагменты речи актрисы Татьяны Шитовой, которые относились к более резкому стилю. Затем эти образцы с одним и тем же текстом протестировали вслепую на толокерах. Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. В принципе, этого можно было ожидать: уверен, многие предпочтут более ласковый разговор по телефону то есть с потерей в качестве живому, но холодному общению.
Новый формат контента в утреннем шоу Алисы: истории от навыков
Более того, никакого виджета для браузеров разработчики VK пока не предусмотрели. И тогда возникает вопрос: «Читает ли Алиса последние новости так, как она это делала раньше? Да, здесь она может прийти на помощь, и это будет гораздо удобнее, чем открывать Дзен и читать новости там. Только нужно предварительно выполнить некоторые манипуляции. Все объяснения буду сопровождать скриншотами, которые сделал и с телефона, и с ноутбука. Как настроить новости в Алисе Можно дать ей обычную команду «Алиса, настрой новости». Если же мы просто напишем «новости» без предварительной настройки, то голосовой помощник нам выдаст такое сообщение: Дополню, что настроить Алису можно не только в приложении Яндекса с 12 сентября оно называется Яндекс.
Если на умной колонке поставить аудиокнигу на паузу и позже включить на смартфоне, то воспроизведение продолжится на том же месте. А позже «Алису» хотят научить не только находить, оплачивать и включать нужные книги, но и давать рекомендации на основе пользовательских вкусов. А на закуску — милейшая и одна из самых новых коллабораций: «Алиса» и Whiskas Дома есть коты и кошки? А может, вы только готовитесь к их появлению? Тогда говорим вот какую команду: «Алиса, запусти навык «Больше мурррчаний с Whiskas». Это поможет котородителям сделать так, чтобы питомец был счастлив. Навык включает в себя пять разделов с рекомендациями по уходу и заботе: котокухня, котомузыка, котоигры, котоуход и котомассаж.
Все это с озвучкой от Николая Дроздова. Ну а чей еще голос можно было представить, когда речь идет о животных? Алиса дает полезные советы о том, как обустроить уютное и безопасное пространство для игр и отдыха, провести расслабляющий сеанс котомассажа и приучить питомца к тактильности или подобрать котенку оптимальный рацион. Также есть забавный раздел с комплиментами для кошек: пусть даже они не понимают речь, но чувствуют интонации и любят слова с шипящими и свистящими звуками. Самое необычное — раздел котомузыки.
Сценарий: Время спать Ранее: Приходилось по отдельности выключать телевизор, светодиодную ленту, обесточить какие-то розетки и, конечно, выключить свет в спальне. В ближайшее время докуплю ещё кнопку для запуска данного сценария - долгое нажатие. УДЯ НЕ запоминает состояние телевизора. Можно и без умной розетки и wake on lan режима управлять.
Тогда из этого моего сценария убрать телевизор. Сейчас: Возле входной двери установлена умная кнопка. После её зажатия происходит сценарий: выключается всё освещение, которое забывал выключить, выключается кондиционер, розетки обесточиваются если установлена умная розетка или умное реле на розетку. Сценарий: Помогаем кондиционеру не работать просто так Ранее: я забывал выключить кондиционер, когда открывалась дверь на балконе. Сейчас: Я также забываю выключать кондиционер, когда выхожу на балкон. С данным сценарием кондиционер отключается автоматически. Список покупок Ранее: На моём телефоне установлено приложение Tick-Tick, это простая гибка тудушка. Через неё создавал список покупок. Но таким голосовым управлением добавляется по одной задаче.
Сейчас: В каждой комнате установлен Яндекс со своими мини станциями и создавать списки покупок голосом стало удобно. Например, Вы принимаете душ или делая дела по дому обнаружили отсутствие зубной пасты. Голосовой фразой "Алиса, добавь зубную пасту в список покупок" - зубная паста добавляется в общий список покупок. Не забывайте пуши использовать для других сценариев. Если влажность в доме повысилась, открылась дверь или что-то ещё. Сценарий: После работы направляемся домой Наконец-то можно подготовить квартиру к вашему приходу светодиодной гирлянды на балконе у меня нет. Сценарий: Доброе утро Вы проснулись. Голосовым управлением "Алиса, доброе утро" или нажатием кнопки начинается утренний сценарий. Яндекс Станция включает Шоу Алисы погода, новости, музыка и т.
Об этом я рассказываю ниже. Для утреннего сценария использую автоматизацию охлаждения кухни кондиционером. К данному сценарию можно подключить: кофеварку через навык xiaomi от Яндекса , но у меня дома рожковая кофеварка. К данному сценарию можно добавить: Рассказать список личных дел на сегодня. Я этими делами не пользуюсь. Утреннее шоу Алисы В утреннем шоу Алиса расскажет о погоде, настраиваемая подборка новостей, короткие подкасты и треки из плейлиста дня. Дополнительно можно подключить навыки из представленной подборки. Обо всём этом Алиса рассказывает через музыкальный трек. Ещё есть секретное шоу: ночное шоу Алисы со спокойной музыкой.
А что с роботом пылесосом? Да, его тоже можно использовать для сценариев или управления голосом, но он у меня не такой умный у моего пылика нет лидара, беда. Приходится перед каждой его уборкой все-все хорошенько прятать. Будь он с лидаром, настроил бы сценарию для утренней влажной уборки или когда с работы направляюсь домой. Но не все устройства упомянуты.. Да, Вы правы. Я только начинаю строить свой удобный умный дом. Ещё есть умная лампочка. Я её использую, когда начинаю работать.
В приложениях для смартфонов такого пока нет. Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении. А для тех, кто сидит на самоизоляции, голосовой помощник даёт советы о том, как провести время с пользой.
Читает ли Алиса последние новости? Настраиваем её на телефоне и на компьютере
Чтобы запустить программу, нужно сказать: «Алиса, включи утреннее шоу!». Паузы между новостями и песнями голосовой помощник заполняет актуальной информацией. первый шаг в этом направлении". Выбрать тематику новостей и подкастов можно в приложении «Яндекс», сказав «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей». Утреннее шоу Алисы — как настроить и использовать Утреннее шоу Алисы позволяет ознакомиться с новейшими новостями, прослушать интересные подкаcты и. Для того чтобы настроить новости на колонке с Алисой Яндекс. Друзья Алисы и пользователи сервисов Яндекса, общаясь с Алисой, смогут узнавать актуальные новости из мира мотоциклов.
Утреннее шоу от Алисы на Яндекс Станции
Команды и сценарии для Алисы: покоряем умного помощника. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении», — говорит руководитель продукта Андрей Законов. первый шаг в этом направлении". «Утреннее шоу» и новости радиостанций доступны во всех умных колонках с поддержкой «Алисы».