Этого голосового ассистента создали, когда Siri ещё не была адаптирована для русскоязычных пользователей. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. В статье мы рассмотрим историю развития голосовых ассистентов — от первых синтезаторов речи 1779 года до умных колонок в наших домах. Сегодня мы делаем первые шаги к тому, чтобы у голосового помощника появился визуальный образ.
Как настроить Марусю на телефоне. Здесь всё, что нужно знать
В статье мы рассмотрим историю развития голосовых ассистентов — от первых синтезаторов речи 1779 года до умных колонок в наших домах. Сколько стоит создание ассистента и что для этого нужно уметь. Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Голосовой помощник — искусственный интеллект с развитыми навыками распознавания речи, который обрабатывает огромные объемы информации, благодаря чему постоянно учится. Если мысль о том, что голосовые помощники захватывают мир, пугает вас, сейчас самое время отвести взгляд от экрана.
10 главных умных помощников в 2022 году
Ассистент постоянно работает в фоне и при этом не занимает ни единого дюйма экрана мобильного гаджета. Запустить приложение «Дуся» можно голосом, взмахом, встряхиванием и множеством других способов. Разработчики программы акцентируют внимание юзеров на том, что «Дуся» — это не чат-бот, который будет заигрывать с пользователем и рассказывать ему анекдоты а-ля Siri. К числу недостатков программы «Дуся» можно отнести то, что она является платной. Пользователю даётся неделя на знакомство с интеллектуальной помощницей — по истечении этого срока придётся приобрести подписку. Голосовой помощник давно не обновлялся разработчиками, поэтому не поддерживается некоторыми устройствами. Особенности приложения: Можно самому добавлять скрипты, чтобы «Дуся» понимала даже специфичные задачи. Активация жестами: встряхиванием, поднесением к уху и пр.
По голосовой команде — она способна настраивать ОС, запускать различные приложения и задачи, делать пометки в календаре и т. Пока же вместо нее на компьютере можно использовать Алису , Марусю , ассистента Google , или Горыныча...
Примечание: иногда ее "работа" приводит к сбоям в работе ПК...
Советский физик Лев Мясников как раз был занят таким исследованием с 1939 года в рамках диссертации «Техническая фонетика». В 1942 году, несмотря на войну и ужасы блокадного Ленинграда, ученый защитил свой проект, продемонстрировав фокус-группе аппарат, умеющий распознавать несколько гласных и согласных звуков. Размеры аппарата были внушительными даже для того времени. Его высота составляла порядка 180 сантиметров.
Работа с распознавателем чисел происходила с помощью телефона: абонент произносил число в трубку, система распознавала звук, как электрический сигнал и сопоставляла его с загруженными ранее в систему голосовыми референсами фраз. Система могла распознавать кроме 16 заложенных слов и 6 цифр еще и 10 математических команд. Семейства, представляемых в тот период времени «речевиков», мало чем отличались друг от друга, и соответственно прогресс шел семимильными шагами, без особого развития, породив потерю надежды и доверия к разрабатываемой технологии. Стагнация После публикации в 1969 году открытого письма американского инженера Джона Пирса, в котором он обосновал свое сомнение относительно исследованиям в области фонетических технологий, лидирующая тогда команда Bell, потеряла интерес со стороны инвесторов и на несколько лет осталась без финансовой поддержки. Говорящая кукла Джулия Julie the talking doll появилась на прилавках американских магазинов в 1987 году.
Её уникальность состояла в том, что ребенок мог научить куклу распознавать его речь. За семь лет до выпуска игрушки, в научном обществе произошел переворот, который по важности безусловно превосходит вышеупомянутую Джулию. В 1980 году инженеры впервые научились применять методы «Скрытой Модели Маркова», разработанной отечественным ученым в области математики Андреем Марковым. Скрытая Модель Маркова, Марковские цепи Немного отойдя от темы, постараюсь объяснить что это за такая математическая модель. По сути это описание вероятностей перехода объекта из одного состояние в другое.
То есть будущая вариация объекта не зависит от прошлого, а зависит от настоящего — от того, в каком состоянии объект находится в данный момент времени. Выходит, это матричная система генерации случайных событий в рамках заданного аргумента. Для примера рассмотрим такую модель графа с возможными физическими состояния человека: По картинке мы можем определить, что человек может находиться в четырех состояниях, причем не в каждое может перейти сразу. Например, если человек лежит, то он не может просто взять и пойти, для этого ему нужно пройти цепочку последовательности — сесть, встать и только потом уже пойти. Алгоритмы марковской модели в распознавании речи работают примерно по тому же принципу матричного графа.
А благодаря наличию нейросетей, любой желающий при должных знаниях может «научить» свой сервис обучаться, то есть чем больше люди будут пользоваться теми или иными функциями, тем лучше будут оптимизированы алгоритмы работы распознавания речи, благодаря улучшению генерирующей работы Марковской модели, расширением словарного запаса и пополнением библиотеки голосовых паттернов. Так, например, в 1990 году увидела свет одна из первых коммерческих программ по распознаванию речи — Dragon Dictate, ориентированная на массовый рынок потребителей. За эту космическую сумму денег пользователь получал возможность писать текст, просто проговаривая его в микрофон. К сожалению, программа не всегда работала корректно, и допускала даже по тем меркам достаточно серьезные ошибки. Представляла она из себя портал VAL, призванный помочь покупателям в поиске нужной информации о интересующих товарах.
Сферой использования этой системы были торговые центры, информационные стенды и прочие коммерчески ориентированные области деятельности. В 1997 году, вышла обновленная версия вышеупомянутой Dragon Dictate, в ней разработчики потрудились над скоростью и качеством распознавания речи. Google уже в 2002 году предприняла решение по развитию голосового поиска и интеграцией его в свою экосистему. Voice Search не имел особого успеха, но послужил отправной точкой для будущего приложения Voice Search для iPhone и Android, ставшим впоследствии интерактивным помощником Google Now, а с недавних пор Google Assistant. Система распознавания речи 2002 года от Google как и аналоги конкурентов работала при помощи телефонного звонка на специальный номер, пользователи не оценили такой способ поиска, так как он оказался попросту неудобен.
Общение происходит в режиме реального времени: Тамара реагирует на вопросы, а ее речь синхронизирована с изображением на экране — движением губ и мимикой. Визуальный образ Тамары был создан нейросетью, совместившей портреты 50 выдающихся женщин, которые в разное время внесли значимый вклад в развитие ИТ-сферы. Мы постоянно работаем над развитием голосового, а теперь и визуального консультанта. В этом году для клиентов с нарушением слуха в тестовом режиме был внедрен видеоаватар, который консультирует пользователей по банковским услугам и сервисам на русском жестовом языке. В перспективе 3D-аватар Тамары может появиться в приложении и в офисах банка для консультирования клиентов», — прокомментировал заместитель президента-председателя правления банка Георгий Горшков.
Обновлён рейтинг голосовых помощников
Несмотря на то, что голосовые помощники уже в то время были привычным делом, Алисе удалось произвести впечатление на русскоговорящую публику. Голосовой помощник — искусственный интеллект с развитыми навыками распознавания речи, который обрабатывает огромные объемы информации, благодаря чему постоянно учится. Голосовые помощники составят расписание, переведут деньги, закажут еду, возьмут на себя управление умным домом — в общем, они умеют все, что положено уметь хорошему помощнику. В статье мы рассмотрим историю развития голосовых ассистентов — от первых синтезаторов речи 1779 года до умных колонок в наших домах. Голосовые ассистенты заслужили доверие как у крупных, так и у небольших компаний, став важной.
Сколько стоит работа голосового помощника в России
Eventopia» — навык для голосового помощника Алисы, позволяющий школьникам быстро и легко находить увлекательные мероприятия и экскурсии для их возраста. Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости.
Голосовой помощник Alexa заговорит голосом усопших
На первой позиции рейтинга располагается «Алиса», разработку которой «Яндекс» начал в 2016 году. Этот ассистент набрал 419,3 тыс. Вторую строку списка занимает семейство ассистентов «Сбер Салют», которое включает различных персонажей: это «Сбер», «Афина» и «Джой» с разным характером. Сообща они показали результат в 153,6 тыс.
Китайские производители получат импульс на внутреннем рынке Китайские производители разрабатывают все более совершенных голосовых помощников, таких как iFlytek, Baidu и Huawei. И хотя «проникновение» данных решений в КНР невелико, аналитики Juniper Research ожидают, что использование недорогих смарт-колонок повысит внедрение помощников в системы умных домов 100 млн в 2024 году по сравнению с 4 млн в 2019 году.
Однако влияние КНР будет ограничено внутренним рынком, так как конфликт между компанией Huawei и правительством США продолжает оказывать влияние на различные сегменты. Значительная роль голосовых помощников означает, что в случае появления решений на западных рынках они сразу станут предметом пристального внимания и это ограничит их общий потенциал.
Siri и Ассистент отправляют сообщения, Алиса отшучивается. Никому она ничего, конечно, не передала.
Скорее всего, это связано с тем, что и Сири, и Google Ассистент — нативные помощники для своих систем, тогда как Алиса — стороннее приложение. К слову о них: сообщения в сторонних приложениях: Siri в этот раз не подвела — все четко. Ассистент тоже. Алиса опять отшутилась.
И опять неудачно. Теперь — музыка: Обидно, что несмотря на встроенный в iOS Apple Music Сири испытывает большие проблемы с тем, чтобы включать песни западных исполнителей. Грамотно отличать русский от английского помощник Apple пока так и не умеет. Музыку» соответственно.
С английским у русской Siri полная катастрофа. Алиса выдала ссылку на клип в «Яндексе», Google. Ассистент сразу открыл видео на YouTube. Посмотрим, как обстоят дела с российскими исполнителями: Тут Сири выступила на уровне Алисы — поделилась ссылками на ролик из поисковика.
Ассистент снова сразу же открыл на YouTube нужное видео. Переходим к еде: И вот тут Алиса удивила. Если Сири и Google Ассистент просто открыли список ближайших пиццерий, помощник «Яндекса» вызвал карточку «Папа Джонс», где можно полностью сформировать заказ. Кафе: Тут все без сюрпризов — все помощники справились.
А вот еще одна задачка про кафе, но посложнее: Первый раунд, в котором выйграла Сири. Номер на экране — просто и понятно. Ассистент предложил выбор, а Алиса все поняла не правильно. С кафе ассистенты разобрались, а что насчет заправок?
Голосовым помощником по умолчанию является Google Assistant, и это нужно исправить Эти настройки помогут вам запустить Марусю через любой приложение, воспользовавшись комбинацией кнопок или кратковременным нажатием на кнопку питания. Предварительно на вашем смартфоне должна быть включена соответствующая опция в разделе «Функции кнопок». Без этой функции быстрый запуск не сработает Сколько бы разрешений Марусе я ни выдал, она никак не хочет запускаться голосом. Таковы ограничения Google, которые тот же Яндекс обходит при помощи собственного лончера. Сделает ли что-то подобное VK Group — неизвестно.
Но хотелось бы. Ну а я лишь скажу несколько слов о том, как подключить Марусю к телефону: Подключите колонку к источнику питания. Запустите приложение Маруся на своем смартфоне. Откройте настройки и перейдите в раздел «Подключить колонку». Авторизуйтесь в своей учетной записи VK ID регистрируется одним кликом.
Маруся голосовой помощник команды для умных колонок VK Капсула
Речь помощника синтезируется по определенным значениям тембра, тональности и других параметров, то есть он не говорит голосом живого человека. Помощник от Google умеет искать информацию в одноименном поисковике, работать со звонками и сообщениями, управлять устройствами умного дома, находить объекты на картах и прокладывать к ним маршрут, включать мультимедийный контент и открывать сайты, вести диалоги с пользователем в рамках одной темы без необходимости уточнения, о чем именно идет речь. О наиболее полезных командах помощника мы писали здесь. Конечно, работает он с сервисами экосистемы Google. Важное преимущество этого ассистента — умение анализировать поведение пользователя для выдачи более релевантных рекомендаций. Подобного инструмента технология Visual Snapshot нет ни у одного конкурирующего продукта. Из недостатков помощника от Google отметим ориентированность на американский рынок и недостаточную «человечность» русскоязычной локализации. Пользователи жалуются, что виртуальный ассистент иногда «как не живой», а его адаптированность к российским реалиям оставляет желать лучшего. А еще при разговоре с ассистентом нужно предварять каждый вопрос фразой «Окей, Google», тогда как американская версия способна включаться в полноценный диалог без всяких повторов. Справедливости ради заметим, что Google Ассистент постепенно совершенствуется. Так, за 8 месяцев с момента запуска сервиса в РФ помощник научился различать ударение в слове «замок», подружился со страховым сервисом «Согласие» и пополнил базу знаний информацией об услугах Сбербанка.
Алиса Алиса от Яндекса — наиболее достойный конкурент Google Ассистента. Этот помощник изначально говорит на русском языке, его не нужно адаптировать, что само по себе большой плюс. А для машинного обучения нейросети разработчики использовали массив текстов из рунета и классику русской литературы — это помогает делать общение с помощником более «живым». Так, Алиса умеет импровизировать, кокетничать и даже обижаться. Например, при разговоре двух Алис на определенном этапе диалога первая предложила второй «выброситься из окна». Еще помощник умеет отличать детские голоса от взрослых. То есть при разговоре с ребенком Алиса будет общаться соответственно — это еще один плюс к «человечности». У ассистента есть все базовые навыки: он может читать новости, узнает прогноз погоды , перемножит числа, конвертирует валюту и т. Кроме того, Алиса расскажет ребенку сказку, сыграет с ним в игры, сделает подборку фото и даже поможет с подсчетом калорий. Особенно удобно, что Алиса запоминает предыдущий разговор, и если вы решите продолжить его после небольшой паузы — она не начнет переспрашивать, что вы имеете в виду.
Подробнее про основные возможности помощницы читайте здесь.
К сожалению, формат «Бирюлек» — это то, что привлекло мое внимание за прошедшую неделю, и то, что меня волновало, если хотите, это авторское видение рынка и событий на нем. Иногда в «Бирюльках» я рассказываю о том, как устроен рынок и технологии, но делаю это по необходимости, причем сильно укорачивая свой рассказ, ограничивая себя. В рамках «Диванной аналитики» такие материалы также неуместны, так как в них скорее не рассказывается про маркетинг или коммерческую составляющую продукта, а делается акцент на технологиях и том, как они работают. Отсюда и необходимость в такой рубрике. Пока будем считать ее экспериментальной, не могу сказать, будет она появляться время от времени или станет более-менее постоянной, это зависит от вас и тех тем, что интересны вам. Поэтому смело высказывайте свои предложения в комментариях, а заодно предлагайте темы для будущих выпусков «Как это работает? Голосовые помощники для дома — рынок Amazon Alexa и Google Home Первым голосовым помощником можно смело считать Amazon Alexa, это устройство появилось в ноябре 2014 года и стало для рынка своего рода открытием. Прототипы подобных устройств появлялись задолго до дебюта Alexa, но они не доходили до коммерческой реализации и выглядели очень аскетично.
Идея Alexa была простой и понятной, это голосовой помощник, которого можно разбудить, обратившись к нему по имени. Выбор имени Alexa не случаен, в английском языке четко распознается звук X, это уловка, чтобы устройство не ошибалось и реагировало на одно слово, а не на два, как это сделано у Google с его фразой «OK, Google». Помощник после обращения к нему умеет сообщать нужную информацию, например, рассказывать о погоде, пробках, зачитывать новости или даже отправлять письма другим людям, которые вы тут же диктуете. Позднее Alexa научилась управлять элементами умного дома, например, термостатами от Nest, лампочками Hue от Philips и другими. Вы просто говорите, что нужно изменить температуру, и Alexa отправляет эту команду на нужные устройства. Также как в Siri, в Alexa можно вести диалоги и задавать вопросы, многие ответы шутливы, на многие вопросы система ищет ответы в интернете. Появлением Alexa и других подобных систем мы обязаны прогрессу в двух областях — распознавании речи и распространении дешевого интернета, когда каждая квартира постоянно подключена к сети. Прежде чем рассмотреть устройство Alexa и ей подобных, сделаю ремарку в отношении Siri, Bixby, Google Assistant и других голосовых помощников на смартфонах и планшетах. Технология, которая лежит в основе этих сервисов, полностью идентична и никак не отличается, поэтому когда я рассказываю про Alexa или Google Home, можете смело считать, что это относится и к голосовым помощникам на смартфонах.
Рынок США является первым и ключевым для голосовых помощников, причем во всех видах устройств. Одно из самых свежих исследований eMarketer утверждает, что четверть всех владельцев смартфонов хотя бы раз в месяц используют голосового помощника, это около 60 миллионов человек. В том же исследовании говорится, что продажи домашних голосовых помощников в 2016 году удвоились и составили в США 35. Категория «Другие» почти не присутствует на рынке, и ниже мы попытаемся разобраться, почему это так. Как работает домашний голосовой помощник — команда и распознавание голоса Каждый голосовой помощник имеет как минимум микрофон и громкоговоритель: первый нужен, чтобы слышать ваши команды, второй — чтобы отвечать вам. В зависимости от модели могут отличаться число микрофонов, их направленность как правило, это 360 градусов , чувствительность и другие параметры. Но на принципе работы это никак не сказывается. Голосовой помощник подключается к интернету, он не умеет работать без постоянного доступа к сети. Вы настраиваете свой голосовой помощник на фразу, которая его «будит», это команда, заставляющая его «слушать» все, что вы скажете.
Например, сказав Alexa, вы пробудите помощник от Amazon, и он начнет слушать все, что вы говорите. Команды выключения как таковой нет, устройство просто засыпает, когда понимает, что диалог завершился. Пробудить его можно повторной командой Alexa. Много шуток в США было на тему того, что не повезло женщинам, которых зовут так же, как устройство от Amazon, у них оно будет работать постоянно. На самом деле в Alexa, также как и в других голосовых помощниках, вы можете сменить слово-команду на любое другое. Совет от разработчиков прост: чтобы это слово не было коротким и его можно было хорошо распознать даже в шумных условиях. Устройство в локальной памяти хранит все настройки, там же располагаются буфер и система распознавания голоса. Домашний голосовой помощник можно воспринимать как упрощенный вариант смартфона, в котором может быть дисплей, либо его может и не быть. Важно, что система распознавания голоса в большинстве случаев локальная, именно устройство обрабатывает звук и распознает его.
В ряде случаев, когда устройство не может самостоятельно распознать и расшифровать голос, оно отправляет запись в облако, где происходит распознавание, так как серверы имеют большую производительность и большие базы данных для проверки и подбора слов. Как правило, большинство производителей используют комбинированные системы, распознавание голоса происходит локально, на сервер, который должен его обработать, он отправляется в виде условного текста или уже команды. Для ряда запросов, предполагающих местное действие, оно тут же осуществляется. Например, когда пользователь говорит «установить будильник на 8 часов утра», система локально выполняет команду, не обращаясь в облако. То же самое касается и настройки других устройств умного дома, например, изменения температуры в термостате. Многие ошибочно считают, что если голосовой помощник распознает локально команды и голос, то эти данные навсегда остаются в нем, это не так. Все зависит от производителя, марки устройства, но всегда все данные, записанные после слова-команды, передаются на серверы производителя, где они и хранятся. Эти данные могут быть использованы для более точной настройки системы распознавания и в других целях, например, их может запросить полиция в рамках расследования уголовного дела, и компания-производитель их предоставит.
Помимо этого, голосовые помощники могут стать удобным инструментом для пожилых людей, которые могут испытывать трудности с использованием технологий. Так как предоставляют простой способ взаимодействия с устройствами. Когда появился голосовой помощник и кто его придумал Сегодня мы ассоциируем голосовых помощников с такими технологическими гигантами, как Apple, Google, Amazon и Microsoft. Однако история голосовых помощников началась задолго до появления этих компаний. Одним из первых голосовых помощников был Dragon Dictate, разработанный в начале 1980-х годов компанией Dragon Systems. Эта программа позволяла пользователям диктовать текст с помощью голоса, который затем превращался в печатный текст на компьютере. Хотя это не совсем был голосовой помощник в современном понимании, он стал одним из первых примеров технологии распознавания голоса. Следующим этапом в развитии голосовых помощников стал 2011 год, когда компания Apple представила Siri — голосового помощника, изменившего парадигму интерфейсов пользовательских устройств. Siri обеспечивала удобный способ взаимодействия с устройствами Apple через голосовые команды, отвечая на вопросы, выполняя задачи и предоставляя информацию. За Siri последовали другие голосовые помощники, такие как Google Assistant, Amazon Alexa и Microsoft Cortana, каждый из которых предоставлял свои уникальные возможности и функции. Важно отметить, что развитие голосовых помощников стало возможным благодаря внедрению искусственного интеллекта и машинного обучения. Эти технологии позволили голосовым помощникам обучаться и адаптироваться к запросам пользователей, делая их все более умными и способными. Что умеют голосовые помощники: 5 возможностей 1. Поисковые запросы Голосовые помощники позволяют пользователям выполнять поисковые запросы в интернете, не используя руки для ввода команд на клавиатуре или сенсорном экране. Они могут отвечать на широкий спектр вопросов, предоставлять сведения о погоде, новостях, географических объектах, исторических событиях и многом другом. Организация задач и напоминаний Голосовые помощники помогают в организации задач и напоминаний.
Это позволило ускорить обработку заявок жителей, а также грамотно распределить ресурсы операторов. Всего обработано около 4,2 миллиона звонков жителей. В среднем голосовой помощник принимает около 400 тысяч таких обращений в месяц. Он принимает показания водосчетчиков, напоминает о необходимости проведения поверки и подсказывает даты сезонного отключения воды. Горожанам достаточно произнести код плательщика, указанный в едином платежном документе, и показания счетчиков воды, после чего виртуальный ассистент сам передаст данные в расчетную систему центра госуслуг. Сегодня голосовой помощник задействован в работе 10 городских горячих линий. Он помогает составлять заявки на вызов мастера, записываться к врачу, на медицинские процедуры, лабораторные и инструментальные исследования, подсказывает статус готовности документов. Как работает и развивается голосовой помощник Общаться с горожанами роботу помогают технологии синтеза и распознавания речи. Когда голосовой запрос поступает в систему, он воспринимает его как набор звуковых волн. Чтобы восстановить сказанное, визуальный ассистент запускает процесс распознавания речи: нейросеть анализирует речевой поток, определяет, какие именно звуки были произнесены, и делит звуковую волну на фрагменты. Затем система сопоставляет их с имеющимися в ее базе знаний шаблонами, подбирает нераспознанные слова по контексту и определяет последовательность слов, после чего собирает их в предложение. Человеческий язык довольно сложен для понимания искусственным интеллектом, поэтому для развития возможностей робота общегородской контакт-центр использует глубокое обучение с помощью комбинации методов и алгоритмов, применение которой позволяет добиться более точного распознавания речи. Благодаря технологиям виртуальный ассистент способен самостоятельно совершенствовать свои навыки. В роли учителя выступает человек, он закладывает конкретные примеры и шаблоны в базу знаний робота, которые в дальнейшем использует в своей работе голосовой помощник.
Голосовой помощник общегородского контакт-центра принял почти 75 миллионов звонков
С их помощью более 6500 людей с гипертензией и 1500 больных диабетом находятся под постоянным наблюдением. Отмечается, что Минздрав планирует увеличить количество пациентов под мониторингом до 25 000 к 2024 году.
Google Assistant тоже предложил запустить Metallica, только вот нативный музыкальный сервис не был активирован. Вечная загадка — что приготовить на ужин, когда совсем лень и холодильник практически пустой.
С помощниками, по идее, такой проблемы быть не должно. Но все они просто выдали ссылки на ресурсы о готовке еды. Ответы принимаются, но хотелось бы конкретики: мол, вот вам самый простой вариант со списком нужных продуктов.
Для проверки мы выбрали улицу с заковыристым названием: 2-я Шестая линия. Лучше всех справилась Алиса — с первого раза и без дополнительных уточнений. Второе место заслужил Google Assistant: сначала он выдал что-то непонятное, но потом исправился и верно указал путь.
Siri же призналась, что ничего не нашла, однако это не единственная ее проблема: на простейший запрос «проложи маршрут к Комаровке» помощница решила, что нам нужна… деревня с таким названием в Украине. Запрос «открой Onliner» оказался слишком простым: справились все, но Алиса не только нашла сайт, а еще и автоматически открыла его в браузере. Siri просто выдала результаты поисковых запросов в интернете, а Google Assistant нашел на смартфоне приложение «Каталог» и запустил его — неплохо, но чуточку не то, что мы просили.
Удобный сценарий использования голосовых помощников — запрос курса валют. Не нужно лезть в калькулятор или конвертер, вам сразу посчитают нужную сумму. Но это если ассистент сразу поймет, что вы хотите.
Но раз системы все знают о пользователе и умеют включать геолокацию, то вполне могут сообразить, что за деньги нас интересуют. Алиса уточнила, про какую валюту речь, и, получив прямой ответ, сразу посчитала.
В Tele2 рассказали: «Астру» программировали как остроумную и дерзкую помощницу, которая хорошо разбирается в новых трендах и технологиях. Она способна грамотно отвечать на звонки, всегда на стороне абонента, может легко поставить на место спамеров и мошенников. Она ответит на входящие вызовы, если абонент находится вне зоны действия сети, не поднимает трубку или сбрасывает звонок. Ассистент поможет узнать контакты курьера или детали записи в салон красоты.
Теоретически они могут дать вам нужную информацию, избавив от необходимости читать более длинные тексты. Бендер не против использования языковых моделей для обмена простыми вопросами и ответами — она сама пользуется Google Assistant на кухне, чтобы конвертировать единицы измерения в рецептах. Но Шах и Бендер также приводят более тревожный пример — в прошлом году Google на запрос «Какой самый уродливый язык Индии? Никаких простых ответов Здесь возникает дилемма. Получать прямые ответы удобно, но часто они могут быть неверными, неуместными или оскорбительными. В 2020 году Штайн и его коллеги, Мартин Поттаст из Лейпцигского университета и Маттиас Хаген из Университета Мартина Лютера в Галле-Виттенберге, опубликовали статью, посвященную проблемам прямых ответов на поисковые запросы. Штайн и его коллеги рассматривают поисковые технологии как переход от организации и фильтрации информации с помощью таких методов, как предоставление списка документов, соответствующих поисковому запросу, к составлению рекомендаций в форме единственного ответа на вопрос.
Но состоится этот переход, по их словам, не скоро. И дело даже не в технических трудностях. Но мы забываем об этом, когда видим прямые ответы поисковой системы», — рассуждает Штайн. Шах также считает, что представление пользователям некого «единого» ответа на вопрос — это проблема, поскольку источники информации и любые разногласия между ними в таком ответе скрыты. На эти проблемы Шах и Бендер предлагают ряд решений. Они считают, поисковые технологии должны учитывать различные способы поиска информации, многие из которых не предполагают прямых ответов. Люди часто используют поиск для изучения тем, по которым у них, возможно, даже нет конкретных вопросов, говорит Шах.
В этом случае полезнее было бы просто предложить список документов.
Голосовой помощник
В статье мы рассмотрим историю развития голосовых ассистентов — от первых синтезаторов речи 1779 года до умных колонок в наших домах. Сколько стоит создание ассистента и что для этого нужно уметь. Пока разработку собственных голосовых помощников могут позволить себе крупные компании. В большинстве случаев использование голосовых ассистентов сводится к нулю: то они плохо понимают запрос, то не могут его выполнить. Рейтинг построен по количеству упоминаний голосовых помощников в русскоязычном сегменте соцмедиа. Поскольку развитие голосовых ассистентов своими силами связано с продолжительными инвестициями, за исключением гигантов никто позволить себе такого не может.
Голосовые помощники
Голосовому помощнику нужно учитывать множество акцентов, в которых фонемы звучат по-разному. Рассказываем, каких голосовых ассистентов чаще всего используют россияне, в каких случаях просят их помочь и почему некоторые обходят стороной эту технологию. Перспективы монетизации голосовых помощников Согласно прогнозам Juniper Research, к 2023 году в мире будут использовать 8 миллиардов голосовых помощников — на одного человека будет приходиться дватри ассистента.
Что умеет голосовой помощник Алиса
Поэтому важно выдержать баланс, чтобы голосовой ассистент никого не обидел, не расстроил и тем более не причинил вред. Бывает, что разработчики стараются придавать своим продуктам некоторые индивидуальные черты. В то же время важно помнить про эффект зловещей долины , и производители это учитывают — большинство ассистентов не пытаются притворяться человеком и обычно стремятся к тому, чтобы не реагировать излишне человечно на определенные вопросы. Леонид Саночкин, технический лидер в МТС AI Сколько стоит создание ассистента и что для этого нужно уметь Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Например, разработка Олега обошлась «Тинькофф» примерно в 50 миллионов рублей и оправдала себя уже в первый месяц, когда позволила сэкономить столько же. Чтобы разработать своего помощника, стоит определиться с тем, какие проблемы будет решать ИИ и какой результат получат пользователи. Сейчас технологии позволяют разработать как голосового помощника, так и чат-бота.
Они оба распознают человеческую речь, но первый может сам выстроить логическую цепочку, а второй отправит автоматизированный ответ. Если бюджет не позволяет разработать личного Олега, то лучше будет обратиться к экосистеме Сбера или Алисы, которые помогут разработать свой навык на их платформе. Навыки для Алисы можно создать с помощью платформы Яндекс. Диалоги , а Сбер работает в SmartApp Studio. Тех, кто не умеет программировать, выручит визуальный конструктор от Яндекса или сторонний Dialogflower. На базе Aimylogic можно создать навыки почти для всех известных ассистентов.
По данным Just Al, создание чат-бота займет от недели до 3,5 месяцев и в среднем будет стоить от 250 до 300 тысяч рублей. При том можно заняться разработкой самостоятельно, и тогда придется оплатить лишь лицензию за использование конструктора , которая стоит от 5900 до 59 000 рублей в зависимости от количества пользователей. Работа строится по следующей схеме. Первым этапом определяются требования и создается ТЗ. На проектировании проводятся анализ и разметка пользовательских данных и создание макетов интерфейса. При разработке нужно будет реализовать бизнес-логику и интеграции.
А после этого протестировать навык и запустить его. Какой голосовой ассистент лучше Алиса от Яндекса Интерфейс Алисы на смартфоне. Помощник помогает пользователю в решении разных задач: Ищет информацию. Алиса может найти информацию по различным темам: погода, новости, курсы валют. Отвечает на вопросы. Развлекает пользователя.
Включает музыку, фильмы, подкасты. Напоминает о событиях. Так ассистент уведомляет о важных мероприятиях: дни рождения, встречи. Переводит тексты на другие языки. С помощью Алисы можно переводить тексты на более чем 100 языков. Взаимодействует с детьми.
Читает сказки, объясняет уроки. Управляет другими устройствами — умными лампами, кондиционерами, роботами-пылесосами.
Выделяет речь, анализирует отдельные слова и связь между ними. Сравнивает полученную информацию с шаблонами. Система ищет варианты, как слово произносится. Если слово для неё новое, она так же сравнивает его с шаблонами. Когда голосовой помощник не может найти ответ, не понимает команду, то просит пользователя задать вопрос по-другому. Выдаёт ответ, ориентируясь на библиотеку шаблонов и поведение пользователя в сети, его прошлые запросы в поисковых системах, геолокацию. Программа может вступить в диалог, если ей не хватает данных.
Например, уточнить, куда пользователь хочет поехать, если тот вызывает такси. Несовершенная технология Хотя схема выглядит стройной и понятной, она по-прежнему изобилует багами. Только за прошлый год голосовые помощники спровоцировали несколько довольно громких инфоповодов. Например, Алиса по ошибке выдавала личный номер тверского пенсионера за номер администрации города Конаково. В итоге на бывшего мэра, давно ушедшего на пенсию, обрушилась лавина звонков горожан, желающих заказать пропуск. Та же Алиса вгоняла пользователей в ступор открытой критикой президента и фразами о том, что «он попал в Кремль случайно». Это лишь некоторые из ошибок, просочившихся в сеть. Куда больше милых багов, с которыми мы сталкиваемся при ежедневном взаимодействии с голосовыми помощниками. Но они по-прежнему пользуются спросом.
За что мы их любим Люди говорят почти в четыре раза быстрее, чем печатают. Голосовой помощник помогает быстрее ввести данные и получить ответ. Конечно, при условии, что программа чётко распознала речь и нашла шаблон в базе данных. Голосовым приложением чаще пользуются, когда заняты руки. По этой причине из голосового приложения на смартфоне помощники быстро перекочевали в музыкальные колонки и умный дом. Можно заниматься домашними делами и параллельно заказывать еду из ресторана, не отвлекаясь на нажатие кнопок. Самый популярный ответ на вопрос, почему вы используете виртуальных ассистентов — «Это быстро» исследование Stonetemple Голосовые чатботы заменяют десятки сотрудников. Бизнесу выгоднее вложиться в разработку голосового помощника, ведь бот может общаться с сотнями клиентов одновременно, не уставать и не бегать покурить каждые полчаса. Помощника можно персонализировать.
Изменить голосовые команды, дать имя ассистенту вместо «заводского» и даже выбрать голос, чтобы о погоде и курсах валюты вам рассказывал Трамп или Баста. Просто интересно. Каждый хотя бы раз так делал: задавал Алисе странный вопрос, а потом издевался над её ответом.
Так, например, Мегафон использует виртуального ассистента «Елена» , чтобы снизить нагрузку на свои колл-центры. Например, ассистент может помочь узнать актуальный баланс, количество мегабайт, минут и SMS на вашем номере, получить выписку по расходам, узнать о подключенных услугах, отключить ненужные, подобрать новый тариф, а также оплатить счета. Ежедневно «Елена» обрабатывает около 75 тысяч обращений клиентов, приблизительно 45 тысяч из которых обслуживает самостоятельно, не обращаясь к помощи операторов контактного центра.
Также похожим функционалом обладает недавно запущенный голосовой помощник «Олег» от «Тинькофф», который может переводить деньги на счета, бронировать столик в ресторане, записывать в салоны красоты, покупать билеты в кино, менять данные пользователя в экосистеме банка, заказывать и отправлять на почту электронные документы, а также общаться на свободные темы, консультировать по банковским продуктам и давать советы, опираясь на информацию из «Тинькофф-журнала». Несмотря на существование барьеров использования голосовых помощников, в ближайшей перспективе видится возможность появления отдельного сегмента цифровой торговли - V-commerce или Voice Commerce. Мы прогнозируем, что люди будут все больше пользоваться голосовыми ассистентами для транзакционных действий: заказа еды и продуктов, оплаты билетов, покупки определенных категорий товаров. В середине июня Mail. Пока что она выполняет стандартные запросы, помогая искать нужную информацию в интернете, включать музыку, уточнять прогноз погоды, стоимость авиа и железнодорожных билетов, а также, например, какие фильмы идут в кино. Разработчики рассчитывают, что в будущем помощник будет интегрирован в другие продукты Mail.
Подобное уже было представлено Google в собственном помощнике Now в 2012 году, но, к сожалению, он не имел такой проработки в плане понимания контекста и уступал по количеству и качеству голосовых возможностей. Amazon Alexa Следующими на очереди идут Amazon. Компания решила влиться в набирающий обороты технологический тренд и опубликовала в 2014 году фирменный голосовой ассистент, разработка которого велась аж с 2010 года. Изначально, как в случае с Siri, Alexa являлась отдельным приложением для смартфонов на iOS и Android. Понимая, что на одном приложении далеко не уедешь, компанией также было представлено отдельное устройство — первая в мире умная колонка с голосовым ассистентом Amazon Echo. Её уникальность состояла в том, что кроме обычных пользовательских запросов, Amazon Echo могла послужить эдаким мозгом для всей техники умного дома. То есть по голосовому запросу владелец мог контролировать температуру на термостате, управлять освещением и делать прочие подобные вещи у себя дома. Позже конкурентами в лице Google и Apple были представлены свои умные колонки Google Home и HomePod с аналогичным функционалом. Говорить подробно о них я не вижу смысла, так как различия между ними заключаются лишь в более глубокой интеграции под каждую из собственных экосистем.
Общей проблемой этой троицы для пользователей, родившихся и проживающих в СНГ, является отсутствие поддержки русского языка и несовместимость с местными сервисами навигации, вызова такси, заказа еды. Станция Но совсем недавно, 29 мая, наша отечественная компания Яндекс, провела конференцию Yet another Conference 2018, на которой представила свою первую железку — умную колонку Яндекс. Станция с интегрированным в неё голосовым помощником Алиса. Станция от Яндекса была полностью спроектирована в стенах Московского офиса компании. Кроме возможности работы в качество умного помощника, колонка имеет видеовыход HDMI и может работать с внешними проекторами, мониторами и само собой с телевизорами. Поиск фильмов осуществляется при помощи интеграции библиотеки онлайн сервисов: ivi, Кинопоиск, Амедиатека и Яндекс. Видео Музыкальные возможности колонки явно не хуже конкурентов, максимальная мощность звука составляет целых 50 Вт. В довесок имеется возможность звучания в стереорежиме. Внутреннее убранство гаджета можно увидеть на официальной схеме: В качестве основного источника аудио-контента выступает фирменный сервис Яндекс.
Музыка, насчитывающий в себе коллекцию из 35 млн композиций. Также приятным бонусом является наличие открытого протокола Bluetooth, позволяющего выводить на колонку звук с любого вашего устройства при отсутствии возможности подключения колонки к сети интернет. Работает она только через Wi-Fi. К функционалу Алисы добавили раздел Диалоги. Что это такое? Это отдельная платформа для голосовых чат-ботов, пополнить которую может любой желающий при условии прохождения модерации своего проекта командой Яндекс. Уже сейчас в библиотеке есть несколько забавных Диалогов, которые помогут вам приятно провести время. Из таких я выделил: «Игра Математика» — замечательнейшая возможность занять ребенка на некоторое время, в течение которого он будет обучаться простой арифметике в игровой форме; «Верю — не верю» — проверка на то, отличите ли вы реальный факт от выдумки, лично я давеча пока тестировал этот навык, узнал много интересных вещей, незнакомых мне ранее. И интерактивную игру «Фантастический квест», в которой с помощью своих решений вы можете решить судьбу космического путешественника — тем, кто когда-то играл в Lifeline, наверняка должно понравится.
Продажи колонки совсем начнутся скоро, уже этим летом вы сможете приобрести себе такой гаджет за скромные 9 990 руб. Всем покупателям будет предоставлен год доступа к Яндекс.