Агентство Juniper Research опубликовало смелый прогноз индустрии голосовых помощников и умных ассистентов. Алиса, первый российский голосовой помощник, предназначенный для массового использования, появилась в 2017 году. Несмотря на то, что голосовые помощники уже в то время были привычным делом, Алисе удалось произвести впечатление на русскоговорящую публику.
Голосовой помощник общегородского контакт-центра принял почти 75 миллионов звонков
Но помощник реагирует и на голос после выдачи приложению разрешения на доступ к микрофону. Откликается ассистент на слово «Маруся», что вполне предсказуемо. После первого запуска Маруся предлагает познакомиться с основными навыками Голосовой помощник Маруся доступен и в других приложениях VK Group, но в той же Почте Mail. Ru вызов ассистента голосом невозможен, несмотря на выдачу всех запрашиваемых разрешений. Поэтому включить Марусю можно будет только нажатием на кнопку.
Она отображается в левом верхнем углу почтового приложения. Здесь вы можете включить или выключить активацию голосом напоминаю, что данная опция работает только внутри приложения , выбрать источник новостей среди предлагаемых вариантов, а также настроить темную тему. К сожалению, у Маруси не так много настроек, которые можно изменить Среди дополнительных возможностей стоит выделить «Утренний эфир». Когда пользователь произносит фразу «Доброе утро», Маруся начинает рассказывать владельцу смартфона о погоде и новостях.
В одноименной вкладке настроек можно изменить содержимое эфира, но все это не особо важные параметры.
В ноябре 2020 года в Just AI провели телефонный роботизированный опрос с использованием собственного движка NLU, а также технологий распознавания речи от Яндекс. Cloud и Тинькофф. Растет общее число пользователей голосовых ассистентов. В ходе опроса мы уточняли, знают ли пользователи о новых голосовых ассистентах. В 2020 году голосовых помощников стали использовать чаще.
Меняется расстановка сил среди устройств с голосовыми помощниками. В то же время ассистентов стали больше использовать на других устройствах. За год кейсы использования голосовых ассистентов стали разнообразнее. Умные телевизоры. Большинство новых телевизоров с функцией Smart TV, в том числе эконом-класса, оснащены функцией голосового помощника. Яндекс расширяет присутствие в сегменте дорогих ТВ-приставок с Алисой и начал сотрудничество с производителями ТВ.
Если на счет конфиденциальности данных есть опасения, то специалисты рекомендуют отключать доступ к микрофону у приложений с голосовыми ассистентами. Как пользоваться голосовым помощником решают сами пользователи. Виртуальные голосовые ассистенты в бизнесе Кроме решения повседневных задач пользователей виртуальные голосовые помощники помогают бизнесу, например, они могут отвечать на звонки вместо оператора или заниматься продажей товаров и услуг.
Это тип общих голосовых помощников. В бизнесе голосовых помощников в основном создают для коммуникации с клиентами во время телефонных звонков. Реже голосовые помощники используют для того, чтобы сопровождать клиентов при выполнении задач с помощью сервиса компании, например, при совершении операции в банке.
Также голосовые помощники используют на предприятиях. Виртуальные ассистенты помогают управлять производственными процессами, с их помощью можно, например, запустить станок. Чаще виртуальных голосовых помощников внедряют в бизнес компании из банковской отрасли, также это направление популярно в телекоме, ритейле, e-commerce, финтехе, сервисных услугах.
Как использовать тренд на голосовые помощники в локальном SEO Ранее мы рассказывали об одном из трендов последних лет в интернет-маркетинге — голосовом поиске. Для бизнеса это полезный инструмент, с помощью которого можно привлечь клиентов локально. Так как зачастую перед тем, как отправиться куда-то пользователи задают вопросы голосовым помощникам: «где пообедать», «куда поехать, чтобы отметить день рождения», «цветы около меня».
Помимо актуальной информации о телефоне, адресе и ссылках на сайт и соцсети, рекомендуем оптимизировать посты в геосервисах под голосовые запросы. Например, указывать в конце поста фразы «Около метро Бауманская», «Расскажем о том, где вкусно и недорого позавтракать», «Ремонт автомобилей в районе Полежаевской» и так далее; Оптимизируйте объявления под голосовой поиск; Отслеживайте отзывы, а также раздел «Вопросы» в Google. Отвечайте пользователям, используя ключевые слова: например, «В нашем меню вы можете найти завтраки от 1000 рублей».
Используйте эти рекомендации для стратегию локального продвижения. Резюме У голосовых помощников огромный потенциал.
Ориентированы Джой, Сбер и Арина конечно, на использование с сервисами, которые входят в экосистему Сбера, от банковских операций и финансового консультирования до заказа еды и общения на разнообразные темы. В SmartMarket есть цела куча приложений для Салюта, при помощи которых можно обеспечить доступ к разным сервисам из экосистемы Сбера при помощи голоса. Поддерживается и управление устройствами умного дома, теми, которые поддерживаются Сбером. Список их, положа руку на сердце, не слишком обширен. На этом перечень полноценных голосовых помощников российского происхождения исчерпывается. Но к нему следует добавить еще два имени. Пока — в качестве аванса, поскольку за этими разработками имеется очень серьезная основа — развивающиеся экосистемы сервисов. Олег О запуске Олега в «Тинькофф» объявили в 2019 году.
Голосовой помощник вернее, как его называют в банке, «ассистент» позиционируется как сервис в области финансов и лайфстайла. Доступен Олег в приложении «Тинькофф» и предназначен для того, чтобы выполнять повседневные команды: управлять финансовыми продуктами «Тинькофф» и переводить деньги, бронировать места в ресторанах, салонах красоты, покупать билеты, искать скидки, давать советы, основываясь на публикациях «Тинькофф Журнала». Просто поговорить с Олежей тоже можно. Актер записал около 30 часов реплик, на основе которых нейросеть генерирует различные ответы. Через год помощник серьезно обновился. Во-первых, пользователям позволили его переименовать, по своему усмотрению первоначально Олег был довольно серьезным мужчиной, не терпящим панибратства. А кроме того, Олег стал доступен абонентам «Тинькофф Мобайл», которые могут сделать на его основе своего личного секретаря. Он может автоматически отвечать на звонки все или по выбору, причем не просто записать сообщение, а еще и ответить на него, и даже пообщаться с абонентом , записывать голосовые сообщения и превращать их в текст. Обещано, что Олег будет помогать с инвестициями, нарастит свою «бытовую» функциональность. Иными словами, Олегу обещано большое будущее.
Вопрос только в том, когда и как обещания будут превращаться в реальность. Дело в том, что Марвин не стал массовым явлением, несмотря на то, что появился он еще в 2020 году. Все это время в МТС занимались активным строительством своей экосистемы она была представлена весной этого года , и до развития Марвина, судя по всему, просто не доходили руки. А вчера и вовсе стало известно , что проект закрыт. До недавнего времени Марвин был доступен абонентам МТС через приложение оператора, по данным на сайте он поддерживал стандартные функции. Вместе с запуском Марвина в компании даже выпустили умную колонку на «мозгах» голосового помощника и на старте предлагали её всего за 1 рубль почтать про колонку можно в блоге коллег на Хабр. Сейчас умных колонок от МТС в продаже нет, и непонятно, появятся ли они снова. С тех пор МТС не представляла каких-либо разработок в этой сфере. Были новости, что компания ищет менеджера продукта. А в начале этого года появились официальные оптимистичные новости: МТС перезапустит проект колонки с голосовым ассистентом.
Упоминаем мы Марвина по той простой причине, что он весьма перспективный: в компании строят экосистему, в которую отлично вписывается голосовой помощник. По данным "Ведомостей", компания провела альфа-тесты и показала топ-менеджерам прототип, который успешно включал лампу, робот-пылесос и выполнял другие команды.
Алиса, Джой, Олег, Ева… Кто они? ТОП-9 самых популярных голосовых помощников
Теперь — с нейросетью YandexGPT. Она позволила улучшить мои сценарии работы, а это значит, что я умею ещё больше, чем раньше. Я доступна в умных устройствах, сервисах и приложениях Яндекса, а ещё в новом Чате. Придумываю идеи, пишу и редактирую тексты. Сегодня мы делаем первые шаги к тому, чтобы у голосового помощника появился визуальный образ. Голосовые помощники становятся все привычнее для россиян. По данным разработчика голосовых сервисов Just AI, в 2020 году аудитория голосовых ассистентов в России составила 52 млн пользователей. Агентство Juniper Research опубликовало смелый прогноз индустрии голосовых помощников и умных ассистентов.
К 2023 году число голосовых помощников в мире достигнет восемь млрд
Голосовой помощник — искусственный интеллект с развитыми навыками распознавания речи, который обрабатывает огромные объемы информации, благодаря чему постоянно учится. Десятилетняя эволюция умных устройств, которые от стандартных голосовых помощников, выполняющих простые бытовые задачи, доросли до технологий, способных запоминать предпочтения пользователя и находить ответы на самые неожиданные вопросы, — яркий. В постоянно меняющемся мире технологий неизменно лишь одно: желание технокомпаний запустить свой голосовой помощник.
Русскоговорящие голосовые помощники: кто умнее?
Госуслуги — через голосового помощника. Москва, 28 августа 2023 года — Госуслуги с Роботом Максом теперь доступны на умных устройствах с Алисой. Голосовой ассистент, который тесно связан с устройствами компании Самсунг и поддерживает 4 языка, на русском не говорит. В большинстве случаев использование голосовых ассистентов сводится к нулю: то они плохо понимают запрос, то не могут его выполнить. По нашим оценкам, от 90 до 95% пользователей голосовых ассистентов используют помощники на телефонах. Рынок голосовых помощников в 2022-м вырос на 33%, до 2,7 млрд руб. В 2023-м он может увеличиться еще на 40–45% за счет перехода на голосовые контакт-центры и роста потребности в персонализации.
Правила комментирования
- Развитие голосовых помощников: история, статистика использования
- Новости — подборка навыков Алисы, голосового помощника от Яндекса.
- Информация
- Рекомендуем приобрести
- А что происходит на рынке голосовых помощников в России сегодня?
- Как устроена работа голосовых помощников
Обзор голосовых помощников: что умеют Алиса, Салют, Маруся, Google Assistant и Siri
Использование голосового ассистента помогает сократить задержки, паузы в диалоге с клиентом, время ожидания при пиковых нагрузках и массовых инцидентах. Госуслуги — через голосового помощника. Москва, 28 августа 2023 года — Госуслуги с Роботом Максом теперь доступны на умных устройствах с Алисой. Обзор функций голосового помощника Алиса от «Яндекс». Голосовой помощник тут же переключился на более мягкий и человеческий голос, имитируя члена семьи.
ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями
Единственное что было добавлено компанией за последнее время это возможность работы с другими приложениями, поддержка новых языков, макросы с iOS 12 и обновленный интерфейс. Причиной такой неспешности, с точки зрения внедрения компанией новых функций, может является уход основной команды разработчиков Siri, в связи с кадровой перестановкой нового руководства, пришедшего после смерти Стива Джобса. Microsoft Cortana Виртуальная голосовая помощница Cortana была впервые продемонстрирована Microsoft на собственной презентации Build 2 апреля 2014 года. Назван ассистент в честь персонажа из игровой серии шутеров Halo. Голосом ассистента стала актер озвучки Джен Тейлор, подарившая голос Кортане в игре. Особенностью ассистента является кроссплатформенность.
По умолчанию Cortana предустановлена на компьютерах и мобильных устройствах с операционной системой Windows 10, а также на игровых консолях Xbox One. Также ассистент предугадывает нужды пользователя при условии, что вы разрешите сервису доступ к своим личным данным — электронной почте, календарю, местоположению и другим. Подобное уже было представлено Google в собственном помощнике Now в 2012 году, но, к сожалению, он не имел такой проработки в плане понимания контекста и уступал по количеству и качеству голосовых возможностей. Amazon Alexa Следующими на очереди идут Amazon. Компания решила влиться в набирающий обороты технологический тренд и опубликовала в 2014 году фирменный голосовой ассистент, разработка которого велась аж с 2010 года.
Изначально, как в случае с Siri, Alexa являлась отдельным приложением для смартфонов на iOS и Android. Понимая, что на одном приложении далеко не уедешь, компанией также было представлено отдельное устройство — первая в мире умная колонка с голосовым ассистентом Amazon Echo. Её уникальность состояла в том, что кроме обычных пользовательских запросов, Amazon Echo могла послужить эдаким мозгом для всей техники умного дома. То есть по голосовому запросу владелец мог контролировать температуру на термостате, управлять освещением и делать прочие подобные вещи у себя дома. Позже конкурентами в лице Google и Apple были представлены свои умные колонки Google Home и HomePod с аналогичным функционалом.
Говорить подробно о них я не вижу смысла, так как различия между ними заключаются лишь в более глубокой интеграции под каждую из собственных экосистем. Общей проблемой этой троицы для пользователей, родившихся и проживающих в СНГ, является отсутствие поддержки русского языка и несовместимость с местными сервисами навигации, вызова такси, заказа еды. Станция Но совсем недавно, 29 мая, наша отечественная компания Яндекс, провела конференцию Yet another Conference 2018, на которой представила свою первую железку — умную колонку Яндекс. Станция с интегрированным в неё голосовым помощником Алиса. Станция от Яндекса была полностью спроектирована в стенах Московского офиса компании.
Кроме возможности работы в качество умного помощника, колонка имеет видеовыход HDMI и может работать с внешними проекторами, мониторами и само собой с телевизорами. Поиск фильмов осуществляется при помощи интеграции библиотеки онлайн сервисов: ivi, Кинопоиск, Амедиатека и Яндекс. Видео Музыкальные возможности колонки явно не хуже конкурентов, максимальная мощность звука составляет целых 50 Вт. В довесок имеется возможность звучания в стереорежиме. Внутреннее убранство гаджета можно увидеть на официальной схеме: В качестве основного источника аудио-контента выступает фирменный сервис Яндекс.
Музыка, насчитывающий в себе коллекцию из 35 млн композиций. Также приятным бонусом является наличие открытого протокола Bluetooth, позволяющего выводить на колонку звук с любого вашего устройства при отсутствии возможности подключения колонки к сети интернет. Работает она только через Wi-Fi.
Пользователи могут создавать списки дел, устанавливать напоминания о важных событиях, деловых встречах. Управление умным домом С помощью голосовых помощников пользователи имеют возможность управлять умным домом, включая регулирование освещения, температуры, мультимедийных систем, безопасности и других функций.
Отправка сообщений и управление контактами Голосовые помощники позволяют пользователям отправлять сообщения и управлять контактами, использовать голосовые команды для отправки текстовых сообщений, электронных писем. Навигация и планирование поездок Голосовые помощники предоставляют навигационные и планировочные услуги, позволяя пользователям составлять маршруты, получать информацию о дорожной обстановке, бронировать транспорт, заказывать такси и многое другое. И это лишь малая часть того, что могут делать современные голосовые помощники. С развитием технологий искусственного интеллекта и машинного обучения, голосовые помощники становятся все более умными и адаптивными, открывая новые возможности. Как работает голосовой помощник Голосовые помощники, такие как Siri, Google Assistant, Amazon Alexa и другие, представляют собой программные приложения, которые позволяют пользователям взаимодействовать с устройствами с помощью голосовых команд.
Они работают при помощи сложных алгоритмов распознавания голоса и искусственного интеллекта, которые позволяют им понимать и обрабатывать различные варианты голосовых команд и запросов пользователей. Процесс работы голосового помощника начинается с захвата звукового сигнала от микрофона устройства. Затем звуковой сигнал преобразуется в цифровой формат с помощью аналого-цифрового преобразователя, чтобы компьютер мог его обработать. С этого момента начинается процесс распознавания голоса. После преобразования аудиосигнала в цифровой формат, алгоритмы голосового помощника начинают анализировать и обрабатывать голосовую команду.
Сначала происходит фоновое шумоподавление, устраняющее нежелательные шумы, которые могут повлиять на точность распознавания. Затем голосовая команда проходит через процесс фонетического анализа, который позволяет определить отдельные звуки и фонемы в произнесенном слове или фразе. Эти звуки затем сравниваются с известными образцами звуков и слов в базе данных голосового помощника. Далее идет этап сравнения и анализа, где голосовой помощник сопоставляет произнесенные слова с моделями речи и словарями.
Среди корпораций, имеющих возможность доминировать на рынке голосовых помощников и разрабатывать собственные системы, отметим такие компании, как Amazon, Apple, Google, Facebook, Microsoft, Samsung. Другие производители будут вторичны, так как не смогут создать собственные системы распознавания голоса и конвертации его в текст, они будут пользоваться теми решениями, что предоставят им перечисленные компании. Скорее всего, можно ожидать, что Google будет бесплатно раздавать такие решения для партнеров, создающих голосовые помощники, во всяком случае, первоначально подход будет такой. Это подход, который мы видим в Android, на первом этапе систему раздают бесплатно и всячески подсаживают на нее производителей, а затем постепенно начинают закручивать гайки, чтобы добиться дополнительных плюсов для себя. Обработка запроса, сценарии и их выполнение После того, как голосовой помощник распознал голос и превратил его в текст, он отдает его в облако либо выполняет простую локальную команду, как это было в примере с будильником. Достоинство голосового помощника напрямую вытекает из того числа операций команд , которые он способен распознать и правильно их обработать.
Именно сценарии использования становятся второй проблемой для широкого и быстрого распространения голосовых помощников по всему миру. В Amazon привлекли сторонних разработчиков, чтобы они создавали свои сценарии использования и команды, к концу февраля 2017 года таких команд стало 10. В Amazon их называют «умениями» skills. Простота создания новых умений подкупает разработчиков, равно как и то, что продукты от Amazon популярны в Америке, поэтому очень быстро голосовые помощники научились заказывать пиццу из любого магазинчика рядом, вызывать Uber и делать множество не таких тривиальных вещей. Чем больше людей пользуется голосовыми помощниками, тем большее число сценариев возникает, а система быстрее учится их правильно обрабатывать. Например, в самом начале пути Alexa почти не знала немецкие рок-группы, хотя сам язык поддерживался. Сегодня поиск по музыкальным группам Германии и жанрам музыки пусть и не идеален, но вполне сносен, вы можете получить необходимые сведения, запросив информацию. Система обучается, и прогресс налицо. Для сторонних разработчиков возникает вопрос, кто будет создавать и поддерживать такую систему. Например, в Китае сейчас наблюдается бум стартапов, что инвестируют десятки миллионов долларов в это направление, они создают компании, которые пытаются в одном продукте предоставить как раз обработку сценариев и их автоматизацию.
Это не только и не столько рынок голосовых помощников, для такой автоматизации найдется более широкое применение, например, это обработка заказов на сайтах, создание чат-ботов для поддержки клиентов любого бизнеса, в России вы уже сталкиваетесь с этим, обращаясь в службу поддержки Билайна, беседу с вами ведет программа. Бум развития сценариев, которые нужны потребителям, напрямую связан с помощниками, они выигрывают от того, что в алгоритмы загоняют стандартные действия. К сожалению, формализовать естественный язык не так-то просто, поэтому любые диалоги с голосовым помощником или программой в сети не являются очень глубокими. Так, любой разговор можно описать в парадигме вопрос-ответ, когда каждая пара образует один уровень, большинство программ обработки диалогов сегодня ведут более-менее осмысленный разговор для 2-3 уровней, затем они начинают пасовать, и тогда появляется продуманная программистами заглушка, например, у Siri это шутки, которые должны скрыть незнание программой того, как действовать дальше. Пользовательские сценарии условно можно разделить на простейшие, те, что не зависят от страны и языка, и сложные. То есть, это предопределенные действия, реализация которых в устройстве или программе не вызывает никаких затруднений. В простых сценариях важно, чтобы система распознавания речи правильно распознала контекст и то, является запрос утверждением или вопросом. Например, одна и та же фраза может восприниматься системой различно: «Будильник на 8 часов стоит или нет? Многие системы первоначально просто ставили будильник на это время, не проверяя, есть он уже или нет. Теперь они «научились» проверять состояние будильника и правильно отвечать на этот вопрос.
Сложные сценарии напрямую привязаны к контексту языка и страны. Например, спрашивая, что сегодня идет в кино, вы не ждете, что голосовой помощник зачитает вам список фильмов в Нью-Йорке, наверное, вы хотите услышать его для своего города и желательно для своего района или любимого кинотеатра. Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области. Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях. В Amazon этой информации нет, поэтому сценарии подразумевают не только алгоритм действий, но им нужна и первоначальная информация. В России дочерняя компания i-Free под названием Just AI с 2011 года создает такую платформу, то есть они пытаются создавать сценарии, применимые для российского рынка. Первым продуктом, в котором на массовом рынке применяются сценарии, созданные компанией, стал робот Pudding в нашем варианте «Емеля» , он умеет разговаривать на русском языке, искать определенный контент и защищать детей от нежелательных слов и запросов. Назвать «Емелю» роботом сложно, это самый настоящий голосовой помощник, ориентированный на детей в возрасте от 5 до 11 лет, при этом он не является игрушкой. Со стороны компании Just AI в этом голосовом помощнике сценарии и распознавание русской речи движок от Nuance. В теории, если ребенок начнет интересоваться самоубийством или подобными темами, такой «робот» может отговорить его и отправить экстренное сообщение родителям — это те самые сценарии, которые нужно разработать и добавить их в устройство.
Другой пример, дети часто хотят, чтобы им рассказали сказку, выбор сказок огромен, и возникает вопрос, на какой остановиться. В таких голосовых помощниках будет выбор приоритетных произведений, известных как детям, так и родителям. То есть, если вы не знаете, что именно хотите услышать, то говорите: «Хочу сказку». А уже сам помощник выбирает, какую именно сказку вы услышите. Насколько умным будет ваш голосовой помощник, напрямую зависит от того, насколько он понимает контекст беседы, знает ваш образ жизни например, где вы работаете и адрес офиса, ваш распорядок дня. Понятно, что в этой гонке преимущество за Google, так как в рамках Ассистента компания знает про вас так много, что может построить разумные сценарии и подсказки, которые будут уместны и важны. Другие компании в этом направлении пока являются отстающими, но пытаются быстро развиваться.
Кроме того, виртуальные ассистенты используются в ИТ-секторе, отделах клиентского обслуживания и информационных запросов. В качестве успешных примеров VEA эксперты приводят сервис Alexa for Business от Amazon, на которых сотрудники могут переложить выполнение таких задач, как планирование встреч и логистические операции, а также платформу MIKA от Nokia, помогающую инженерам находить ответы при выполнении сложных задач или диагностике проблем. В перспективе виртуальные ассистенты повысят производительность труда сотрудников и будут способствовать их конструктивному взаимодействию, убеждены в Gartner. Поделиться с помощью:.
Маруся голосовой помощник команды для умных колонок VK Капсула
По голосовой команде — она способна настраивать ОС, запускать различные приложения и задачи, делать пометки в календаре и т. Пока же вместо нее на компьютере можно использовать Алису , Марусю , ассистента Google , или Горыныча... Примечание: иногда ее "работа" приводит к сбоям в работе ПК...
Как и Алиса, Маруся разговаривает приятным женским голосом и знает разные игры и сказки. Ассистент работает с торговой площадкой AliExpress и музыкальным сервисом Spotify , умеет воспроизводить музыку из ВКонтакте и «дружит» с онлайн-кинотеатром Wink. А еще Маруся вместе с Капсулой активно учатся взаимодействовать с системами умного дома. В голосовом помощнике не предусмотрено создание навыков, но чат-боты для Маруси с 2021 года легко написать, например, с помощью визуального конструктора Aimylogic от Just AI. С не меньшей легкостью к Марусе можно подключить чат- боты , созданные для других голосовых помощников.
Марусю можно установить не только из App Store и Google Play, но и из AppGallery от Huawei , то есть фактически ассистент загружается на любой современный смартфон. Из недостатков помощника отметим не всегда адекватное распознавание задач и, соответственно, чуть менее чуткое реагирование на запросы, чем у Алисы. Дуся Дуся — это, скорее, конструктор для создания персонализированного голосового ассистента для продвинутых пользователей. Дуся не умеет разговаривать на отвлеченные темы, не рассказывает анекдоты и поначалу не очень дружественна по отношению к владельцам смартфонов. Это именно ассистент, выполняющий команды пользователя: у приложения нет визуального интерфейса, есть только иконка для доступа к огромному количеству настроек и библиотеке скриптов. Можно редактировать имеющиеся сценарии их уже порядка 150 или писать скрипты «с нуля» — возможности персонализации Дуси поистине безграничны. Однако готовы ли вы потратить уйму времени на настройку и «допиливание» голосового помощника под свои нужды — вопрос индивидуальный.
Среди основных плюсов Дуси отметим: Различные способы активации: не только по голосовой фразе, но и через виджет или ярлык «Дуся Старт», а также жестами по взмаху, встряхиванию, поднесению гаджета к уху. Безграничные возможности расширения возможностей за счет скриптов. Можно управлять ассистентом не только со смартфона, но и с ПК либо телеграм-бота. Но есть и недостатки: Помощник доступен только для смартфонов на ОС Android. Ориентация на продвинутых пользователей. Не самый дружественный интерфейс и настройки для создания скриптов. Отсутствие «человечности», неумение разговаривать на отвлеченные темы.
Дуся — единственный платный голосовой помощник в нашем обзоре. После недельного пробного периода придется покупать подписку 399 рублей Специализированные голосовые ассистенты Всех описанных выше виртуальных ассистентов можно отнести к разряду универсальных. Есть голосовые помощники и с более узкой специализацией.
С их помощью более 6500 людей с гипертензией и 1500 больных диабетом находятся под постоянным наблюдением. Отмечается, что Минздрав планирует увеличить количество пациентов под мониторингом до 25 000 к 2024 году.
В Amazon привлекли сторонних разработчиков, чтобы они создавали свои сценарии использования и команды, к концу февраля 2017 года таких команд стало 10. В Amazon их называют «умениями» skills. Простота создания новых умений подкупает разработчиков, равно как и то, что продукты от Amazon популярны в Америке, поэтому очень быстро голосовые помощники научились заказывать пиццу из любого магазинчика рядом, вызывать Uber и делать множество не таких тривиальных вещей. Чем больше людей пользуется голосовыми помощниками, тем большее число сценариев возникает, а система быстрее учится их правильно обрабатывать.
Например, в самом начале пути Alexa почти не знала немецкие рок-группы, хотя сам язык поддерживался. Сегодня поиск по музыкальным группам Германии и жанрам музыки пусть и не идеален, но вполне сносен, вы можете получить необходимые сведения, запросив информацию. Система обучается, и прогресс налицо. Для сторонних разработчиков возникает вопрос, кто будет создавать и поддерживать такую систему. Например, в Китае сейчас наблюдается бум стартапов, что инвестируют десятки миллионов долларов в это направление, они создают компании, которые пытаются в одном продукте предоставить как раз обработку сценариев и их автоматизацию. Это не только и не столько рынок голосовых помощников, для такой автоматизации найдется более широкое применение, например, это обработка заказов на сайтах, создание чат-ботов для поддержки клиентов любого бизнеса, в России вы уже сталкиваетесь с этим, обращаясь в службу поддержки Билайна, беседу с вами ведет программа. Бум развития сценариев, которые нужны потребителям, напрямую связан с помощниками, они выигрывают от того, что в алгоритмы загоняют стандартные действия. К сожалению, формализовать естественный язык не так-то просто, поэтому любые диалоги с голосовым помощником или программой в сети не являются очень глубокими. Так, любой разговор можно описать в парадигме вопрос-ответ, когда каждая пара образует один уровень, большинство программ обработки диалогов сегодня ведут более-менее осмысленный разговор для 2-3 уровней, затем они начинают пасовать, и тогда появляется продуманная программистами заглушка, например, у Siri это шутки, которые должны скрыть незнание программой того, как действовать дальше.
Пользовательские сценарии условно можно разделить на простейшие, те, что не зависят от страны и языка, и сложные. То есть, это предопределенные действия, реализация которых в устройстве или программе не вызывает никаких затруднений. В простых сценариях важно, чтобы система распознавания речи правильно распознала контекст и то, является запрос утверждением или вопросом. Например, одна и та же фраза может восприниматься системой различно: «Будильник на 8 часов стоит или нет? Многие системы первоначально просто ставили будильник на это время, не проверяя, есть он уже или нет. Теперь они «научились» проверять состояние будильника и правильно отвечать на этот вопрос. Сложные сценарии напрямую привязаны к контексту языка и страны. Например, спрашивая, что сегодня идет в кино, вы не ждете, что голосовой помощник зачитает вам список фильмов в Нью-Йорке, наверное, вы хотите услышать его для своего города и желательно для своего района или любимого кинотеатра. Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области.
Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях. В Amazon этой информации нет, поэтому сценарии подразумевают не только алгоритм действий, но им нужна и первоначальная информация. В России дочерняя компания i-Free под названием Just AI с 2011 года создает такую платформу, то есть они пытаются создавать сценарии, применимые для российского рынка. Первым продуктом, в котором на массовом рынке применяются сценарии, созданные компанией, стал робот Pudding в нашем варианте «Емеля» , он умеет разговаривать на русском языке, искать определенный контент и защищать детей от нежелательных слов и запросов. Назвать «Емелю» роботом сложно, это самый настоящий голосовой помощник, ориентированный на детей в возрасте от 5 до 11 лет, при этом он не является игрушкой. Со стороны компании Just AI в этом голосовом помощнике сценарии и распознавание русской речи движок от Nuance. В теории, если ребенок начнет интересоваться самоубийством или подобными темами, такой «робот» может отговорить его и отправить экстренное сообщение родителям — это те самые сценарии, которые нужно разработать и добавить их в устройство. Другой пример, дети часто хотят, чтобы им рассказали сказку, выбор сказок огромен, и возникает вопрос, на какой остановиться. В таких голосовых помощниках будет выбор приоритетных произведений, известных как детям, так и родителям.
То есть, если вы не знаете, что именно хотите услышать, то говорите: «Хочу сказку». А уже сам помощник выбирает, какую именно сказку вы услышите. Насколько умным будет ваш голосовой помощник, напрямую зависит от того, насколько он понимает контекст беседы, знает ваш образ жизни например, где вы работаете и адрес офиса, ваш распорядок дня. Понятно, что в этой гонке преимущество за Google, так как в рамках Ассистента компания знает про вас так много, что может построить разумные сценарии и подсказки, которые будут уместны и важны. Другие компании в этом направлении пока являются отстающими, но пытаются быстро развиваться. Умение обработать запрос, правильно выделить его контекст и найти релевантный ответ для голосовых помощников становится важнейшим свойством. Те компании, что научились выпускать голосовых помощников в Китае а таких уже десятки , не могут быстро и легко локализовать продукт для России или других стран, им нужны сценарии, которых у них нет. Им нужно понимание локального контекста, а оно не может появиться из ниоткуда. И на этом пути выигрывают компании, которые уже начинают собирать такие данные всеми возможными способами.
Мне это чем-то напоминает золотую лихорадку в картографии, когда в первые годы развития карт на мобильных устройствах все бились за максимальное и точное наполнение по POI, так как карта без расшифровки названий компаний и магазинов, времени их работы и тому подобного — это почти бесполезный рисунок. Обратите внимание, что есть еще один важный момент для домашних голосовых помощников, это наличие контента, например, музыки. Одно дело, когда у вас уже есть подписка на какой-то музыкальный сервис и вы слушаете и ищете музыку в нем.