Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников.
Голосовыми помощниками пользуются более половины россиян
ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями | Голосовыми помощниками пользовались 63% россиян за последние полгода, говорится в исследовании Group4media. |
Как настроить Марусю на телефоне. Здесь всё, что нужно знать | Алиса, первый российский голосовой помощник, предназначенный для массового использования, появилась в 2017 году. |
Голосовой помощник: что это, для чего нужен, как работает, что умеют | Лучший голосовой ассистент: сравниваем 6 помощников. |
Голосовых помощников станет больше, чем людей
Голосовой помощник тут же переключился на более мягкий и человеческий голос, имитируя члена семьи. Этот ассистент набрал 419,3 тыс. упоминаний за указанный период, став самым обсуждаемым голосовым помощником в российском сегменте интернета. Чат с Алисой, работающей на нейросети YandexGPT — широкие возможности искусственного интеллекта. В новом Чате с виртуальным ассистентом Алисой можно придумывать креативные идеи для работы и учебы, писать и редактировать тексты, создавать новые кулинарные. Число используемых цифровых голосовых помощников к 2023 году утроится и составит 8 млрд по всему миру, говорится в исследовании Juniper Research.
Обновлён рейтинг голосовых помощников
Этот ассистент набрал 419,3 тыс. упоминаний за указанный период, став самым обсуждаемым голосовым помощником в российском сегменте интернета. В большинстве случаев использование голосовых ассистентов сводится к нулю: то они плохо понимают запрос, то не могут его выполнить. Обзор функций голосового помощника Алиса от «Яндекс». Eventopia» — навык для голосового помощника Алисы, позволяющий школьникам быстро и легко находить увлекательные мероприятия и экскурсии для их возраста. Лучшие голосовые помощники: 4 ассистента с поддержкой русского языка.
Комаровка в Украине и советы по ужину: что умеют голосовые помощники Siri, Алиса и Google Assistant
В России есть два десятка сильных игроков, которые разделили между собой рынок голосовых роботов. Это исследование мы посвятили тем из них, кто показывает рост. Как и большинство технологических рынков, российский VoiceTech кратно — более чем в два раза — вырос в ковидный 2020 год, после этого рост замедлился. В 2020 году без учета компаний, аффилированных с государством, рынок заработал более 1,3 млрд руб. В 2021 году — более 2 млрд руб.
Дмитрий Головин, заместитель руководителя департамента информационных технологий города Москвы: «В базе знаний робота-помощника содержится более 400 тематик, по которым он может оказать помощь, например, записать на прием к врачу или сдать показания счетчиков. Он подскажет график работы органов исполнительной власти и статус готовности документов, а также подаст заявку в Единый диспетчерский центр. Роботу-помощнику достаточно двух минут, чтобы выслушать вопрос, получить дополнительную информацию и предоставить ответ звонившему». В мэрии отметили, что голосовой помощник находит нужную информацию в два раза быстрее человека.
Есть и более забавные возможности. А еще вы можете посоветоваться с ассистентом, какую программу выбрать. А еще Гугл Ассистент, пожалуй, лучше всех переводит фразы на другие языки из списка поддерживаемых. Siri Голосовой помощник Apple Siri встроен во все умные продукты от Apple. Умеет работать с некоторыми устройствами умного дома, задавать поиск в интернете, строить маршрут и искать потерянные беспроводные наушники. На русском языке возможности ограниченны. Развлечений с помощью Siri не то чтобы очень много, поэтому отдаем этому помощнику четвертое место нашего рейтинга. Популярность у него скорее слегка навязанная: в России много поклонников гаджетов от Apple, и все они обеспечены этим голосовым помощником по умолчанию. Посмотреть все товары умного дома, совместимые с Siri: Выбрать Салют от Сбер Сбер активно развивает полноценную экосистему, и с голосовыми помощниками решил не мелочиться — в систему Салют встроены сразу три. Афина, Джой и Сбер — три помощника на единой платформе знаний, но каждый — со своими индивидуальными чертами и вариантами реакций. Сбер — за деловой подход, Джой игрива и общительна, а Афина держит нейтралитет. Голосовые помощники составят расписание, переведут деньги, закажут еду, возьмут на себя управление умным домом — в общем, они умеют все, что положено уметь хорошему помощнику. Из эксклюзивных развлечений доступен Okko — сервис онлайн-кинотеатров и развлечений, все остальное, в принципе, развивается аналогично сервисам Яндекса и VK. Умная колонка Сбер, она же ТВ-приставка , отличается оригинальным дизайном, а также наличием чувствительных «ушей» — у нее есть сразу три микрофона, так что услышит вас даже из соседней комнаты. Из оригинальных гаджетов стоит отметить и умный дисплей Sber SberPortal. Сбер очень серьезно вложился в звук — в этой модели использованы японские технологии для получения эффекта звука со всех сторон. У дисплея есть все функции персонального ассистента, по нему можно смотреть фильмы и даже делать видеозвонки с широкоугольной камерой. Лайфхак от покупателей «Эльдорадо»: дисплей удобно использовать как умный телевизор в машине. Алекса от «Амазон» Мегапопулярный в англоязычном мире, в России этот голосовой помощник используется в основном в устройствах умного дома. Сейчас «Амазон» активно развивает тему голосовых покупок, а также медицинской диагностики с помощью голосовых помощников. В этом году в Алексу добавили более 80 000 вопросов и ответов на медицинскую тематику. Большое внимание уделяется и детскому развитию.
Он помогает составлять заявки на вызов мастера, записываться к врачу, на медицинские процедуры, лабораторные и инструментальные исследования, подсказывает статус готовности документов. Как работает и развивается голосовой помощник Общаться с горожанами роботу помогают технологии синтеза и распознавания речи. Когда голосовой запрос поступает в систему, он воспринимает его как набор звуковых волн. Чтобы восстановить сказанное, визуальный ассистент запускает процесс распознавания речи: нейросеть анализирует речевой поток, определяет, какие именно звуки были произнесены, и делит звуковую волну на фрагменты. Затем система сопоставляет их с имеющимися в ее базе знаний шаблонами, подбирает нераспознанные слова по контексту и определяет последовательность слов, после чего собирает их в предложение. Человеческий язык довольно сложен для понимания искусственным интеллектом, поэтому для развития возможностей робота общегородской контакт-центр использует глубокое обучение с помощью комбинации методов и алгоритмов, применение которой позволяет добиться более точного распознавания речи. Благодаря технологиям виртуальный ассистент способен самостоятельно совершенствовать свои навыки. В роли учителя выступает человек, он закладывает конкретные примеры и шаблоны в базу знаний робота, которые в дальнейшем использует в своей работе голосовой помощник. База знаний — это своеобразная энциклопедия для виртуального ассистента, в которой содержатся ответы на самые распространенные вопросы жителей. Сегодня в ней собрана информация по более чем 230 темам: вопросам жилищно-коммунального хозяйства, транспорта, оказания госуслуг, а также о контактах и режиме работы городских учреждений. Так как жители часто используют разговорный сленг, в базу знаний добавлен большой словарь разговорных слов, который постоянно обновляется. Например, робот понимает значение слов платежка, жировка, квиток, талончик и других. Робот на линии единой справочной службы Самой востребованной городской линией у москвичей является единая справочная служба Правительства Москвы. На нее приходится наибольшее число звонков, поступающих в общегородской контакт-центр.
Еще материалы
- Банковские помощники
- Ожидается трехкратный рост использования цифровых голосовых помощников - Новости
- Сколько стоит работа голосового помощника в России - Hi-Tech
- В Петербурге назвали самых популярных голосовых помощников
- Публикации
- Голос будущего: как появились голосовые ассистенты
Call-центры вымрут как динозавры: что ждет рынок голосовых помощников
Голосовой помощник – это программное обеспечение, которое позволяет пользователям взаимодействовать с устройствами с помощью голосовых команд. Это один из первых российских голосовых помощников — его запустили в 2018 году. Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников. Невидимый, но полезный ассистент: что умеют делать Алиса, Маруся и другие российские голосовые помощники. Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней. С появления первых голосовых помощников прошло 25 лет, а технология всё ещё далека от совершенства.
Банки визуализируют голосовых помощников
Фото: ВТБ В рамках форума инновационных финансовых технологий Finopolis-2023 банк ВТБ представил визуализированный образ будущего цифрового банковского помощника. В качестве 3D-аватара был выбран женский образ с именем Тамара. Одним из цифровых инструментов, который позволит совершить качественный рывок в развитии рынка финансовых технологий, могут стать виртуальные инфлюенсеры — 3D-визуализация цифровых ассистентов, вступающих в диалог и имитирующих человеческое общение. Сегодня мы делаем первые шаги к тому, чтобы у голосового помощника появился визуальный образ. Тамара — это синергия навыка финансового помощника, прорыва в области визуализации, а также возможностей голосового общения в режиме реального времени.
Сообщается, что госуслуги стали доступны на умных устройствах с Алисой, а также в Браузере, Навигаторе или приложении Яндекса. Робот Макс уже может рассказать, как воспользоваться нужным сервисом, прислать ссылку в мобильном приложении Единого портала госуслуг, проинформировать о штрафах и даже самостоятельно подать некоторые заявления. Число доступных в голосовом помощнике сервисов будет расширяться.
В качестве примера он привёл Белгородскую область, где перешли с 67 номеров поликлиник на единый, который обслуживает 400 линий. Кроме того, внедрены персональные медицинские помощники — устройства для непрерывного контроля состояния пациентов.
В ближайшие четыре года их количество фактически удвоится, по прогнозу агентства Juniper Research к концу 2020 года оно составит 4,2 миллиарда устройств. Главной проблемой индустрии голосовых помощников остается их монетизация. Среди устройств со встроенными голосовыми помощниками аналитики особенно выделяют автомобили и телевизоры, именно эти направления будут расти быстрее других. Тем не менее, многое зависит от того, насколько голосовые помощники будут полезны и востребованы потребителями. Для их интеграции не требуется менять оборудование, но это не означает, что ассистента на основе искусственного интеллекта можно подсадить в любое устройство, подключенное к интернету.
Artox Media Digital Group о развитии голосовых помощников
Разработчики программы акцентируют внимание юзеров на том, что «Дуся» — это не чат-бот, который будет заигрывать с пользователем и рассказывать ему анекдоты а-ля Siri. К числу недостатков программы «Дуся» можно отнести то, что она является платной. Пользователю даётся неделя на знакомство с интеллектуальной помощницей — по истечении этого срока придётся приобрести подписку. Голосовой помощник давно не обновлялся разработчиками, поэтому не поддерживается некоторыми устройствами. Особенности приложения: Можно самому добавлять скрипты, чтобы «Дуся» понимала даже специфичные задачи.
Активация жестами: встряхиванием, поднесением к уху и пр. Более 150 встроенных функций: прокладывание маршрутов, поиск мест и не только. Импорт и экспорт скриптов.
По прогнозам экспертов, к 2020 году больше половины всех запросов в интернете будут выполняться с помощью технологий распознавания речи. Подписывайтесь на наш Телеграм Из недавних релизов хочу отметить умную колонку Яндекс. Станция с фирменным голосовым помощником Алиса. Благодаря наличию HDMI-разъема колонка может выступать в роли телеприставки, и абсолютно всё взаимодействие с графической оболочкой, поиском в интернете и видео-контентом выполняется с помощью голоса. Это уже, пожалуй, можно назвать маленьким шагом к далекому будущему. Но давайте по порядку, и узнаем, с чего все началось. Работая в России, он создал аппарат, который мог воспроизводить всего несколько гласных звуков а, э, и, о, у. На фоне нынешних технологий — это всего ничего, но для того времени и с учетом того, что это не программный, а механический синтезатор речи, можно со всей уверенностью считать это революцией и первым шагом в развитии существующих фонетических систем. К сожалению, фотографии и схемы устройства не дошли до наших дней. Аппарат Voder был представлен в 1937 году. Интонация речи вводились ассистентом с клавиатуры, напоминающей таковую у музыкальных инструментов, на презентации в видео, слышно, что аппарат умеет «выговаривать» лишь одно имя, но с разными интонациями. Советский физик Лев Мясников как раз был занят таким исследованием с 1939 года в рамках диссертации «Техническая фонетика». В 1942 году, несмотря на войну и ужасы блокадного Ленинграда, ученый защитил свой проект, продемонстрировав фокус-группе аппарат, умеющий распознавать несколько гласных и согласных звуков. Размеры аппарата были внушительными даже для того времени. Его высота составляла порядка 180 сантиметров. Работа с распознавателем чисел происходила с помощью телефона: абонент произносил число в трубку, система распознавала звук, как электрический сигнал и сопоставляла его с загруженными ранее в систему голосовыми референсами фраз. Система могла распознавать кроме 16 заложенных слов и 6 цифр еще и 10 математических команд. Семейства, представляемых в тот период времени «речевиков», мало чем отличались друг от друга, и соответственно прогресс шел семимильными шагами, без особого развития, породив потерю надежды и доверия к разрабатываемой технологии. Стагнация После публикации в 1969 году открытого письма американского инженера Джона Пирса, в котором он обосновал свое сомнение относительно исследованиям в области фонетических технологий, лидирующая тогда команда Bell, потеряла интерес со стороны инвесторов и на несколько лет осталась без финансовой поддержки. Говорящая кукла Джулия Julie the talking doll появилась на прилавках американских магазинов в 1987 году. Её уникальность состояла в том, что ребенок мог научить куклу распознавать его речь. За семь лет до выпуска игрушки, в научном обществе произошел переворот, который по важности безусловно превосходит вышеупомянутую Джулию. В 1980 году инженеры впервые научились применять методы «Скрытой Модели Маркова», разработанной отечественным ученым в области математики Андреем Марковым. Скрытая Модель Маркова, Марковские цепи Немного отойдя от темы, постараюсь объяснить что это за такая математическая модель. По сути это описание вероятностей перехода объекта из одного состояние в другое. То есть будущая вариация объекта не зависит от прошлого, а зависит от настоящего — от того, в каком состоянии объект находится в данный момент времени. Выходит, это матричная система генерации случайных событий в рамках заданного аргумента. Для примера рассмотрим такую модель графа с возможными физическими состояния человека: По картинке мы можем определить, что человек может находиться в четырех состояниях, причем не в каждое может перейти сразу. Например, если человек лежит, то он не может просто взять и пойти, для этого ему нужно пройти цепочку последовательности — сесть, встать и только потом уже пойти.
Siri же призналась, что ничего не нашла, однако это не единственная ее проблема: на простейший запрос «проложи маршрут к Комаровке» помощница решила, что нам нужна… деревня с таким названием в Украине. Запрос «открой Onliner» оказался слишком простым: справились все, но Алиса не только нашла сайт, а еще и автоматически открыла его в браузере. Siri просто выдала результаты поисковых запросов в интернете, а Google Assistant нашел на смартфоне приложение «Каталог» и запустил его — неплохо, но чуточку не то, что мы просили. Удобный сценарий использования голосовых помощников — запрос курса валют. Не нужно лезть в калькулятор или конвертер, вам сразу посчитают нужную сумму. Но это если ассистент сразу поймет, что вы хотите. Но раз системы все знают о пользователе и умеют включать геолокацию, то вполне могут сообразить, что за деньги нас интересуют. Алиса уточнила, про какую валюту речь, и, получив прямой ответ, сразу посчитала. Siri и Google Assistant отправили на финансовые сайты. В целом помощники были полезнее, чем казалось до начала теста. Но все равно: когда руки свободны, удобнее выполнить действие самому. Возможно, дело привычки. Ну а если писать неудобно — там уже приходится полагаться на ассистентов. Решение от Google самое «серьезное»: минимум характера и попыток ответить «как человек». Алиса и Siri в этом плане приятнее, они пытаются создать ощущение человеческого разговора — что самой манерой ответа, что интонациями. А если глобально, то это по-прежнему игрушки, только уже очень смышленые.
Хотя и функция общения у него тоже есть, так же как и привычные по другим ассистентам возможности делать покупки или искать рестораны поблизости. Это, пожалуй, самый необычный голосовой помощник: не только из-за пола, но и потому, что имеет достаточно узкую специализацию. Будет интересно посмотреть, получит ли он отдельное приложение, которое позволит Олегу зажить без привязки к «Тинькоффу». Салют Совместимость: iOS, Android, умные устройства Одна голова хорошо — а три лучше, решили в «Сбере» и сделали сразу трех виртуальных ассистентов. Одной командой «Салют» можно вызвать Джой и Афину с женскими голосами и Сбера с мужским. У каждого из них свой характер и стиль ответов — по сути, нам предлагают помощников для разных аудиторий огромной корпорации. Ассистенты работают в банковских мобильных приложениях и девайсах компании, таких как ТВ-приставка SberBox , колонка SberBox Time и устройства для умного дома. Способностей у этой троицы много , и они все-таки полноценно ассистентские, нежели просто финансовые, как у Олега. Трио может помочь с разными вопросами, заказом еды интегрирован «Самокат» , управится с умным домом, включит музыку или кино в данном случае в сберовском сервисе Okko. По широте возможностей, на наш взгляд, три голоса чуть уступают Алисе или Марусе, но Салют — самый молодой из представленных в нашей подборке сервисов, и можно не сомневаться, что развиваться он будет быстро. Bixby Совместимость: Android, умный дом А теперь займемся иностранными языками и расскажем о помощниках, которые пока что не поддерживают русский. В их числе и ассистент от Samsung — Bixby, который встроен во все флагманские устройства Galaxy. Так же, как и Дуся, этот помощник может выполнять команды по определенному скрипту, тут они называются routines. Samsung поддерживает свой проект и даже собирается встроить ассистента в умную колонку Galaxy Home, но та пока еще не вышла. А вот подтверждения планов по включению русского языка пока найти не удалось. Возможно, это изменится в случае успеха техники на нашем рынке. Alexa Совместимость: Android, iOS, FireOS Американский технологический гигант Amazon практически не представлен в России, но у себя на континенте он стабильно входит в топ-3 самых используемых и узнаваемых. Работает Alexa на умных колонках — как собственных Echo, так и сторонних, — а кроме того, на операционной системе FireOS, и вдобавок еще существует в виде Android-приложения. Ассистент не заточен под какой-то один сервис и одинаково хорошо взаимодействует, например, и с Apple Music, и с Google Play Music.
Русскоговорящие голосовые помощники: кто умнее?
Руководство Google намерено извлечь выгоду из приобретения Nest, встроив голосовой помощник Assistant в новую линейку устройств, таких как Google Nest Hub Max. Аналитики Juniper Research считают, что вложения Google в ИИ позволят внедрять усовершенствованные умные и автономные функции, тем самым создавая новый дифференцирующий фактор в сегменте. А вовлечение значительных инвестиций в партнерские отношения даст дополнительный толчек развитию собственной экосистемы. Китайские производители получат импульс на внутреннем рынке Китайские производители разрабатывают все более совершенных голосовых помощников, таких как iFlytek, Baidu и Huawei.
По словам Прасада, «ИИ не избавит от боли от потери, но поможет сохранить воспоминания». При этом для работы технологии понадобится около минуты речи настоящего человека — подойдут даже аудиосообщения. В данный момент технология находится в разработке.
С поиском музыки вышло неоднозначно: на запрос «открой последний альбом Metallica» Алиса сразу включила первый трек с нужной пластинки, а Siri почему-то запустила вторую песню. Справедливости ради отметим, что мы не просили проигрывать альбом с начала, но логично было бы сделать именно так. Google Assistant тоже предложил запустить Metallica, только вот нативный музыкальный сервис не был активирован. Вечная загадка — что приготовить на ужин, когда совсем лень и холодильник практически пустой. С помощниками, по идее, такой проблемы быть не должно. Но все они просто выдали ссылки на ресурсы о готовке еды. Ответы принимаются, но хотелось бы конкретики: мол, вот вам самый простой вариант со списком нужных продуктов. Для проверки мы выбрали улицу с заковыристым названием: 2-я Шестая линия. Лучше всех справилась Алиса — с первого раза и без дополнительных уточнений. Второе место заслужил Google Assistant: сначала он выдал что-то непонятное, но потом исправился и верно указал путь. Siri же призналась, что ничего не нашла, однако это не единственная ее проблема: на простейший запрос «проложи маршрут к Комаровке» помощница решила, что нам нужна… деревня с таким названием в Украине. Запрос «открой Onliner» оказался слишком простым: справились все, но Алиса не только нашла сайт, а еще и автоматически открыла его в браузере. Siri просто выдала результаты поисковых запросов в интернете, а Google Assistant нашел на смартфоне приложение «Каталог» и запустил его — неплохо, но чуточку не то, что мы просили. Удобный сценарий использования голосовых помощников — запрос курса валют. Не нужно лезть в калькулятор или конвертер, вам сразу посчитают нужную сумму. Но это если ассистент сразу поймет, что вы хотите.
Голосовой помощник использует искусственный интеллект для обработки голосовых команд и выполнения нужных действий. Они могут выполнять множество функций, такие как поиск информации в интернете, управление умным домом, напоминания, планирование расписания, отправка сообщений и многое другое. Голосовые помощники распознают голосовые команды пользователя и интерпретируют их для выполнения соответствующих задач. Они также могут изучать предпочтения пользователя и адаптировать свои рекомендации, чтобы делать их более персонализированными. Использование голосовых помощников не только делает взаимодействие с устройствами удобней, но и помогает людям с ограниченными возможностями или мобильностью. Кроме того, голосовые помощники бывают крайне полезны в автомобиле, когда водителям нужно оставаться сосредоточенными на дороге и не отрывать рук от руля. Для чего нужен голосовой помощник Голосовые помощники позволяют пользователям осуществлять множество задач без необходимости использования клавиатуры или сенсорного экрана. Отправка сообщений, управление умным домом, составление списка дел, поиск информации в интернете и другие задачи могут быть выполнены просто голосом, что особенно удобно в ситуациях, когда руки заняты или нужно оставаться сосредоточенным на другой задаче. Голосовые помощники также могут повысить производительность, освобождая пользователей от необходимости тратить время на выполнение повседневных задач. Они могут упростить процессы планирования, организации и выполнения задач. Помимо этого, голосовые помощники могут стать удобным инструментом для пожилых людей, которые могут испытывать трудности с использованием технологий. Так как предоставляют простой способ взаимодействия с устройствами. Когда появился голосовой помощник и кто его придумал Сегодня мы ассоциируем голосовых помощников с такими технологическими гигантами, как Apple, Google, Amazon и Microsoft. Однако история голосовых помощников началась задолго до появления этих компаний. Одним из первых голосовых помощников был Dragon Dictate, разработанный в начале 1980-х годов компанией Dragon Systems. Эта программа позволяла пользователям диктовать текст с помощью голоса, который затем превращался в печатный текст на компьютере.
Голосовой помощник общегородского контакт-центра принял почти 75 миллионов звонков
Главной проблемой индустрии голосовых помощников остается их монетизация. Среди устройств со встроенными голосовыми помощниками аналитики особенно выделяют автомобили и телевизоры, именно эти направления будут расти быстрее других. Тем не менее, многое зависит от того, насколько голосовые помощники будут полезны и востребованы потребителями. Для их интеграции не требуется менять оборудование, но это не означает, что ассистента на основе искусственного интеллекта можно подсадить в любое устройство, подключенное к интернету. В частности, в обозримом будущем меньше половины пользователей телевизоров со встроенными голосовыми помощниками будут их использовать.
НЕТ»; Межрегиональный профессиональный союз работников здравоохранения «Альянс врачей»; Юридическое лицо, зарегистрированное в Латвийской Республике, SIA «Medusa Project» регистрационный номер 40103797863, дата регистрации 10. Минина и Д. Кушкуль г. Оренбург; «Крымско-татарский добровольческий батальон имени Номана Челебиджихана»; Украинское военизированное националистическое объединение «Азов» другие используемые наименования: батальон «Азов», полк «Азов» ; Партия исламского возрождения Таджикистана Республика Таджикистан ; Межрегиональное леворадикальное анархистское движение «Народная самооборона»; Террористическое сообщество «Дуббайский джамаат»; Террористическое сообщество — «московская ячейка» МТО «ИГ»; Боевое крыло группы вирда последователей мюидов, мурдов религиозного течения Батал-Хаджи Белхороева Батал-Хаджи, баталхаджинцев, белхороевцев, тариката шейха овлия устаза Батал-Хаджи Белхороева ; Международное движение «Маньяки Культ Убийц» другие используемые наименования «Маньяки Культ Убийств», «Молодёжь Которая Улыбается», М. Казань, ул.
Вы просто говорите, что нужно изменить температуру, и Alexa отправляет эту команду на нужные устройства. Также как в Siri, в Alexa можно вести диалоги и задавать вопросы, многие ответы шутливы, на многие вопросы система ищет ответы в интернете. Появлением Alexa и других подобных систем мы обязаны прогрессу в двух областях — распознавании речи и распространении дешевого интернета, когда каждая квартира постоянно подключена к сети. Прежде чем рассмотреть устройство Alexa и ей подобных, сделаю ремарку в отношении Siri, Bixby, Google Assistant и других голосовых помощников на смартфонах и планшетах. Технология, которая лежит в основе этих сервисов, полностью идентична и никак не отличается, поэтому когда я рассказываю про Alexa или Google Home, можете смело считать, что это относится и к голосовым помощникам на смартфонах. Рынок США является первым и ключевым для голосовых помощников, причем во всех видах устройств. Одно из самых свежих исследований eMarketer утверждает, что четверть всех владельцев смартфонов хотя бы раз в месяц используют голосового помощника, это около 60 миллионов человек. В том же исследовании говорится, что продажи домашних голосовых помощников в 2016 году удвоились и составили в США 35. Категория «Другие» почти не присутствует на рынке, и ниже мы попытаемся разобраться, почему это так. Как работает домашний голосовой помощник — команда и распознавание голоса Каждый голосовой помощник имеет как минимум микрофон и громкоговоритель: первый нужен, чтобы слышать ваши команды, второй — чтобы отвечать вам. В зависимости от модели могут отличаться число микрофонов, их направленность как правило, это 360 градусов , чувствительность и другие параметры. Но на принципе работы это никак не сказывается. Голосовой помощник подключается к интернету, он не умеет работать без постоянного доступа к сети. Вы настраиваете свой голосовой помощник на фразу, которая его «будит», это команда, заставляющая его «слушать» все, что вы скажете. Например, сказав Alexa, вы пробудите помощник от Amazon, и он начнет слушать все, что вы говорите. Команды выключения как таковой нет, устройство просто засыпает, когда понимает, что диалог завершился. Пробудить его можно повторной командой Alexa. Много шуток в США было на тему того, что не повезло женщинам, которых зовут так же, как устройство от Amazon, у них оно будет работать постоянно. На самом деле в Alexa, также как и в других голосовых помощниках, вы можете сменить слово-команду на любое другое. Совет от разработчиков прост: чтобы это слово не было коротким и его можно было хорошо распознать даже в шумных условиях. Устройство в локальной памяти хранит все настройки, там же располагаются буфер и система распознавания голоса. Домашний голосовой помощник можно воспринимать как упрощенный вариант смартфона, в котором может быть дисплей, либо его может и не быть. Важно, что система распознавания голоса в большинстве случаев локальная, именно устройство обрабатывает звук и распознает его. В ряде случаев, когда устройство не может самостоятельно распознать и расшифровать голос, оно отправляет запись в облако, где происходит распознавание, так как серверы имеют большую производительность и большие базы данных для проверки и подбора слов. Как правило, большинство производителей используют комбинированные системы, распознавание голоса происходит локально, на сервер, который должен его обработать, он отправляется в виде условного текста или уже команды. Для ряда запросов, предполагающих местное действие, оно тут же осуществляется. Например, когда пользователь говорит «установить будильник на 8 часов утра», система локально выполняет команду, не обращаясь в облако. То же самое касается и настройки других устройств умного дома, например, изменения температуры в термостате. Многие ошибочно считают, что если голосовой помощник распознает локально команды и голос, то эти данные навсегда остаются в нем, это не так. Все зависит от производителя, марки устройства, но всегда все данные, записанные после слова-команды, передаются на серверы производителя, где они и хранятся. Эти данные могут быть использованы для более точной настройки системы распознавания и в других целях, например, их может запросить полиция в рамках расследования уголовного дела, и компания-производитель их предоставит. Следующий важный момент — это языки, на которых умеют говорить голосовые помощники. Например, для Amazon это английский и немецкий. В случае Amazon сервис Alexa — это удобный способ что-то купить на сайте Amazon, поэтому ареал распространения ограничен теми странами, где сервис имеет наибольшую аудиторию. Для того же Google Home в планах, напротив, быть везде где только возможно. Мы увидим экспансию Google Home на всех мировых рынках, он начнет появляться на всех языках. Хотя пока он представлен ровно в том же количестве стран, что его прямой конкурент. Здесь Google выступает в роли догоняющего и поэтому не спешит быть везде, так как другие конкуренты маловероятны, ниже мы обсудим, почему это так. Итак, вы сказали слово-команду, и ваше устройство «проснулось», записывает ваш голос, чтобы его распознать. Первый и самый важный элемент — это распознавание голоса и его преобразование в текст. Как правило, текущие голосовые помощники настраиваются на один основной язык. Например, если устройство поддерживает как английский, так и русский, одновременно разговаривать с ним на двух языках не выйдет, оно будет путаться и просить повторить фразы. В будущих устройствах этот момент будет с легкостью разрешен, так как голосовые помощники научатся сами определять язык, на котором вы говорите.
Поэтому для распознавания речи голосовой помощник делит слова на звуковые фрагменты — фонемы. Носители языка узнают именно их: например, первые гласные в словах «дом» и «домашний» мы воспринимаем одинаково, хотя звуки разные. В Алисе различают всего 48 фонем — в соответствии с подходом Ленинградской фонологической школы. Для того, чтобы распознавать фонемы, помощник работает с их числовым представлением. Так, когда вы произносите запрос, смартфон записывает его и отправляет на сервер компании, которая разрабатывала голосового помощника. Там запись разделяется на множество маленьких фреймов — фрагментов речи длиной в сотые доли секунды. Затем каждый фрейм подвергают математическим преобразованиям и в результате получают коэффициенты, описывающие его частотные характеристики. А на основании этих данных ассистент может предположить, к какой фонеме принадлежит фрейм. Как и человек, голосовой помощник не всегда хорошо распознаёт звуки, и ему приходится достраивать слова исходя из контекста и статистики. У него есть таблица вероятностей переходов, которая указывает, что после «к» с одной вероятностью будет «о», с другой — «т» и так далее. Это позволяет определить варианты последовательности фонем и потом варианты слов, которые вы могли сказать. Голосовому помощнику нужно учитывать множество акцентов, в которых фонемы звучат по-разному. Например, в Москве чаще будет произноситься гласная «а», а в Архангельске — «о». Причем, если для Siri и Alexa можно выбрать британский или американский английский, а вот вологодского или краснодарского русского нет.
Банки визуализируют голосовых помощников
Согласно данным ВЦИОМ, голосовыми сообщениями пользуются 64% россиян. Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы. С появления первых голосовых помощников прошло 25 лет, а технология всё ещё далека от совершенства. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home.
Что такое голосовой помощник?
- Русскоговорящие голосовые помощники: кто умнее?
- Голосовой помощник общегородского контакт-центра принял почти 75 миллионов звонков
- Список TOP-30 популярных голосовых помощников в мире
- Новости дня
- «Алиса» научилась рассказывать москвичам об оценках детей в школе: Россия:
- Углубляясь в историю
Яндекс Образование
В то же время современные ученые утверждают, что языковые модели ИИ, на которых основаны голосовые помощники, не столько понимают нас, сколько имитируют это понимание. Страницы в категории «Виртуальные ассистенты». Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home.
Свежие статьи
- Обновлён рейтинг голосовых помощников
- Как голосовые помощники распознают речь
- Рынок умных колонок и голосовых ассистентов в России и мире
- Голосовой помощник Alexa заговорит голосом усопших
- Больше половины россиян пользовались голосовыми помощниками за последние полгода
- Голосовой помощник: что это, для чего нужен, как работает, что умеют