1. Главная
  2. Как развивались сервисы голосовых помощников и какие технологии в них используются

Как развивались сервисы голосовых помощников и какие технологии в них используются

24 февраля 20244 минуты чтения
Иллюстрация материала

Голосовые ассистенты стали неотъемлемой частью повседневного опыта многих людей. Они поселились в компьютерах, смартфонах, часах, колонках. Как так получилось и с чего все начиналось — рассказываем в статье.

Что такое голосовой помощник

Специальные программы умеют понимать человеческий голос и выполнять его команды. В основе их работы лежат технологии распознавания и синтеза речи, а также алгоритмы искусственного интеллекта. Последние необходимы для непрерывного обучения и развития ассистентов.

Первые синтезаторы и генераторы человеческой речи появились еще в XVIII-XIX веках. С годами устройства дорабатывались, а в 1962 году компания IBM представила миру технологию Shoebox. Эта система могла распознавать цифры от 0 до 9 и 16 слов.

Сегодня такие достижения звучат наивно, но в прошлом веке появление технологии стало прорывом.

Как работают голосовые помощники

Один из основных параметров успешной интеграции голосовых ассистентов — их совместимость с различными платформами: Windows, Android, iOS, XboxOS, FireOS и другими.

Помимо универсальности, важна и корректная работа сервисов. Обеспечить ее помогают следующие технологии.

Автоматическое распознавание речи (ASR). Процесс, позволяющий услышать и понять запрос пользователя. Для этого необходим микрофон и интернет-соединение, по которому аудиосигнал передается на серверы для последующего анализа и конвертации в текст.

Понимание естественного языка (NLU). Когда голос преобразован в текст, искусственному интеллекту необходимо понять его смысл и определить ключевые детали запроса.

Выполнение задачи через интерфейсы программирования приложений (API). Сюда входит умение найти информацию в Сети, передать команду сопряженным устройствам экосистемы, набрать номер из списка контактов и другие действия.

Взаимодействие с пользователем. К нему относятся ответы через динамик устройства, текстом или с помощью световых индикаторов.

Самообучение и обновление. Чтобы взаимодействие с голосовым помощником было продуктивным, он должен постоянно совершенствоваться. Это происходит на основе сбора и анализа запросов, тестирования и доработки программного продукта разработчиками.

Первые голосовые помощники

Первым в привычном понимании голосовым помощником стала Siri от Apple, которая появилась в iPhone 4S в 2011 году. Уже через год Google представил своего ассистента для Android-устройств. Функциональные возможности программ оказались схожи — они умели совершать вызовы, набирать сообщения, оставлять заметки в календаре, сообщать погоду, запускать приложения и управлять воспроизведением музыки. Отличались только команды, которые должен был произнести человек для вызова ассистента: «Hey Siri» или «OK Google».

Впоследствии версии своих голосовых помощников появились и у других крупных производителей электроники: например, у Microsoft — это Cortana, а у Samsung — Bixby.

Отдельно стоит отметить Alexa от Amazon. Если первые ассистенты использовались преимущественно в смартфонах и компьютерах, то местом обитания этого помощника стал смарт-динамик, который компания-производитель представила в 2014 году — умная колонка Amazon Echo.

Сегодня голосовые помощники интегрируются в системы умного дома. Например, с их помощью можно управлять освещением и электроприборами.

Перечисленные сервисы — Siri, Google Assistant и Alexa остаются самыми популярными голосовыми помощниками в мире.

Российские голосовые помощники

В 2017 году «Яндекс» выпустил своего голосового ассистента — Алису. Сегодня она считается одной из самых умных и продвинутых в сегменте. Алиса умеет не только точно отвечать на запрос человека, но и вступать с ним в диалог как виртуальный собеседник. Благодаря самообучению она постоянно совершенствуется.

Еще одна лидирующая отечественная разработка — Маруся от VK. Основные умения ассистентов похожи, но у Маруси есть особенность — она отличный помощник для пользователей социальной сети «ВКонтакте». Там с помощью ассистента можно найти пользователя или сообщество, включить песню или подкаст, набрать и отправить сообщение, позвонить контакту и проверить электронную почту.

Для получения доступа ко всем возможностям Алисы и Маруси потребуются соответствующие подписки. Для первой — Яндекс Плюс или Плюс Мульти, для второй — VK Combo или VK Музыка + Wink. Подписка дает возможность слушать музыку, аудиокниги, управлять просмотром фильмов в онлайн-кинотеатрах, а также получать дополнительные скидки на доставку еды, такси и другие бонусы.

Помимо Алисы и Маруси есть еще Салют от «Сбера», Олег от «Тинькофф Банка», Ева от «Мегафона» и другие. Набор их навыков пока уступает лидерам рынка, но помогает клиентам компаний получать более качественное обслуживание. Ева отвечает за звонки, безопасность в сети и защиту от спама, Олег поможет перевести деньги и выполнит роль секретаря, пока владелец смартфона занят. Салют работает только на устройствах Сбера, его изюминка — опция выбора голоса и тона собеседника — деловой, умеренный или дружеский.

Текст:

Интересует подключение продуктов Ростелекома?

Оставьте заявку и наш специалист проконсультирует вас.

Город, улица, дом, квартира
Введён несуществующий номер телефона