Воспроизведение речи и управление голосом на Rapsberry Pi 3

Описание Воспроизведение речи и управление голосом на Rapsberry Pi 3

Воспроизведение речи и управление голосом на Rapsberry Pi 3 79
Тэги

Большинство проектов, в которых используется Raspberry Pi 3, предполагают вывод какой-то информации по запросу или сразу после обработки данных. В качестве источника вывода может выступать не только небольшой дисплей, подключенный к плате, или монитор, но и динамики. Но чтобы выводить информацию по аудиоканалу, вначале нужно установить специальное ПО.

Самый простой способ вывода информации

Есть очень простой способ вывода текстовой информации в форме голоса на операционных системах Linux. Для этого нужно установить небольшую утилиту. Она имеется в репозитории каждого дистрибутива.

Чтобы загрузить речевой синтезатор русской речи Raspberry Pi (да, эта программа поддерживает и русский язык) на систему, основанную на Debian (например, Raspbian), потребуется в консоли из-под суперпользователя выполнить следующую команду:

apt-get install alsa-utils festival festvox-ru speech-tools

После недлительной процедуры загрузки, распаковки и интеграции утилита сразу же будет готова к использованию.

Речевые синтезаторы для Raspberry Pi

Чтобы ее протестировать, достаточно ввести в консоли команду: echo «Пример сообщения» / festival –tts –language Russian.

Затем можно использовать bash-скрипты с соответствующими командами в своих проектах.

Но у этой программы есть один недостаток – задержка между отправкой команды на выполнение и непосредственно воспроизведением составляет 3-5 секунд.

Другие синтезаторы речи

Довольно функциональным речевым синтезатором является ESpeak TTS. В Raspbian его можно загрузить из стандартного репозитория. Качество речи, которое он выдает, не является высоким, но зато его возможно сконфигурировать под себя. В частности, пользователь может определить:

  • скорость воспроизведения;
  • продолжительность пауз между словами;
  • тональность голоса;
  • необходимость выделения слов, которые начинаются с прописных букв.

речевые синтезаторы для Raspberry Pi

Если доступ в интернет с Raspberry Pi – не проблема, можно использовать синтезатор от Google. Для этого нужно скачать g_speak.sh – специальный скрипт. Его легко найти на GitHub. Особенность этого синтезатора – высокое качество речи.

Еще один синтезатор, отличающийся высоким качеством речи – Pico TTS. Он используется в том числе на Android. Чтобы его загрузить из репозитория, следует указывать название libttspico-utils.

Голосовое управление на Linux

На Raspberry Pi управление голосом возможно – для этого есть несколько утилит. Самым известным является ассистент под названием Sirius. Он имеет часть функционала, которая свойственна Google Assistant или Siri. Но все-таки эта утилита общего назначения, и с её использованием в проектах могут возникнуть трудности.

Другой вариант – сделать голосовое управление на Raspberry Pi 3 самостоятельно. Для этого понадобится какой-нибудь из синтезаторов речи, а также Python с PyQT5 и ряд специальных модулей, например: speech_recognition и requests.

Чтобы заставить это все работать так, как нужно, потребуется потратить некоторое время. Но можно и найти готовые решения в Сети, адаптировав их под свои задачи.

Воспроизведение речи и управление голосом на Rapsberry Pi 3

Еще один вариант – использование Pocketsphinx. Работа с ним тоже не отличается легкостью – нельзя просто включить и начать использовать. Но если есть свободное время, можно ознакомиться с довольно емкой статьей на данную тему на habrahabr. Это один из немногих материалов по этой программе на русском языке.

Если с тем чтобы заставить на RPi воспроизводиться речь, проблем возникнуть не должно, то чтобы управлять ею голосом, понадобится потратить достаточно много времени. Но при применении усердия в итоге можно добиться очень интересных результатов.