Вышел Multispeech версии 4.3.0

Дата:20.09.2021
Источник:GitHub
Поделиться в Twitter Поделиться в Facebook Поделиться в VKontakte Поделиться в Telegram

Стало доступно обновление речевого сервера Multispeech версии 4.3.0, разрабатываемого Игорем Порецким для операционных систем Linux. Это многоязычный речевой сервер с поддержкой русского, английского, немецкого, французского, итальянского, испанского и португальского языков и возможностью автоматического переключения синтезаторов в зависимости от языка читаемого текста. Он может работать как по протоколу Emacspeak, так и подключаться через специально поставляемый модуль к речевому серверу Speech Dispatcher в виде многоголосого синтезатора на базе синтезаторов ru_tts, MBROLA и eSpeak.

Среди основных нововведений Multispeech 4.3.0 выделяются:

  1. Включено явное обозначений ударений для русского языка.
  2. Поддержка явного обозначения ударений в бэкэнде ru_tts. В итоге, встроенный ru_tts теперь может на ходу менять ударение в своей речи, если оно расставлено в исходном тексте при помощи общеупотребимого знака U+301, который, в частности, используется для этой задачи в Википедии. Например, эту функцию можно опробовать при чтении следующего четверостишья:
    Отлетела от костра
    И погасла быстро:
    Коль неверно, то искра́,
    Если верно — и́скра!
    Интересующиеся, но не использующие Multispeech, для понимания могут прочитать вышеприведённый пример при помощи синтезатора речи RHVoice, в котором, начиная с версии 1.2.3, есть аналогичная функциональность.
  3. Улучшение правил русской транслитерации латиницы.
  4. Немного упрощена структура конфигурации.
  5. Исправление механизма определения испанского языка.

Отметим, что первые три пункта являются доработками для улучшения речи русских синтезаторов, в частности, встроенного ru_tts, но они реализованы на уровне Multispeech, который выполняет предобработку входной текстовой строки с преобразованием знака ударения U+301 и нескольких латинских букв в понятные ru_tts конструкции. Таким образом, данные улучшения будут заметны лишь при использовании ru_tts именно в составе Multispeech.

Собранные релизы и исходный код Multispeech доступны в репозитории проекта на GitHub. Также Multispeech входит в состав специального набора пакетов средств невизуального доступа на базе Emacspeak.


Метки


Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2021