Подпроект Skomoroh

Skomoroh работает только в Linux и других вариантов просто не предусмотрено. В составе подпроекта Skomoroh входит 4 программы:

    skomoroh0.1 - программа использующая в качестве движка tts-движок- ru_tts

    skomoroh0.2 - программа использующая в качестве движка tts-движок- популярный сейчас движок eSpeak

    skomoroh0.3 - программа использующая в качестве движка tts-движок- самый лучший по качеству произношения на сегодняшний день движок RHVoice

    skomoroh1.0 - универсальная программа, которая может использовать в качестве tts-движка- все вышеперечисленные или любой другой, который может функционировать из коммандной строки и преобразование в речь из которого можно сохранить в виде wav файла.


Общие требования для всех программ подпроекта Skomoroh

Для нормального функционирования программы необходимо:

  1. Должны быть установлены из репозитария ОС библиотеки QT 4.5 и выше
  2. Должны быть установлены из репозитария ОС sox, xsltproc, lame и linx
  3. Для успешного функционирования необходимы утилиты преобразования форматов файлов в текстовые: antiword, shell- утилита antiodt, файлом настройки FB2_2_txt.xsl для xsltproc и собственно требуемый tts-движок. Утилиты можно взять которые можно взять тут в файле UtilTool.zip или в интернете, где возможно более новые версии . Все модули должны быть разархивированы в тот же каталог, в котором расположен будет исполнимый модуль.

skomoroh0.1

программа использующая в качестве движка tts-движок- ru_tts

ru_tts движок крайне скоростной и по качеству воспроизведения он достаточно разборчивый и интонированный, но по спектру частот он все же похож на робота Вертера.

Т.к. у него вывод в RAW формате, при помощи sox ему, в отличии от Festival, можно регулировать темп речи, тон голоса, придавать эхо и делать разные изменения голоса.

Но у него отличный от Festival выход и на вход подается текст в кодировке KOI-8R.
Переделав графическое приложение MenesrelDaemon под движок ru_tts, я получил подпроект Skomoroh.
Его, в отличии от MenestrelDaemon, собираюсь поддерживать в будущем и, по мере появления других русских движков, встраивать их именно в этот подпроект.

Исполнимый модуль создается при помощи среды разработки от QT- qt-creator 2.0 и выше. И в архиве с исходниками, находится проект qt-creator, из которого можно сделать исполнимый модуль

В skomoroh0.1 исполнимый модуль с утилитами, которые могут быть разархивированы в любой удобный каталог на ПС пользователя, а в меню или на стол можно поставить ссылку/пункт меню на модуль Skomoroh, который и является исполнимым.
Если установлено все, что перечислено в пунктах 1-3, то сразу должен начать работать.

Программа предназначена для озвучки русских текстов, поэтому времени на интернационализацию не тратил.
ru_tts движок среднего качества, но очень быстрый.
Еще у него есть дополнительные особенности:


Файлы подпроекта вместе с движком ru_tts можно найти тут.



skomoroh0.2

программа использующая в качестве движка tts-движок eSpeak

eSpeak движок крайне скоростной, но по качеству воспроизведения русским голосом он не достаточно разборчив и не интонированный, и по спектру частот он все же похож на робота Вертера в худшей своей ипостаси. eSpeak с некоторыми другими голосами может давать и не плохие результаты, но с русский голос просто ужасный, но привыкнуть можно, хотя я, лично, предпочитаю все же использовать ru_tts, чем eSpeak

Т.к. у него вывод в WAV формате, при помощи sox ему, как и в Festival, можно регулировать темп речи, тон голоса, придавать эхо и делать разные изменения голоса.

У него такой же, как в Festival выход и на вход подается текст в кодировке UTF-8.

Исполнимый модуль создается при помощи среды разработки от QT- qt-creator 2.0 и выше. И в архиве с исходниками, находится проект qt-creator, из которого можно сделать исполнимый модуль

В skomoroh0.2 исполнимый модуль с утилитами, которые могут быть разархивированы в любой удобный каталог на ПС пользователя, а в меню или на стол можно поставить ссылку/пункт меню на модуль Skomoroh, который и является исполнимым.
Если установлено все, что перечислено в пунктах 1-3, а так же tts-движок eSpeak, то сразу должен начать работать.

Программа предназначена для озвучки русских текстов, поэтому времени на интернационализацию не тратил.
eSpeak движок среднего качества, но с низкокачественным русским голосом и очень быстрый.
Еще у него есть дополнительные особенности:


Файлы подпроекта можно найти тут.



skomoroh0.3

программа использующая в качестве движка tts-движок RHVoice, с самым лучшим русским голосом

RHVoice -движок, разработанный Ольгой Яковлевой на базе flite и русского голоса для festival, но с доработками, делающими его не хуже профессиональных голосов, со спектром, близким к естественному мужскому голосу, интонированный и просто хорошо воспринимаемый. Этот голос стал одним из стандартных в дистрибутиве AltLinux. Данный движок находится в этом подкаталоге. В нем предлагается движок в двух вариантах поставки:

Можно поискать в Интернете более свежие варианты движка. Скорость преобразования движка не такая высокая, как у двух предыдущих, но выше, чем у festival.

Т.к. у RHVoice вывод может быть в WAV формате, при помощи sox ему, как и в Festival, можно регулировать темп речи, тон голоса, придавать эхо и делать разные изменения голоса.

У него такой же, как в Festival выход и на вход подается текст в кодировке UTF-8.

Исполнимый модуль создается при помощи среды разработки от QT- qt-creator 2.0 и выше. И в архиве с исходниками, находится проект qt-creator, из которого можно сделать исполнимый модуль

В skomoroh0.3 исполнимый модуль с утилитами, которые могут быть разархивированы в любой удобный каталог на ПС пользователя, а в меню или на стол можно поставить ссылку/пункт меню на модуль Skomoroh, который и является исполнимым.
Если установлено все, что перечислено в пунктах 1-3, а так же установлен tts-движок RHVoice, то сразу должен начать работать.

Программа предназначена для озвучки русских текстов, поэтому времени на интернационализацию не тратил.
RHVoice движок высшего качества русского голоса, но не очень скоростной.
Еще у него есть дополнительные особенности:


Файлы подпроекта можно найти тут.



skomoroh1.0

универсальная программа

Программа универсальная и может использовать все 3 вышеперечисленных tts-движка, а так же любой другой движок, способный работать из коммандной строки и результат его преобразования текста в речь можно представить в виде WAV- файла

Т.к. задан вывод речи у движка в WAV формате, при помощи sox ему, как и в Festival, можно регулировать темп речи, тон голоса, придавать эхо и делать разные изменения голоса.

Предусмотрена настройка кодировки входной информации в соответствии с требованиями движка.

Исполнимый модуль создается при помощи среды разработки от QT- qt-creator 2.0 и выше. И в архиве с исходниками, находится проект qt-creator, из которого можно сделать исполнимый модуль

В skomoroh1.0 исполнимый модуль с утилитами, которые могут быть разархивированы в любой удобный каталог на ПС пользователя, а в меню или на стол можно поставить ссылку/пункт меню на модуль Skomoroh, который и является исполнимым.
Если установлено все, что перечислено в пунктах 1-3, а так же один из tts-движков, то сразу после настройки программы на параметры движка средствами самой программы, программа должна начать работать.

Программа предназначена для озвучки русских текстов, поэтому времени на интернационализацию не тратил.
Хотя предоставлен только Linux вариант данной программы, но ее исходный текст можно компилировать в Windows, если там найдется движок не SAPI, и удовлетворящий указанным выше требованиям. Для работы с SAPI движками есть другие разработки, для Windows, например Балаболка. К стати SAPI-версия движка RHVoice так же существует в интернете


Файлы подпроекта можно найти тут.