staging.inyokaproject.org

Omilo

Dieser Artikel wurde für die folgenden Ubuntu-Versionen getestet:

Dieser Artikel ist mit keiner aktuell unterstützten Ubuntu-Version getestet! Bitte teste diesen Artikel für eine Ubuntu-Version, welche aktuell unterstützt wird. Dazu sind die Hinweise zum Testen von Artikeln zu beachten.

Zum Verständnis dieses Artikels sind folgende Seiten hilfreich:

./omilo-qt5.png Omilo 🇬🇧 (abgeleitet vom griech. ομιλία - Sprache) ist ein Programm zur Textumwandlung, das Festival, Flite oder Open Mary 🇬🇧 als Sprachausgabe verwenden kann. Es ist in Qt5 verfasst und liefert englische (weiblich/männlich), deutsche, italienische, türkische und griechische Stimmausgaben. Es lassen sich beliebige Texte oder Textdateien in Sprache umwandeln und als Wave-Dateien abspeichern. Die grafische Oberfläche ist - bis auf wenige Ausnahmen - übersetzt.

Installation

Omilo ist nicht in den Ubuntu-Paketquellen vorhanden. Es kann als deb-Paket von der Downloadseite ⮷ bezogen werden[1]. Die Mary-Stimmen werden direkt mitinstalliert, verwendet wird Version 5.0. Unter Ubuntu 18.04 kann das dort vorgehaltene Paket für 17.10 eingesetzt werden. Ggf. lässt es sich aber nur über das Terminal mit dpkg installieren.

Hinweis!

Fremdpakete können das System gefährden.

Die Nutzung der Mary-Stimmen setzt eine Java-Installation voraus, als Abhängigkeit ist openjdk-jre-7 oder openjdk-jre-8 angegeben, es funktioniert auch mit openjdk-jre 11.

Konfiguration

Der Start[2] kann sich etwas verzögern, weil zunächst der Mary-Server via Java aktiviert werden muss, es erscheint zunächst nur das Logo mit einem Hinweis darauf. Im Panel nistet sich ein Icon ein, über dass das Programm (mit rechte Maustaste) in den Vordergrund gerufen ("Wiederherstellen") oder beendet werden kann.

Omilo bringt die verwendeten Sprachausgabeprogramme mit, sowohl Mary, Flite als auch Festival sind im Paket enthalten, was zu der nicht unerheblichen Größe von 94 MB für das Paket beiträgt. Im Hauptfenster im Menü "Optionen → Installiere Stimmen" können neben den Standard-"Kal-Festival"-Stimme weitere englische/amerikanische Festival/Flite-Stimmen heruntergeladen und speziell für Omilo installiert werden. Eventuell bereits auf dem System vorhanden Festival-Installationen oder Stimmen können über einen Umweg (siehe unten) bei Bedarf auch genutzt werden. Über "Ansicht" kann die Schrift im Editor fett ("Fett(druck)") dargestellt werden, außerdem kann man ein "Negativ" mit schwarzem Hintergrund und weißer Schrift einstellen ("Invertiere Farben"), was ggf. für Menschen mit Sehbeeinträchtigungen besser zu erkennen ist. Außerdem kann unter "Schriftart-Einstellungen" jede auf dem System installierte Schriftart für das Fenster eingestellt werden.

Die Konfigurationswerte werden in der Datei ~/.config/Omilo-qt5/Omilo-qt5.conf gespeichert; dort kann bei Bedarf auch eine andere text2wave-Datei zur Erzeugung der Ausgabe-Wave-Datei angegeben werden[4], falls nötig. Allerdings muss trotzdem die dazu passende festival-Datei verwendet werden, die sich in der Konfigurationsdatei bisher nicht festlegen lässt. Standardmäßig ist dort /usr/bin/text2wave eingetragen, also die des über das Paket festival installierte Datei; Omilo verwendet allerdings seine "eigene" Version, die Angabe also ggf. anpassen, damit die tatsächlich gewünschte Version genutzt wird.

Der Aufruf der Hilfefunktion liefert drezeit kein Ergebnis.

Benutzung

./omilo-main.png

Hauptbestandteil ist der Sprachausgabe-Editor. Am einfachsten kann man Omilo nutzen, indem man Text markiert (in irgendeinem Fenster) und dann mit F10 in das Omilo-Fenster importiert und wiedergibt. Unterbrechen kann man die Wiedergabe auch mit F11 , vorausgesetzt, "NUM-lock" ist ausgeschaltet.

Text kann außerdem über drag'n'drop direkt in das Fenster gezogen werden, per Tastatur geschrieben - oder korrigiert - werden, oder es werden Textdateien über "Datei → Öffen" ausgewählt, Omilo erwartet UTF-8-codierte Texte. Die Bedienung erfolgt entweder über die Schaltflächen der Leiste oben oder über die entsprechenden Tastenkürzel. Vor Ausgabe sollte die gewünschte Stimme für die Wiedergabe ausgewählt werden. Bei längeren Texten kann etwas Zeit vergehen, bis die Wiedergabe startet! Unten im Fenster wird angezeigt, ob das Ausgabemodul noch arbeitet. Die Ausgabe lässt sich über die Pausentaste unterbrechen, diese Funktion ist allerdings bisweilen etwas zäh, die Wiedergabe startet nach Unterbrechung ggf. erst nach einigen Sekunden Wartezeit. Mit dem Schieberegler über dem Fenster kann in der Textausgabe navigiert werden.

Mit rechte Maustaste-Klick lässt sich im Kontextmenü - neben den üblichen Funktionen wie "Ausschneiden, Kopieren" und "Einfügen" auch "Markierten Text wiedergeben", allerdings wird damit eine ggf. schon laufende Sprachausgabe unterbrochen, und müsste dann wieder neu gestartet werden.

Die Funktion "Sprechen → Ab Cursor-Position wiedergeben" encodiert den Text ab der Cursorposition neu, und startet dann von dort mit der Sprachausgabe. Die Geschwindigkeit lässt sich während der Ausgabe nicht verändern, es kann aber vor der Sprachausgabe das Tempo eingestellt werden, entweder über das Auswahlmenü rechts neben der "Play/Pause"-Taste, oder über "Sprechen → Langsamer/Schneller wiedergeben" oder ( Strg + 8 bzw Strg + 9 -Taste).

Änderungen am Text können gespeichert werden ("Datei → Speichern" oder "Speichern unter...". Omilo fragt bei Aufruf anderer Dateien nochmal explizit nach. Bis zur Erstellung einer neuen Sprachausgabe bleibt allerdings die alte Wave-Datei aktiv.

Die Sprachausgaben der Texte können auch als Wave-Datei abgespeichert werden ("Datei → Als Wave-Datei exportieren"). Die Datei kann dann frei benannt und in jedem beschreibbaren Verzeichnis abgelegt werden.

Probleme und Lösungen

Sprachauswahl für Festival

Auch die in Omilo mitgelieferte Festival-Version verwendet für die Stimmauswahl - so vorhanden - die Datei ~/.festivalrc. Wenn die dort eingestellte Stimme nicht der in Omilo gewählten Festival-Stimme entspricht, wird nichts ausgegeben (bzw. ggf. eine andere Stimme verwendet). Wenn das Programm im Terminal gestartet wurde, erscheint ggf. ein Hinweis zu einer "unbound variable" in Festival, falls die Stimme nicht nutzbar ist.

Tastenkürzel

Omilo, Text to Speech
Tasten Funktion Tasten Funktion
F10 markierten Text importieren und wiedergeben F11 Wiedergabe unterbrechen
Strg + N "Datei → Neu" Strg + O "Datei → Öffnen..."
Strg + S "Datei → Speichern" Strg + E "Datei → Als Wave-Datei exportieren..."
Strg + Q "Datei → Beenden"
Strg + Z "Bearbeiten → Rückgängig" Strg + + Z "Bearbeiten → Wiederholen"
Strg + X "Bearbeiten → Ausschneiden" Strg + C "Bearbeiten → Kopiern"
Strg + V "Bearbeiten → Einfügen" Alt + C "Bearbeiten → Löschen"
Strg + A "Bearbeiten → Alle auswählen" F1 "Hilfe → Hilfe"
F2 "Sprechen → Sprechen" F12 "Sprechen → Abbruch"
F3 "Sprechen → Stimme auswählen" Strg + 1 "Sprechen → Stop"
Strg + 3 "Sprechen → Wiedergabe/Pause" Strg + 8 "Sprechen → Absenkungsrate"
Strg + 9 "Sprechen → Erhöhungsrate" Strg + 1 "Sprechen → Speak from current position" (Ab Cursor wiedergeben)
F4 "Optionen → Installiere Stimmen..." F5 "Optionen → Flite-Einstellungen..."
Strg + B "Ansicht → Bold (fett)" Strg + I "Ansicht → Invert Color" ("Negativ" darstellen)
Kontextmenü im Editor (rechte Maustaste)
Strg + X "Ausschneiden" Strg + C "Kopieren"
Strg + V "Einfügen" F7 "Speak (selected text)" (Markierten Text sprechen)

Alternativen

Diese Revision wurde am 24. November 2021 15:35 von Heinrich_Schwietering erstellt.
Die folgenden Schlagworte wurden dem Artikel zugewiesen: Multimedia, TTS, Kommunikation, Bildung, Barrierefreiheit, ungetestet