[[Vorlage(Getestet, bionic)]] {{{#!vorlage Wissen [:Pakete installieren: Installation von Programmen] [:Editor: Einen Editor öffnen] [:Rechte: Rechte für Dateien und Ordner ändern] [:sudo:Root-Rechte] }}} [[Inhaltsverzeichnis()]] [[Bild(XSane/xsane-logo.png, 64, left)]] [topic:ubuntu-liest-vor:xsane2speech] ist ein Wrapper-Skript für [:XSane:], mit dem eine eingescannte Textvorlage sofort "vorgelesen" werden kann. Die dafür nötige Texterkennung erfolgt über [:tesseract-ocr:] oder [:Cuneiform-Linux:], die Textausgabe kann über die Sprachsynthesizer-Programme [:eSpeak:]/[:eSpeak_NG:] oder [:Festival:] erfolgen. Der Text wird gespeichert, er kann sowohl direkt wiedergegeben als auch via [:Audiodateien_umwandeln#Lame:Lame] als '''.mp3'''-Datei gespeichert werden. Zum Einsatz kommen außerdem [:yad:] (für Abfragen zum Verlauf), ggf. auch [:Zeichensatz-Konverter#iconv:iconv] und [https://www.darwinsys.com/file/ file] {en} (zur Sicherstellung bzw. Überprüfung der richtigen Textkodierung), ggf, auch [:FFmpeg:] für die Wiedergabe unter Festival. = Vorbereitung = Folgende Pakete müssen installiert [1] werden: {{{#!vorlage Paketinstallation xsane, universe imagemagick file tesseract-ocr, universe, sowie die gewünschten Sprachpakete espeak lame, multiverse mbrola, multiverse, optional, sowie gewünschte MBROLA-Stimmen, Verwendung über eSpeak, ggf. auch Festival festival, universe, optional, sowie die gewünschten Stimmen und Wörterbuchdateien cuneiform, multiverse, optional, sinnvoll z.B. für Texte in Spalten, bietet viele Sprachen yad ffmpeg, optional, für Festival }}} = xsane2speech = Das Skript selbst kann als [https://media-cdn.ubuntu-de.org/wiki/attachments/01/18/xsane2speech.sh xsane2speech.sh] {dl} heruntergeladen oder in einen Editor [2] kopiert, abgespeichert und ausführbar[3] gemacht werden. {{{#!vorlage Hinweis Für die Verwendung von [:Festival:] muss, wenn ein anderer Player als Ausgabesoftware verwendet werden soll, der Befehl für die Audioausgabe in Zeile 167/169 angepasst werden, es muss dort der entsprechende Player eingesetzt werden! Festival aus den Quellen greift inzwischen auf [:ALSA#aplay:aplay] zurück, für die deutsche Version ist im Skript [:ffplay:] vorgesehen. }}} {{{#!code bash #!/bin/bash # xsane2speech - speech directly from xsane # Copyright (C) 2010 - 2019 Heinrich Schwietering # # This program is free software: you can redistribute it and/or modify # it under the terms of the GNU General Public License as published by # the Free Software Foundation, either version 3 of the License, or # (at your option) any later version. # # This program is distributed in the hope that it will be useful, # but WITHOUT ANY WARRANTY; without even the implied warranty of # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the # GNU General Public License for more details. # # You should have received a copy of the GNU General Public License # along with this program. If not, see . ## # ############################################################################## # # xsane2speech 0.3 # # *** OCR and TTS made simple *** # # ############################################################################## # # xsane2speech is a OCR wrapper to be able to use tesseract or cuneiform # with xsane, and utter the result via espeak or festival or save it as mp3 # # # TEMP_DIR=/tmp/ # folder for temporary files (TIFF & tesseract data) ERRORLOG="xsane2speech.log" # file where STDERR goes ESPEAK=espeak CUNEIFORM=cuneiform FESTIVAL=/PATH/TO/COMPILED/VERSION/OF/festival/bin #path for german festival and text2wave TESSERACT=tesseract USER=~/Dokumente/Vorlesen SEL=/usr/local/bin/select.sh MAINPROG=xsane2speech.sh if [[ -z "$1" ]] then echo "Usage: $0 [OPTIONS] xsane2speech converts files to TIF, scans them with Tesseract or Cuneiform outputs the text in a file and converts it to speech OPTIONS: -i define input file (any image-format supported) -o define output-file (*.txt) -l define language-data OCR engine should use -e