[[Vorlage(archiviert)]] {{{#!vorlage Wissen [:Pakete installieren: Installation von Programmen] [:Packprogramme: Archive entpacken] [:Terminal: Ein Terminal öffnen:] [:sudo: Root-Rechte] [:Programme kompilieren: Pakete aus dem Quellcode erstellen] [:Programme starten: Ein Programm ohne Menüeintrag starten] [:Menüeditor: Programme zum Menü hinzufügen] [:Rechte: Rechte für Dateien und Ordner ändern] }}} [[Inhaltsverzeichnis()]] [[Bild(./ocrgui.png, 80, left)]] [http://ocrgui.sourceforge.net/ OcrGui] {en} ist ein Programm, mit dem in einer grafischen Oberfläche aus Bildvorlagen eine Texterkennung erzeugt werden kann. Zum Einsatz kommen dazu [:tesseract-ocr:] oder [:GOCR:]; außerdem kann das Ergebnis mit [:Hunspell:] einer Rechtschreibprüfung unterzogen werden. Das Programm wurde in [:Programmiersprache#C:C] verfasst, es verwendet GLib- und GTK+-Komponenten. Die Entwicklung von OcrGui stagniert leider (letzte Änderungen von 2011), liefert aber aufgrund der Verwendung von tesseract-ocr gute Ergebnisse. Mit [:tesseract-ocr#tesseract-ocr-3-00:tesseract-ocr 3.0x] (Standard ab [:Precise:12.04 Precise Pangolin]) ist in den Texten auch eine Spaltenerkennung möglich. = Installation = Benötigt werden die Pakete[1] {{{#!vorlage Paketinstallation imagemagick tesseract-ocr, sowie die gewünschten Sprachdateien gocr hunspell, sowie die gewünschten Sprachdateien libgtk2.0-dev libdbus-glib-1-dev libhunspell-dev intltool }}} Das Programm selbst liegt nicht in den Ubuntu-Quellen oder als '''.deb''' vor (es wurde für openSUSE entwickelt); daher muss der Quellcode von [sourceforge:ocrgui/files:sourceforge.net] {dl} heruntergeladen und entpackt [2] werden. Ggf. müssen für die Installation mit [:Programme_kompilieren#Installieren:checkinstall] manuell der Pfade '''/usr/local/share/ocrgui/doc''' sowie '''/usr/local/share/icons/hicolor/16x16, 22x22, 32x32, 48x48, scalable''' angelegt werden[3][4], {{{#!vorlage Befehl sudo mkdir /usr/local/share/ocrgui/doc ## etc. }}} weil ansonsten `make` das Kompilieren abbricht, da diese Ordner standardmäßig nicht existieren und von der Installationsroutine auch nicht angelegt werden. Alternativ kann man auch zunächst `sudo make install` aufrufen, und danach `sudo checkinstall`. Danach kann das Programm normal kompiliert[5] werden. Das Programm wird dann im Terminal gestartet [6]; komfortabler ist es, sich einen Starter anzulegen [7]. [[Bild(./ocrgui-preferences.png, 250, right)]] = Konfiguration = Über ''"File -> Preferences"'' erreicht man das Konfigurationsfenster. Im Reiter ''"General"'' werden Einstellungen zur zu verwendenden Schriftart (''"Text font"'') und der Ausrichtung des Hauptfensters vorgenommen. Es lässt sich der Speicherort für die Einstellungen und das Temporärverzeichnis festlegen; außerdem lässt sich einstellen, dass die Umbruchzeichen am Zeilenende entfernt (''"Remove new line character"''), ggf. durch eine Leerstelle ersetzt werden sollen (''"Substitute with a blank space"''). Ebenso lässt sich einstellen, ob und wie viele leere Zeilen eingefügt werden sollen. Unter ''"Programs"'' wird angezeigt, ob alle benötigten Programme installiert sind, in ''"Tesseract"'' lässt sich die zu verwendende Sprache einstellen (ggf. muss der Pfad zu den Sprachdateien angegeben werden), und festlegen, dass Tesseract als Standard-Anwendung für die Texterkennung genutzt werden soll. Unter ''"Gocr"'' lassen sich dezidierte Einstellungen zur Erkennung mit GOCR (Schwellwert, "Schmutz"-Entfernung, Abstand zwischen Wörtern/Buchstaben und Erkennungssicherheit) machen; Details in der GOCR-Dokumentation ([:man:Manpage]); ebenso lässt sich hier GOCR als Standard-Texterkennung aktivieren. Unter ''"Spell Check"'' lässt sich das zu verwendende Wörterbuch auswählen, oder auch selbst ein Pfad zum einzusetzenden Wörterbuchverzeichnis angeben. {{{#!vorlage Hinweis OcrGui lässt sich auch mit [:tesseract-ocr#tesseract-ocr-3-00:tesseract-ocr-3.0x] verwenden; die benötigten Sprachdateien '''.traineddata'''-Dateien müssen dazu in '''/usr/local/share/tessdata''' vorliegen. Allerdings scheinen nicht alle Sprachversionen erkannt zu werden. Als "Notlösung" kann man zur Nutzung einer nicht erkannten Version der Sprachdatei den Namen einer der erkannten geben... Die Dateien müssen für alle Benutzer lesbar sein, außerdem sollten sie "ausführbar" sein[8]. Das Problem ist ab Version 0.2.2 bereinigt worden. }}} [[Bild(./ocrgui-main.png, 250, right)]] = Bedienung = Bilddateien lassen sich über ''"File -> Open"'' oder die Ordnerschaltfläche öffnen; OcrGui unterstützt alle gängigen Bildformate (allerdings kein [:PDF:]). Die Dokumente werden in der Seitenleiste angezeigt, der Wechsel erfolgt mit Doppel-[[Vorlage(Tasten, lmt)]]-Klick auf die jeweils gewünschte Seite (der Wechsel ist allerdings ggf. etwas zäh). Die Texterkennung wird über die Taste mit dem "Bild-zu-A" gestartet, sie erfolgt für jede Seite einzeln (eine Stapelverarbeitung ist nicht vorgesehen). Die Lupentasten daneben dienen zum Zoomen des Bildes im linken Teil des Hauptfensters. Der erkannte Text lässt sich über die Speichertaste abspeichern; dabei ist der ToolTip ''"Save more text in the same file"'' etwas irreführend, da nicht, wie es ggf. sinnvoll wäre, Text an eine bestehende Datei angehängt werden kann, sondern der Text verschiedener Dokumente gemeinsam abgespeichert wird. Die Dokumente müssen dazu in der Seitenleiste markiert werden (mehrere lassen sich über [[Vorlage(Tasten, strg+lmt)]] auswählen). Allerdings wird der Text in der falschen Reihenfolge erfasst, d.h. der Text des untersten Dokumentes zuerst, der des obersten zuletzt. Die Dokumente lassen sich leider nicht verschieben, sodass bei mehrseitigen Dokumenten schon beim Aufruf auf die "falsche" Reihenfolge geachtet werden muss. [[Bild(./ocrgui-spellcheck.png, 150, right)]] Die Texterkennung wird im rechten Teil angezeigt, die Tasten darüber dienen der Bearbeitung des Textes. Mit der Speicher-Taste wird der momentan angezeigte Text abgespeichert. Die ABC-Taste daneben (ToolTip ''"Spell check with hunspell"'') bewirkt ein Unterstreichen unbekannter Wörter im Editorfenster und öffnet ein Korrekturfenster, in dem für unbekannte Wörter Korrekturvorschläge gemacht werden. Es kann auch eine eigene Schreibweise angegeben werden (''"Insert a word"'') und über die Schaltfläche ''"Sustitute"'' (falsche Schreibung im Programm selbst) eingefügt werden. Die weitere "abc"-Taste dient dazu, die Schriftart im Editor-Fenster anzupassen, daneben lässt sich die Größe einstellen. Diese Angaben haben aber keinen Einfluss auf die eigentliche Ausgabe; diese erfolgt bei tesseract-ocr in reinem Text-Format. Eine ausführliche bebilderte Anleitung kann ab 0.2.2 über ''"Help -> Contents"'' (oder [[Vorlage(Tasten, f1)]]) im Browser aufgerufen werden, sie findet sich in '''usr/share/doc/ocrgui/doc/ocrgui_manual.html'''. = Tastenkürzel = ||<-3 rowclass="titel"> OcrGui|| || Tasten||Funktion|| Übersetzung || ||[[Vorlage(Tasten, strg+o)]]||''"File -> Open"''|| Datei öffnen || || [[Vorlage(Tasten, strg+w)]]||''"File -> Close"''|| Datei schließen|| ||[[Vorlage(Tasten, strg+q)]]||''"File -> Quit"''|| Programm beenden || || [[Vorlage(Tasten, strg+r)]]||''"Image -> Recognition"''|| Texterkennung starten || ||[[Vorlage(Tasten, strg+plus)]]||''"Image -> Zoom in"''|| Vergrößern || || [[Vorlage(Tasten, strg+minus)]]||''"Image -> Zoom out"''|| Verkleinern || ||[[Vorlage(Tasten, strg+0)]]||''"Image -> Normal size"''|| Originalgröße anzeigen || || [[Vorlage(Tasten, strg+s)]]||''"Text -> Save"''|| Text speichern || ||[[Vorlage(Tasten, strg+m)]]||''"Text -> Save multiple text"''|| Text mehrerer Seiten speichern || || [[Vorlage(Tasten, strg+p)]]||''"Text -> Spell check"''|| Rechtschreibung überprüfen|| ||[[Vorlage(Tasten, f1)]]||''"Help -> Contents"''|| Anleitung im Browser öffnen|| = Alternativen = * [:tesseract-ocr#xsane2tess:xsane2tess], [:Cuneiform-Linux#Einbindung-in-XSane:xsane2cunei] zur Texterkennung direkt aus [:XSane:] (auch für mehrseitige Dokumente) * [:Archiv/vietOCR:] - vergleichbares Programm ebenfalls auf [:tesseract-ocr:]-Basis, ab Version 1.9 auch mit Rechtschreibprüfung * [:Archiv/YAGF:] - umfangreiches Frontend für [:Cuneiform-Linux:] mit Scanner-Integration via [:XSane:]; ebenfalls mit Korrekturfunktion * [:cuneiform-qt:] - vergleichbares einfacheres Programm, das ebenfalls auf Cuneiform-Linux als OCR-Engine zurückgreift = Links = * [http://ocrgui.sourceforge.net/ Projektseite] {en} * [sourceforge:ocrgui:OcrGui] auf sourceforge.net * [:Texterkennung:] #tag: Grafik, Büro, Kommunikation, Texterkennung, OCR