[[Inhaltsverzeichnis()]] [[Bild(DjVu/djvu-logo.png, 100, left)]] Unter Ubuntu kann [:DjVu:] mit der Open-Source-Implementierung [http://djvu.sourceforge.net/index.html DjVuLibre] {en} genutzt werden, ein Projekt, das von den ursprünglichen Entwicklern des Formats gepflegt wird. Etliche Pakete sind in den Ubuntu-Paketquellen greifbar. Dazu gehören u.a. der DjVu-Betrachter DjView ('''djview3/4'''), ein Browser-Plugin ('''djvulibre-plugin'''), um DjVu-Dateien in Webseiten betrachten zu können, '''djvulibre-desktop''', um die Daten auf der Arbeitsfläche verwenden zu können. Außerdem '''djvuserve''', ein [wikipedia:Common_Gateway_Interface:CGI]-Programm zum direkten Umwandeln von mehrseitigen DjVu-Dokumenten in ein indirektes DjVu-Dokument. Dies ermöglicht es, effizient mit großen DjVu-Dokumenten zu arbeiten, ohne nicht benötigte Seiten übertragen zu müssen. Des Weiteren gehören etliche Bibliotheken zu dem Projekt (komplette Übersicht der Programme auf [http://djvu.sourceforge.net/doc/index.html djvu.sourgeforge.net] {en}, die meisten sind im Paket '''djvulibre-bin''' enthalten). Ein "Anwendungsbeispiel" ist das polnische Projekt [http://poliqarp.wbl.klf.uw.edu.pl/slownik-polszczyzny-xvi-wieku/ poliqarp] {en}, in dem sehr umfangreiche alte Wörterbücher komplett digitalisiert, indiziert und zur Durchsuchung online gestellt werden. Hier kommen besonders Software-Entwicklungen von [http://jwilk.net/software/ Jakub Wilk] {en} zum Einsatz, u.a. '''djvusmooth''', '''pdf2djvu''' und '''ocrodjvu'''. Vom selben Entwickler stammt auch '''python-djvu''', um DjVu in Python-Anwendungen verwenden zu können. Außerdem hat der Autor auch das Programm [http://jwilk.net/software/didjvu didjvu] {en} entwickelt, mit dem die Erstellung bitonaler Ebenen möglich ist. = Lesen/Darstellen = == DjView == [http://djvu.sourceforge.net/djview4.html DjView4] {en} - umfangreicher Dokument-Betrachter mit vielfältigen Möglichkeiten, und ist für alle aktuellen Ubuntu-Versionen in den Paketquellen vorhanden. Der Viewer ermöglicht es es auch, DjVu-Dokumente in andere Formate (u.a. '''.pdf''') zu konvertieren). Das dazugehörige Browser-Plugin stellt eine Browser-Version des DjView-Readers zur Verfügung, und bietet Unterstützung für Netscape-4.x, Netscape-6.x, [:Firefox:Mozilla], [http://galeon.sourceforge.net/ Galeon] {en}, [:Konqueror:], und [:Opera:]. Einzelheiten unter [:DjView:]. == djvusmooth == [http://jwilk.net/software/djvusmooth djvusmooth] {en} ist ein schlichtes Betrachter-Programm ähnlich [:DjView:], mit dem darüber hinaus auch Korrekturen an der Texterkennung, dem Inhaltsverzeichnis und den Metadaten möglich sind. Weiteres im Artikel [:djvusmooth:]. == Evince == [:Evince:] - Der Standard-GNOME-Dokument-Betrachter ist ohne weiteres Zutun in der Lage, DjVu-Dateien darzustellen und auch eine ggf. vorhandene Textebene zu durchsuchen. == Okular == [:Okular:] - Auch das KDE-Pendant kann DjVu-Daten darstellen, allerdings ist dazu die Installation des Paketes '''okular-extra-backends''' nötig. Okular besitzt einige interessante Werkzeuge wie eine Marker- und Kommentarfunktion, allerdings werden Änderungen nicht in der Datei selbst, sondern extern gespeichert. ## weitere Funktionen? Editierbar? = Erstellen/Konvertieren/Bearbeiten = == djvused == [http://djvu.sourceforge.net/doc/man/djvused.html djvused] {en} ist ein Kommandozeilenprogramm zum Bearbeiten von DjVu-Dateien. Es ist das "Schweizer Taschenmesser", mit dem eine Vielzahl von Möglichkeiten gegeben sind, von Metadatenverwaltung, -erstellung, Auslesen und Bearbeitung etc., über das Erstellen von Vorschaubildern bis zum Extrahieren einzelner Seiten etc. Einzelheiten im Artikel [:djvused:] == gscan2pdf == Mit [:gscan2pdf:] können Dokumente eingescannt und direkt im DjVu-Format abgespeichert werden (als "bundled"-Dokument); allerdings kann für farbige Vorlagen keine Segmentierung der Lagen erfolgen, weil dafür das [:DjVu#Hintergrund:c44]-Verfahren zur Anwendung kommt. Es ist auch die Texterkennung mit [googlecode:ocropus:OCRopus] {en} oder [:Cuneiform-Linux:] möglich. Eine Korrektur der Texterkennung ist ebenfalls implementiert. Momentan gibt es bei der Texterkennung mit Cuneiform noch Probleme bei Vorlagen, in denen unterschiedliche Schriftarten/Formatierungen vorhanden sind. Die von Cuneiform gelieferte Texterkennung im [wikipedia:HOCR_(Standard):hOCR]-Format liefert sehr gut Ergebnisse, mit denen auch das Layout der Vorlage recht gut wiedergeben lässt, allerdings werden momentan als fett oder kursiv formatiert erkannte Zeichen in gscan2pdf nicht verarbeitet, der Entwickler arbeitet aber an einer Lösung. == didjvu == [http://jwilk.net/software/didjvu didjvu] {en} ist eine noch in der Entwicklung befindliches, aber schon sehr leistungsstarkes Kommandozeilenprogramm, mit dem die in DjVuLibre fehlende Segmentierung der Vorlagen für die Erstellung der bitonalen "foreground mask" möglich ist. Das Programm verwendet das Open-Source-Framework [http://gamera.informatik.hsnr.de/ gamera] {en}, um die Lagen erstellen zu können. [:xsane2djvu:] und [:pct-scanner-script:] können didjvu verwenden, Einzelheiten im Artikel [:didjvu:]. == xsane2djvu == [:xsane2djvu:] ist ein Skript, mit dessen Hilfe DjVu-Dateien direkt aus [:XSane:] heraus erstellt und mit einer Textebene versehen werden können. Die Erstellung ein- und mehrseitiger DjVu-Dateien ist möglich, verwendet wird zur Encodierung [:didjvu:] (andere Encoder sind möglich). Die Texterstellung erfolgt mittels [:ocrodjvu:], dazu können [:Cuneiform-Linux:] bzw. [:tesseract-ocr:] eingesetzt werden. == pdf2djvu == [http://jwilk.net/software/pdf2djvu pdf2djvu] {en}, in den Paketquellen, umfangreiches Kommandozeilenwerkzeug zur Konvertierung von PDF-Dateien in das DjVu-Format; eine Texterkennung bleibt dabei erhalten. Außerdem existiert eine einfache grafische [:GTK:]2-Bedienoberfläche (GUI) für das Programm, [http://www.trustfm.net/GeneralTools/SoftwarePdfToDjvuGUI.php Pdf To Djvu GUI] {en} als Freeware, das die Auswahl der '''.pdf'''-Dateien, sowie einige der pdf2djvu-Optionen als Bedienoberfläche beinhaltet. Details unter [:pdf2djvu:]. == DjVuDigital == [http://djvu.sourceforge.net/gsdjvu.html DjVuDigital] {en}, eine Programm aus dem Paket '''djvulibre-bin''', mit dem PS/PDF-Dateien umgewandelt werden können. Allerdings muss zuvor ein aktualisierte Version eines Ghostscript-Treibers erstellt werden; wegen ungeklärter Lizenz-Fragen liegt kein benutzbares Programm vor, sondern muss, nach dem Patchen des Ghostscript-Codes, selbst erstellt werden. Details im Artikel [:DjVuDigital:]. == minidjvu == [http://minidjvu.sourceforge.net/ minidjvu] {en} ist ein einfacher Binärgrafik-De/Encoder für die Kommandozeile zum Umwandeln anderer Formate in das DjVu-Format und umgekehrt, unterstützt '''BMP''', '''PBM''' und '''TIFF''' (über '''libtiff'''), in den Paketquellen. Einzelheiten in im Artikel [:minidjvu:]. == pct-scanner-script == pct-scanner-scripts ist ein sehr detailiert konfigurierbares Kommandozeilen-Werkzeug aus dem gleichnamigen Paket, das wie gscan2pdf den gesamten Prozess vom Einscannen der Vorlagen über die Bearbeitung bis zur Ausgabe als DjVu-Datei ermöglicht (auch PDF-Dateien könne erstellt werden; eine Texterkennung ist mit etwas Anpassung für DjVu-Dateien auch möglich). Das Programm ist ggf. nicht direkt für alle [:SANE#Backend:sane-Backends] einsetzbar. Details im Artikel [:pct-scanner-script:]. == djvubind == [googlecode:djvubind:] ist ein Kommandozeilenprogramm, mit dem schnell und unkompliziert '''tiff'''-Vorlagen zu [wikipedia:E-Book:E-Books] verarbeitet werden können. Zum Einsatz kommt [:minidjvu:], oder [http://djvu.sourceforge.net/doc/man/cjb2.html cjb2] {en}, für die Texterkennung wird standardmäßig [:tesseract-ocr:] verwendet, [:Cuneiform-Linux:] ist zwar vorgesehen, aber noch sehr unzuverlässig. Konzipiert wurde es zur Weiterverarbeitung von [:Scan Tailor:]-Vorlagen. Details im Artikel [:djvubind:]. == any2djvu == [http://any2djvu.djvu.org/ any2djvu] {en} ist ein kostenloser webbasierter Service zum Erstellen von DjVu-Dateien, der vom DjVu-Projekt getragen wird. Es können Dateien in allen gängigen Formaten hochgeladen, und zu '''.djvu'''-Dateien umgewandelt werden; die Standardeinstellung sieht '''.ps'''/'''.ps.gz'''/'''.pdf'''-Dokumente vor, es können aber auch weitere Angaben zu den eigenen Daten gemacht werden. Der Service kann auch genutzt werden, um vorliegende '''.djvu'''-Dateien verifizieren, oder dafür eine Texterkennung durchführen zu lassen. Außerdem können öffentlich zugängliche Dokumente direkt aus dem Internet angegeben und konvertiert werden. Man sollte sich allerdings im Klaren darüber sein, dass von den Betreibern keinerlei Garantien oder besondere Sicherheitsmaßnahmen zum Datenschutz übernommen werden können. Der Service scheint keine Segmentierung/Erstellung einer [:DjVu#Vordergrund:"foreground mask"] für mehrfarbige Vorlagen zu beinhalten. Nähere Einzelheiten auf der [http://any2djvu.djvu.org/help.php Hilfeseite] {en} des Projektes. any2djvu ist im Paket '''djvulibre-bin''' enthalten, der Service kann auch direkt über die Kommandozeile gestartet werden, siehe [:man:Manpage] des Programms. = Texterkennung (OCR) = == ocrodjvu == [http://jwilk.net/software/ocrodjvu ocrodjvu] {en} ist ein umfangreiches Kommandozeilen-Werkzeug in [:Python:] zur Texterkennung in DjVu-Dateien, es verwendet OCRopus/[:tesseract-ocr:] oder [:Cuneiform-Linux:] als OCR-Software. Das Programm ist in den Paketquellen, es kommt u.a. in [:xsane2djvu:], optional in [:pct-scanner-script:] zum Einsatz. Einzelheiten im Artikel [:ocrodjvu:]. == gscan2pdf == [:gscan2pdf:], siehe oben. Aufgrund der fehlenden Open-Source-Implementierung für die Segmentierung erfolgt die Texterkennung nicht für das eigentlicher DjVu-Dokument, sondern erfolgt vorher, direkt von der gescannten Vorlage, das Ergebnis wird dann als "hidden layer" in die DjVu-Datei integriert. Das kann bei gerade farbigen Vorlagen zu Erkennungsproblemen führen; eine Texterkennung liefert generell für bitonale Vorlagen verlässlichere Ergebnisse. = Sonstiges = == ExifTool == [:ExifTool:] ist seit Version 7.44 in der Lage, auch DjVu-[:Metadaten:] auszulesen. Details siehe [http://owl.phy.queensu.ca/~phil/exiftool/TagNames/DjVu.html DjVu.html] {en} auf der ExitTool-Projektseite. == djvu2pdf == [https://0x2a.at/site/projects/djvu2pdf djvu2pdf] {en} ist ein kleines Kommandozeilen-Programm, basierend auf [http://djvu.sourceforge.net/doc/man/ddjvu.html ddjvu] {en}, das es ermöglicht, DjVu-Dateien in das PDF-Format umzuwandeln. Die Textlage des DjVu-Dokumentes wird im Original nicht übernommen, mit einer Anpassung funktioniert auch das. Details im Artikel [:djvu2pdf:] = Links = * [http://www.docspal.com/ Online-Konvertierungs-Service] {en}, über den kostenlos auch djvu-Dateien erstellt werden können * [http://www-sop.inria.fr/marelle/Vladimir.Komendantsky/djvu-HOWTO.html DjVu-Howto] {en} mit Skripten zum Erstellen von DjVu-Dateien * [http://en.wikisource.org/wiki/Help:DjVu_files Anleitung] {en} zum Erstellen/Bearbeiten von DjVu-Dateien auf wikisource.org #tag: Grafik, Übersicht, Editor, Bildung, Büro, Kommunikation, OCR, Texterkennung, djvu