Archivierte alte Webseite - Datenschutzerklärung, Adressen und Links zu externen Seiten sind vielfach ungültig - Bitte besuchen Sie www.PROJECT-CONSULT.com
Archived old Web Site - Privacy declaration, addresses and links to external web sites may be invalid - Please visit www.PROJECT-CONSULT.com
Kompressionsverfahren für Dokumente
Vor der Einführung eines elektronischen Archivs sind grundlegende Überlegungen notwendig. Das Archivformat ist eines der zu beachtenden Faktoren. Schließlich sollen die Dokumente aus dem elektronischen Archiv in einigen Jahrzehnten immer noch lesbar sein. Hier gilt es auf Standards zu setzen. Für Informationen, bei denen es bei der Archivierung auf den unverfälschbaren bildhaften Charakter ankommt, bieten sich neben PDF die Formate TIFF und JPEG2000 an.
Mit Standards beschäftigt sich seit 1865 die International Telecommunication Union (ehemals CCITT), kurz ITU genannt. Sie ist eine Unterorganisation der UN und hat 189 Mitgliedsstaaten. Mitglieder sind die Betreibergesellschaften der nationalen Fernmeldenetze. Die ITU erstellt Normen bzw. Empfehlungen für Fernsprech-, Fernschreib- und Rechnernetze sowie für Endgeräte.
Im Bereich der DRT (Document Related Technologies) sind die standardisierten TIFF-Dokumente zu beachten.
TIFF Tagged Image File Format
Als Archivformat wird sehr oft TIFF ausgewählt. Das TIFF Format unterliegt verschiedenen Kompressionsverfahren. Kommt auf elektronischem Wege ein Fax an, so handelt es sich dabei um ein Dokument nach ITU TIFF-Gruppe 3. Dieses Format wird bei herkömmlichen analogen Faxgeräten für die Übertragung erzeugt. Es bietet eine 1:10 Kompression an und hat damit einen geringeren Kompressionsfaktor als Gruppe 4 (1:20). Dadurch dass bei Gruppe 3 Kompriemierung unkomprimierte Referenzzeilen als Wiederaufsetzpunkte benutzt werden, ist dieses Format für die Archivierung weniger geeignet.
Bei einem Scanner wird standardmässig ein Dokument nach ITU TIFF-Gruppe 4 erzeugt. Hierbei handelt es sich um einen Weltstandard im Archivbereich. Dabei wird das Dokument zeilenweise Bildpunkt für Bildpunkt analysiert. Dieses Verfahren ist für binäre (schwarz/weiß) Dokumente besonders gut geeignet, und es komprimiert ein TIFF verlustfrei (bei anderen Formaten können -abhängig von der Komprimierungsstufe- Details verschwinden). Es ist für die Archivierung besser geeignet. Um ein elektronisch eingegangenes Fax ITU TIFF-Gruppe 3 und auch andere Dokumenttypen ins Archiv zu bekommen, werden diese „konvertiert“. Diese Konvertierung findet von Format X (Word, Excel, Txt, Fax-TIFF 3, etc.) in das Format ITU TIFF-Gruppe 4 statt. Hiermit wird ein unveränderliches, von der erzeugenden Anwendung unabhängiges und standardisiertes Format für die Langzeitarchivierung gewählt. Aber auch hier sollte Wert darauf gelegt werden, dass die aktuellen Gesetze bei der Einführung von komplexen DRT-Systemen mit integriertem Archiv Beachtung finden (z.B. HGB, GDPdU, etc.). So ist z.B. für steuerrelevante, originär in elektronischen System entstandene Daten die TIFF Konvertierung ab dem 01.01.2002 ausgeschlossen.
JPEG2000
Während das TIFF-Format die Anforderungen der letzten 16 Jahre erfolgreich erfüllen konnte, ist mit neuen Anforderungen an den Markt das noch frische JPEG2000 Format entstanden. Zu diesen Anforderungen gehören u.a. die Verarbeitung von übergroßen Bildern (mehr als 64k x 64 k Pixel), die Integration der Metadaten zur Bildbeschreibung, die Integration der Informationen zum Copyright (Watermarking) und die Erhöhung der Anzeigegeschwindigkeit durch die progressive pixelabhängige Darstellungsform.
Für die Bildkompression bei JPEG2000 setzt man Wavelets ein, die wie ein Filter wirken und den Bildinhalt in zwei Frequenzbereiche zerlegen. Um die Geschwindigkeit zu erhöhen, kommt ein mehrschrittiger, rekursiver Algorithmus zum Einsatz. Jeder Durchlauf des Filters erzeugt ein geglättetes Bild mit den niedrigen Frequenzanteilen sowie ein komplementäres mit den hohen Frequenzen. Beide erzeugten Wavelet-Koeffizienten enthalten genau die halbe Informationsmenge und ergeben zusammengesetzt wieder das Ausgangsbild. Somit gehen weder Informationen verloren noch entstehen redundante Daten. Die Filter werden abwechselnd in Zeilen- und Spaltenrichtung angewandt. Im Laufe des Verfahrens teilt der Algorithmus den Bildinhalt in immer feinere Freuqenzbänder, die sich schließlich nach den Wahrnehmungseigenschaften des Auges unterschiedlich weiterbehandeln lassen.
Diese sogenannte schnelle Wavelet-Transformation ist eine Entwicklung von Stéphane Mallat und Yves Meyer aus dem Jahr 1986 und macht das Verfahren erst praktikabel. Die Verkleinerung der Dateigrößen um den Faktor 40 ist erst durch Wavelet-Verfahren möglich, die weniger Bildfehler produzieren. Die aus über hundert Experten bestehende JPEG2000-Gruppe hat sich in den vergangenen vier Jahren die Aufgabe gemacht, einheitliche Kodierparameter und ein einheitliches Format zu definieren. Das menschliche Auge reagiert auf leichte Unschärfen bei weitem nicht so empfindlich wie auf Moirè- oder Klötzchenmuster. Deshalb sind mit Wavelets -abhängig von der Anwendung- Kompressionsfaktoren bis zu 100 möglich. Die Möglichkeit wichtige Bildteile weniger stark zu komprimieren ist ebenfalls vorhanden. JPEG2000 lässt sich so einstellen, dass bereits die ersten Kilobytes ein grobes Vorschaubild ergeben. Bei Bedarf können noch mehr Daten nachgeladen werden und das Bild wird immer feiner. Der Anwender kann die Übertragung der Daten jederzeit beenden, wenn die Darstellung seinen Qualitätsanspruch erreicht hat. Aber Achtung: es gibt zwei universelle Wavelets zur Basisversion von JPEG2000, und nur eines davon ist für die verlustfreie Kompression zuständig. Erste Viewer und Entwicklungswerkzeuge sind bereits kostenlos im Internet verfügbar.
Mit JPEG2000 sind somit höhere Kompressionsfaktoren als bei TIFF Gruppe 4 möglich. Der wesentliche Vorteil ergibt sich aber daraus, dass dieses Format eine verlustfreie Archivierung und eine verlustbehaftete Anzeige zur Steuerung der Netzwerkkapazitäten ermöglicht.
Rechtshinweis
© CopyRight PROJECT CONSULT 2002
Autorenrechte Jan Uzunoglu

Rechtshinweis
Autorenrechte
Zum Download sind auschließlich die Beiträge in der Rubrik Download vorgesehen. Als PDF bereitgestellte Beiträge enthalten auch die zugehörigen Grafiken.
Download

Top
Seitentitel: Standards_Kompression, Zitierung: http://www.PROJECT-CONSULT.com/home.asp?SR=402
Zuletzt aktualisiert am: 27.4.2002
CopyRight © 1992-2012 PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH
20251 Hamburg, Breitenfelder Str. 17, Tel.: +49-40-46076220, E-Mail, Rechtshinweis
Optimiert für MS Explorer 5.x, 6.x, 1024x768 Pixel, Cookies(on), JavaScript(on)
Archivierte alte Webseite - Datenschutzerklärung, Adressen und Links zu externen Seiten sind vielfach ungültig - Bitte besuchen Sie www.PROJECT-CONSULT.com
Archived old Web Site - Privacy declaration, addresses and links to external web sites may be invalid - Please visit www.PROJECT-CONSULT.com