Xerox-Multifunktionsgeräte verändern Gescanntes

5. August 2013, 7:30 Uhr | Archiv

Das man Texterkennungs-Software nur bedingt trauen kann ist hinlänglich bekannt. Trotz stetig besser werdender Software für diesen Zweck schleichen sich immer noch Fehler ein, die zu ernsten Problemen führen können, wenn sie nicht korrigiert werden. Das ein Scanner ohne den Einsatz von Texterkennung das Gescannte ändert, dürfte den meisten allerdings neu sein. Solch ein Verhalten hat jetzt allerdings ein Informatiker bei Geräten von Xerox festgestellt.

Bestimmte Scankopierer von Xerox verändern selbstständig Zeichen. Im Beispiel wird aus einer 6 eine 8. Bild und Hervorhebung: David Kriesel, dkriesel.com

Bestimmte Scankopierer von Xerox verändern selbstständig Zeichen. Im Beispiel wird aus einer 6 eine 8. Bild und Hervorhebung: David Kriesel, dkriesel.com

Durch einen Zufall entdeckte man in einem Unternehmen einen Fehler in der Kopie eines Bauplans wo die Quadratmeterzahl eines Raumes falsch angegeben war. Erstaunlicherweise handelte es sich dabei um einen sehr „sauberen“ Fehler, ganz so als hätte jemand mittels digitaler Bildbearbeitung die Zahlen säuberlich ausgetauscht und den Plan dann ausgedruckt.

Wie der Informatiker David Kriesel in seiner Untersuchung des Problems zeigt, liefern Geräte der „WorkCentre“-Serie von Xerox bei diesem Bauplan reproduzierbare Fehler. Getestet mit einem Gerät vom Typ 7535 und einem des Typs 7556 tauchen in Dokumenten, die direkt in ein PDF gescannt werden, wiederholt falsche Bildstellen auf. Aus der Ziffer 6 wird eine 8, aber auch der vollständige Austausch längerer Ziffernkombinationen passiert.

Als Grund für diese Fehler scheint sich der verwendete Kompressionsalgorithmus verantwortlich zu zeichnen. Der verwendete „JBIG2“-Standard speichert einmal verarbeitete Bildstellen in einem „Wörterbuch“ zwischen und setzt diese wieder ein, falls eine Bildstelle gefunden wird, deren Abweichung nur marginal zur bereits gespeicherten ist. Offensichtlich passiert genau dies innerhalb der Xerox-Geräte. Eine unglückliche Kombination aus der Größe der gespeicherten Bildstelle und der Objektgröße im Dokument, beispielhaft erzeugte eine Arial mit 7 pt entsprechende Probleme, führt dazu, dass der Scanner eine gescannte 6 durch eine 8 ersetzt etc.

Es handelt sich damit wahrscheinlich um reinen Software-Fehler, der durch die Wahl einer kleineren Größe für die gespeicherten Bildstellen behoben werden kann. Bisher steht eine Reaktion von Xerox zu diesem Problem aus, auch Geräte mit aktuellster Firmware sind davon betroffen. Wie lange dieser Fehler schon existiert ist unbekannt.

Bis zu einer Behebung des Problems bietet es sich an, Dokumente zunächst als TIFF-Datei zu scannen und daraus ein PDF zu erzeugen. In diesem Fall kommen für die Komprimierung der TIFFs und des PDFs andere Verfahren zum Einsatz, bei denen keine entsprechenden Fehler bekannt sind.

Wir empfehlen allen Lesern zu prüfen, ob im Unternehmen entsprechende Geräte von Xerox eingesetzt werden und ob dort dieser Fehler auftritt. Da unbekannt ist, wie lange dieser Fehler schon in der Software existiert, sollten Sie zudem auch Scans von wichtigen Dokumenten im Nachhinein genau prüfen und Geschäftspartner auf dieses Problem hinweisen.

Quelle: Weblog von David Kriesel

Über den Autor

Florian Meier

0 Kommentare


Was meinen Sie zu diesem Thema?

Wir freuen uns über Ihren Kommentar.

Schreibe einen Kommentar

* Pflichtangaben; Ihre E-Mail-Adresse wird nicht veröffentlicht.
 

Copyright

Copyright 2015 Bernd Zipper, zipcon consulting GmbH

Archiv