SSL (?): an | aus

Bitte die Forenregeln und die Hinweise zu den Versuchen lesen!

Neue Antwort erstellen
Wie kann man Buchscans restaurieren?
Illumina-Mitglied

Anmeldedatum: 27.10.2015
Beiträge: 658
Artikel: 0
Wohnort: Leverkusen
Hallo Freunde der gescannten Literatur!

Ich habe im Moment das Problem, daß ich das Inhaltsverzeichnis eines alten Buches (Rheinboldt: Chemische Unterrichtsversuche) digitalisieren will. Bei der 6. Auflage (relativ druckfrisch, 1979 herausgegeben, lizensierter Nachdruck durch Amazon) klappte das sehr gut, bis auf wenige wiederkehrende "Erkennungslücken" bei der OCR-Texterkennung. Jetzt will ich die Erstauflage behandeln, die seit 1933 viel "Gilb" angesammelt hat. Der Rohscan ist etwas verschwommener, obwohl mit dem selben Gerät erstellt. In der OCR-Bearbeitung bekomme ich über 50% Fehler und Buchstabensalat.

Gibt es eine Möglichkeit, die als .pdf abgelegten Scans per "Massenverarbeitung" so zu restaurieren, daß die Texterkennung über 90% sinnvollen Text ausgibt? Ich hoffe, daß ich den "Papierton" irgendwie zurückdrängen kann und eventuell die Kantenschärge am Buchdtaben etwas "nachschärfen" kann. Allerdings weiß ich nicht, ob das mit dem Adobe 9.5 oder dem Windows-Picturemanager machbar ist.


Die Notlösung währe, den gesamten Text vom Inhaltsverzeichnis abzutippen, was mit der "Einfingersuchmethode" etwas mühsam würde. Zumal ich noch die Auflagen 3 und 4 mit einbeziehen möchte, da es mindestens zwei Überarbeitungen und Erweiterungen oder Neusortierungen gab.
Benutzer-Profile anzeigenAlle Beiträge von Glaskocher anzeigenPrivate Nachricht senden
Illumina-Mitglied

Anmeldedatum: 01.01.2017
Beiträge: 18
Artikel: 0
Hallo Glaskocher,

mit diesem Problem hatte ich auch schon zu kämpfen und mit folgendem Rezept gute Ergebnisse erzielt:
Der Scan muss zunächst im Kontrast verbessert werden, das ist eine simple Photoshop-Funktion. Er sollte auch als tif-Datei vorliegen, weil jpg-Dateien gerade an den Kanten kleine Strukturen wie den Buchstaben nicht so genau sind. Wenn das nicht hilft, konvertieren in schwarzweiß (8 Bit) und nochmal den Kontrast verstärken oder in 1 Bit (schwarz/weiß) umwandeln.

Ein gutes OCR-Programm kommt aber auch mit vergilbtem Hintergrund gut klar. Möglicherweise liegt es an veralteter Software. Es gibt auhc Webseiten wo man online OCRen kann:
u.v.a. https://www.onlineocr.net/de/

Grüße vom
Dr. Death
Benutzer-Profile anzeigenAlle Beiträge von Dr. Death anzeigenPrivate Nachricht senden
Wie kann man Buchscans restaurieren?
Du kannst keine Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum nicht antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Alle Zeiten sind GMT + 1 Stunde  
Seite 1 von 1  



Vorheriges Thema anzeigen :: Nächstes Thema anzeigen  
  
   
  Neue Antwort erstellen