Anzeige

Am Puls von Microsoft

Anzeige

Frage PDF-Dateien verbessern möglich?

Shinowak

nicht mehr wegzudenken
Hallo,

gibt es ein Programm mit welchem ich ein PDF Dokument besser nutzbar machen kann? Die Situation ist folgende. Ich habe von meiner Professorin ein Buch eingescannt, für das Seminar, bekommen kann damit allerdings nahezu nicht arbeiten, da die Seiten nicht als Text, sondern als Bilder gescannt sind. Die folge ist, dass ich nicht direkt zu Kapiteln springen oder Wörter suchen kann. Das markieren und kopieren von Textpassagen bleibt mit auch verwehrt.

Gibt es Programme die mir helfen könnten? Am liebsten freeware :)

Danke schonmal im vorraus...

LG
 
Anzeige
ah ja okay, kleines missverständnis. ich meine, es ist schon pdf, doch erkennt die pdf keine wörter. buchstaben und ähnliches gibt es "offiziell" nicht, eben nur viele kopien der seiten als bild darin.
 
Zuletzt bearbeitet:
Ich habe gerade mal die Prozedur probiert, weil ich selbst sehr oft gescannten Text von meinem Chef bekomme und den nur mit viel Aufwand nachbearbeiten kann.
Wenn ich nach dem Umwandeln von JPG in PDF (natürlich über die Webseite) das Dokument lade und bearbeiten will, wird mir angezeigt:
"Fehler: Das Dokument ist ein gescanntes Bild und kann nicht bearbeitet werden."
Ich kann zwar Textobjekte über den vorhandenen Text legen, aber nicht einzelne Worte oder Buchstaben (mit vertretbarem Aufwand), so wie in einer Textverarbeitung, ändern.
Das Bild bleibt also auch nach dem Konvertieren ein Bild, leider!

Wenn es doch eine Möglichkeit gibt, lasse ich mich gern belehren und wäre über die Belehrung dankbar, weil ich schon lange eine Möglichkeit suche, gescannte PDF zu bearbeiten.
 

Anhänge

  • JPGtoPDF_bearbeiten.JPG
    JPGtoPDF_bearbeiten.JPG
    107,4 KB · Aufrufe: 666
Ich glaube wir kommen zu keinem befriedigenden Ergebnis:
Die Seiten, die Shinowak bekommen hat, sind eingescannt. Kein OCR-Programm ist in der Lage, daraus richtige PDF-Dateien zu machen.
Eigentlich ist das logisch, denn PDF-Dateien enthalten neben dem sichtbaren Text auch versteckten Text und Steuercode sowie Links. Wie soll ein OCR-Programm wissen wohin bei einem Bild eine Seitenzahl zeigt, nur als Beispiel.
Also nach meiner Meinung wird es ein Wunschtraum bleiben.

Nachtrag: genau der Link "OCR" von Slobofree bestätigt meine Meinung.
 
Zuletzt bearbeitet:
Mit "PDF to TxT Converter" kann man PDF zum Text umwandeln, aber ohne die Fotos, nur Text!
 

Anhänge

  • pdf-text.PNG
    pdf-text.PNG
    226,7 KB · Aufrufe: 647
ReadIris pro kann anscheinend mit derartigen PDFs umgehen, sonst würde die PDF-Importfunktion ja keinen Sinn machen, denn editierbares PDF ist ja das Ziel der Operation.

Bei einem HP-Drucker mit OCR versteckt sich die Shell mit dem vollen Funktionsumfang des verwendeten Readiris im HP-Verzeichnis als "Dpe_ocr.exe. Damit geht zumindest bei mir kein Scannen, aber man kann Files einlesen.
Bei einigen HPs ohne OCR läßt sich dieses Paket nachrüsten, wie geht habe ich früher schon mal hier im Forum beschrieben.
http://www.drwindows.de/hardware-and-treiber/24240-fehlendes-ocr-bei-hp-multifunktionsdruckern-nachruesten.html
 
Zuletzt bearbeitet von einem Moderator:
das thema ist zwar schon alt aber ich bin auf der suche nach etwas womit man z.b songbücher die eine schlechte pdf qualität haben verbessern kann. was für möglichkeiten gibt es für sowas und um auch die seiten einheitlich gross zu kriegen ?
 
Guten Morgen @crimsonidol77!
Hast du den Thread von Anfang an gelesen? Dann wirst du gelesen haben, dass es keine kostenlose oder kostengünstige Möglichkeit gibt, PDF-Dateien vernünftig nach zu bearbeiten. Die meisten Shareware-Tools können nur Textmodule, zB einen Absatz löschen und neu einfügen.
Eine richtige Bearbeitung ist nur in Adobe Acrobat oder einem der Drittanbietertools ab 50 € aufwärts möglich.
Beispiele:
Fremde PDF Dateien bearbeiten mit dem PDF Editor
http://www.heise.de/download/pdfeditor-1175927.html
PDF-Editor, Text in PDF bearbeiten | Adobe Acrobat XI
(bei Adobe genau aufpassen. Der Preis ist pro Monat)

Den CAD KAS Editor hatte ich vor Jahren mal kurz getestet, war aber nicht zufrieden, da die PDFs, die ich von meinem Chef erhielt, gescannte Bilder waren.
Beide Programme kann man erst 30 Tage testen. Der Cad Kas Editor fügt eine "Demoversion"-Bemerkung in das Dokument.
 
Was heißt schlechte Qualität, sind die schon eingescannt?
Oder sollen die von einem schlechten Songgbuch ( schon abgenutzt ) eingescannt werden und dann verbessert?

Jede Scanner Software kann Seiten als PDF einscanne, meiner hat sogar einen Knopf am Gerät dafür, wenn die Software das unterstütz die dabei liegt.
Liegt nichts bei: Freeware OCR Scanner Software Scan2Pdf - horland
Nur bearbeiten und ändern ist da dann mit einem Standard PDF Viewer nicht möglich, der dient, auch als Acrobat Raeder, nur der Anzeige.
PDF bearbeiten, eigenes kannst du hiermit machen, mal schauen ob dir das reicht: PDF24 Creator - Download - CHIP
 
Vor einiger Zeit habe ich mal ABBYY FineReader ausprobiert. Der kann den Text aus tif- und aus pdf-Dateien herausholen. Ich hatte das Programm mal Test-Version auf dem PC. Aber das Tool kostet Geld.

Klaas
 
das sind schon eingescannte songbücher (guitar sheet music) und ich habe den PDF Creator und auch Abbey Fine Reader. Zuerst möchte ich allerdings wenn so etwas geht die einzelnen seiten nachdem ich sie beschnitten habe um z.b dunkle ränder zu entfernen auf eine einheitliche Größe bringen wobei mir ein paar prozent abweichung egal wären. es soll aber nicht so sein das der Adobe Reader von den ca. 80% fensterbreite bei einer anderen seite plötzlich auf 50% geht weil die Größe der seite anders ist. ich habe mal ein bild angehangen als bsp und am besten wäre es wenn es so eine art rekonstruktionsprogramm geben würde was so etwas automatisch kaschiert und die größe beibehält und schlechteren text wieder auf hochglanz bringt.(Ich hoffe ich habe mich verständlich ausgedrückt mit dem was ich meine)
 

Anhänge

  • 1998 Slayer - Riff By Riff-030.jpg
    1998 Slayer - Riff By Riff-030.jpg
    987,2 KB · Aufrufe: 428
Sie PDF Reader vergrößern oder verkleinern ja nicht die Größe der Seite als Datei, sondern nur die Größe der Anzeige auf dem Monitor.
Da wird es wohl was geben an ( Profi ) Programmen die das können was du dir vorstellt:
Wenn es Dir darum geht, Deine PDF-Dateien zur späteren Überarbeitung in ein editierbares Format wie bspw. .txt oder .doc zu überführen, ist OCR also das Werkzeug Deiner Wahl.
Versuch mal die OCR-Einstellungen 'ClearScan' oder ähnliches.
Abyy Fine Reader kann die Qualität auch einen guten Teil verbessern.

Gescannte oder fotografierte Texte und PDFs optimieren geht mit: Gescannte oder fotografierte Texte und PDFs optimieren ? Ein kleines Scan Tailor-Tutorial für Windows | Stummkonzert
Scan Tailor kann leider nur TIF-Dateien bearbeiten, daher mußt du zunächst das Ausgangsmaterial in dieses Bildformat umwandeln.
Beim Adobe Acrobat Pro X gibt es bei eingescannten die Möglichkeit, unter WERKZEUGE -> DOKUEMTENVERARBEITUNG -> Gescannte PDF-Dateien optimieren auszuwählen.
 
Bei Notenblättern ist OCR-mäßig nix zu wollen, selbst die Lyrics dürften schlecht zu extrahieren sein. Man kann nur jede Seite als Jpeg etc abspeichern und manipulieren, zb Schärfe, Kontrast. Dem sind aber enge Grenzen gesetzt bei schlechten Vorlagen. Nur wenn große Scans übertrieben weich gezeichnet sind, läßt sich das schärfen ohne daß es dann aussieht wie Grafik vom Atari VCS oder Nintendo Gameboy.
 
Anzeige
Oben