pdftotext: verwandelt .pdf in .txt

Achtung: Dieses Blog liegt brach. Neue Beiträge und Aktualisierungen der alten findet Ihr unter kazam.de. Bitte in Zukunft dort vorbeischauen, dort kommentieren und dahin verlinken. Vielen Dank. Bis gleich auf kazam.de.

Ab und zu kommt es vor: Broschürenüberarbeitung, natürlich existiert kein Word-Dokument. »Sie können sich ja die Texte aus dem PDF holen.« Ja, Seite für Seite markieren, kopieren, Programm wechseln, einfügen, wieder zurück. Das kann bei längeren Testen schon etwas nerven. Zum Glück hat Carsten Blüm einen Installer für pdftotext erstellt. Er schreibt dazu:

»Pdftotext« ist ein Shell-Programm für die Konvertierung von PDF-Dokumenten (Portable Document Format / Adobe Acrobat) in reinen Text. Es ist Open Source Software.

Und ungemein praktisch, da es auch PDFs mit komischen deutschen Sonderzeichen konvertiert. Sehr zeitsparend bei umfangreichen PDFs, die weiterbearbeitet werden sollen.

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s