<< Themensammlung Organisieren

12.02.08

Windows: Wie man nur den Text aus Dokumenten extrahiert

Mit dem Freewareprogramm "Text Mining Tool" kann man den Text aus Dokumenten wie PDFs, HTML- oder Worddateien extrahieren - und zwar nur den Text.

Im Gegensatz zum schlichten Copy&Paste holt Text Mining Tool nur den Text aus den Dokumenten. Etwaige Formatierungen eingebundener Bilder werden so nicht mitkopiert. Auch ist das Kopieren von im Ursprungsdokument durch Objekte stark fragmentiertem Text mit Text Mining Tool wesentlich leichter.

Einziger Nachteil: Wie man im Screenshot sehen kann, werden Umlaute leider nicht korrekt verarbeitet:

textminingtool

Wer aber damit leben kann, ausgiebig mit Text arbeitet und diesen aus Dokumenten extrahieren muss, für den wird Text Mining Tool die Arbeit wesentlich erleichtern.

Text Mining Tool ist Freeware und Windows only.

» Text Mining Tool - free converter of PDF, DOC, CHM, RTF, HTML files to text

(gefunden bei Lifehacker)

Förderland-Newsletter

Wissen für Gründer und Unternehmer