<< Themensammlung Organisieren

12.02.08Leser-Kommentare

Windows: Wie man nur den Text aus Dokumenten extrahiert

Mit dem Freewareprogramm "Text Mining Tool" kann man den Text aus Dokumenten wie PDFs, HTML- oder Worddateien extrahieren - und zwar nur den Text.

Im Gegensatz zum schlichten Copy&Paste holt Text Mining Tool nur den Text aus den Dokumenten. Etwaige Formatierungen eingebundener Bilder werden so nicht mitkopiert. Auch ist das Kopieren von im Ursprungsdokument durch Objekte stark fragmentiertem Text mit Text Mining Tool wesentlich leichter.

Einziger Nachteil: Wie man im Screenshot sehen kann, werden Umlaute leider nicht korrekt verarbeitet:

textminingtool

Wer aber damit leben kann, ausgiebig mit Text arbeitet und diesen aus Dokumenten extrahieren muss, für den wird Text Mining Tool die Arbeit wesentlich erleichtern.

Text Mining Tool ist Freeware und Windows only.

» Text Mining Tool - free converter of PDF, DOC, CHM, RTF, HTML files to text

(gefunden bei Lifehacker)

Kommentare

  • Alex

    12.02.08 (21:09:48)

    Ich verwende seit einiger Zeit problemlos PureText: http://www.stevemiller.net/puretext/ Alex

  • Flo

    13.02.08 (11:00:24)

    Ich wüsste nicht wem sowas in Deutschland etwas bringt wenn keine Umlaute möglich sind ;)

  • Marcel Weiss

    13.02.08 (13:09:10)

    Alex: kannte ich noch nicht. Werde ich mal testen. Danke! - Flo: Zum Beispiel Leute, die viel mit englischen Text arbeiten. Gibt sicher noch mehr Beispiele, wenn auch zugegeben sicher nicht so viele.

  • Artur B.

    13.02.08 (16:15:16)

    Hallo, um nur den text aus einem dokument herauszubekommen kann man das kopierte auch einmal im normalen "Editor" einfügen und von daraus nochmal kopieren. Oder verstehe ich den Nutzen dieses Programms falsch?

  • Michael

    14.02.08 (14:27:46)

    Ich kann in diesem Zusammenhang nur ac'tivAid empfehlen (hier das Modul PastePlain), und nicht nur hierfür, auch ansonsten ist das Teil äußerst hilfreich. Genauso wie Ditto, ein äußerst hilfreicher Clipboard-Manager, mit dem kopierte Texte auf einfachste Weise plain eingefügt werden können (und noch vieles mehr). Beide Tools gehören zu meinen MustHaves auf allen Rechnern...

  • Wolf-Dieter Roth

    15.02.08 (20:26:29)

    Wenn es nur darum geht, Texte in MS Würg zu pasten, ohne immer all die bescheuerten Formatierungen mit zu pasten, tut es auch "Inhalte einfügen". Was man sich auch auf ein Kürzel legen kann z.B. ALT-V (statt CTRL-V). Leider muß man dann aber trotzdem noch unter 95 angebotenen Optionen "Unformatierten Text" auswählen. Dabei ist das normal die einzige Variante, die man will. Aber Billy-Boy ist halt so stolz drauf, alle Grafik und Farben mitübernehmen zu können...

Diesen Beitrag kommentieren:

Die Kommentare können nur zwischen 9 und 16 Uhr
freigeschaltet werden. Wir bitten um Verständnis.

Um Spam zu vermeiden, schreiben Sie bitte die Buchstaben aus diesem Bild in das nebenstehende Formularfeld:

Das könnte Sie auch interessieren

Förderland-Newsletter

Wissen für Gründer und Unternehmer