31.01.11 07:00

, von Martin Weigert

Topicmarks: Automatisierte Textzusammenfassungen

Topicmarks aus Zürich extrahiert auf Basis einer semantischen Spracherkennungsanalyse die wichtigsten Fakten aus beliebigen englischsprachigen Texten.

Manchmal hat man Zeit und Muße, um sich in Ruhe umfangreiche Artikel, Blogpostings, Dokumente, Studien oder anderes Textmaterial zu Gemüte zu führen. Es gibt aber auch Situationen, da muss es schnell gehen, oder der einem vorliegende Beitrag ist zwar wichtig, aber trocken und umständlich formuliert, so dass die eigenen Gedanken leicht abschweifen. Oder - der wohl häufigste Fall: Man hat solche Unmengen an lesenswertem Stoff gesammelt, dass man nicht mehr weiss, wo anfangen mit lesen.

Topicmarks heißt ein junger Dienst der phiScape, der in diesen und ähnlich gelagerten Situationen Rettung verspricht. Der in Beta-Phase befindliche Webservice erlaubt es, beliebige (vorläufig nur englischsprachige) Texte automatisiert zusammenzufassen. So soll Nutzern innerhalb von wenigen Minuten ein Überblick über die in einem Text enthaltenen Informationen gegeben werden. Um mit Topicmarks kostenlos die Zusammenfassung eines Textdokuments zu erstellen, können Nutzer entweder eine Office-Datei in gängigen Formaten (inkl. PDF) auf der Website hochladen, direkt den zu sezierenden Text in ein Formular einfügen oder den Link zu einer Seite im Web angeben. Notwendig ist eine einmalige Registrierung oder der Login mit einem Yahoo- oder Google-Konto.

Texte können auch per E-Mail (eingebettet in die Mail oder als Anhang) eingesandt oder aus Evernote importiert werden. Um mit einem Klick die Analyse eines Onlinebeitrags zu initieren, stellt Topicmarks zudem ein Browser-Bookmarklet bereit.

Ist eine Analyse veranlasst worden, setzt Topicmarks seine semantischen Spracherkennungsalgorithmen in Gang, was je nach Wörteranzahl einige Minuten oder länger in Anspruch nehmen kann. Steht die Kurzfassung zur Verfügung, benachrichtigt Topicmarks darüber per Mail und liefert den Link zum so genannten "Text Knode" - so heißen bei Topicmarks die Zusammenfassungen von Texten.

Jeder Text Knode besteht aus verschiedenen Elementen: Einer listenförmigen Übersicht der im Text erwähnten Fakten, einer kompakten Zusammenfassung in mehreren Absätzen, einer Aufschlüsselung der wichtigsten Stichwörter in Tagcloud- und Indexform sowie aus Meta-Informationen zum Text.

Zum Vergrößern klicken

Sämtliche analysierten Texte werden auf dem Topicmarks-Dashbard dargestellt und dort dauerhaft archiviert. Text Knodes erhalten einen kryptischen, aber frei zugänglichen Link, der jedoch erst etwas umständlich freigelegt werden muss, z.B. indem man auf den Twitter-Button klickt, woraufhin ein Tweet mit der URL zum Knode generiert wird (Beispiel: topicmarks.com/t/TGxwRHxJfDI1MDM5fFV8MjUwMzl8Y2VafA).

Momentan ist die Nutzung von Topicmarks kostenfrei. Mittelfristig strebt der Dienst an, von Intensivanwendern eine Gebühr zu verlangen. Was die Unterstützung weiterer Sprachen neben Englisch betrifft, sind die Topicmarks-Macher ehrlich und unterstreichen, dass die englischsprachige Version ein großer Erfolg werden müsste, bevor die Ausweitung auf andere Sprachen finanziert werden kann, weil dafür aufgrund der unterschiedlichen Struktur von Sprachen völlig neue Algorithmen notwendig sind.

Ich habe einige Texte mit Topicmarks getestet, die Resultate variierten dabei von brauchbar bis unbrauchbar. Insgesamt kann ich mir aber gut vorstellen, mit Topicmarks die Kernpunkte aus Texten zu extrahieren, die ich nicht vollständig lesen möchte und bei denen es auch nicht so schlimm ist, wenn ich die ein oder andere Passage verpasse.

Link: Topicmarks

© 2015 förderland
RSS Feed Beobachten

Kommentare: Topicmarks: Automatisierte Textzusammenfassungen

Seit OS X gibt es zumindest auf dem Mac standardmässig den Dienst "Zusammenfassen" unter dem Applikationsmenü verfügbar für jede Software mit Text. Eventuell muss man den Dienst unter Einstellungen>Tastaturkurzbefehle>Dienste hinzufügen. Hier können Texte absatzweise und satzweise einstellbar gekürzt werden. Auch mehrsprachig. Die Ergebnisse sind jedoch nicht wirklich überzeugend.

Diese Nachricht wurde von habu am 31.01.11 (07:49:33) kommentiert.

Ich gebe mein Hirn an der Garderobe ab und lasse Andere für mich denken. Nein, im Ernst, es wird ohnehin immer schwieriger, in Ruhe zuzuhören oder zu lesen. Es erfordert nun einmal Anstrengung und Zeit, zu verstehen, was der Andere wirklich meint. Diese Dienste werden unsere Probleme vergrößern.

Diese Nachricht wurde von Tilo Timmermann am 31.01.11 (08:13:10) kommentiert.

Ich frage mich: Wollen wir das? Die Informationsflut, die es zu bändigen gilt wird dann noch unkontrollierter wachsen. Wissen wird dann nicht mehr aufgeschrieben, um gelesen zu werden, sondern um daraus “Facts” und “Summaries” abzuleiten. Schreiben wir doch gleich nur noch das auf, was wichtig ist.

Diese Nachricht wurde von Johannes Moskaliuk am 31.01.11 (14:19:20) kommentiert.

Technologischer Fortschritt bringt immer auch Nebenwirkungen mit sich. Ich finde, dass diese jedoch nicht automatisch die Betrachtung der Vorzüge überlagern sollten. Im Übrigen: Aufzuhalten sind Entwicklungen wie diese ohnehin nicht. Insofern stellt sich die Frage, ob wir (als Gesellschaft) dies wirklich wollen, am Ende nicht.

Diese Nachricht wurde von Martin Weigert am 01.02.11 (01:58:40) kommentiert.

Ja und nein: Ja: Ich bin begeistert von der Vorstellung, die drei Paper, die ich heute lesen wollte, in knappen Zusammenfassungen vor mir zu haben, und dann nur noch die Stellen lesen zu müssen, die wirklich wichtig sind. Das Semantic Web wird (wenn auch nicht in naher Zunkunft), unseren Umgang mit Wissen und Infos entscheidend verändern. Vorzüge sehe ich da, und zwar viel. Nein: Technologien sind für den Menschen und nicht andersrum. Die Frage "Wollen wir das" stellt sich für mich immer. Wie eine Gesellschaft die technologischen Möglichkeiten nutzen möchte, ist für mich eine sehr wesentliche Frage, die zu disktutieren ist. P.S.: Kommentare auf wissensdialoge.de willkommen!

Diese Nachricht wurde von Johannes Moskaliuk am 01.02.11 (08:20:28) kommentiert.

Ich nehme an, der Service funktioniert am besten bei suchmaschinenoptimierten Texten, die klar um Keywords herum aufgebaut sind. Schon die klassische Stilvorgabe, Wortwiederholungen zu vermeiden, dürfte das Programm vor ein Problem stellen. Der Schreiber, der seinen Stil gegen die Zumutungen von SEO verteidigt, wird sich bestätigt fühlen: Was als "content" verfügbar gemacht wird, mit dem lässt sich vollautomatisch auch alles machen.

Diese Nachricht wurde von rp am 01.02.11 (21:32:29) kommentiert.

Kostenfreie Nutzung, das bedeutet: 1) "Login mit einem Yahoo- oder Google-Konto". Haha, damit sie meine E-Mails gleich auch den interessierten Organisationen zusammengefasst bereitstellen können? 2) "Sämtliche analysierten Texte werden auf dem Topicmarks-Dashbard dargestellt und dort dauerhaft archiviert." Und damit können andere User sich gleich an den Texten der Mitmenschen erfreuen. Wer dort mehr hochlädt als eine öffentliche Website, handelt ziemlich fahrlässig. Alles in allem also gar nicht beunruhigend, dass es keinerlei Hinweise auf Nutzungsbedingungen/Terms of use auf der Site gibt. Aber immerhin gibt es hier einen aufschlussreichen Testbericht: "die Resultate variierten dabei von brauchbar bis unbrauchbar". Das ist eine ziemlich gekonnte Zusammenfassung!

Diese Nachricht wurde von Oliver am 06.02.11 (19:58:00) kommentiert.

Das ist auf jeden Fall ein sehr interessanter, wenn auch unglaublich schwer zu realisierender Ansatz, insofern ein Anspruch auf hohe Qualität gegeben ist und dauerhaft vom System erfüllt werden soll. Wir setzen bei Liviato auf das Wissen und die Kreativität unserer Nutzer, die Inhaltsangaben von Büchern verfassen.

Diese Nachricht wurde von Michael Romer am 07.02.11 (09:17:27) kommentiert.

Stimme Dir zu! Meiner Meinung nach setzt sich gute Technologie immer durch, sobald die Zeit reif ist.

Diese Nachricht wurde von Susanne am 03.02.13 (22:12:36) kommentiert.
Diesen Beitrag kommentieren:

Die Kommentare können nur zwischen 9 und 16 Uhr
freigeschaltet werden. Wir bitten um Verständnis.

Titel*

Name*

E-Mail*

(Wird nicht veröffentlicht!)

URL

Kommentar*

Um Spam zu vermeiden, lösen Sie bitte folgende Rechenaufgabe:

Förderland-Newsletter

Wissen für Gründer und Unternehmer