<< Themensammlung Netzwertig

Unter netzwertig veröffentlichen wir in unserem Blog Einschätzungen zu aktuellen digitalen Geschäftsmodellen und IT-Trends, Meldungen, Analysen, Reviews und Specials.

27.05.10Leser-Kommentare

Sentimentanalyse: Emotionen statt Fakten

Je weiter sich partizipative Medien ausbreiten, desto größere Bedeutung erhält die maschinelle Analyse der Emotionen, die über Tweets, Status-Updates, Kommentare und Blogbeiträge transportiert werden.

Ähnlich wie das statische Web und herkömmliche Internetsites durchsucht werden können, lässt sich auch das Social Web nach Schlüsselworten filtern. Die Echtzeitkomponente sowie die Frage der Gewichtigung solcher Suchergebnisse stellen hierbei zwar neue Herausforderungen dar, aber sowohl etablierte Suchmaschinen als auch spezialisierte Anbieter des Real-Time-Web tun alles, um diese Nuss zu knacken.

Mit dem Aufstieg des sozialen Internets steigt aber nicht nur der Bedarf an Möglichkeiten, um Status-Updates und Nutzer-Kommentare bei sozialen Netzwerken, Microbloggingdiensten, in Blogs und auf Videosites durchsuchbar zu machen. Auch das Interesse, die Stimmung und Emotionen solcher Äußerungen aufzufangen, ist groß.

Für Unternehmen, Organisationen und Personen ist es nämlich nicht nur interessant, wer wo und wann auf sie bezogene Inhalte bei Facebook, Twitter, Tumblr, Posterous, YouTube und vielen anderen Social-Web-Plattformen publiziert hat, sondern auch, ob es sich dabei um Kritik oder Lob, um positive oder negative Äußerungen handelte.

"Sentiment Analysis" oder "Sentimentanalyse" nennt sich die Technologie, um derartige Schlüsse ziehen zu können. Grundlage sind Analysen von Polarität, Subjektivität oder der Art gewählter Wörter. Anhand dessen lassen sich mit Hilfe von Algorithmen zumindest tendenzielle Auskünfte über die Emotionen geben, die durch einen bestimmten Text ausgedrückt werden.

Zwar ist die Zielgenauigkeit heutiger Dienste zur Sentimentanalysen eher schwankend und weit von hundert Prozent entfernt, aber selbst im aktuellen Entwicklungsstadium eröffnen sich bereits einige spannende Anwendungsszenarien.

Tweetfeel beispielsweise ist ein kostenloses Analyse-Tool für Twitter, um zu beliebigen Suchwörtern die allgemeine Stimmungslage der diese enthaltenden Tweets unter die Lupe zu nehmen. Passend zur Vielzahl der Erwähnungen der gerade abgeschlossenen US-Fernsehserie Lost in meinem persönlichen Twitter-Stream zeigt eine Tweetfeel-Suche nach "Lost" den allgemeinen Tenor zur Sendung in der Twittersphäre.

Aktuell erhalte ich ein Verhältnis von rund 63 Prozent negativer Tweets. Wie man an den dazu eingeblendeten Twitter-Nachrichten sehen kann, orientiert sich Tweetfeel primär an eindeutigen Wörtern wie "love", "hate" oder "better". Eine Analyse deutschsprachiger Tweets ist mit dem Service somit nicht möglich.

Ein anderes Beispiel ist ContextSense, ein Werkzeug, das beliebige Websites hinsichtlich ihrer allgemeinen Polarität analysiert und das Ergebnis als Prozentwert zwischen 0 (negativ) und 1 (positiv) ausgibt. Leider stellt auch hier die Sprache eine Barriere dar: ContextSense scheint sich lediglich auf englische Sites anwenden zu lassen, wie die ebenfalls angebotene Analyse der behandelten Themenkomplexe für netzwertig.com zeigt: So will der Service bei uns Inhalte über Robotik und Astrologie gefunden haben....

Einen weiteren spannenden Ansatz präsentiert RankSpeed, eine Suchmaschine, bei der man Suchbegriffe mit zusätzlichen, emotionsgeladenen Adjektiven erweitert. So lässt sich mit RankSpeed nach "Smartphones" suchen, die "excellent", "easy" oder "cool" sind. RankSpeed analysiert dazu die Äußerungen in Blogs und Twitter und erlaubt die herkömmliche Websuche sowie eine Produktsuche.

Über die Qualität der Suchergebnisse kann man zwar geteilter Meinung sein, aber RankSpeed gibt immerhin einen inspirierenden Vorgeschmack auf das, was mit einer fortschreitenden Entwicklung der Sentimentanalyse sowie einer weiteren Ausbreitung partizipative Medien alles möglich sein wird.

Voraussetzung für eine nützliche und akkurate Emotionsanalyse ist eine möglichst umfangreiche Datenbank an Wörtern und Sprachen, die zudem unterschiedlichste Abkürzungen, Umgangssprache sowie sich ständig verändernden Jugendslang beherrscht. Hinzu kommt semantische Technologie, um den Gesamtkontext verstehen zu können. Es soll ja nicht pauschal jedes Status-Update mit den zwei Wörtern "love" und "lost" in die Sentimentanalyse zum Serienfinale von Lost einbezogen werden, denn letztlich kann es im jeweiligen Tweet auch um etwas ganz anderes gehen.

Die Sentimentanalyse wird sich in den nächsten Jahren noch stark weiterentwickeln. Mittelfristig könnte das Verfahren zu einem der wichtigsten Tools für Firmen, Marktforscher, Werber, Politiker und Organisationen werden. Dann reicht ein Klick, um aggregiert zu erfahren, welche Emotionen Menschen zu einem beliebigen Zeitpunkt im Bezug auf eine Marke, ein Produkt, einen Service oder eine Partei mit sich herumtragen.

(Illustration: stock.xchng)

Kommentare

  • Philipp

    27.05.10 (16:20:34)

    Intelligente Ideen haben damit zum Beispiel auch Meta-Bewertungsdienste www.trustyou.de oder diverse social Media Analytics tools, die im Unternehmensumfeld eingesetzt werden.

  • dasparadoxon

    27.05.10 (23:18:10)

    Danke für die Zusammenfassung. Dann lasst mal Anfangen ein Tool zu schreiben, das die Ergebniss dieser Tools nutzt, um mit intelligenten Bots und (menschlichen) Agenten diese Ergebnisse durch generierten Content zu beeinflussen.

  • Mike Schwede

    28.05.10 (14:23:46)

    Schöne Zusammenstellung. Wichtig bei Sentimentanalysen finde ich, dass richtige Textanalytics-Systeme dahinterstecken, die nicht nur die Wörter, sondern die Sätze interpretieren. Damit auch "netzwertig ist nicht schlecht" nicht als negativ gekennzeichnet wird. Wenn man dann so ein System anwirft liefert es bei internationalen Brands eine gutes Gefühl was abgeht und wie sich die Stimmung in der Zeit entwickeln hat. Beispiel BP: http://www.slideshare.net/orange8interactive/quick-social-media-brand-analysis-on-bp Automatische Sentimentanalysen machen aber nur Sinn, wenn sie sehr breit abgestützt sind. Eine Analyse auf der komplexen deutschen Sprache über einen mittelbekannten Brand nur in der Schweiz hat eine zu tiefe Datenbasis und Querschläger wie Sarkasmus fallen zu stark ins Gewicht. Tools, die behaupten, sie hätten das im Griff übertreiben. Am besten macht man einfach selber mal einen Test. Deshalb setzen wir bei orange8 hier auf manuelle Sentimenteinschätzungen, die wir für unsere Kunden erledigen. Und auch die manuelle Einschätzung ist manchmal gar nicht so einfach. Ich denke daher, dass Programme das nie so differenziert wie ein Mensch hinkriegen wird. Für globale Brands ist es aber eine praktische Bereicherung.

  • Martin Weigert

    28.05.10 (15:13:56)

    Danke für eure Ergänzungen!

  • Tobias Knobloch

    28.05.10 (15:32:21)

    Gerade durch die Kürze des Ausdrucks, besonders sinnfällig bei Diensten, die von vornherein zeichenbegrenzt sind (z.B. Twitter oder twick.it), wird eine echte semantische Sinnanalyse von Aussagen im Zusammenhang ihrer Äußerung erschwert. Ob etwas positiv oder negativ gemeint ist, darüber entscheidet dort, wo jedes Zeichen zählt, oft nur dieser Zusammenhang von ganzen threads. Das aber bedeutet, dass eine Filterung nach Keywords hier nicht viel bringt. Die semantische Analyse von user generated internet content steht - ob es sich um Emotionen oder anderes handelt - vor großen Herausforderungen, bevor das Web 3.0 ausgerufen werden kann. Wenn Kontext immer mehr den Inhalt mitbestimmt, wie propagiert wird, dann hilft eine Suche nach Schlüssewörtern herzlich wenig. Ein im starken Sinne verstehendes Web wird daher noch eine Weile brauchen.

  • Stefan

    28.05.10 (15:41:54)

    Das Interessante an der Sentimentanalyse ist der Fakt, dass die meisten Tools und 3rd Party APIs dies nicht hinbekommen. Gerade Tippfehler, Variationen, Ironie usw...werden normalerweise nicht erkannt. Wir nutzen bei auch Menschen, um die Resultate der Sentiment APIs nochmals zu überprüfen. Anders geht es leider (noch) nicht.

  • Martin Weigert

    28.05.10 (15:43:31)

    Ich denke auch, dass ein menschlicher Eingriff sinnvoll ist. Gleichzeitig ist das dann natürlich nicht mehr genau so ein Big Deal wie maschinelle Sentimentanalyse. Wenn sie denn funktioniert ;)

  • Marcus Haberkorn

    29.05.10 (13:13:35)

    Ist Jonathan Harris "We feel fine" (2006) bekannt? http://www.wefeelfine.org/

  • Nick Nickson

    04.08.10 (13:18:00)

    Danke für die kurze Übersicht. Nach allem was ich bis jetzt gesehen habe und mir vor allem von irgendwelchen Vertrieblern erzählen lassen musste, ist das meiste was im Unternehmensumfeld eingesetzt ist statistischer Firlefanz, der mehr zufällig agiert. Von linguistischen Analysen auf Satzebene ist da nicht viel zu spüren. Ich versuche genau diese linguistische Tiefe in mein System zu integrieren, indem ich auf der einen Seite positive und negative Wörter kenne und lerne, aber auf der anderen Seite auch jede menge Regeln auf Satzebene benutze, um die Tonalität anzupassen (Verneinung, Konjunktiv etc..) Das ganze steckt im allgemeinen (vor allem auf deutsch) aber noch so in den Kinderschuhen, dass das ganze als "REIN AUTOMATISCHER SERVICE" auf keinen Fall verkauft werden darf. Die kleinen Spielerreien wie Tweetfeel und dergleichen sind natürlich völlig OK und lustig.. Nick

  • Sean Kollak

    16.08.10 (15:28:44)

    Hallo Martin, toller Artikel. Habe ihn kurzerhand in meinem letzten Blog-Post verlinkt. http://bit.ly/semantic_web Darin berichte ich über das Interview mit Peter Kruse über die Entwicklung des Internets.

  • Martin Weigert

    16.08.10 (15:36:08)

    Ebenso, interessanter Artikel! Danke für den Hinweis.

Diesen Beitrag kommentieren:

Die Kommentare können nur zwischen 9 und 16 Uhr
freigeschaltet werden. Wir bitten um Verständnis.

Um Spam zu vermeiden, schreiben Sie bitte die Buchstaben aus diesem Bild in das nebenstehende Formularfeld:

Das könnte Sie auch interessieren

Förderland-Newsletter

Wissen für Gründer und Unternehmer