Im Fenster Survey-Antworten kategorisieren können Sie eine Sentimentanalyse von Survey-Antworten durchführen. Dabei wird automatisch bewertet, ob Inhalte als negativ, neutral oder positiv einzuschätzen sind. Die Survey-Antworten lassen sich entsprechend ihrer Sentiments anschließend autocodieren.
Voraussetzung für die Nutzung der Funktion ist, dass alle Antworten einer Frage mit einem Code codiert wurden. Dies ist zum Beispiel der Fall, wenn Sie die Importfunktion für Survey-Daten verwendet haben. Im Regelfall entspricht dann der Name des Codes dem Text bzw. einer Kurzfassung der offenen Frage.
So geht's
- Wählen Sie im Hauptfenster von MAXQDA aus dem Menü die Funktion Analyse > Survey-Daten kategorisieren.
- Ziehen Sie aus dem Codesytem einen Code, mit dem die Antworten auf eine offenen Survey-Frage codiert wurden, in den erscheinenden Dialog:

- Es erscheint die Analyseumgebung für Survey-Antworten. Hier rufen Sie oben rechts im Menü die Funktion Sentiment-Analyse auf:

-
Im erscheinenden Dialog können Sie verschiedene Optionen wählen:
Stellen Sie ganz oben die Sprache der Antworten ein, damit MAXQDA die entsprechende Ressource für die Sentimentbewertung heranzieht.
Hashtags ignorieren – bei eingeschalteter Option werden Hashtags, wie z.B. #bestever, nicht bei der Bestimmung des Sentiments berücksichtigt.
Stopp-Wort-Liste anwenden – bei eingeschalteter Option werden alle Wörter der ausgewählten Stopp-Wort-Liste bei der Bestimmung des Sentiments ignoriert. Auch Hashtags, die einem Stopp-Wort entsprechen, werden ignoriert.
- Nach Klick auf OK wird die Sentimentanalyse durchgeführt und es werden vier weitere Spalten in der Tabelle ergänzt:
- Sentiment: Enthält die Einschätzung der Antwort in fünf Stufen von „Negativ“ bis „Positiv“. Antworten, in denen keine Wörter mit einem Sentimentwert enthalten sind, werden mit der Einschätzung „Kein Sentiment“ gekennzeichnet.
- (Positive) Worte: Anzahl an Wörtern, die als positiv gewertet wurden.
- (Negative) Worte: Anzahl an Wörtern, die als negativ gewertet wurden.
- Differenz: Differenz zwischen positiven und negativen Worten. Wenn die Zahl negativ ist, überwiegen die negativen Worte. Emojis und Symbole zählen dabei als Wörter.

Sie können die Tabelle nach den neu hinzugefügten Spalten sortieren, indem Sie die Spaltenüberschrift mit der Maus anklicken.
Survey-Antworten mit Sentiments autocodieren
Sie können die Zuordnung der Sentiments zu den einzelnen Antworten als Codes im Codesystem von MAXQDA speichern:
- Rufen Sie die Funktion Start > Antworten mit Sentiment autocodieren auf. Es erscheint der folgende Dialog:
- Wählen Sie die Sentiments aus, die codiert werden sollen. Sie können beispielsweise nur die positiven und eher positiven Antworten codieren lassen.
- Nach Klick auf OK werden in der „Liste der Codes“ die gewählten Sentiments als Codes angelegt. Sollten die Sentiment-Codes bereits existieren, werden diese verwendet.
Wie bestimmt MAXQDA die Sentiments?
MAXQDA verwendet zur Bestimmung von Sentiments ein Lexikon, das für jedes eingetragene Wort einen Sentimentwert enthält. Dieser Wert ist negativ für negativ konnotierte Worte, nahe bei Null für neutrale Worte und positiv für positiv konnotierte Worte.
Bei der Analyse einer Antwort prüft MAXQDA für jedes Wort, ob es im Lexikon enthalten ist und weist diesem Wort den Sentimentwert zu (Hashtags und Wörter der Stopp-Liste werden auf Wunsch ignoriert). Wenn das Wort nicht im Lexikon vorhanden ist, schlägt MAXQDA das Wort in einer Lemmataliste nach. Wenn für das Wort ein Lemma gefunden wird und dieses Lemma im Sentiment-Lexikon enthalten ist, wird für das Wort der Sentimentwert des Lemmas gespeichert.
Zusätzlich werden zwei Regeln angewandt, um die Einschätzung des Sentiments zu optimieren:
- Bei einer Negation werden die Werte der nachfolgenden 3 Wörter umgekehrt, sodass beispielsweise die Aussage „I was not very happy“ als negativ eingestuft wird.
- Bei Modalverben, wie „can“, „should“ etc. werden die Sentimentwerte der nachfolgenden Wörter abgeschwächt.
Aus den Sentimentwerten der einzelnen Wörter einer Antwort wird der Mittelwert gebildet und auf dieser Basis die Einschätzung des Sentiments für die ganze Antwort vorgenommen: Bei negativem Mittelwert wird als Sentiment „negativ“ oder „eher negativ“ ausgegeben. Bei positiven Scores wird „eher positiv“ oder „positiv“ ausgegeben. Ist der Mittelwert gleich oder nahe Null, wird der Text als „neutral“ eingestuft. Antworten ohne Wörter mit Sentimentwerten erhalten die Kennzeichnung „Kein Sentiment“.
In der Literatur zur automatischen Sentimentanalyse finden sich meist 60 bis 70% Übereinstimmung im Vergleich zu einer menschlichen Kontrollzuordnung. Dabei ist zu berücksichtigen, dass auch menschliche Einschätzungen des gleichen Textes unterschiedlich ausfallen können. Die Güte einer Sentimentanalyse ist von mehreren Faktoren abhängig, vor allem der Passung des Lexikons für ein bestimmtes Themengebiet. Bitte beachten Sie auch, dass einen Sentimentanalyse wenig Sinn hat für Antworten, in denen kaum bis gar keine Bewertungen zum Ausdruck kommen.
Lexikon für Englisch
Das Lexikon für Englisch basiert auf der Ressource SentiWordNet 3.0, die unter einer Attribution-ShareAlike 4.0 Unported (CC BY-SA 4.0 ) Lizenz steht (weitere Infos zu SentiWordNet finden sich bei Baccianella, Esuli & Sebastiani, 2010). Das Lexikon von SentiWordNet 3.0 wurde für die Nutzung in MAXQDA optimiert, u.a. durch
- Entfernung von Sonderzeichen und Duplikaten
- Ergänzung von typischen Social-Media-Abkürzungen (z.B. LOL – laughing out loud), Emojis und Superlativen
- Manuelle Anpassung von Scores für einzelne Wörter an Scores ihrer Synonyme
Sie können die von MAXQDA für die Sentimentanalyse verwendeten Lexika einsehen und anpassen. Die Lexika befinden sich im Unterordner „Resources > SentimentScore“ des Installationsordners von MAXQDA:
Windows
C:\Programme\MAXQDA2020\Resources\SentimentScore
macOS
Programm-Verzeichnis > Rechter Mausklick auf MAXQDA 24 > Paketinhalt anzeigen:
Contents / Resources / SentimentScore
Von den Lexikon-Dateien wird nur die Spalte “total_score” berücksichtigt. Wenn man einen total_score für eigene Wörter ergibt, ist es sinnvoll, sich an bereits existierenden vergleichbaren Wörtern zu orientieren. Die Spalten “PosScore” und “NegScore” wurden nur zur Berechnung von “total_score” verwendet, sie können auf 0.0 gesetzt werden.
Literatur
Baccianella, S.; Esuli, A.; Sebastiani, F. (2010). SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining. Proceedings of LREC. 10.
http://nmis.isti.cnr.it/sebastiani/Publications/LREC10.pdf