MAXDictio erlaubt bei der Bestimmung von Worthäufigkeiten und Wortkombinationen eine Lemmatisierung für verschiedene Sprachen einzuschalten. Ist die Option eingeschaltet, werden Wörter auf ihre jeweiligen Grundformen zurückgeführt, sodass Wörter mit gleicher Bedeutung unabhängig von Deklination oder Kasus zusammengefasst werden. So wird beispielsweise für die Wörter „gibt“, „gab“, „gäbe“ nur das Wort „geben“ gezählt und für die Genitiv-Formen „Glückes“ und „Glücks“ wird lediglich „Glück“ ausgegeben.
Die Lemmatisierung in MAXDictio wird mithilfe von Lemmata-Listen durchgeführt, die für folgende Sprachen vorliegen:
- Bulgarisch
- Deutsch
- Englisch
- Estnisch
- Französisch
- Italienisch
- Katalanisch
- Polnisch
- Portugiesisch
- Schwedisch
- Spanisch
- Tschechisch
- Ukrainisch
- Ungarisch
Die Listen liegen im TXT-Format (UTF-8) vor und können beliebig editiert und erweitert werden. Es empfiehlt sich hierfür Sicherungskopien anzulegen, denn die Dateien werden ggf. bei der Neuinstallation überschrieben. Sie finden die Listen im Installationsordner von MAXQDA:
Windows:
C:\Programme\MAXQDA24\Resources\Lemmatization
Mac:
- Programm-Verzeichnis > Rechter Mausklick auf MAXQDA24 > Paketinhalt anzeigen:
- Unterordner Contents / Resources / Lemmatization öffnen
Lemmata-Liste für Deutsch: „Es wurde eine Lemmata-Liste verwendet, die auf den „Deutsche Morphologie-Daten“ von Daniel Naber basiert (http://www.danielnaber.de/morphologie/) und unter der Creative Commons Attribution-ShareAlike 4.0 Lizenz veröffentlicht wurde (http://creativecommons.org/licenses/by-sa/4.0/).“
Lemmata-Listen für andere Sprachen: „Es wurde eine Lemmata-Liste verwendet, die ursprünglich von Michal Boleslav Měchura bereitgestellt wurde ) und unter der Open Database License (ODbL) veröffentlicht wurde (http://opendatacommons.org/licenses/odbl/1.0/).“