Japanische Texte analysieren

Die Funktionen von MAXDictio basieren auf Algorithmen, welche eine Trennung von Worten anhand von Leerzeichen, Satzzeichen etc. vornehmen, wie es beispielsweise für lateinische Sprachen üblich ist. Bei silbenbasierten Sprachen wie z.B. Japanisch finden sich zwischen den Worten keine Leerzeichen, sodass eine einfache Aufgliederung nicht möglich ist.

Um in MAXQDA auch Texte in japanischer Sprache zu analysieren, kann eine Trennung der japanischen Worte mithilfe der Bibliothek „MeCab: Yet Another Part-of-Speech and Morphological AnalyzerMeCab“ (https://taku910.github.io/mecab/) vorgenommen werden. In japanischen Texten können auch Partikel ignoriert werden. Partikel werden zur Bestimmung grammatischer Funktion oder Beziehungen an Worte oder Satzteile angehängt. Optional lassen sich Partikel ignorieren. Partikel haben selbst keine Bedeutung, sondern dienen dazu, einen Satz zu ordnen und die Beziehungen zwischen den Wörtern in einem Satz zu markieren.

Um japanische Texte mit MAXQDA zu analysieren, öffnen Sie die generellen Einstellungen durch Klick auf das Einstellungssymbol in der linken unteren des MAXQDA-Hauptfenster und wechseln in die Abteilung Wort-Trennung. Dort schalten Sie die Option Sprache der Texte ist Japanisch ein. Zum Ignorieren von Partikeln wählen Sie zusätzlich Ignoriere Partikel (Japanisch)

Wenn die Option für japanische Texte eingeschaltet ist, sollten keine nicht-japanischen Texte analysiert werden, da bei diesen die Korrektheit der Ergebnisse nicht gewährleistet werden kann.

Hinweis: Bei den abzutrennenden Zeichen – z.B. bei der Funktion Worthäufigkeiten – empfiehlt es sich, folgende Zeichen zu ergänzen, bei denen es sich trotz ihres identischen Aussehens technisch gesehen nicht um die gleichen Zeichen handelt wie bei den standardmäßig eingetragenen lateinischen Zeichen:
@ ! $ % & / ( ) = ? ^ ‘ ’ “ ” 「 」 『 』 []〔 〕 〈 〉 < > 《 》 ≪ ≫ { } 【 】 ¥# + ― ー* _ : ; ~ 。 . 、 ,

Alle Funktionen von MAXDictio lassen sich für japanische Texte verwenden. Ausnahme bildet lediglich die Einstellung Nur ganzes Wort im Diktionär und im Optionsdialog bei der Funktion „Keyword-in-Context“.

War diese Seite hilfreich?