10 Dez 2019, 15:29
Wenn viele Dokumente auf einen Rutsch aus einzelnen Dateien eingelesen werden sollen, dann empfiehlt es sich, vorher im Importverzeichnis eine Software für die Duplikatsuche zu nutzen.
Wenn die Daten aus Excel importiert werden, kann mit der Funktion "Bedingte Formatierung/Regeln zum Hervorheben von Zellen/Doppelte Werte" ein entsprechender Check im Arbeitsblatt durchgeführt werden. Diese Funktion vergleicht aber nur Texte bis zu einer Länge von 256 Zeichen, aber man kann ja die Textanfänge vergleichen (z.B. mit der Funktion LINKS()).
Will man tatsächlich viele längere Texte komplett auf Dupletten prüfen, dann funktioniert auch das problemlos mit der freien Statistiksoftware "R" .
Man kann eine Excel-Datei (mithilfe des Pakets "openxlsx") oder viele einzelne Textdateien (mit dem Paket "readtext") in eine "R"-Datei einlesen und dann mit dem der Funktion "distinct" im Paket "dplyr" Dupletten ausfilten.
Das Ergebnis kann man wieder in eine Excel-Datei ausgeben, die dann in MAXQDA verarbeitet wird.