Hallo zusammen,
Sehr geehrte Damen und Herren,
in einer Studie möchten wir viele unterschiedliche Arten von Dokumenten untersuchen. Um Worthäufigkeiten und Wortzusammenhänge untersuchen zu können, müssen wir die Dokumente, die alle als PDF vorliegen, in eine Txt-Datei umwandeln (Zeilenumbrüche werden im PDF nicht erkannt von Maxqda).
Ein großes Problem, das bei der Umwandlung entsteht, ist, dass einige Seiten des PDF nicht in txt konvertiert werden und/oder Spalten nicht also solche erkannt werden. Häufig werden bei mehrspaltig gesetzten Seiten in der pdf-Datei die Zeilen in der txt-Datei horizontal über alle Spalten ausgelesen.
Bei etwa 400 zu analysierenden Dokumenten wäre das manule Ändern ein riesen Aufwand. Gibt es Menschen hier, die damit Erfahrungen gemacht haben und eventuell helfen könnten? Das Programm Abbyy Finereader wurde uns bereits empfohlen, bringt aber andere Probleme wie der Falscherkennen von Buchstaben mitsich.
Viele Grüße
Simon
Version: MAXQDA 2020
System: Windows 10