AI Assist - Efficient, secure, ready to use. Try it now.

À la recherche d’une approche hybride pour l’analyse de gros corpus de données textuelles : l’exemple de l’évaluation environnementale de l’éolien au Québec

Gros corpus de données qualitatives : richesse ou contrainte ?

Les données textuelles et verbales sont centrales dans les recherches en sciences sociales. Cependant, l’exploration de corpus volumineux implique un investissement important, à la fois en temps et financier, qui limite considérablement leur usage ou le rend dépendant de financements conséquents. Dans ce contexte, il nous semblait particulièrement intéressant d’examiner le potentiel des approches hybrides d’analyse de contenu (manuelle et assistée par ordinateur) et des méthodes mixtes pour faciliter l’analyse de ces gros corpus de données textuelles, dont la richesse est paradoxalement un obstacle à la connaissance.

Gros corpus de données textuelles

Le projet qui va être présenté se comprend ainsi dans un effort plus vaste pour déterminer le potentiel de l’analyse de données textuelles assistée par ordinateur dans nos champs de recherche. Dans une précédente analyse bibliographique, nous avions exploré le potentiel de l’analyse lexicale automatisée pour examiner les publications scientifiques des membres d’un groupe de recherche en développement territorial (Fournis et Dumarcher, 2017). Le présent projet vise (1) à approfondir cette exploration en examinant le potentiel des outils d’analyse semi-automatisée disponible dans certains logiciels QDA, comme MaxQda, (2) à explorer des assemblages et combinaisons d’outils informatiques, pour voir dans quelle mesure ils permettent d’optimiser et de faciliter l’analyse de ces gros corpus.

Nous commencerons par quelques mots sur le projet, avant de détailler l’utilisation que nous avons faite de MaxQda …

Le projet « Penser comme le BAPE. La construction de l’expertise du Bureau d’Audiences Publiques sur l’Environnement »

En plus des objectifs méthodologiques que nous venons de développer, ce projet visait également à approfondir nos connaissances sur le Bureau d’Audiences Publiques sur l’Environnement (BAPE), organisme indépendant d’évaluation environnementale et d’aide à la décision du gouvernement du Québec (Canada). Il s’agissait étudier la structure de la connaissance produite par les acteurs publics lors d’un grand projet – ici l’ensemble des rapports produits au BAPE dans le cadre des projets de parcs éoliens au Québec (1997-16)

Wind turbines

Nous avons réalisé une étude de cas de la filière éolienne, via les 21 rapports émis dans le cadre des audiences publiques entre 1997 et 2016. Cette analyse vise à examiner l’évolution conjointe des enjeux abordés (contenu thématique : enjeux techniques, environnementaux, territoriaux) et des connaissances et expertises mobilisées (contenu bibliographique : expertise publique, privée, citoyenne, 3 technique, scientifique, etc.) Le but est d’identifier les cadrages sociotechniques privilégiés par l’action publique, ainsi que leurs variations et évolutions selon les projets et les périodes.

Cette analyse s’est donc faite en deux volets, l’expertise et les enjeux, correspondants à deux méthodes :

  1. Pour examiner les enjeux abordés dans les rapports, nous avons utilisé l’analyse automatisée de données textuelles (avec le logiciel Iramuteq).
  2. Pour examiner l’expertise mobilisée dans les 21 rapports, nous avons recensé (de façon semi-automatisée avec MaxQda) et analysé les 5867 références bibliographiques et documentaires listées, ainsi que leurs 9192 citations au fil du texte.

Voyons plus en détail comment MaxQda a été mobilisé avec succès dans ce volet sur l’expertise.

Comment avons-nous utilisé Maxqda pour retrouver, coder et extraire les citations ?

Concrètement, MaxQda a été utilisé pour identifier, coder et extraire les citations au fil du texte des rapports. C’est la fonction « recherche lexicale élargie » qui nous a permis d’identifier automatiquement les citations, avec l’utilisation de caractères spéciaux et d’expressions régulières. Les citations recensées ont été codées avec la fonction « autocode », selon le type de document auquel elles renvoient. Le BAPE classe les documents en plusieurs catégories selon leur origine et vocation (documents de procédure, déposés par le promoteur, par les participants, transcriptions de séances, mémoires, bibliographie …) Ces documents sont référencés et classés avec un format relativement standardisé (des chaînes de lettres et chiffres), ce qui a simplifié la recherche et le codage automatique.

Les résultats du codage ont ensuite été explorés avec les outils d’analyse et de visualisation de MaxQda (cf. Illustration 1), qui ont permis d’examiner les similitudes entre rapports (navigateur de la matrice des codes, matrices de similarités et de distance), et de comparer la structure interne des rapports (portraits de documents). Cela a été éclairant sur les types de documents les plus cités et les tendances associées, mais restait trop limité : ces premiers résultats s’appuyaient seulement sur la classification des documents du BAPE et n’apportaient qu’un éclairage très partiel sur notre objet.

Illustration 1 : Portrait de document et matrice de distance dans MAXQDA.Illustration 1 : Portrait de document et matrice de distance dans MAXQDA.

Nous voulions aller plus loin et examiner les types d’expertise mobilisés et les types d’acteurs impliqués. Pour cela, nous avons profité de la richesse des fonctionnalités d’export de MaxQda pour poursuivre l’analyse dans un logiciel de type tableur. Nous avons construit une base de données dans le tableur, avec un fonctionnement similaire à une base de données relationnelle (très simplifiée), qui met en relation trois entrées :

  1. les rapports du BAPE (et leurs caractéristiques),
  2. les références bibliographiques et documentaires listées dans les rapports (codées manuellement selon le type d’expertise et d’acteur auquel elles renvoient : public, privé, citoyen, technique, scientifique, etc.)
  3. les citations de ces références au fil du texte, extraites grâce à MaxQda, recodées automatiquement selon le type d’expertise de la référence à laquelle elles renvoient.

L’export des segments codés, dans MaxQda, inclut également des informations sur la situation des segments dans les rapports (indicateurs de début et de fin). Cela nous a permis d’examiner l’évolution des types d’expertise mobilisés au fil du temps, ainsi que les variations selon les projets et leurs caractéristiques (cf. image). Nous avons pu voir plus clairement les tendances 5 et évolutions, et des périodes distinctes se dessiner au fil de la structuration de la filière éolienne.

Avec quelques efforts de conversion et de mise en forme, nous avons aussi également pu visualiser la densité à laquelle les différents types d’expertise sont mobilisés au fil du texte des rapports, et leur cooccurrence : cela a permis de voir lesquelles sont mobilisées conjointement, sous forme de « dialogue » (cf. Illustration 2).

Illustration 2 : Exemples de “dialogue” entre différents types d’expertise, via la co-occurrence et la densité des citations dans les rapports.Illustration 2 : Exemples de “dialogue” entre différents types d’expertise, via la co-occurrence et la densité des citations dans les rapports.

Résultats

Les résultats ont montré que, conformément à nos hypothèses, la structure de l’expertise mobilisée évolue au fil du temps, conjointement à l’évolution des enjeux abordés. Il y a ainsi une sorte de stabilisation progressive de la filière éolienne : l’émergence et la stabilisation d’enjeux successifs, passant par la mobilisation d’expertises variées et de fluctuations dans l’ampleur de la participation citoyenne.

Cela nous semble confirmer le potentiel des méthodes mixtes et des approches hybrides de l’analyse de contenu, à la fois pour la science politique et l’analyse de l’action publique (comme dans le cadre de ce projet) mais aussi pour l’analyse bibliographique et bibliométrique (cf. le croisement entre analyse des références et analyse thématique). 

La suite ?

people celebrating

Nous continuerons à explorer le potentiel de ces méthodes dans la prochaine étape du projet, qui intégrera la participation publique : l’analyse du contenu des mémoires (déposés dans le cadre des audiences) visera à comparer les enjeux abordés dans les mémoires et ceux mis en avant dans les rapports. Il est également envisagé d’analyser les rapports et mémoires du BAPE pour d’autres secteurs énergétiques et d’exploitation des ressources.

About the Author

AmélieAmélie Dumarcher est formatrice certifiée pour MAXQDA. Titulaire d’une Maîtrise en Géographie appliquée (MA, Université d’Avignon – France), elle prépare actuellement un Doctorat en Sciences régionales, au croisement entre la Géographie et la Science politique (Université du Québec à Rimouski – Canada). Ses recherches portent sur la gouvernance des ressources dans les régions périphériques du Québec et du Canada, ainsi que sur les modes de développement historiques et les dynamiques actuelles de ces territoires périphériques. Elle a un intérêt marqué pour les approches multidisciplinaires et les méthodes mixtes, ainsi que pour les solutions créatives qu’autorise l’utilisation des “digital tools” en sciences humaines et sociales.

Ce projet a été réalisé en collaboration avec Yann Fournis (Université du Québec à Rimouski) et Sébastien Chailleux (Université de Pau et des Pays de l’Adour), avec la participation financière du Centre de Recherche sur le Développement Territorial (CRDT).

Pour plus d’information sur le projet et ses mises à jour, nous vous invitons à visiter : https://www.researchgate.net/project/Penser-comme-le-BAPE-La-construction-de-lexpertisedu-Bureau-dAudiences-Publiques-sur-lEnvironnement-Quebec-FR-EN

Références

CHAILLEUX Sébastien, DUMARCHER Amélie, FOURNIS Yann, 2017. La construction de l’expertise du Bureau d’Audiences Publiques sur l’Environnement (Québec) Le cas des projets éoliens (1997-2016)., presented at the « 14ème Congrès de l’AFSP », Montpellier (France).

FOURNIS Yann et DUMARCHER Amélie, 2017. Le territoire du CRDT. La construction d’un espace intellectuel, entre science et territoire., Rimouski (QC): Éditions GRIDEQ-CRDT, 161 p.

 

Traduction de l’article original, publié en janvier 2019, disponible en anglais sur : https://www.maxqda.com/blogpost/environmental-assessment/

MAXQDA Newsletter

Our research and analysis tips, straight to your inbox.