Que peut-on
attendre aujourd'hui très concrètement en matière
d'analyse de questions ouvertes ?
De lutilisation de questions ouvertes
Les études marketing se répartissent en deux grandes
catégories : les enquêtes qualitatives et les enquêtes
quantitatives.
La première catégorie désigne plutôt
les observations recueillies lors de tables rondes ou d'entretiens
semi-directifs en face à face ou, plus rarement, au téléphone.
Ces études concernent généralement un petit
nombre d'interviewés (quelques individus à quelques
dizaines d'individus tout au plus) et servent le plus souvent à
préparer des études quantitatives ultérieures
en dégageant les thèmes d'intérêt, la
terminologie employée par la population cible, etc.
L'information recueillie est généralement très
peu structurée et correspond à l'expression des interviewés
sur des thèmes initiés par l'enquêteur mais
traités ensuite librement par les individus ou les groupes
interrogés.
Les études quantitatives, elles, concernent un plus grand
nombre d'interviewés (plusieurs centaines jusqu'à
plusieurs dizaines de milliers parfois) et s'attachent à
recueillir leurs réponses à des questions précisément
définies. L'objectif est de connaître la répartition
de la population interrogée par rapport aux différentes
réponses proposées.
La technique
du «truffage»
Les études quantitatives conçues par les professionnels
comportent généralement très peu de questions
ouvertes. En revanche, les questionnaires réalisés
par les débutants en matière d'enquêtes en regorgent.
Ainsi, n'est-il pas rare de voir des questionnaires qui proposent
à chaque question fermée, une question ouverte intitulée
«Pourquoi ?» ou «Commentez :», censée
permettre aux interviewés de s'exprimer librement. Ces questions
rassurent le concepteur de l'enquête en lui faisant croire
qu'il évite ainsi le risque de rater des informations essentielles
qu'aurait eu à lui donner la personne interrogée.
En réalité, ce type de «truffage» est
contre-productif à plusieurs titres :
- Les questions
ouvertes systématiques révèlent un manque de
préparation de l'enquête et un manque de précision
dans les objectifs. Leur utilisation diminue la pertinence générale
du questionnaire : les questions fermées sont traitées
avec moins de soin et d'esprit d'exhaustivité que nécessaire,
puisque la présence des questions ouvertes est censée
ramener quand même l'information que l'on a oubliée
d'aller chercher dans la partie fermée du questionnaire.
- Les questions ouvertes rallongent considérablement l'administration
du questionnaire en face à face ou au téléphone
(écriture ou frappe des réponses). Les enquêteurs
sont parfois tentés de raccourcir ou de résumer, pas
toujours de manière pertinente, les réponses exprimées.
- Lorsque le questionnaire est rempli manuellement par un enquêteur
ou, pire encore, en auto-administré par la personne interrogée,
la saisie des réponses manuscrites s'avère souvent
fastidieuse en raison d'écritures parfois illisibles. Les
risques d'erreurs sont ainsi multipliés.
- Le taux de réponse aux questions ouvertes systématiques
est généralement extrêmement faible (de l'ordre
de 10%).
Il n'est pas rare que les réponses exprimées soient
hors sujet, mal formulées (voire incompréhensibles)
ou encore sans contenu (ex : «Rien à signaler»).
En résumé, l'utilisation fréquente de questions
ouvertes «générales» dans les études
quantitatives, loin d'apporter une information essentielle, génère
des pertes de temps importantes et se traduit même parfois
par la perte d'informations qu'il aurait été plus
simple d'obtenir en structurant mieux le questionnaire.
Le recueil
pertinent d'informations complémentaires
La description ci-dessus ne doit pas laisser croire que le recueil
d'informations ouvertes n'a aucune place dans les enquêtes
qualitatives. Simplement, les questions ouvertes doivent être
utilisées à bon escient, souvent dans l'objectif d'achever
de structurer l'information.
Ainsi, lorsque l'on propose une liste d'items (marque utilisée,
magasin fréquenté, caractéristique recherchée,
pays d'origine), le fait de proposer une réponse «Autre,
préciser
» permet de collecter des items complémentaires
non prévus initialement. La liste initiale est généralement
incomplète parce qu'il était impossible de balayer
a priori tout l'univers des réponses possibles. Dans ce cas,
la question est semi-ouverte (ou semi-fermée). Les bons logiciels
denquêtes permettent de gérer lajout dynamique
des nouvelles réponses lors de la saisie. Cette fonctionnalité
est appelée «Enrichissement». Une réponse
ainsi ajoutée sera proposée lors de la saisie du questionnaire
suivant et pourra être cochée. Cela accélère
la saisie et évite de retaper des libellés identiques
avec des orthographes différentes. Le codage se fait en quelque
sorte en direct et les questions ainsi enrichies peuvent être
traitées comme les autres questions fermées.
Bien entendu, il est généralement possible de revoir
les réponses ajoutées pour procéder éventuellement
à un regroupement avant le traitement.
Du
traitement spécifique des questions ouvertes
Vous lavez compris, nous vous conseillons vivement de limiter
lusage des questions ouvertes dans vos enquêtes.
Toutefois, lorsque vous en avez une ou plusieurs à traiter,
les outils denquêtes du marché peuvent vous apporter
de laide, même si certains produits promettent plus
quil ne peuvent tenir.
Avoir les
idées claires
Quel est lobjectif du chargé détudes confronté
au dépouillement dune question ouverte ?
Cest bien sûr de faire ressortir le maximum dinformations.
Mais si lon en reste là, on est susceptible dêtre
séduit par des approches théoriques mélangeant
la statistique avec des notions de linguistique et de sémantique.
Certains éditeurs de logiciels jouent dailleurs avec
les mots en baptisant leurs méthodes «Analyse sémantique»,
«lexicale», ou «de contenu». Lutilisation
dans les interfaces de termes comme «corpus», «réseaux
sémantiques» et autre «lemmatisation» achève
lillusion en donnant à penser que le logiciel sera
capable dextraire automatiquement le sens des réponses
obtenues.
Or il nexiste pas aujourdhui de logiciel capable de
comprendre le sens réel des réponses aux questions
ouvertes. Les outils denquêtes sont capables de compter
la fréquence de citation des mots, de les regrouper en expressions,
de repérer les formes grammaticales, les négations,
etc...
Ils peuvent fournir des représentations graphiques de réseaux
de mots reliés entre eux selon des fréquences dassociation
dans les phrases.
Mais une fois que lon a fait tout cela, on se retrouve au
final avec un magma dinformations, comparable à celui
que lon avait au départ.
Un traitement
«concret»
En réalité, au delà de la manipulation des
concepts linguistico-statistiques, lobjectif est darriver
à «coder» les réponses aux questions ouvertes,
pour pouvoir les utiliser conjointement aux autres variables, dans
les analyses statistiques.
Une fois que lon a pris conscience que loutil informatique
ne peut pas arriver sans intervention humaine à un codage
pertinent, on recherchera les logiciels qui apporteront une aide
concrète au chargé détude (utile pour
un bon nombre dannées encore !).
Certains outils offrent pour cela des fonctionnalités très
intéressantes basées sur la démarche suivante
:
- affichage
de la liste des réponses textuelles obtenues, en les classant
selon différents critères (présence de certaines
expressions par exemple),
- création dynamique dune question qualitative correspondante,
avec possibilité de lui ajouter des modalités nouvelles
en fonction des thèmes trouvés en parcourant les réponses
à la question ouverte,
- possibilité dassocier la réponse textuelle
aux modalités de réponses.
A ce titre, il est indispensable que lon puisse effectuer
lassociation de chaque texte à plusieurs modalités,
pour quune réponse qui porte sur plusieurs thèmes
puisse être correctement recodée. La question de recodage
sera donc obligatoirement multiple.
Les meilleurs
produits permettent deffectuer ces opérations de manière
visuelle, en glissant à la souris les réponses dans
les modalités et en enrichissant de manière dynamique
la liste de réponses. Ils offrent également des outils
pour faciliter la circulation dans les textes de réponses,
permettant de masquer les phrases déjà affectées
ou de repérer automatiquement celles qui comportent certains
mots.
Au final, le chargé détude disposera dune
variable recodée, vraiment utilisable dans les analyses statistiques,
au prix de quelques efforts.
Dans ce domaine comme dans bien dautres, linformatique
apporte donc une aide réelle à condition de rester
concret et de ne pas céder à la tentation de la pensée
magique.
|