|

Introduction
LE
PAPIER, MÉDIA
INCONTOURNABLE POUR LA COLLECTE D'INFORMATION
L'information est une arme
de compétitivité pour les entreprises, et les
informations pertinentes ne se trouvent pas toujours
à portée de main. Elles sont bien sûr dans l'entreprise
elle-même, contenues dans ses systèmes d'information,
mais également sur le terrain, à savoir chez les
concurrents, les clients, les commerciaux, les
utilisateurs. Ces données externes sont récupérées
de multiples façons :
- la réponse à un formulaire électronique sur
le site web,
- une conversation téléphonique avec un agent
d'un centre d'appel,
- une demande écrite d'information,
- une réclamation,
- la réponse à une enquête de satisfaction.
Si de plus en plus, ces flux d’informations entre
l’entreprise et son environnement sont électroniques,
le mode écrit reste irremplaçable et inévitable,
pour au moins quatre raisons :
1/ Culturelles :
le papier et le stylo restent les outils de travail
et de réflexion préférés de nombreux cadres acheteurs
ou dirigeants. Pour s’assurer de la conservation
d’un document, le réflexe le plus courant reste
de l’imprimer et le placer dans un dossier.
2/Légales :
le papier étant obligatoire pour de nombreux documents,
son utilisation déborde naturellement de ce cadre
et concerne toute l’entreprise.
3/ Pratiques :
dans la recherche d’informations sur le terrain,
comme le sondage en sortie des urnes, l'enquête
client-mystère, les enquêtes de satisfaction dans
les gares et aéroports, le papier s'impose, surtout
si le questionnaire impose une saisie manuscrite
de texte.
4/ La confidentialité des réponses :
le papier est l’un des seuls média qui garantisse
l'anonymat. L'entreprise est ainsi confrontée
à l’impératif de numériser des données externes
au format papier et le faire économiquement. Pour
l'y aider, elle peut faire appel à des technologies
de gestion électronique de documents et de Workflow.
LA
TECHNOLOGIE DE LECTURE AUTOMATIQUE DE DOCUMENTS
La gestion électronique de
documents est un domaine en progression rapide,
à un rythme de 25 à 30% par an en France. Parmi
ses applications, l'acquisition des informations,
c'est à dire la lecture automatique de documents
(LAD) est sans doute celle qui se développe le
plus. Elle est déjà largement utilisée :
- Dans les entreprises de vente par correspondance
ou les Caisses d'Assurance Maladie où elle permet
d'automatiser la saisie de documents écrits.
- Dans l'enseignement (évaluations ),
- Dans le domaine hospitalier (demandes d'analyses...)
- Dans l'univers spécifique du vote d'assemblées.
- Dans le domaine des études et des enquêtes,
la lecture optique est apparue sous la forme de
lecture de marques ou OMR pour Optical Mark Reading.
Cette technologie permet de créer des questionnaires
sur le principe des cases à cocher, qui peuvent
être saisis une fois complétés à des vitesses
de lecture de l'ordre de 7.000 pages recto-verso
à l'heure.
Un questionnaire qui comporterait 250 cases à
cocher par page (il pourrait en avoir en théorie
jusqu'à 3840), sera donc saisi à la vitesse d'environ
deux millions de caractères à l'heure. Avec un
lecteur optique doté d'un logiciel OMR, on peut
donc sans aucun problème envisager de saisir plusieurs
dizaines de milliers de questionnaires en quelques
jours avec le support d'un seul et unique opérateur.
L'analyse du contenu du document lu se passe au
niveau du lecteur optique qui dispose d'une intelligence
propre et dédiée (microprocesseur intégré). Cela
permet une saisie en toute fiabilité sans remettre
en cause la productivité, puisque le lecteur travaille
par exception et ne déclenche une intervention
manuelle que lorsqu'un problème se présente.
- En synthèse, la lecture optique permet de diviser
par dix le coût d’acquisition de questionnaires
par rapport aux technologies classiques.

Le dépouillement
rapide des questionnaires
Un équipement de lecture automatique
est composé d'un micro-ordinateur, d'un logiciel
de pilotage de la lecture et d'un périphérique
de lecture qui peut être un lecteur optique ou
un scanner.
LE FONCTIONNEMENT DE
LA LECTURE OPTIQUE
Le lecteur se connecte simplement
au micro-ordinateur par le port série, sans paramétrage
ou installation particulière.
En début de session de lecture, l'utilisateur
lance son logiciel de lecture optique et télécharge,
en quelques secondes, dans la mémoire du lecteur,
le programme de traitement du questionnaire à
lire.
A partir de ce moment, le lecteur est capable
d'analyser le questionnaire correspondant, de
détecter les incohérences (ex : double marquage)
et d'envoyer instantanément au micro-ordinateur
les seules informations utiles. Ce processus de
décodage en amont permet de définir le niveau
de performance au niveau du lecteur et non par
rapport à l'ordinateur utilisé.
Par ailleurs, en raison des systèmes d'identification
optique utilisés, la technologie OMR présente
un niveau de fiabilité très élevé du résultat
de la lecture. Le matériel de lecture lui-même
est également extrêmement robuste et s'apparente
d'avantage à un équipement industriel qu'à un
appareil bureautique.
Un lecteur OMR peut être manuel, semi-automatique
ou automatique. Dans ce dernier cas, il peut disposer
d'un bac de rejet, destiné à recevoir les questionnaires
écartés automatiquement car mal remplis ou détériorés
(qui peuvent être repris ensuite par un opérateur).
La plupart des modèles de lecteurs acceptent une
double tête de lecture, permettant de lire en
un seul passage les deux faces d'un questionnaire.
Certains modèles peuvent également disposer d'une
ou plusieurs têtes spéciales code barre permettant
de lire des codes de personnalisation imprimés
ou collés sur le questionnaire (etiquettes).
Enfin, les appareils les plus sophistiqués peuvent
intégrer une tête de lecture OCR, permettant de
décoder une ou plusieurs lignes d'un texte dactylographié
sur le questionnaire, dans des polices de caractères
définies.
En France, dans le domaine spécifique de la saisie
automatique de questionnaires d'enquêtes, la technologie
OMR permet déjà le dépouillement rapide des questionnaires
de plusieurs très grands instituts d'études. Cependant,
en raison du coût relativement élevé des lecteurs
(60 à 250 KF), l'OMR reste lié dans l'esprit des
décideurs à la notion de volumes importants.
LA
SCANNÉRISATION
Tout le monde connaît les périphériques de scannage
de documents qui récupèrent l'image d'un document
pour la restituer à l'écran ou sur papier : scanners
bureautiques, fax, copieurs numériques...
Lorsqu'on parle de lecture automatique de questionnaires
ce type d'appareil sert de référentiel dans l'esprit
des non-initiés. En effet, si je peux scanner
une image, pourquoi ne pourrais-je pas scanner
un questionnaire ?
En réalité, le problème n'est pas de savoir récupérer
l'image du document mais de le faire vite, et
de savoir analyser son contenu en le récupérant
dans l'application appropriée.
Contrairement aux lecteurs optiques, les scanners
ne disposent pas d'une intelligence “embarquée”.
Il faut donc scanner l'image, la transmettre à
l'ordinateur de la manière la plus rapide et la
plus compacte possible puis la décoder à ce niveau.
Or l'image d'une page A4 “pèse” plusieurs centaines
de milliers d'octets (à comparer aux quelques
dizaines d'octets que transmet un lecteur optique
!). Pourtant, la technologie de la scannérisation
a de nombreux atouts dont le premier est sans
doute la possibilité de prendre en compte les
réponses à des questions ouvertes.
Ainsi, dans la mesure où le scanner récupère l'image
du document, il est possible de stocker et dans
certains cas d'analyser automatiquement l'image
de la zone manuscrite contenant la réponse.
Si cette zone manuscrite est libre (écriture cursive
normale sans écartement des lettres), il est techniquement
impossible aujourd'hui de reconnaître automatiquement
l'écriture et de transformer la réponse en texte.
Le seul moyen de prendre en compte l'information
est de stocker l'image en tant que telle pour
permettre ensuite à un opérateur humain de visualiser
sur son écran les réponses données et de ressaisir
leur contenu manuellement.
En revanche, si la réponse est écrite en respectant
certaines conventions, dont la plus courante est
de placer une lettre majuscule ou un chiffre unique
dans des cases prévues à cet effet, certains logiciels
du marché arrivent à reconnaître automatiquement
ces caractères avec une fiabilité satisfaisante
et à les stocker dans le fichier des données.
Cette possibilité est le plus souvent utilisée
pour prendre en compte un nom, un code ou une
note mais pas vraiment une zone de réponse à une
vraie question ouverte.
LA
MAÎTRISE D'UN FORMAT SPÉCIFIQUE
DE DOCUMENT
Quelle que soit la technologie utilisée, la lecture
automatique implique l'utilisation de questionnaires
mis en forme selon des normes spécifiques.
La technologie de la lecture optique exige des
documents normalisés avec des petits rectangles
noirs sur la droite de chaque page. Ces marques
sont appelées “pistes-horloges” et indiquent à
la tête de lecture la position des cases à cocher
(appelées “alvéoles”) sur la page.
L'utilisation de documents prévus à cet effet
est également très fortement conseillée dans le
cadre de la lecture scanner même si certains logiciels
permettent de partir de documents existants pour
les codifier à posteriori (ce qui ne donne pas
toujours de bons résultats). Il n'existe pas pour
la scannérisation des normes internationales comme
dans le cas de la lecture optique. Les documents
doivent plutôt correspondre à ce qu'attend le
logiciel de lecture. En général, les règles minimales
habituellement utilisées sont la présence de marques
de repérages (angles, carrés ou traits de positionnement)
et l'utilisation de cases particulières.
Pour concevoir des questionnaires normalisés,
il existe deux solutions : la première consiste
à utiliser un logiciel spécialement prévu à cet
effet, comme OMR Manager, qui permet à l'utilisateur
de concevoir son questionnaire sans se soucier
des normes puisque les cases sont placées automatiquement
à des positions optimales. OMR Manager va d'ailleurs
jusqu'à générer automatiquement le programme de
pilotage du lecteur optique en incluant tous les
contrôles de cohérence nécessaires (nombre de
cases à cocher par question, contrôles des bornes
pour les zones à cocher numériques et les dates,
etc...).
La deuxième solution consiste à utiliser un logiciel
de mise en page de type PAO, qui offre certainement
beaucoup plus de possibilités graphiques et de
gestion des couleurs mais qui nécessite une connaissance
parfaite des normes de positionnement des cases.
Le document ainsi conçu doit ensuite faire l'objet
d'une programmation dans un langage compréhensible
par le lecteur et/ou le logiciel de lecture utilisé
afin de pouvoir être lu automatiquement. La complexité
de ce processus le réserve à la production de
documents sophistiqués et/ou particuliers (formats
spécifiques...) par des spécialistes du domaine.

Un
questionnaire OMR à la loupe
Pour assurer une lecture et un
décodage ultrarapide du questionnaire, un lecteur
optique a besoin de repères précis. Nous présentons
ci-dessous les normes usuelles dans le domaine
de l'OMR ainsi que les différents éléments pouvant
apporter une valeur ajoutée à vos questionnaires
automatisés.
1. CHAMPS PERSONNALISÉS
On peut apposer sur les questionnaires des informations
d'identification, provenant d'une base de données
(publipostage de questionnaires). Ces zones n'auront
aucune signification pour le lecteur optique.
Pour relier le questionnaire à la bonne personne,
on peut apposer en bas de la page une codification
binaire du numéro de l'individu (qui sera lue
et décodée par le lecteur) ou imprimer un code
barre dans une zone réservée.
2. PISTES-HORLOGE
Il s'agit de cet ensemble de marques, positionnées
sur le côté droit de la feuille (à une distance
précise du bord). Leur objectif est de signaler
au lecteur la présence sur la même ligne de cases
à lire et à décoder. La plupart des imprimantes
ne peuvent imprimer en standard ces marques si
près du bord de la page ce qui rend difficile
la production autonome de questionnaires. OMR
Manager intègre des astuces permettant de contourner
automatiquement cette difficulté (simule une impression
dans un format plus large).
3. ALVÉOLES
On désigne ainsi les cases à cocher que le lecteur
doit analyser. Il existe deux normes de têtes
de lecture qui analysent respectivement 40 (Europe)
ou 48 (USA) alvéoles par ligne. Ces têtes sont
équipées du nombre équivalent de diodes qui s'intéressent
chacune à une colonne de la feuille. De ce fait,
les alvéoles doivent être positionnées à des emplacements
précis avec un espacement fixe entre elles. Il
est conseillé, quand on le peut, d'imprimer ces
alvéoles en rouge, pour assurer une qualité de
lecture optimale. En effet, le rouge est une couleur
neutre non lue par le lecteur optique. Ainsi,
une alvéole rouge à bords plus épais ne perturbe
pas la lecture tout en assurant une meilleure
lisibilité du questionnaire pour la personne qui
le remplit. Sur demande, le fabricant peut fournir
un lecteur optique qui lit le rouge (et ignore
une autre couleur).
4. NUMÉROTATION
DE LA PAGE
Un questionnaire OMR peut comporter plusieurs
pages recto ou recto verso. Pour permettre au
lecteur d'identifier immédiatement la page à décoder,
on prévoit un code binaire du numéro de la page
que le lecteur pourra décoder. A condition de
terminer la lecture par la dernière page du questionnaire,
les pages précédentes peuvent être fournies dans
le désordre. Dans le cas d'un questionnaire de
3 pages recto par exemple, le lecteur restitue
des résultats équivalents si les pages sont lues
dans l'ordre 1-2-3 ou 2-1-3.
5. NUMÉROTATION
DU QUESTIONNAIRE
En apposant en bas de la page un numéro de questionnaire
codifié en binaire et qui sera lu par le lecteur,
on rend possible l'identification du document
et sa liaison avec des champs d'une base de données.
La présence de cet identifiant permet ainsi de
compléter le questionnaire lu par des informations
déjà connues par ailleurs (base de données).

Comment
choisir son matériel
SCANNER
OU LECTEUR OPTIQUE : QUELLES DIFFÉRENCES
?
On confond souvent les scanners et les lecteurs
optiques alors que ce sont des matériels aux performances
et aux objectifs très différents :
Les lecteurs optiques sont des machines à très
haut débit (1.000 pages/heure pour les modèles
d'entrée de gamme et jusqu'à 7.000 pages recto-verso
en haut de gamme). Seules les données recherchées
sont lues, contrôlées et envoyées à l'ordinateur
(moins de 0,1 ko par page).
Les scanners en revanche lisent tout le contenu
de la feuille et envoient une image (> 100 ko).
L'ordinateur doit analyser cette image ce qui
prend 5 à 30 secondes par page. En revanche, un
scanner peut lire des zones manuscrites ou dessinées.
Malgré la nette différence de performances pour
la lecture de questionnaires, il peut être intéressant
d'utiliser un scanner plutôt qu'un lecteur optique
soit pour des raisons de budget soit à cause de
la nécessité de prendre en compte les zones manuscrites.
Ainsi, si votre objectif est de prendre en compte
des questionnaires essentiellement quantitatifs
(à 80%), le choix le plus naturel est la lecture
optique qui offre un niveau de vitesse effective
et de fiabilité incomparables, avec notamment
des mécanismes de transport du papier et des têtes
de lectures particulièrement éprouvés.
En revanche, si l'on doit saisir des questionnaires
ayant beaucoup de zones textuelles ou alors des
documents déjà existants, le scanner offre plus
de souplesse et d'adaptabilité. Les zones de textes
manuscrits sont stockées sous forme d'images et
peuvent être reprises au clavier ultérieurement.
Attention : la reconnaissance de 'caractères manuscrits'
en est toujours au stade de l'expérimentation
: le taux de 'non reconnus' ou de 'substitution'
reste très élevé pour un usage professionnel.
COÛT ET CARACTÉRISTIQUES
TECHNIQUES
| |
Scanners
|
Lecteurs optiques
|
| Modèle |
DR-3020
|
DR-3050
|
Axm 930
|
Axm 990
|
| Marque |
Canon
|
Canon
|
Axiome
|
Axiome
|
| Vitesse
de lecture A4 recto |
40 ppm
|
90 ppm
|
1200 / h
|
6500 / h
|
| Vitesse A4
recto verso |
22 ppm
|
50 ppm
|
1200 / h
|
6500 / h
|
Interface
matérielle |
SCSI
|
SCSI
|
RS-232
|
RS-232
|
Interface
logicielle |
Isis Twain
|
Isis Twain
|
AXF ADELE+
|
AXF ADELE+
|
Entrée
des
feuilles |
Chargeur 100
|
Chargeur 500
|
Feuille à feuille
|
Chargeur
|
Format
minimum
(en mm) |
55 x 70
|
55 x 70
|
38 x 83
|
54 x 86
|
Format
maximum
(en mm) |
256 x 363
|
297 x 432
|
229 x 305
|
229 x 305
|
| Autres |
Noir et blanc
|
Noir et blanc
Code barres
(option)
Imprimante
(option)
|
Codes barres
(option)
|
Bac de rejet
Code barres
(option)
Imprimante
(option)
|
Prix
HT
indicatif |
27 KF
|
65 KF
|
60 KF
|
150 KF
|

Les
solutions OMR
Il existe trois types de solutions
pour produire et exploiter des documents lisibles
rapidement : - confier la réalisation du document
à une équipe spécialisée comportant au moins un
graphiste et un développeur,
- faire développer une solution spécifique, calquée
sur vos besoins,
- opter pour une solution automatisée qui offre
une autonomie complète.
LA SOLUTION
À CODAGE MANUEL (ÉQUIPE)
Cette solution est longue et coûteuse car elle
fait mobilise l'activité de plusieurs intervenants.
Il s'agit ici de :
- concevoir une maquette du document en vue de
son impression Offset. Cette maquette doit respecter
les normes précises de positionnement propres
à la lecture rapide.
- programmer dans le langage spécifique compris
par le lecteur optique les informations nécessaires
à la lecture du document (position des alvéoles
sur la feuille, ordre de lecture, détection des
différentes erreurs possibles, …).
- tester le programme sur une maquette du document
réalisée à l'identique.
- lancer la production Offset du document.
- lire les documents retournés.
- convertir les réponses obtenues dans un format
compatible avec les logiciels de traitement utilisés
ensuite.
- ajouter les titres de ligne et/ou de colonne
au tableau de résultat global récupéré dans le
logiciel de traitement.
Cette solution nécessite une équipe de spécialistes
pour la création du document et pour la mise au
point d'un fichier de lecture correct utilisable
par le lecteur optique. Les documents mis au point
peuvent être réimprimés à l'identique, mais les
modifications éventuelles nécessitent l'intervention
du graphiste et du développeur.
LES SOLUTIONS
SUR-MESURE
Ces solutions ont été utilisées par les Grand
Comptes pionniers de la lecture optique. Il s'agit
en général de créer des modèles de documents,
comme dans le cas précédent, intégrés à une interface
d'impression et de lecture. S'il est parfois possible
de modifier certaines zones des documents (date,
autres champs personnalisés comme l'adresse),
des modifications plus avancées (changer une question)
qui touchent au fichier de lecture demandent le
développement d'une mise à jour auprès des concepteurs
originaux.
LES SOLUTIONS
AUTOMATISÉES
DE NOUVELLE GÉNÉRATION
Ce type de solution remplace l'équipe de conception
des documents et permet leur mise en page et la
réalisation des fichiers nécessaires à la lecture.
OMR Manager est la première solution qui permet
à un intervenant unique de mettre en page, imprimer,
et lire le document, sans posséder de connaissance
particulière, et avec un matériel courant. Plus
besoin d'intervenants multiples : une seule personne
suffit pour produire et exploiter un document,
avec toute la souplesse que cela implique en termes
de souplesse d'exécution et de délais.

Fiche
technique OMR Manager
Le logiciel OMR Manager permet
de réaliser l’ensemble du processus d’une étude
en s’appuyant sur la technologie de la lecture
optique ou scanner.
OMR Manager permet tout d’abord de créer un questionnaire
avec une interface simple de type tableur, ou
d’importer un questionnaire conçu avec un logiciel
comme Ethnos.
Des fonctions de mise en page permettent de créer
des tableaux, de dessiner, d’intégrer des images
et de modifier la disposition des différents éléments
sur la page. Les questionnaires sont ensuite imprimés
sur toute imprimante laser reconnue par Windows.
Néanmoins, lorsque les volumes de questionnaires
sont importants, il devient préférable de faire
flasher le questionnaire chez un imprimeur.
Dans la phase de récupération des questionnaires
une fois complétées, OMR Manager génère automatiquement
le fichier de pilotage du lecteur optique sans
intervention de l'utilisateur, et contrôle la
cohérence des données lues en temps réel, avec
option d’arrêt pour reprise manuelle.
Les données lues optiquement sont ensuite automatiquement
stockées au format de logiciels de traitement
comme 'ETHNOS, ou bien dans des formats standard
de type ASCII fixe ou délimité.

CARACTERISTIQUES
TECHNIQUES
| Caractéristiques |
Lecteur
optique |
Scanner |
| Rapidité |
1000
à 7000 questionnaires recto-verso
par heure selon le modèle |
1200
à 3000 questionnaires recto-verso
à l'heure |
| Couleurs |
Documents
en noir ou couleur |
Documents
en noir ou couleur |
| Codes
barre |
Oui,
en option |
Oui |
| Zones
manuscrites |
Saisie
clavier post-lecture |
Saisie
assistée |
|