Introduction
LE PAPIER,
MÉDIA INCONTOURNABLE POUR LA COLLECTE D'INFORMATION
L'information est une arme de compétitivité pour les
entreprises, et les informations pertinentes ne se trouvent pas
toujours à portée de main. Elles sont bien sûr
dans l'entreprise elle-même, contenues dans ses systèmes
d'information, mais également sur le terrain, à savoir
chez les concurrents, les clients, les commerciaux, les utilisateurs.
Ces données externes sont récupérées
de multiples façons :
- la réponse à un formulaire électronique sur
le site web,
- une conversation téléphonique avec un agent d'un
centre d'appel,
- une demande écrite d'information,
- une réclamation,
- la réponse à une enquête de satisfaction.
Si de plus en plus, ces flux dinformations entre lentreprise
et son environnement sont électroniques, le mode écrit
reste irremplaçable et inévitable, pour au moins quatre
raisons :
1/ Culturelles
:
le papier et le stylo restent les outils de travail et de réflexion
préférés de nombreux cadres acheteurs ou dirigeants.
Pour sassurer de la conservation dun document, le réflexe
le plus courant reste de limprimer et le placer dans un dossier.
2/Légales
:
le papier étant obligatoire pour de nombreux documents, son
utilisation déborde naturellement de ce cadre et concerne
toute lentreprise.
3/ Pratiques
:
dans la recherche dinformations sur le terrain, comme le sondage
en sortie des urnes, l'enquête client-mystère, les
enquêtes de satisfaction dans les gares et aéroports,
le papier s'impose, surtout si le questionnaire impose une saisie
manuscrite de texte.
4/ La confidentialité
des réponses :
le papier est lun des seuls média qui garantisse l'anonymat.
L'entreprise est ainsi confrontée à limpératif
de numériser des données externes au format papier
et le faire économiquement. Pour l'y aider, elle peut faire
appel à des technologies de gestion électronique de
documents et de Workflow.
LA TECHNOLOGIE
DE LECTURE AUTOMATIQUE DE DOCUMENTS
La gestion électronique de documents est un domaine en progression
rapide, à un rythme de 25 à 30% par an en France.
Parmi ses applications, l'acquisition des informations, c'est à
dire la lecture automatique de documents (LAD) est sans doute celle
qui se développe le plus. Elle est déjà largement
utilisée :
- Dans les entreprises de vente par correspondance ou les Caisses
d'Assurance Maladie où elle permet d'automatiser la saisie
de documents écrits.
- Dans l'enseignement (évaluations ),
- Dans le domaine hospitalier (demandes d'analyses...)
- Dans l'univers spécifique du vote d'assemblées.
- Dans le domaine des études et des enquêtes, la lecture
optique est apparue sous la forme de lecture de marques ou OMR pour
Optical Mark Reading.
Cette technologie permet de créer des questionnaires sur
le principe des cases à cocher, qui peuvent être saisis
une fois complétés à des vitesses de lecture
de l'ordre de 7.000 pages recto-verso à l'heure.
Un questionnaire qui comporterait 250 cases à cocher par
page (il pourrait en avoir en théorie jusqu'à 3840),
sera donc saisi à la vitesse d'environ deux millions de caractères
à l'heure. Avec un lecteur optique doté d'un logiciel
OMR, on peut donc sans aucun problème envisager de saisir
plusieurs dizaines de milliers de questionnaires en quelques jours
avec le support d'un seul et unique opérateur.
L'analyse du contenu du document lu se passe au niveau du lecteur
optique qui dispose d'une intelligence propre et dédiée
(microprocesseur intégré). Cela permet une saisie
en toute fiabilité sans remettre en cause la productivité,
puisque le lecteur travaille par exception et ne déclenche
une intervention manuelle que lorsqu'un problème se présente.
- En synthèse, la lecture optique permet de diviser par dix
le coût dacquisition de questionnaires par rapport aux
technologies classiques.
Le dépouillement
rapide des questionnaires
Un équipement
de lecture automatique est composé d'un micro-ordinateur,
d'un logiciel de pilotage de la lecture et d'un périphérique
de lecture qui peut être un lecteur optique ou un scanner.
LE FONCTIONNEMENT
DE LA LECTURE OPTIQUE
Le lecteur se connecte simplement au micro-ordinateur par le port
série, sans paramétrage ou installation particulière.
En début de session de lecture, l'utilisateur lance son logiciel
de lecture optique et télécharge, en quelques secondes,
dans la mémoire du lecteur, le programme de traitement du
questionnaire à lire.
A partir de ce moment, le lecteur est capable d'analyser le questionnaire
correspondant, de détecter les incohérences (ex :
double marquage) et d'envoyer instantanément au micro-ordinateur
les seules informations utiles. Ce processus de décodage
en amont permet de définir le niveau de performance au niveau
du lecteur et non par rapport à l'ordinateur utilisé.
Par ailleurs, en raison des systèmes d'identification optique
utilisés, la technologie OMR présente un niveau de
fiabilité très élevé du résultat
de la lecture. Le matériel de lecture lui-même est
également extrêmement robuste et s'apparente d'avantage
à un équipement industriel qu'à un appareil
bureautique.
Un lecteur OMR peut être manuel, semi-automatique ou automatique.
Dans ce dernier cas, il peut disposer d'un bac de rejet, destiné
à recevoir les questionnaires écartés automatiquement
car mal remplis ou détériorés (qui peuvent
être repris ensuite par un opérateur).
La plupart des modèles de lecteurs acceptent une double tête
de lecture, permettant de lire en un seul passage les deux faces
d'un questionnaire. Certains modèles peuvent également
disposer d'une ou plusieurs têtes spéciales code barre
permettant de lire des codes de personnalisation imprimés
ou collés sur le questionnaire (etiquettes).
Enfin, les appareils les plus sophistiqués peuvent intégrer
une tête de lecture OCR, permettant de décoder une
ou plusieurs lignes d'un texte dactylographié sur le questionnaire,
dans des polices de caractères définies.
En France, dans le domaine spécifique de la saisie automatique
de questionnaires d'enquêtes, la technologie OMR permet déjà
le dépouillement rapide des questionnaires de plusieurs très
grands instituts d'études. Cependant, en raison du coût
relativement élevé des lecteurs (60 à 250 KF),
l'OMR reste lié dans l'esprit des décideurs à
la notion de volumes importants.
LA SCANNÉRISATION
Tout le monde connaît les périphériques de scannage
de documents qui récupèrent l'image d'un document
pour la restituer à l'écran ou sur papier : scanners
bureautiques, fax, copieurs numériques...
Lorsqu'on parle de lecture automatique de questionnaires ce type
d'appareil sert de référentiel dans l'esprit des non-initiés.
En effet, si je peux scanner une image, pourquoi ne pourrais-je
pas scanner un questionnaire ?
En réalité, le problème n'est pas de savoir
récupérer l'image du document mais de le faire vite,
et de savoir analyser son contenu en le récupérant
dans l'application appropriée.
Contrairement aux lecteurs optiques, les scanners ne disposent pas
d'une intelligence embarquée. Il faut donc scanner
l'image, la transmettre à l'ordinateur de la manière
la plus rapide et la plus compacte possible puis la décoder
à ce niveau. Or l'image d'une page A4 pèse
plusieurs centaines de milliers d'octets (à comparer aux
quelques dizaines d'octets que transmet un lecteur optique !). Pourtant,
la technologie de la scannérisation a de nombreux atouts
dont le premier est sans doute la possibilité de prendre
en compte les réponses à des questions ouvertes.
Ainsi, dans la mesure où le scanner récupère
l'image du document, il est possible de stocker et dans certains
cas d'analyser automatiquement l'image de la zone manuscrite contenant
la réponse.
Si cette zone manuscrite est libre (écriture cursive normale
sans écartement des lettres), il est techniquement impossible
aujourd'hui de reconnaître automatiquement l'écriture
et de transformer la réponse en texte. Le seul moyen de prendre
en compte l'information est de stocker l'image en tant que telle
pour permettre ensuite à un opérateur humain de visualiser
sur son écran les réponses données et de ressaisir
leur contenu manuellement.
En revanche, si la réponse est écrite en respectant
certaines conventions, dont la plus courante est de placer une lettre
majuscule ou un chiffre unique dans des cases prévues à
cet effet, certains logiciels du marché arrivent à
reconnaître automatiquement ces caractères avec une
fiabilité satisfaisante et à les stocker dans le fichier
des données. Cette possibilité est le plus souvent
utilisée pour prendre en compte un nom, un code ou une note
mais pas vraiment une zone de réponse à une vraie
question ouverte.
LA MAÎTRISE
D'UN FORMAT SPÉCIFIQUE DE DOCUMENT
Quelle que soit la technologie utilisée, la lecture automatique
implique l'utilisation de questionnaires mis en forme selon des
normes spécifiques.
La technologie de la lecture optique exige des documents normalisés
avec des petits rectangles noirs sur la droite de chaque page. Ces
marques sont appelées pistes-horloges et indiquent
à la tête de lecture la position des cases à
cocher (appelées alvéoles) sur la page.
L'utilisation de documents prévus à cet effet est
également très fortement conseillée dans le
cadre de la lecture scanner même si certains logiciels permettent
de partir de documents existants pour les codifier à posteriori
(ce qui ne donne pas toujours de bons résultats). Il n'existe
pas pour la scannérisation des normes internationales comme
dans le cas de la lecture optique. Les documents doivent plutôt
correspondre à ce qu'attend le logiciel de lecture. En général,
les règles minimales habituellement utilisées sont
la présence de marques de repérages (angles, carrés
ou traits de positionnement) et l'utilisation de cases particulières.
Pour concevoir des questionnaires normalisés, il existe deux
solutions : la première consiste à utiliser un logiciel
spécialement prévu à cet effet, comme OMR Manager,
qui permet à l'utilisateur de concevoir son questionnaire
sans se soucier des normes puisque les cases sont placées
automatiquement à des positions optimales. OMR Manager va
d'ailleurs jusqu'à générer automatiquement
le programme de pilotage du lecteur optique en incluant tous les
contrôles de cohérence nécessaires (nombre de
cases à cocher par question, contrôles des bornes pour
les zones à cocher numériques et les dates, etc...).
La deuxième solution consiste à utiliser un logiciel
de mise en page de type PAO, qui offre certainement beaucoup plus
de possibilités graphiques et de gestion des couleurs mais
qui nécessite une connaissance parfaite des normes de positionnement
des cases. Le document ainsi conçu doit ensuite faire l'objet
d'une programmation dans un langage compréhensible par le
lecteur et/ou le logiciel de lecture utilisé afin de pouvoir
être lu automatiquement. La complexité de ce processus
le réserve à la production de documents sophistiqués
et/ou particuliers (formats spécifiques...) par des spécialistes
du domaine.
Un questionnaire
OMR à la loupe
Pour assurer
une lecture et un décodage ultrarapide du questionnaire,
un lecteur optique a besoin de repères précis. Nous
présentons ci-dessous les normes usuelles dans le domaine
de l'OMR ainsi que les différents éléments
pouvant apporter une valeur ajoutée à vos questionnaires
automatisés.

1. CHAMPS
PERSONNALISÉS
On peut apposer sur les questionnaires des informations d'identification,
provenant d'une base de données (publipostage de questionnaires).
Ces zones n'auront aucune signification pour le lecteur optique.
Pour relier le questionnaire à la bonne personne, on peut
apposer en bas de la page une codification binaire du numéro
de l'individu (qui sera lue et décodée par le lecteur)
ou imprimer un code barre dans une zone réservée.
2. PISTES-HORLOGE
Il s'agit de cet ensemble de marques, positionnées sur le
côté droit de la feuille (à une distance précise
du bord). Leur objectif est de signaler au lecteur la présence
sur la même ligne de cases à lire et à décoder.
La plupart des imprimantes ne peuvent imprimer en standard ces marques
si près du bord de la page ce qui rend difficile la production
autonome de questionnaires. OMR Manager intègre des astuces
permettant de contourner automatiquement cette difficulté
(simule une impression dans un format plus large).
3. ALVÉOLES
On désigne ainsi les cases à cocher que le lecteur
doit analyser. Il existe deux normes de têtes de lecture qui
analysent respectivement 40 (Europe) ou 48 (USA) alvéoles
par ligne. Ces têtes sont équipées du nombre
équivalent de diodes qui s'intéressent chacune à
une colonne de la feuille. De ce fait, les alvéoles doivent
être positionnées à des emplacements précis
avec un espacement fixe entre elles. Il est conseillé, quand
on le peut, d'imprimer ces alvéoles en rouge, pour assurer
une qualité de lecture optimale. En effet, le rouge est une
couleur neutre non lue par le lecteur optique. Ainsi, une alvéole
rouge à bords plus épais ne perturbe pas la lecture
tout en assurant une meilleure lisibilité du questionnaire
pour la personne qui le remplit. Sur demande, le fabricant peut
fournir un lecteur optique qui lit le rouge (et ignore une autre
couleur).
4. NUMÉROTATION
DE LA PAGE
Un questionnaire OMR peut comporter plusieurs pages recto ou recto
verso. Pour permettre au lecteur d'identifier immédiatement
la page à décoder, on prévoit un code binaire
du numéro de la page que le lecteur pourra décoder.
A condition de terminer la lecture par la dernière page du
questionnaire, les pages précédentes peuvent être
fournies dans le désordre. Dans le cas d'un questionnaire
de 3 pages recto par exemple, le lecteur restitue des résultats
équivalents si les pages sont lues dans l'ordre 1-2-3 ou
2-1-3.
5. NUMÉROTATION
DU QUESTIONNAIRE
En apposant en bas de la page un numéro de questionnaire
codifié en binaire et qui sera lu par le lecteur, on rend
possible l'identification du document et sa liaison avec des champs
d'une base de données. La présence de cet identifiant
permet ainsi de compléter le questionnaire lu par des informations
déjà connues par ailleurs (base de données).
Comment choisir
son matériel
SCANNER OU
LECTEUR OPTIQUE : QUELLES DIFFÉRENCES ?
On confond souvent les scanners et les lecteurs optiques alors que
ce sont des matériels aux performances et aux objectifs très
différents :
Les lecteurs
optiques sont des machines à très haut débit
(1.000 pages/heure pour les modèles d'entrée de gamme
et jusqu'à 7.000 pages recto-verso en haut de gamme). Seules
les données recherchées sont lues, contrôlées
et envoyées à l'ordinateur (moins de 0,1 ko par page).
Les scanners
en revanche lisent tout le contenu de la feuille et envoient une
image (> 100 ko). L'ordinateur doit analyser cette image ce qui
prend 5 à 30 secondes par page. En revanche, un scanner peut
lire des zones manuscrites ou dessinées.
Malgré
la nette différence de performances pour la lecture de questionnaires,
il peut être intéressant d'utiliser un scanner plutôt
qu'un lecteur optique soit pour des raisons de budget soit à
cause de la nécessité de prendre en compte les zones
manuscrites.
Ainsi, si votre objectif est de prendre en compte des questionnaires
essentiellement quantitatifs (à 80%), le choix le plus naturel
est la lecture optique qui offre un niveau de vitesse effective
et de fiabilité incomparables, avec notamment des mécanismes
de transport du papier et des têtes de lectures particulièrement
éprouvés.
En revanche, si l'on doit saisir des questionnaires ayant beaucoup
de zones textuelles ou alors des documents déjà existants,
le scanner offre plus de souplesse et d'adaptabilité. Les
zones de textes manuscrits sont stockées sous forme d'images
et peuvent être reprises au clavier ultérieurement.
Attention : la reconnaissance de 'caractères manuscrits'
en est toujours au stade de l'expérimentation : le taux de
'non reconnus' ou de 'substitution' reste très élevé
pour un usage professionnel.
COÛT
ET CARACTÉRISTIQUES TECHNIQUES
|
Scanners |
Lecteurs
optiques |
| Modèle |
DR-3020 |
DR-3050 |
Axm
930 |
Axm
990 |
| Marque
|
Canon
|
Canon |
Axiome |
Axiome
|
| Vitesse
de lecture A4 recto |
40
ppm |
90
ppm |
1200
/ h |
6500
/ h |
| Vitesse
A4 recto verso |
22
ppm |
50
ppm |
1200
/ h |
6500
/ h |
| Interface
matérielle |
SCSI |
SCSI |
RS-232 |
RS-232
|
| Interface
logicielle |
Isis
Twain |
Isis
Twain |
AXF
ADELE+ |
AXF
ADELE+ |
| Entrée
des feuilles |
Chargeur
100 |
Chargeur
500 |
Feuille
à feuille |
Chargeur
|
| Format
minimum (en mm) |
55
x 70 |
55
x 70 |
38
x 83 |
54
x 86 |
| Format
maximum (en mm) |
256
x 363 |
297
x 432 |
229
x 305 |
229
x 305 |
| Autres |
Noir
et blanc |
Noir
et blanc
Code barres (option)
Imprimante (option) |
Codes
barres
(option) |
Bac
de rejet
Code barres (option)
Imprimante (option) |
| Prix
HT indicatif |
27
KF |
65
KF |
60
KF |
150
KF |
Les solutions
OMR
Il existe trois
types de solutions pour produire et exploiter des documents lisibles
rapidement : - confier la réalisation du document à
une équipe spécialisée comportant au moins
un graphiste et un développeur,
- faire développer une solution spécifique, calquée
sur vos besoins,
- opter pour une solution automatisée qui offre une autonomie
complète.
LA SOLUTION
À CODAGE MANUEL (ÉQUIPE)
Cette solution est longue et coûteuse car elle fait mobilise
l'activité de plusieurs intervenants. Il s'agit ici de :
- concevoir une maquette du document en vue de son impression Offset.
Cette maquette doit respecter les normes précises de positionnement
propres à la lecture rapide.
- programmer dans le langage spécifique compris par le lecteur
optique les informations nécessaires à la lecture
du document (position des alvéoles sur la feuille, ordre
de lecture, détection des différentes erreurs possibles,
).
- tester le programme sur une maquette du document réalisée
à l'identique.
- lancer la production Offset du document.
- lire les documents retournés.
- convertir les réponses obtenues dans un format compatible
avec les logiciels de traitement utilisés ensuite.
- ajouter les titres de ligne et/ou de colonne au tableau de résultat
global récupéré dans le logiciel de traitement.
Cette solution nécessite une équipe de spécialistes
pour la création du document et pour la mise au point d'un
fichier de lecture correct utilisable par le lecteur optique. Les
documents mis au point peuvent être réimprimés
à l'identique, mais les modifications éventuelles
nécessitent l'intervention du graphiste et du développeur.
LES SOLUTIONS
SUR-MESURE
Ces solutions ont été utilisées par les Grand
Comptes pionniers de la lecture optique. Il s'agit en général
de créer des modèles de documents, comme dans le cas
précédent, intégrés à une interface
d'impression et de lecture. S'il est parfois possible de modifier
certaines zones des documents (date, autres champs personnalisés
comme l'adresse), des modifications plus avancées (changer
une question) qui touchent au fichier de lecture demandent le développement
d'une mise à jour auprès des concepteurs originaux.
LES SOLUTIONS
AUTOMATISÉES DE NOUVELLE GÉNÉRATION
Ce type de solution remplace l'équipe de conception des documents
et permet leur mise en page et la réalisation des fichiers
nécessaires à la lecture. OMR Manager est la première
solution qui permet à un intervenant unique de mettre en
page, imprimer, et lire le document, sans posséder de connaissance
particulière, et avec un matériel courant. Plus besoin
d'intervenants multiples : une seule personne suffit pour produire
et exploiter un document, avec toute la souplesse que cela implique
en termes de souplesse d'exécution et de délais.
Fiche
technique OMR Manager :
Le logiciel
OMR Manager permet de réaliser lensemble du processus
dune étude en sappuyant sur la technologie de
la lecture optique ou scanner.
OMR Manager permet tout dabord de créer un questionnaire
avec une interface simple de type tableur, ou dimporter un
questionnaire conçu avec un logiciel comme Ethnos.
Des fonctions de mise en page permettent de créer des tableaux,
de dessiner, dintégrer des images et de modifier la
disposition des différents éléments sur la
page. Les questionnaires sont ensuite imprimés sur toute
imprimante laser reconnue par Windows. Néanmoins, lorsque
les volumes de questionnaires sont importants, il devient préférable
de faire flasher le questionnaire chez un imprimeur.
Dans la phase de récupération des questionnaires une
fois complétées, OMR Manager génère
automatiquement le fichier de pilotage du lecteur optique sans intervention
de l'utilisateur, et contrôle la cohérence des données
lues en temps réel, avec option darrêt pour reprise
manuelle.
Les données lues optiquement sont ensuite automatiquement
stockées au format de logiciels de traitement comme 'ETHNOS,
ou bien dans des formats standard de type ASCII fixe ou délimité.
Caractéristiques
techniques :
| Caractéristiques |
Lecteur
optique |
Scanner |
| Rapidité |
1000
à 7000 questionnaires recto-verso par heure selon le modèle |
1200
à 3000 questionnaires recto-verso à l'heure |
| Couleurs |
Documents
en noir ou couleur |
Documents
en noir ou couleur |
| Codes
barres |
Oui,
en option |
Oui |
| Zones
manuscrites |
Saisie
clavier post-lecture |
Saisie
assistée |
|