Logiciel SaaS

Océrisation des documents : définition, fonctionnement, solutions

Retour aux ressources

Gestion des frais de déplacement

25 octobre 2022

À travers cet article, Cegid Notilus vous présente le concept et les principes de l’océrisation, son fonctionnement et plusieurs exemples de mise en œuvre.

6 min

L’océrisation des documents est un procédé issu du progrès technologique qui a de nombreuses applications dans le monde professionnel. Ses avantages sont divers et particulièrement intéressants. Si votre entreprise l’utilise, vous mesurez probablement l’intérêt de cette alternative aux saisies manuelles.

 

Océrisation : définition

Ne cherchez pas dans le dictionnaire, vous n’y trouverez pas le mot océrisation ! C’est un mot barbare formé à partir de l’acronyme anglais OCR (Optical Character Recognition, ou reconnaissance optique des caractères).

Océriser, c’est exécuter un processus automatisé qui consiste en :

  • la lecture optique d’un document, à l’aide d’un scanner ou autre dispositif (caméra d’un smartphone, d’une tablette, etc.),
  • puis son analyse numérique, pixel par pixel, et sa transformation en fichier texte.

Les premiers prototypes d’OCR remontent à près de 100 ans, mais les systèmes ont évolué significativement ces dernières années. L’océrisation trouve maintenant de nombreuses applications dans divers domaines, tant dans le milieu professionnel que dans la vie quotidienne des particuliers.

 

Comment fonctionne l’océrisation de documents ?

Pour océriser un document, plusieurs étapes sont nécessaires. On pourrait le représenter globalement comme un cycle en V :

  • partant d’une vision globale pour la dissocier en éléments unitaires,
  • transformant ces éléments,
  • puis reconstituant une représentation globale par agrégation des éléments transformés.

D’abord, dans le cas d’un document papier, il faut au préalable le scanner ou en prendre une photo numérique. Le document ainsi numérisé est alors envoyé au logiciel d’OCR.

Ensuite, le process d’océrisation proprement dit commence.

Le logiciel effectue dans un premier temps un traitement de l’image semblable à ceux que l’on peut faire sur une application photo. Cela consiste par exemple à transposer en noir et blanc, à améliorer la luminosité, le contraste et les contours, à ajuster l’alignement horizontal, à rogner voire à recadrer l’image…

L’objectif de cette étape est de préparer l’image pour en faciliter la lecture par le logiciel d’OCR.

L’outil procède alors à une reconnaissance itérative pour diviser le document en lignes, en mots puis en caractères. Enfin, il est en mesure d’effectuer la reconnaissance de caractères proprement dite, signe par signe.

Diverses techniques permettent d’identifier la lettre de l’alphabet, le chiffre, le symbole ou le signe de ponctuation qui correspond à chaque caractère :

  • Certaines s’appuient sur la comparaison méthodique avec une bibliothèque de modèles servant de référentiel ;
  • D’autres, basées sur des probabilités, conviennent particulièrement à l’écriture manuscrite.

Après cette identification unitaire, le logiciel commence à agréger en effectuant des vérifications et des corrections d’ordres linguistique et sémantique. Il utilise pour cela un dictionnaire, des règles orthographiques et grammaticales, ainsi qu’une bibliothèque d’expressions (séquences de mots).

Finalement, l’outil termine le process d’océrisation en générant le fichier correspondant au format demandé : txt, docx, pdf, etc.

Découvrez Cegid Notilus !

Avec notre OCR tous les champs tels que la TVA, la devise ou le montant, sont automatiquement détectés. Avec l’archivage à valeur probante, vos justificatifs de frais sont conservés dans un cloud sécurisé, fini le papier.

en savoir plus

Quelques limites ?

Comme toute technologie avancée, et comme l’humain d’ailleurs, l’océrisation n’est pas infaillible.

Évidemment, océriser un document manuscrit est une opération très complexe. Si l’on compare avec un document dactylographié, le temps de traitement est plus long dans la premier contexte. En revanche, la fiabilité est meilleure dans le second.

Même entre deux documents dactylographiés, des différences en termes de rapidité et d’exactitude peuvent apparaître selon :

  • la qualité du document (en version papier ou son image),
  • la police de caractères utilisée, etc.

C’est pourquoi l’intelligence artificielle vient utilement en renfort à la technologie OCR, en particulier pour des usages professionnels. Nous en reparlerons plus loin en présentant la solution de Cegid Notilus.

 

Exemples d’applications

 

Océriser des documents à titre personnel

Certes, l’océrisation n’est pas encore vraiment connue et ni largement utilisée dans la vie personnelle. Toutefois, certaines applications peuvent représenter un intérêt, y compris à titre individuel et familial.

En effet, qui ne se réjouirait pas de s’épargner quelques saisies manuelles ? C’est notamment du temps gagné en paperasse. Ce sont aussi des potentielles erreurs évitées, et leurs conséquences plus ou moins lourdes également.

Alors, une application de gestion des finances personnelles peut par exemple intégrer des fonctionnalités d’océrisation des factures ou des tickets de caisse par exemple.

Certains logiciels sont gratuits ou offrent au moins une période d’essai gratuit. Un particulier peut parfaitement songer à océriser par exemple des recettes de cuisine dactylographiées ou non, voire des notes manuscrites qu’il aurait prises.

Cela lui permet de conserver, archiver et indexer ces documents. Il pourrait ensuite effectuer des recherches beaucoup plus rapides et efficaces sur l’ensemble.

 

Applications de l’océrisation dans le monde professionnel

Bien évidemment, l’utilité de l’océrisation est encore plus significative pour les entreprises et les professionnels.

Les motivations sont similaires : gain de temps, réduction des risques d’erreurs et d’omissions, archivage et traitement des données facilités… Mais les impacts sont évidemment plus conséquents dans un contexte d’affaires.

Cela concerne la plupart des secteurs : industriels et commerciaux, services publics ou privés (santé, transport et logistique, banque et assurance…), etc. Les exemples qui suivent sont loin d’être exhaustifs.

L’océrisation permet d’automatiser une très grande partie du tri postal. Il en est de même avec le traitement des chèques par les banques.

Dans les activités de vente par correspondance, l’océrisation peut améliorer le processus de commande à distance qu’une entreprise propose à ses clients. Ceux-ci peuvent par exemple télécharger un bon de commande sur le site de l’entreprise, le compléter et le signer manuellement puis le renvoyer sous forme papier, ou en PDF s’ils disposent d’un scanner.

Il suffit ensuite à l’entreprise d’océriser un PDF pour récupérer automatiquement les données et les transmettre au système de gestion des commandes.

Si l’on considère les avantages que l’océrisation représente pour certaines activités comptables, on comprend que toutes les entreprises peuvent y trouver un intérêt. Océriser les factures plutôt que de les saisir à la main dans le système permet là encore :

  • de gagner du temps,
  • de réduire les erreurs,
  • et donc d’augmenter la performance.

 

Cegid Notilus et l’océrisation intelligente

L’océrisation constitue un atout majeur pour la gestion des notes de frais. Mais la solution développée et proposée par Cegid Notilus va encore plus loin.

Il ne faut que 2 ou 3 secondes pour océriser un ticket de caisse ou autre justificatif de frais. C’est-à-dire le scanner, l’analyser et le retranscrire, le tout directement depuis l’application mobile.

L’utilisateur n’a plus qu’à vérifier le contenu à l’écran. Le justificatif océrisé est alors automatiquement intégré dans le process de gestion des notes de frais.

Il faut savoir aussi que cette vitesse d’exécution ne se fait pas au détriment de la qualité. En effet, le taux de reconnaissance dépasse 90 %, voire 95 % pour certains types de données.

Ce niveau de fiabilité est d’autant plus remarquable que la solution répond à des exigences multi-pays.

Pour atteindre une telle performance, Cegid Notilus associe des technologies d’intelligence artificielle (IA) au système OCR : le « machine learning » et le « deep learning ».

Développés par la cellule IA de Cegid Notilus, ces algorithmes agissent sur une base de plusieurs millions de justificatifs de frais. Couplés à un OCR efficace, ils offrent un service d’océrisation intelligente aux entreprises et à leurs collaborateurs.

Rien de tel qu’un échange de vive voix pour comprendre les enjeux de votre
projet et vous présenter la solution qui répondra à vos attentes.

Contactez-nous