Gestion des frais de déplacement
Dans les coulisses de notre cellule Intelligence Artificielle
12 juillet 2021
Aujourd’hui, pour ce nouvel épisode de « Donnons la parole au produit », nous avons la chance de nous entretenir avec Yoam HAZOT, ingénieur en Intelligence Artificielle. Il nous explique son rôle et celui de « la cellule intelligence artificielle » du groupe : les différents types d’intelligence artificielle, ses différents projets et la méthodologie dédiée. Dans un second temps, il nous parlera des projets de Cegid Notilus, notamment autour de l’OCR, ce procédé technologique qui permet de reconnaître automatiquement les champs d’un justificatif de notes de frais papier.
Qu’est-ce que l’intelligence artificielle ?
L’IA est un ensemble de techniques et de théories permettant à des machines de résoudre des problématiques nécessitant une certaine forme d’intelligence. Le terme d’intelligence artificielle est assez vaste aujourd’hui et de plus en plus cité. Dans le domaine de l’apprentissage, on retrouve majoritairement le Machine Learning (apprentissage automatique) ainsi que le Deep Learning (apprentissage profond).
Le Machine Learning correspond à une catégorie d’algorithmes destinés à apprendre des motifs significatifs à partir des données transmises afin de réaliser des prédictions sur d’autres données.
Le Deep Learning, sous domaine du Machine Learning, s’appuie sur les réseaux de neurones artificiels présentant une structure comparable à celle du cerveau humain.
Ces classes d’algorithmes ont pour but de mimer le raisonnement humain.
Comment s’organise la cellule IA ?
Mais comment se déroule un projet ? Voici les différentes étapes :
- Les équipes Produits expriment leurs besoins
« Notre premier devoir est de s’interroger si la solution au problème nécessite véritablement de l’intelligence artificielle, très souvent ce n’est pas le cas. Il faut mesurer si le jeu en vaut la chandelle. En effet, la mise en place et le développement peuvent être coûteux en termes de temps et d’énergie et parfois ce n’est pas la solution la plus adéquate », indique Yoam.
- Le projet est validé, début du POC (preuve de concept)
Si la cellule IA juge que le projet est intéressant et nécessite de l’IA, un POC est lancé afin de déterminer sa faisabilité. Plusieurs questions doivent alors être abordées : avons-nous assez de données disponibles, avons-nous le temps de le faire ? Il n’est pas rare qu’un projet soit abandonné à cette étape.
« Par exemple, nous avons travaillé sur un projet de reconnaissance vocale en se basant sur les dernières avancées technologiques du domaine en question. Les résultats étaient remarquables mais… uniquement en Anglais car on ne disposait pas assez d’enregistrements audio en Français pour obtenir un rendu satisfaisant. » déclare Yoam.
- Des bonnes performances avant la mise en production
Heureusement pour la cellule IA, le projet est souvent réalisable. Leur travail est de mener à bien ces projets et d’avoir les meilleures performances possibles. Cette dernière partie est la condition « sine qua non » pour rentrer dans une phase de développement.
Une fois que tout est développé de leur côté, les équipes produits n’ont plus qu’à intégrer le tout dans les différentes solutions.
Le « Projet OCR » de Cegid Notilus, fierté de la cellule IA
La cellule IA a été lancée il y a quatre ans maintenant par un projet phare qui utilise la technologie de l’OCR (Reconnaissance optique des caractères).
L’OCR permet d’extraire des informations à partir d’une image (la plupart du temps le texte contenu à l’intérieur). Pour Cegid Notilus, le but était d’envoyer une image (à savoir un justificatif de frais) et d’en ressortir les éléments clés de la dépense : le montant, la date, la devise, la TVA, le pays ou encore la nature (qu’il fallait déduire car elle n’est pas forcément inscrite).
La cellule IA a donc développé des algorithmes de Machine Learning et de Deep Learning, afin de repérer sur l’image les éléments clés. Ces deux classes d’algorithmes travaillent de concert pour retrouver ces champs de manière fiable.
« Cela devient vite technique mais il faut savoir qu’il y a des algorithmes pour chaque détection. Nous avons mis en place plusieurs prédicteurs en simultanée pour qu’il y ait le moins d’erreurs possibles, un algorithme pouvant compenser l’erreur potentielle d’un autre. » indique Yoam.
Un OCR qui se différencie de la concurrence
Aujourd’hui, notre solution permet de reconnaitre des frais de plusieurs pays à savoir : la France, la Suisse, l’Angleterre, l’Espagne, l’Allemagne, les Etats Unis, le Canada, le Mexique, l’Italie et le Portugal. En plus de ça il faut savoir qu’il y a certaines particularités qui nous différencient :
- Des scores de confiance
Dans les faits, nous avons mis en place des scores de confiance pour chaque champ. Chaque prédiction a un score qui lui est dédié. Cela nous permet de choisir parmi les différents algorithmes celui qui est le meilleur et de garantir un taux de reconnaissance très important.
- Une vitesse spectaculaire
Très régulièrement la cellule IA doit effectuer des comparatifs avec les différentes solutions du marché. L’idée est de voir comment l’OCR de Cegid Notilus se positionne par rapport à la concurrence.
« Globalement ce que nous avons pu remarquer c’est que notre OCR est extrêmement rapide : entre deux à trois secondes et ce même lorsque le nombre de frais à la seconde est très élevé. En moyenne les autres solutions mettent deux fois plus de temps et parfois cela peut excéder les dix secondes. En termes d’expérience utilisateur, c’est très important de garantir des temps raisonnables. »
- Le taux de reconnaissance
Evidemment, beaucoup d’acteurs du marché disent avoir le meilleur OCR. De notre côté, nous disposons d’une base de données de 7,9 millions de tickets qui ont été envoyés par les utilisateurs. En moyenne nous sommes à plus de 90 % de taux de reconnaissance sur chaque champ et pour certains plus proches des 95 %.
« Il est à noter que ces 90 % de reconnaissance par champ sont une condition avant le déploiement en production. Par exemple, en ce moment nous sommes en train de travailler sur le pourboire, nous nous assurons que sur l’ensemble des tickets validés, nous ayons un taux de reconnaissance qui soit très fort. Il faut bien imaginer qu’avec environ 14 000 tickets par jour, chaque pourcent est primordial, tant pour nos utilisateurs que pour nous. »
Un contrôle des justificatifs pour garantir un fort taux de reconnaissance
Malheureusement, on ne peut pas laisser les algorithmes apprendre automatiquement avec les frais qui sont envoyés. Il est nécessaire de contrôler ce qui est saisi par l’utilisateur pour garantir un fort taux de reconnaissance.
« Il y a beaucoup d’utilisateurs qui soumettent des tickets mais qui renseignent une valeur qui n’est pas celle que l’on peut lire dans la photo. C’est le cas, par exemple s’ils veulent enlever un frais qui n’est pas pris en charge par l’entreprise ou indiquent la somme remboursée par l’entreprise au lieu du prix total. Il y a encore d’autres utilisateurs qui soumettent des frais avec des justificatifs qui n’en sont pas ou qui ne sont pas utilisables : écran de la station d’essence, tickets flous, tickets manuscrits, tickets multiples, etc. » ajoute-t-il.
Une sécurité pour nos clients
Nos bases de données sont sécurisées, nous avons des sauvegardes régulièrement et sur plusieurs sites distants. Tous les tickets sont anonymisés une fois qu’ils sont dans la base. Coté RGPD et protection des données, l’image du ticket en elle-même disparaît au bout de trois jours.
Y a-t-il de l’Intelligence Artificielle ailleurs dans Cegid Notilus ?
Oui bien sûr, notamment dans la partie Flotte Automobile avec Cegid Notilus !
« Nous avons créé un chatbot de toute pièce dont le but est d’aider l’utilisateur à prendre en main la solution de flotte automobile. Il est capable de saisir des frais, des rendez-vous, des compteurs kilométriques, etc.
Il y a un autre sujet qui concerne l’intégration automatique des factures fournisseurs. L’intelligence artificielle reconnait automatiquement le fichier et le prestataire. Par exemple, si votre loueur vous envoie le contrat de tel véhicule et bien c’est reconnu automatiquement et relié à la fiche véhicule dans Cegid Notilus YourWay. »
On pourrait citer aussi :
- L’estimation de la consommation de carburant des véhicules
- Le recalibrage de la loi de roulage (cela permet au gestionnaire de flotte d’être plus près de la réalité et d’ajuster ses contrats).
- Les anomalies des compteurs kilométriques saisis
Il y a aussi plein d’autres fonctionnalités que nous avons développées mais qui ne sont pas encore intégrées dans les produits. L’intelligence artificielle dans Cegid Notilus a encore de beaux jours devant elle !