Comment intégrer l’OCR à un projet de développement logiciel sur mesure ?

Qu’est-ce qu’un OCR ?

OCR signifie « Optical Character Recognition » en Anglais et « Reconnaissance Optique de Caractères » en Français. C’est une technologie qui permet de transformer un document en une chaîne de texte exploitable. Au début, cette technologie était efficace sur les caractères d’imprimerie uniquement. Maintenant, elle s’applique également à l’écriture manuscrite et le recours à l’IA permet encore d’améliorer fortement le taux de reconnaissance.

reconnaissance d'écriture

 

Comment utiliser un OCR sans connaissances techniques ?

Pour utiliser un OCR sans connaissances techniques, il suffit de confier votre projet à Ozytis, société de développement web et mobile. Nous sommes capables de modéliser votre processus métier et de le digitaliser sous forme de logiciel sur mesure. L’OCR est une brique pouvant être intégrée de manière transparente à votre projet qui sera fourni clefs en main.

 

Comment fonctionne un OCR ?

La reconnaissance de caractères est un processus complexe composé de plusieurs étapes :

  • Préanalyse :

Le document est recadré, nettoyé et amélioré pour faciliter la reconnaissance du texte.

  • Segmentation :

Les zones de texte sont détectées et isolées pour être traitées séparément.

  • Reconnaissance de texte :

Il s’agit du traitement réalisé par l’algorithme de reconnaissance d’écriture. Un travail de comparaison avec une bibliothèque de formes connues est réalisé, permettant de générer une chaîne de caractères.

  • Post-traitement :

La ou les langues des textes sont identifiés et les textes sont analysés selon des critères linguistiques et contextuels. L’objectif étant d’ajuster les textes obtenus pour réduire le nombre d’erreurs.

Fonctionnement OCR

 

Comment mettons-nous en place votre projet OCR ?

Chez Ozytis, un projet OCR s’intègre à chaque fois dans un projet de développement sur mesure. Dans les projets où un OCR est nécessaire, nous faisons appel à un service de reconnaissance de caractères à la demande. Pour cela, nous demandons grâce à des API à notre fournisseur de traiter les fichiers souhaités. En retour, nous obtenons les chaînes de caractère correspondant aux fichiers.

Ensuite, ces chaînes de caractères peuvent être entrées dans une base de données puis intégrées dans un processus métier plus large. Voici des exemples d’applications que nous pouvons réaliser suite à une reconnaissance de caractères :

  • Traitement automatique de bordereaux de commande manuscrits + vérification de la cohérence des commandes
  • Identification d’une société sur une facture fournisseur et traitement automatique des factures
  • Classement automatique de documents selon les champs remplis sur les documents
  • Archivage de documents scannés pour les rendre moins volumineux grâce à la transformation d’images en texte
  • Extraction de données à partir d’un grand nombre de fichiers

Nous nous occupons de la conception, de la programmation et du déploiement de chaque solution qui vous est fournie clefs en main.

projet OCR

 

Combien coûte le service d’OCR ?

Le coût propre à la reconnaissance de caractères est d’environ 0,002€ par page scannée.

Ce coût ne comprend pas les coûts initiaux de conception, programmation et déploiement de la solution, à chiffrer en fonction de votre demande.

coût d'un OCR

 

FAQ : quelles sont les caractéristiques du service OCR que nous proposons ?

Quels sont les formats pris en charge par l’OCR ?

Les formats de documents qui peuvent être utilisés pour la reconnaissance de caractères sont le format PDF et les formats image JPEG, PNG, BMP et TIFF.

 

Quelles langues sont supportées par l’OCR ?

Le service que nous utilisons prend en charge 164 langues pour le texte imprimé. En ce qui concerne le texte manuscrit, 9 langues sont prises en charge : l’anglais, le français, l’allemand, l’italien, le portugais, l’espagnol et le chinois simplifié.

 

Le service OCR peut-il traiter des documents de plusieurs pages ?

Oui, le service OCR peut traiter des documents multi-pages.

 

Quelle est la vitesse de reconnaissance des caractères ?

La vitesse de traitement est de quelques secondes par page. Le traitement peut donc se faire quasiment en temps réel.

Partagez cet article

Partager sur facebook
Facebook
Partager sur twitter
Twitter
Partager sur linkedin
LinkedIn

« un bon développeur doit pouvoir comprendre le métier du client et se mettre à la place de l’utilisateur de la solution. Mais cela ne suffit pas car il doit en permanence garder à l’esprit que la maintenance de ce code doit être facile car un autre développeur est susceptible de reprendre le code après lui ».

Grégoire Larreur
Gérant Associé – Direction technique

En poursuivant votre navigation, vous acceptez nos cookies destinés à l’affichage d’annonces liées à vos intérêts et à nos statistiques. Pour aller plus loin, découvrez notre politique de cookies ou gérez vos cookies.