`OCR | Reconnaissance Optique de Caractères | Sicara

METHODE IA

Sicara et l'OCR

Sicara développe des solutions OCR

Sicara s'adapte à vos besoins afin de fournir la solution qui vous correspond et extraire toute l'information de vos documents. Selon le type de document (imprimé ou manuscript), la criticité de cette étape dans le traitement global (valeur primordiale, création d'un dataset,...), et les contraintes de temps/sécurité, nous tirons parti de : - L'utilisation d'API spécialisées en OCR (Microsoft Cognitive Services, Google Cloud Vision,...) - L'implémentation d'une solution sur-mesure grâce à notre maîtrise des librairies Python : Keras, PyTesseract et OpenCV

OCR - FR Head
OCR loupe 2

La Reconnaissance Optique de Caractères (ROC ou OCR) est un sous-domaine de la Computer Vision, lié à la Reconnaissance de Formes. Ce champ de l'IA correspond à l'interprétation des textes contenus dans les documents physiques. Ces documents peuvent contenir des textes imprimés et/ou manuscripts ainsi que des images. Les applications connues de l'OCR sont la numérisation de documents (imprimés ou manuscrits), l'extraction d'information (documents officiels, factures, plaques d'immatriculation,...) ainsi que la création de datasets d'entraînenement pour une IA.

2 000

1er OCR en ligne

1 870

1er OCR

2 005

Sortie de Tesseract

Quelques Chiffres

+22%
Documents imprimés chaque année
x10
Taille d'un Scan vs. Document Texte
Background
Background
Quotes

Early versions needed to be trained with images of each character, and worked on one font at a time. Advanced systems capable of producing a high degree of recognition accuracy for most fonts are now common, and with support for a variety of digital image file format inputs.

Logo Wikipedia

Wikipedia

Comment ça fonctionne ?

Principales étapes de l'OCR

Etapes de l'OCR

Comment ça fonctionne ?

Principales étapes de l'OCR

1. Uniformisation des documents (rotation, recadrage, mise en forme, etc.) 2. Détection des zones de texte 3. Interprétation du texte 4. Nettoyage intelligent du texte

Quelques Cas d'Application

Des projets qui tirent parti de la reconnaissance de caractères

Centre tri courrier

Quelques Cas d'Application

Des projets qui tirent parti de la reconnaissance de caractères

L'OCR est utilisé dans deux situations en particulier. Tout d'abord, la numérisation de documents dans un but de stockage pour une utilisation future : indexation pour une recherche simplifiée et dataset pour entraîner des algorithmes d'Intelligence Artificielle. Le second type d'usage vise à remplacer certaines tâches d'un processus global par un moteur OCR afin de gagner en productivité. On retrouve cet usage dans le tri du courrier. Un centre de tri voit transiter quotidiennement des milliers de colis. Depuis son dépôt jusqu'à sa livraison, chaque colis passe par de multiples étapes de routage. L'information permettant ces routages est l'adresse indiquée sur le colis. Automatiser cette reconnaissance textuelle à partir d'une photo, grâce à l'OCR, permet d'améliorer vitesse et qualité du service de livraison.

Nos Experts OCR

Nous avons une Équipe expérimentée dans la Computer Vision

startup, sicara, équipe, travail d'équipe

Nos Experts OCR

Nous avons une Équipe expérimentée dans la Computer Vision

En tant que branche de la Computer Vision, notre spécialité, nous développons des solutions OCR.

Adil

Centrale Paris

Clément

Mines Paris, PhD

Félix

Polytechnique

Raphaël

ENSTA


Articles associés écrits par les Data Scientists Sicara (En Anglais)

Keras, IA, tutoriel, GAN

En finir avec les photos floues en utilisant des GAN avec Keras

Ce tutoriel vous montrera, via des exemples, comment rendre vos images plus nettes grâce à Keras.

Comment commencer avec Keras

Tutoriel Keras : Recherche par images avec un auto-encoder de convolution

Comment trouver des images similaires grâce à un auto-encoder de convolution.

TensorFlow, IA, Docker, GPU

Utiliser Tensorflow et Docker sur une machine GPU en quelques minutes

Docker est la meilleure plateforme pour installer rapidement Tensorflow avec une GPU.

AI FOR BUSINESS

Le Livre Blanc

Comment faire des entreprises françaises les championnes de l'Intelligence Artificielle ? Pendant plusieurs mois, Benoît Limare, CEO de Sicara, était partenaire du Think Tank "AI for Business" - Les Echos avec des représentants d'entreprise et des experts de l'IA et de la Data Science. Ce livre blanc rassemble 20 recommandations qui s'adressent à tous types d'entreprises et managers.

Livre Blanc, IA, Intelligence Artificielle, Meilleures Pratiques, Les Echos