OCRFeeder est une application gratuite et open source de reconnaissance optique de caractères et d'analyse de la mise en page des documents pour Linux. Vous pouvez ajouter des images et des fichiers pdf pour la reconnaissance de caractères et exporter votre contenu en ODT, HTML, PDF et texte brut. Il est livré avec quatre moteurs OCR intégrés, Tesseract, GOCR, Ocrad et Cuneiform. Il est publié sous licence open source GPL-3.0+. Certaines autres fonctionnalités sont le correcteur orthographique, sans papier, l'importation d'images à partir d'un scanner et le décrochage d'images.
OCRFeeder est un système d'analyse de la mise en page des documents et de reconnaissance optique des caractères.
Compte tenu des images, il décrira automatiquement son contenu, fera la distinction entre les graphiques et le texte et effectuera l'OCR sur ce dernier. Il génère plusieurs formats dont le principal ODT.
/image%2F0553596%2F20220118%2Fob_1780a9_ocrfeeder3.png)
Il dispose d'une interface utilisateur graphique GTK complète qui permet aux utilisateurs de corriger tous les caractères non reconnus, de définir ou de corriger les cadres de délimitation, de définir des styles de paragraphe, de nettoyer les images d'entrée, d'importer des PDF, d'enregistrer et de charger le projet, de tout exporter vers plusieurs formats, etc. OCRFeeder a été développé dans le cadre du projet de la thèse de maîtrise en informatique de Joaquim Rocha.
Vous trouverez un wiki d'explication sur l'utilisation du logiciel certes en allemand qui vous permettra de connaître les principales fonctions.
Encore une fois, pour bénéficier de la dernière version du logiciel, je vous invite à passer par le format Flatpak directement sur la plateforme Flathub.
/image%2F0553596%2F20220118%2Fob_2b1f17_telecharger-bleu.png)