Ouvrir le menu principal

MacGeneration

Recherche

De plus en plus d’apps exploitent le moteur d’OCR fourni par Apple avec macOS

Nicolas Furno

jeudi 03 juin 2021 à 18:30 • 18

Logiciels

Depuis macOS Catalina, Apple propose à tous les développeurs son propre moteur de reconnaissance optique des caractères, ou OCR. Et depuis macOS Big Sur, ce moteur est capable de transcrire de multiples langues, dont le français et l'anglais. Cette possibilité simplifie grandement la création d’apps d’OCR, comme en témoigne l’arrivée de plusieurs utilitaires sur ce segment. Nous avions évoqué TextSniper en début d’année, mais c’est loin d’être le seul.

TRex est une app très similaire, qui repose elle aussi sur le moteur d’OCR d’Apple. Nichée dans la barre des menus de macOS, elle reprend l’interface des captures d’écran et ajoute au presse-papiers tout texte identifié dans la zone sélectionnée. Après quelques essais, le logiciel fonctionne tout aussi bien et il a l’avantage d’être gratuit et open-source, même si on peut aussi aider le développeur en l’achetant 5,49 € sur le Mac App Store.

TRex en action, avec la même interface pour sélectionner la zone de texte à identifier que pour les captures d’écran (gauche). À droite, les réglages de l’app en haut et le texte extrait par l’OCR d’Apple en bas.

Les résultats sont bons pour copier rapidement quelques lignes de texte et TRex a de bonnes idées, notamment en permettant d’ouvrir directement dans le navigateur les URL identifiées. L’app peut même le faire pour les codes QR, si vous le souhaitez. Cet ajout de fonctions annexes est obligatoire pour sortir du lot, le moteur d’OCR étant désormais commun à de plus en plus d’apps.

D’ailleurs, même les poids-lourds du secteur l’adoptent. La preuve avec Prizmo, acteur historique sur ce marché, qui propose à son tour le moteur d’OCR d’Apple dans sa dernière mise à jour. Avec le risque de perdre sa particularité et ses points forts ? Pas vraiment, nous ont répondu les développeurs qui mettent en avant toutes les fonctions annexes qui améliorent le travail de reconnaissance de caractères et sont essentielles pour les photos. Il faut cadrer correctement les pages, les orienter dans le bon sens et encore les nettoyer pour obtenir de meilleurs résultats.

En outre, le moteur d’OCR d’Apple est excellent, mais pas parfait. En particulier, il n’est pas bien adapté pour identifier la structure d’un document. C’est une faiblesse quand on veut extraire un texte sur plusieurs colonnes, par exemple : le moteur d’Apple aura tendance à confondre les deux colonnes, ce qui donne un texte incompréhensible. Pour compenser, les développeurs de Prizmo ont mis au point un mécanisme qui améliore les résultats générés par Apple, notamment en détectant en amont les colonnes.

Grâce à ce travail réalisé en plus de celui d’Apple, les résultats obtenus avec Prizmo devraient être meilleurs que les apps qui n’utilisent que l’OCR fourni par le système. Cela étant, la dernière version de l’app conserve l’OCR basé sur Tesseract, solution open-source qui fait référence dans le domaine. Ses créateurs ont jugé que les résultats obtenus par l’OCR d’Apple étaient suffisamment bons pour en faire le choix par défaut, mais vous pouvez privilégier l’autre moteur si un document pose problème.

Exemple fourni par les développeurs de Prizmo d’un document mal géré par le moteur d’OCR d’Apple par défaut : à gauche, la reconnaissance des lignes effectuée par Apple pose problème, on note plusieurs colonnes ignorées notamment sous la plaque de rue. À droite, le même document passé par le moteur d’ajustement de Prizmo, puis l’OCR d’Apple : il n’y a plus de problème de colonne mal gérée.

Apple met continuellement à jour son moteur d’OCR, qui sert aussi dans iOS et iPadOS. C’est lui, notamment, qui identifie le texte manuscrit dans l’app Notes et pour la fonction griffonner d’iPadOS 14. L’entreprise a tout intérêt à l’améliorer et toutes les apps qui reposent sur lui profiteront automatiquement de ces progrès.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Apple : des résultats solides, mais la Chine et les droits de douane inquiètent

01/05/2025 à 22:56

• 14


La direction de Tesla aurait cherché un remplaçant pour Musk, suite aux difficultés de l’entreprise

01/05/2025 à 21:00

• 61


Microsoft augmente les prix des Xbox, de leurs manettes et de leurs jeux

01/05/2025 à 16:05

• 55


MacBook Air M4 : la chute des prix se poursuit encore sur ce nouvel incontournable 🆕

01/05/2025 à 15:30

• 55


Profitez de Microsoft Office à petit prix pendant les French Days 2025 📍

01/05/2025 à 15:20

• 0


Nos trucs et astuces pour mieux utiliser Apple Pay sur votre iPhone

01/05/2025 à 15:20

• 32


French Days : le très robuste SSD externe Samsung T7 Shield 2 To à 169 € (- 23 %)

01/05/2025 à 11:30

• 9


French Days : Orange et Sosh suppriment les frais de mise en service qui venaient d’être ajoutés

01/05/2025 à 11:00

• 20


Gabriel Attal souhaite limiter drastiquement l’accès des mineurs aux réseaux sociaux, en imitant la Chine

01/05/2025 à 10:30

• 68


Apple mord la poussière face à Epic, mais ne rend pas les armes

01/05/2025 à 10:00

• 62


French Days : CyberGhost, le meilleur VPN pour Mac à 2,03 € par mois (et franchement, vous auriez tort de vous en priver) 📍

30/04/2025 à 23:47

• 0


Google : NotebookLM génère des podcasts en français à partir de vos documents

30/04/2025 à 16:24

• 20


Raycast arrive sur l’iPhone, essentiellement pour les fonctions liées à l’IA

30/04/2025 à 15:06

• 5


Free Pro passe à 8 Gb/s en symétrique pour tous les clients, mêmes les anciens

30/04/2025 à 13:30

• 31


Voler une voiture ? Jamais ! Utiliser une police sans autorisation sur des DVD ? Toujours

30/04/2025 à 12:34

• 39


Starlink offre l'antenne dans certains pays si vous vous engagez pour un an

30/04/2025 à 11:45

• 49