iOS 16, macOS Ventura : la fonction "Texte en direct" fait aussi des merveilles dans les PDF

Mickaël Bazoge |

La fonction Texte en direct infuse dans tous les recoins d'iOS 16 et de macOS Ventura. Dans les nouveaux OS, la fonctionnalité OCR d'Apple gagne la possibilité de lire du texte dans les vidéos et peut se déployer dans les applications tierces. Mais cette intégration va encore au-delà puisque Texte en direct peut également faire son œuvre dans les PDF.

Dans Aperçu sous Ventura.
Dans Fichiers sous iOS 16.

C'est particulièrement utile dans les cas où les PDF proviennent d'un scanner, comme c'est le cas dans l'exemple ci-dessus : non seulement il est possible de sélectionner le texte présent dans ce PDF numérisé et assez cracra, mais aussi de rechercher dans le document (les lettres accentuées ne sont pas encore prises en compte par le moteur de recherche). Sous macOS Monterey, le même document dans Aperçu ne donne rien.

Pour bénéficier de la reconnaissance de caractères de Texte en direct sous Monterey à partir de ce fichier, il est toujours possible de faire une capture d'écran : dans ce cas, l'OCR du système va analyser l'image et trouver le texte. Dans Ventura, on se passe de cette étape. Cette nouveauté étant intégrée dans PDFKit, les développeurs pourront l'exploiter dans leurs propres apps.

PDFKit améliore aussi la prise en charge des formulaires présents dans les documents PDF. Ils sont automatiquement reconnus, même si le fichier ne contient pas de champs dédiés.

avatar Deckard | 

Ah ! Enfin ! Ça va être pratique cela. Je me demandais d'ailleurs pourquoi cela ne fonctionnait pas déjà dans la version actuelle de macOS vu que ce sont des images encapsulées dans le PDF et je ne voyais pas pourquoi l'OCR ne pouvait pas leur être appliqués. Je suppose qu'il y avait une bonne raison.

avatar iPop | 

@Deckard

Dans les faits, ça existait déjà puisque je m’en sert déjà souvent même Adobe y était à la page depuis des années. Je ne vois pas trop la nouveauté. Le « huge step » serait que enfin l’OCR puisque reconnaître les paragraphes ou les colonnes parce que en l’état c’est inutile.

avatar Oracle | 

@iPop

Tu parles bien de PDF scannés ? Autrement dit des images ?

avatar iPop | 

@Oracle

Oui

avatar RonDex | 

@iPop

Là, il s’agit de PDF créés à partir d’image et non pas de texte.

avatar iPop | 

@RonDex

Sans doute mais il y a toujours un gros souci : la mise en page. La reconnaissance de colonnes ou de retour à la ligne, le plus souvent on se retrouve avec du texte en vrac, idem pour un tableau.

avatar Deckard | 

@iPop
En effet, comme le disent Oracle et RonDex, je parlait de documents scannés. La selection de texte dans un PDF « classique » est évidemment gérée depuis longtemps. Elle pourrait en effet s'améliorer.

avatar Marcos Ickx | 

C’est super que le lecteur de pdf livré par défaut avec iOS et iPadOS supporte non seulement texte en direct mais aussi la recherche.

Et qu’Apple met cela à disposition de tous les développeurs via PDFKit.

curieux de voir si Readdle va adopter cela dans Documents ou PDFExpert.

À voir.

avatar dolbyEX | 

Super ! étant aveugle, c’est toujours très compliqué quand je reçois un PDF image pour réussir à en faire lire le texte

avatar Rickles69 | 

@dolbyEX

+1

avatar EddyI | 

C’est pratique sur un PDF ouvert, mais il restera préférable d’avoir un PDF Texte ou un PDF scanné par un logiciel qui fait aussi de l’OCR et ajoute donc le contenu texte. Car quand on cherche un fichie, Spotlight ne pourra lire que le contenu de ces PDF là.
Dépannage ponctuel oui, mais ce serait génial que ce soit fait en tâche de fond sur n’importe quel PDF. Même si je me doute de la complexité, puisqu’il faudrait stocker cette donnée quelque part.

avatar Oracle | 

@EddyI

« Car quand on cherche un fichie, Spotlight ne pourra lire que le contenu de ces PDF là. »

Étant donné que ça fonctionne très bien sur l’iPhone pour rechercher dans les photos, je suppose que c’est pareil pour les pdf sur MacOS : le contenu du fichier est indexé et rendu disponible à la recherche sans avoir à l’ouvrir.

Et assez d’accord avec ce qui a été dit avant pour l’iPhone : très dommage que le moteur ne sache pas supprimer les retours à la ligne. C’est pourtant simple à discriminer : des lignes qui s’enchaînent sans ponctuation finale, des sauts de ligne après un point et une majuscule au début…

avatar vincentn | 

L'ajout de Live Text à PDFKit est bienvenu.

Je ne sais pas quelles sont les évolutions sous le capot de Ventura concernant Live Text, mais la logique de fonctionnement devrait être la même que sous Monterey. Howard Oakley l'a décrit sur son remarquable blog, notamment dans ces deux billets :

https://eclecticlight.co/2022/06/01/inside-live-text/
https://eclecticlight.co/2022/06/05/last-week-on-my-mac-the-magic-is-how-not-what/

C'est très différent de la technique classique d'océrisation d'un document quelqu'il soit.

Bref, je ne suis pas sûr que Live Text, en l'état, permette ce que souhaiterait @Eddyl .
Je ne pense pas non plus — je n'ai pas encore Ventura d'installé — que l'on puisse désormais directement dans Aperçu exporter/enregistrer sous un document au format PDF+Texte, recherchable.

Après, Apple propose tous les frameworks nécessaires pour proposer également cette possibilité, et bien plus encore (classification, extraction d'entités nommées, annotations…). Y'a plus qu'à, comme on dit (le framework TabularData, dans un autre domaine, semble aussi sympa).

@iPop Pour cela, nous sortons de l'OCR/ICR pour rentrer dans un autre domaine voire, dans l'idéal, dans celui de l'OLR (https://impresso-project.ch/glossary/olr/).
Ce serait effectivement top, mais je ne suis pas sûr que les frameworks d'Apple le proposent encore.

Petit test pour ceux qui ont déjà installé Ventura.
Vous pouvez me dire comme se comporte Aperçu avec un PDF image comportant un tableau ou des données présentées comme telles ?
Sélectionnez l'ensemble des données du tableau reconnue par Live Text, copiez-les et collez-les par exemple dans Numbers puis dans Pages, pour voir comme elles se comportent.

avatar vomi | 

Génial et bienvenu, mais ça ne marche que sur Mac. Avec Textify, les PDF générés offrent cette fonctionnalité (recherche/sélection) sur toutes les plate-formes : https://apps.apple.com/app/id1522041836
PS : je suis le dev de cette app !

CONNEXION UTILISATEUR