Project Naphta : de l'OCR dans le navigateur
Project Naptha est une nouvelle extension réservée pour le moment à Chrome. Si vous utilisez le navigateur de Google, vous avez tout intérêt à l'essayer, tant elle est impressionnante. Une fois en place, elle analyse toutes les images affichées dans le navigateur pour détecter du texte. Le cas échéant, l'extension permet non seulement de copier le texte, mais aussi d'utiliser la reconnaissance optique de caractères (OCR) pour le copier, ou encore le traduire.
La reconnaissance de texte est très impressionnante. Non seulement l'extension détecte le texte sur des captures d'écran, mais Project Naphta fonctionne aussi sur des images, y compris quand le texte n'est pas droit. Dans l'exemple en-dessous, le texte sur la tranche du livre est correctement détecté et on peut le sélectionner pour le copier ou effectuer les autres traitements proposés par l'extension.
Si la détection de texte est extrêmement efficace, on n'en dira pas autant de la reconnaissance optique de caractères. Elle fonctionne assez bien pour du texte très net et en anglais, mais les autres langues et les cas un peu difficiles, comme le précédent, donnent des résultats très approximatifs. Project Naphta n'en est qu'à ses débuts et d'autres fonctions proposées sont surprenantes d'efficacité. On peut ainsi effacer un texte et, à condition que l'arrière-plan soit simple, obtenir un résultat satisfaisant. On peut même modifier un texte pour écrire autre chose à la place.
Project Naphta est pour le moins impressionnant et mérite un essai, ne serait-ce que par curiosité. L'extension est encore limitée par ses résultats pas toujours parfaits, mais elle est aussi totalement gratuite. À noter qu'il y a un grand nombre de curieux ou d'utilisateurs, ce qui fait que le service ne fonctionne pas toujours très bien. Quoi qu'il en soit, c'est un projet techniquement étonnant et les personnes intéressées devraient prendre le temps de lire la page dédiée à l'extension pour en savoir plus.
Red John °_°
Il y aurais un logiciel de ce genre pour les fichiers scannés ?
@iRobot 5S
"Il y aurais un logiciel de ce genre pour les fichiers scannés ?"
En général les logiciels d'OCR font parti de la suite logiciels fournie avec n'importe quel scanner.
Sinon sur Android (et j'imagine que sur IOS aussi du coup) il y a Google translate qui fait plus ou moins la même chose
"Il y aurais un logiciel de ce genre pour les fichiers scannés ?"
Oui. Notamment : FineReader OCR, Adobe Acrobat et d'autres que je ne connais pas.
Cherches "OCR Mac" tu trouveras des choses.
Sympa, impressionnant et très indiscret.
Le plus impression est qu'il ne s'agit que d'un "bout de code" javascript, qu'il semble être possible d'embarquer sur n'importe quel site : en allant sur le site de Projet Naphta sans l'extension, depuis Firefox ou Chrome, l'OCR marche également.
Il doit donc être possible d'embarquer de l'OCR sur n'importe quel site sans que l'utilisateur n'ait besoin de quoi que ce soit sur son poste, hormis un navigateur moderne.
Ça veut juste dire qu'ils vont encore plus compliquer nos Captchas...
Et pour la vraie vie il y a déjà une app pour ça : Word Lens
http://appshopper.com/travel/word-lens