Project Naphta : de l'OCR dans le navigateur

Nicolas Furno |

Project Naptha est une nouvelle extension réservée pour le moment à Chrome. Si vous utilisez le navigateur de Google, vous avez tout intérêt à l'essayer, tant elle est impressionnante. Une fois en place, elle analyse toutes les images affichées dans le navigateur pour détecter du texte. Le cas échéant, l'extension permet non seulement de copier le texte, mais aussi d'utiliser la reconnaissance optique de caractères (OCR) pour le copier, ou encore le traduire.

Project Naphta en action : on voit sur l'image à droite que le premier couplet a été déjà traduit en français. Le second est sélectionné et on peut alors agir dessus.

La reconnaissance de texte est très impressionnante. Non seulement l'extension détecte le texte sur des captures d'écran, mais Project Naphta fonctionne aussi sur des images, y compris quand le texte n'est pas droit. Dans l'exemple en-dessous, le texte sur la tranche du livre est correctement détecté et on peut le sélectionner pour le copier ou effectuer les autres traitements proposés par l'extension.

Si la détection de texte est extrêmement efficace, on n'en dira pas autant de la reconnaissance optique de caractères. Elle fonctionne assez bien pour du texte très net et en anglais, mais les autres langues et les cas un peu difficiles, comme le précédent, donnent des résultats très approximatifs. Project Naphta n'en est qu'à ses débuts et d'autres fonctions proposées sont surprenantes d'efficacité. On peut ainsi effacer un texte et, à condition que l'arrière-plan soit simple, obtenir un résultat satisfaisant. On peut même modifier un texte pour écrire autre chose à la place.

Project Naphta est pour le moins impressionnant et mérite un essai, ne serait-ce que par curiosité. L'extension est encore limitée par ses résultats pas toujours parfaits, mais elle est aussi totalement gratuite. À noter qu'il y a un grand nombre de curieux ou d'utilisateurs, ce qui fait que le service ne fonctionne pas toujours très bien. Quoi qu'il en soit, c'est un projet techniquement étonnant et les personnes intéressées devraient prendre le temps de lire la page dédiée à l'extension pour en savoir plus.

avatar iDanny | 

Red John °_°

avatar iRobot 5S | 

Il y aurais un logiciel de ce genre pour les fichiers scannés ?

avatar phantoom | 

@iRobot 5S

"Il y aurais un logiciel de ce genre pour les fichiers scannés ?"

En général les logiciels d'OCR font parti de la suite logiciels fournie avec n'importe quel scanner.

Sinon sur Android (et j'imagine que sur IOS aussi du coup) il y a Google translate qui fait plus ou moins la même chose

avatar patrick86 | 

"Il y aurais un logiciel de ce genre pour les fichiers scannés ?"

Oui. Notamment : FineReader OCR, Adobe Acrobat et d'autres que je ne connais pas.

Cherches "OCR Mac" tu trouveras des choses.

avatar Boumy | 

Sympa, impressionnant et très indiscret.

avatar ssssteffff | 

Le plus impression est qu'il ne s'agit que d'un "bout de code" javascript, qu'il semble être possible d'embarquer sur n'importe quel site : en allant sur le site de Projet Naphta sans l'extension, depuis Firefox ou Chrome, l'OCR marche également.

Il doit donc être possible d'embarquer de l'OCR sur n'importe quel site sans que l'utilisateur n'ait besoin de quoi que ce soit sur son poste, hormis un navigateur moderne.

avatar iPoivre | 

Ça veut juste dire qu'ils vont encore plus compliquer nos Captchas...

avatar mathiasr | 

Et pour la vraie vie il y a déjà une app pour ça : Word Lens
http://appshopper.com/travel/word-lens

CONNEXION UTILISATEUR