Google Docs passe les fichiers à l'OCR

Florian Innocente |
L'OCR figure désormais parmi les services de Google Documents. En envoyant sur son compte un fichier PDF ou une image contenant du texte, Google Docs va tenter de le retranscrire sous une forme exploitable dans son module de traitement de texte. Cette reconnaissance de caractères fonctionne avec le Français, l'Anglais, l'Allemand, l'Italien et l'Espagnol (d'autres langues vont suivre). L'ingénieur en charge de ce projet dit avoir utilisé des technologies développées par l'équipe de Google affectée à la numérisation d'ouvrages (Google Books).

googledococr


Pour le faire fonctionner, il faut cocher l'option "Convertir le texte de fichiers" dans la page d'importation de Google Docs et ne pas dépasser les 1 Mo pour le document à traiter. Aussitôt importé, aussitôt traduit, il est prêt à être édité en ligne ou exporté vers le bureau.

Nous lui avons soumis une capture d'écran (jpeg) de bonne qualité d'un extrait article.

ocrgoogle2

Il faudra repasser derrière… Le nom iPhone par exemple est écorché de différentes manières quand il n'est pas, à un endroit, proprement escamoté. Autre exemple "l'avis" devient "lävis" ; "Apple" parfois est écrit "App|e", etc. Les i et les l semblent en particulier lui donner du fil à retordre.

Cette fonction gratuite peut néanmoins rendre service (le cas échéant, en fonction du résultat), en dégrossissant l'essentiel du texte et évitant ainsi une saisie intégrale.
avatar arork | 
Ca c'est cool, moi qui voulait convertir des recettes de cuisines scannee de bouquins
avatar iDuplo | 
Et après le texte pars dans les archives de Google, vive la protection de la vie privée!!
avatar Yamtaijika | 
@ iDuplo Dès lors que tu as posté ton commentaire, tu es en droit de remettre en question la protection de ta vie privée....
avatar myckmack | 
Je n'arrive pas à avoir l'interface de Google Docs en français ! Edit : j'ai trouvé !
avatar Tristan971 | 
Si tu veux protéger ta vie privée, qu'est-ce que tu vas envoyer des documents importants sur le site de google documents? (à moins d'être bête...)
avatar Mithrandir | 
Si il faut reprendre derrière à ce point, ça ne sert à rien...
avatar Florian Innocente | 
@ Mithrandir : dans cet exemple ci, il y a de grosses erreurs mais un paquet du texte n'a pas à être retouché. ce sera toujours plus rapide que de le saisir à la main.
avatar Coulonval | 
Vous avez un explication plus détaillée, je n'arrive pas à faire l'OCR :( Quel boulet ...
avatar collodion | 
Ça ne permet de pas se priver de faire un scan ou une photo d'extrême bonne qualité : texte droit, contraste élevé... (un blanc plus que blanc et une typographie très lisible). Quitte à bousiller la tranche du bouquin. Mais je vais éviter... Merci pour la nouvelle, je garde dans un coin. Ça pourrait me rendre de fiers services.
avatar YannK | 
"Dès lors que tu as posté ton commentaire, tu es en droit de remettre en question la protection de ta vie privée...." Oui mais au moins il en est conscient. Combien de gens qui utilisent gmail ou le moteur de recherche sans savoir à peu près comment Google fait de l'argent ? Des millions. Et malheureusement, c'est une réalité. Si un gouvernement se permettait autant que cette entreprise de fichage (le GoogleID existe et a toujours existé, et il permet même d'identifier des utilisateurs en surf privée ou en IP dynamique), les rues seraient à feu et à sang. Alors après on peut me dire qu'on peut ne pas utiliser les services, alors je demande en toute logique pourquoi Google ne demande pas à une personne si elle a le droit d'indexer des infos sur elle à priori...
avatar gazobu | 
j'adore cette parano anti Google, au demeurant elle provient des mêmes qui montrent jusqu'au contenu de leurs intestins sur Facebook. merci Gloogloo de passer mes PDF à l'OCR (si au passage tu enregistres pour toi les réglages du zoom dans le manuel PDF de mon APN, t'en fais cadeau, fais en bon usage)
avatar collodion | 
Le fait de naître au monde constitue le premier fichage. Personne ne peut en échapper. Les fichiers de la sécurité sociale c'est de l'or en barre... Mais étrangement google semble plus menaçant.
avatar Coulonval | 
sinon une indication ?
avatar collodion | 
Tu importes un document et tu n'oublie pas de cocher la case comme montré dans la capture d'écran du billet. Si l'OCR ne se fait pas c'est que ton document n'est pas assez lisible. Pour cela il faut suivre les indications de type et de taille.
avatar nitrow | 
A gabuzo (meuh) : ça n'aurais pas été plus simple de télécharger directement le manuel depuis le site web du constructeur pour ton appareil photo ?

CONNEXION UTILISATEUR