OCRkit : un OCR bon marché

Arnaud de la Grandière |
OCRkit se veut d'une simplicité extrême : glissez votre document (au format PDF, TIFF, BMP, PNG, PNM, ou JPEG) sur l'icône de l'application, et vous obtiendrez en échange un fichier PDF contenant le texte détecté (en Anglais, Allemand, Français, Italien ou Espagnol).

Le fichier PDF résultant contient l'image originale à laquelle est liée le texte détecté, qui devient "sélectionnable".

Capture%20d%E2%80%99e%CC%81cran%202010-01-19%20a%CC%80%2015.31.38


Vous pourrez ainsi effectuer des recherches avec Spotlight sur le contenu textuel de vos images et en utiliser le texte selon vos besoins. Une version de démonstration, valable deux semaines, est disponible. Le logiciel fonctionne à partir de Mac OS X 10.4 sur processeurs Intel uniquement, pour le prix de 39 €.
Tags
#PDF #ocr
avatar r e m y | 

Très malin comme idée.... je vais aller tester de suite.

avatar nicogala | 

Sur que ça serait pas mal (comblerait des lacunes de Prizmo) mais ça serait bien de pouvoir l'essayer... j'ai rempli 3 fois le formulaire et tjrs rien...

avatar iDuck | 

Avec MP Navigator, le logiciel de scan de Canon fourni avec les matériels de la marque, on scanne au format PDF puis on ouvre le fichier PDF avec Aperçu et le texte est sélectionnable.

avatar Arnaud de la Grandière | 

@ nicogala : la démo est envoyée en pièce jointe de l'email, elle fait 5,9 Mo, ce qui peut être refusé par certains fournisseurs (sur certains serveurs la taille des mails est limitée à 5 Mo).

avatar Ambobo25000 | 

Pour les graphistes et autres détenteurs du logiciel Adobe Acrobat pro, sachez qu'il possède un excellent outil ocr aussi. Sinon, si vous en voulez un totalement gratuit: il y a GOCR mais il faut passer par le Terminal

avatar nicogala | 

@Nonoche, je sais, j'ai bien lu, c'était qu'ils étaient longs à envoyer (20mn qd même)

Par contre ce logiciel ne fonctionne pas chez moi : il plante inopinément systématiquement au delà de qques pages (5 à 7) et consomme une RAM folle : launchd monte à 2Go, le swap aussi et me fout 600 000 pages out pour rien au final. En plus il est même pas multithread.

Bref : fuyez braves gens, ce logiciel est même pas digne d'une beta !!

avatar Almux | 

Oui, finaud, vraiment très finaud... et qui risque bien de devenir rapidement incontournable... A voir...

avatar terreaterre | 

>> launchd monte à 2Go, le swap aussi et me fout 600 000 pages out pour rien au final.
>> En plus il est même pas multithread.

C'est un test du logiciel ou du système ?

avatar nicogala | 

@terreaterre : ben tiens, fais le test et dis-nous ce que tu en pense, ça sera plus concret que des remarques ironiques...

avatar Garulfo | 

Sinon vous avez également ce site et c'est gratuit. http://www.free-ocr.com

avatar rdana | 

sinon, au rayon bonnes affaires, Readiris 11 est à 25 € sur amazone actuellement...

avatar Le docteur | 

Tiens ! C'est vrai : quelques ReadIris 11 à 25 euros (dans la version boîte en plus, qui est à préférer résolument à la version téléchargeable avec activation inside).
Mais ReadIris marche mieux que cet OCR.

Pour arriver au même nombre d'erreurs sur Amazon, il faut aller chercher un OmniPage X (qui date de 2002-2003, si je ne m'abuse) et qui n'est vendu que... 379 euros.
Sans plaisanter les résultats (assez mauvais, il faut bien le dire d'OCRKit)sont comparables à ce qu'on obtient avec ce vieux logiciel abandonné par son éditeur, mais encore vendu à des sommes délirantes.

avatar Le docteur | 

Si vous voulez un truc rapide pour exporter essentiellement en Word il y a encore Abby FineReader pour Mac, mais sachez qu'il est en gros limité à l'usage que je viens de décliner. A proscrire pour le PDF de qualité vraiment trop mauvaise, à moins que ça ne nous arrange de compresser à mort nos fichiers.
Le plus "clean" reste pour l"instant Iris 12 (toujours en boîboîte, ne serait-ce que pour ne pas cautionner la pratique de l'activation).
Le jour ou Abby se décidera à sortir une vraie version avec des réglages, vu le niveau de la reconnaissance, ils explosent tout.
Omnipage, visiblement ils ont loupé l'augmentation du nombre de personnes sur Mac, ou s'en foutent, leur logiciel est définitivement à la rue.

avatar Le docteur | 

A noter : je parle de la version "express" de FineReader, on attend encore une version "Pro" pour Mac.

avatar rdana | 

Pour readiris sur amazon, aprés renseignements, c'est une erreur de prix ;-)

avatar teddyR | 

Et bien franchement [url=http://www.free-ocr.com/] remplis très bien sa mission.
Testez, pour une page en pdf, quelques erreurs, deux trois mots à retaper et un temps de réponse rapide, gratuit en ligne.

Merci Garulfo.

avatar Le docteur | 

Test de la dernière version sortie aujourd'hui (1.02) : gros progrès. Ca devient très correct, facilement paramétrable pour ce qui est de la qualité du PDF, et il n'y a pas trop d'erreurs.
Si ReadIris et FineReader veulent tenir face à ce logiciel, il va falloir qu'ils alignent leurs prix.

CONNEXION UTILISATEUR