PDF Diff vous permet de comparer les différences entre deux PDF en un coup d'œil

Félix Cattafesta |

Voici une application récente très spécifique, mais qui pourra s'avérer utile pour ceux qui travaillent avec de nombreux PDF. PDF Diff vous permet de comparer rapidement les différences textuelles entre deux fichiers PDF.

Ce logiciel développé par Alexander Jaehrling est très simple d'utilisation : glisser un PDF d'un côté, un second de l'autre, et le logiciel va rapidement surligner les différences. Il peut ensuite générer une version texte mélangeant les deux versions que l'on peut copier-coller. Le développeur met en avant une utilisation pour les métiers nécessitant de comparer plusieurs contrats ou pour les développeurs ayant à corriger leurs conditions d'utilisation.

Si cette application est très efficace, certaines fonctions sont tout de même manquantes : on aurait aimé pouvoir exporter le texte comparé directement dans un document ou pouvoir enregistrer ses comparaisons pour y revenir sans devoir tout recommencer. L'application est disponible pour 21,99 € sur le Mac App Store.

Kaleidoscope fait la même chose pour le tarif nettement plus onéreux de 74,99 €, mais cette application permet aussi de comparer des fichiers, images et autres types de documents. Si vous désirez comparer des fichiers de manière occasionnelle, le site Diffchecker propose un service directement depuis le navigateur.

avatar Splinter | 

Draftable fait ça parfaitement et gratuitement !

avatar jackhal | 

Peut-être, mais ici on reprend Daring Fireball.

avatar Splinter | 

@jackhal

😅😅😅

avatar hercut | 

Il me semble que Acrobat fait ca aussi ?

Et les outils en ligne, comment sont gérés les documents envoyés ??? Confidentialité ???

avatar Splinter | 

@hercut

C'est un peu le problème...

avatar fredseg | 

@hercut

Ce n’est pas parce qu’une version est desktop qu’elle est ne va pas se connecter au réseau pour fournir une copie des contrats aux espions, et inversement une app réseau peut être tout à fait respectueuse de la confidentialité. Je ne sais pas dans le cas de draftable, c’est juste pour dire que la confidentialité n’est pas forcément liée au fait d’être en ligne ou non. La seule différence indiscutable est la rapidité d’exécution et la disponibilité pour les power users.

avatar holzmann | 

C’est génial pour corriger les copies des élèves !!!

avatar RonDex | 

@holzmann

Enseignants = fainéants 😁

J’ai vu à la TV il y a plusieurs années qu’il existait un logiciel pour les enseignants pour vérifier si les élèves faisait des copier coller d’Internet.
Je n’ai jamais pensé à regarder. Mais il existe des logiciels pour faciliter la tâche aux enseignants : vérifier les copier coller, et autres sortes d’outils ?

P.-S. Je plaisante bien sûr. C’est un métier difficile et largement sous payé. Sans parler qu’ils sans complètement dénigré par les politiques (les ex. sont nombreux et c’est pas le but de ce post). La moitié de ma famille étant enseignants (de la maternelle à la fac), et pas mal d’ami. Tout ça pour dire de ne pas me lapider 😅

avatar vincentn | 

Un peu cher et limité par rapport aux fonctionnalités de Kaléidoscope (déjà très cher mais chouette) ou BeyondCompare par exemple.
Après reste toujours la ligne de commande… 😁

avatar occam | 

Si le texte contenu dans les PDF est accessible, BBEdit lira les PDF comme des fichiers texte. Sa fonction ‘Find Differences’ fournira en tableau parallèle les différences de contenu, ligne par ligne.

La fonction ‘diff’ de macOS fait la même chose :
https://osxdaily.com/2018/02/06/use-diff-compare-files-command-line-mac/

Sinon, il existe de nombreuses variantes de cet outil en Python, dont l’idée de base est de transformer les PDF en bitmap et d’en souligner les aires différentes :
https://pypi.org/project/pdf-diff/
Simple, gratuit, et une fois qu’on aura appris l’universalité de tels outils, on ne voudra plus débourser ses deniers pour résoudre des problèmes basiques sur lesquels des générations d’élèves en informatique ont déjà pioché.

Au grand dam de l’App Store.

avatar xDave | 

@occam

👍🏽👍🏽👍🏽

avatar BeePotato | 

@ occam : « La fonction ‘diff’ de macOS fait la même chose : »

Non.
Lorsqu’on lui fournit des fichiers non textuels, diff se contente d’indiquer s’ils sont identiques ou non. Et si on le force à considérer le contenu de fichiers PDF comme du texte, on aura droit à une sortie bien peu lisible pour la plupart des gens — et potentiellement fausse, du point de vue de la comparaison du contenu textuel des PDF : deux fichiers PDF peuvent être très différents tout en contenant exactement le même texte.

« Sinon, il existe de nombreuses variantes de cet outil en Python, dont l’idée de base est de transformer les PDF en bitmap et d’en souligner les aires différentes : »

Principe intéressante, mais qui ne fournit pas du tout la même fonction que l’utilitaire présenté ici. Pour une comparaison de texte, c’est potentiellement beaucoup moins efficace.

« Simple, gratuit, et une fois qu’on aura appris l’universalité de tels outils, on ne voudra plus débourser ses deniers pour résoudre des problèmes basiques sur lesquels des générations d’élèves en informatique ont déjà pioché.
Au grand dam de l’App Store. »

Finalement, après avoir fait le tours de ces « solutions » alternatives proposées, on se rend compte qu’il peut y avoir de l’intérêt à acheter un petit utilitaire bien fait sur l’App Store. 😛

Pour ma part, pour faire une telle comparaison de PDF je me satisferais tout à fait de FileMerge (qui présente son résultat de façon bien plus agréable que diff) couplé à un filtre faisant l’extraction du texte des PDF. Malheureusement, à ma connaissance MacOS ne fournit toujours pas par défaut de tel filtre utilisable en ligne de commande. J’aimerais bien que textutil soit mis à jour pour gérer les PDF en plus des autres formats qu’il traite déjà.

avatar ablyes | 

BeyondCompare peut comparer les pdf, mais en binaire, ce qui n'a aucun sens.
Il reste super pour le reste.

@Splinter
Draftable n'est gratuit que 5 jours si l'on désire la version desktop.
La version en ligne pour des contrats ... je m'en méfierais.

@occam
La commande diff va compater le binaire non ?
Sinon ton lien vers le projet python m'interesse, mais j'ai une erreur 503, ou parfois une page vide...

avatar Splinter | 

@ablyes

La version en ligne de Draftable, je m'en sers pour des conclusions. Ce n'est pas confidentiel, la justice est publique 😅

avatar occam | 

@ablyes

"La commande diff va compater le binaire non ?
Sinon ton lien vers le projet python m'interesse, mais j'ai une erreur 503, ou parfois une page vide... "

1. Lien python : vérifié, celui que j’ai donné est actuel et correct. Marche sur iPad, W10 et Linux, les 3 systèmes à portée de main.
Vous y allez sur quel OS, avec quel navigateur ?
Quand j’ai des problèmes du genre, c’est en général en Safari sur iPadOS.

avatar occam | 

@ablyes

2. « Diff » binaire ?
Non, diff opère sur tous les fichiers, je l’utilise en priorité pour des .txt.
Pour s’assurer de n’opérer que sur .txt, mettre flag -a.
Pour listing des différences en 2 colonnes, flag -y.

avatar occam | 

@ablyes

3. L’app igen a systématiquement oblitéré mon commentaire après le premier « diff » hors guillemets.
C’est pourquoi j’ai dû scinder en plusieurs commentaires.
Apparement, « diff » a ici encore une fonctionnalité cachée...

avatar occam | 

@ablyes

"erreur 503"

Just in : peut-être en rapport avec cette défaillance à grande échelle ?
https://www.theguardian.com/technology/2021/jun/08/massive-internet-outage-hits-websites-including-amazon-govuk-and-guardian-fastly

CONNEXION UTILISATEUR