Quand vous envoyez un PDF, vous pensez ne partager que le contenu visible du document. En réalité, chaque PDF contient un ensemble de métadonnées invisibles qui peuvent révéler bien plus que vous ne le pensez : votre nom complet, le logiciel que vous utilisez, l'historique de vos modifications, et parfois même la structure interne de votre organisation.
Ce que contiennent les métadonnées d'un PDF
Le nom de l'auteur
C'est l'information la plus courante. Le champ « Auteur » est automatiquement rempli par le logiciel de création avec le nom du compte utilisateur de l'ordinateur. Si votre session Windows s'appelle « Jean-Pierre Durand », chaque PDF que vous créez portera cette signature invisible.
Cela peut poser problème dans plusieurs situations :
- Vous envoyez un document au nom de votre entreprise, mais le nom personnel de l'employé qui l'a rédigé apparaît
- Vous soumettez un document censé être anonyme (évaluation, appel d'offres)
- Vous rédigez un document pour quelqu'un d'autre et votre nom trahit le véritable rédacteur
Le logiciel de création
Le champ « Créateur » et « Producteur » indique précisément le logiciel utilisé pour créer le PDF : « Microsoft Word 2021 », « Adobe InDesign CC 2024 », « LibreOffice 7.6 ». Cette information peut révéler :
- La licence logicielle de votre entreprise
- Si vous utilisez un logiciel gratuit ou professionnel
- La version exacte du logiciel (utile pour cibler des vulnérabilités)
Les dates
Chaque PDF enregistre au minimum deux dates : la date de création et la date de dernière modification. Ces horodatages peuvent être révélateurs :
- Un document daté du « 15 mars » dans le texte mais créé le « 2 mars » dans les métadonnées montre une antidatation
- La différence entre création et modification révèle combien de temps le document a été travaillé
Attention Dans un contexte juridique, les métadonnées d'un PDF peuvent être utilisées comme preuves. Des avocats ont déjà exploité l'écart entre la date affichée dans un contrat et la date de création dans les métadonnées pour démontrer une antidatation.
Les chemins de fichier
Certains logiciels intègrent le chemin complet du fichier source dans le PDF. Cela peut exposer la structure de vos dossiers : C:\Users\jean-pierre.durand\Desktop\Clients\Société_XYZ\Proposition_confidentielle_v3.docx. Ce seul chemin révèle le nom de l'utilisateur, le nom du client et le fait qu'il s'agit d'une troisième version.
Les métadonnées XMP
Le standard XMP (Extensible Metadata Platform) permet d'embarquer des informations encore plus détaillées : mots-clés, description, droits d'auteur, et même un historique des outils utilisés pour les modifications successives.
Le saviez-vous ? En 2003, le gouvernement britannique a publié un dossier sur l'Irak au format Word. Les métadonnées révélaient l'historique complet des modifications et les noms de tous les contributeurs, créant un scandale politique. Les PDF contiennent moins d'historique, mais les métadonnées restent problématiques.
Les risques concrets
Fuite d'identité dans les appels d'offres
Dans les marchés publics, les offres doivent parfois être anonymes. Si le nom de l'auteur apparaît dans les métadonnées, l'anonymat est rompu.
Espionnage industriel passif
Un concurrent qui reçoit vos documents commerciaux peut analyser les métadonnées pour cartographier votre organisation : qui rédige quoi, quels logiciels vous utilisez, quand vos documents sont créés.
Atteinte à la vie privée
Un freelance qui travaille sous un pseudonyme commercial voit son identité réelle exposée par les métadonnées de ses factures.
Vulnérabilité technique
Connaître la version exacte du logiciel utilisé pour créer un PDF peut permettre à un attaquant de cibler des failles connues de cette version.
Comment vérifier les métadonnées de vos PDF
Avant de nettoyer, il est utile de voir ce que vos documents contiennent. Ouvrez un de vos PDF et consultez ses propriétés (Ctrl+D dans la plupart des lecteurs PDF). Vous y trouverez les champs Auteur, Créateur, Producteur, et les dates.
Pour une analyse plus complète, des outils spécialisés extraient l'ensemble des métadonnées, y compris les données XMP.
Comment nettoyer les métadonnées
Le nettoyage des métadonnées supprime les champs d'information sans modifier le contenu visible du document. Le résultat est un PDF identique visuellement, mais débarrassé de ses données cachées.
Pour les instructions détaillées : Nettoyer les métadonnées d'un PDF.
Astuce Prenez l'habitude de nettoyer les métadonnées avant chaque envoi de document à l'extérieur de votre organisation. Cela devrait faire partie de votre processus de vérification, au même titre que la relecture orthographique.
Les bonnes pratiques
- Nettoyez systématiquement avant tout partage externe
- Configurez votre logiciel : dans Word, allez dans Fichier > Informations > Vérifier la présence de problèmes > Inspecter le document
- Vérifiez après nettoyage : ouvrez les propriétés du PDF nettoyé pour confirmer que les champs sont vides
- Sensibilisez vos collègues : dans une entreprise, un seul document non nettoyé peut suffire à exposer des informations sensibles
En résumé
Vos PDF parlent de vous sans que vous le sachiez. Nom de l'auteur, logiciel, dates, chemins de fichier — autant d'informations que vous partagez involontairement à chaque envoi. Le nettoyage des métadonnées est une opération rapide et gratuite qui devrait devenir un réflexe.
Commencez par vérifier un de vos PDF récents : vous serez probablement surpris par ce qu'il contient. Puis nettoyez vos métadonnées avant votre prochain envoi.