PDF/A : LE format pour archiver ?

Le PDF (Portable Document Format), défini par la société Adobe, est normalisé depuis juillet 2008 (ISO 32000-1). Il repose sur la version 1.7 et correspond à Acrobat V8.

On peut souvent lire : « PDF est un bon format pour archiver car on ne peut pas le modifier ». Malheureusement, ce n’est pas vrai. Il existe des outils permettant de manipuler le contenu. Et un bon format à archiver repose sur d’autres critères : ouvert, libre, « lisible »…

En plus du classique PDF, il existe une famille adaptée à l’archivage appelée PDF/A (A pour … Archive). Ces formats sont également normalisés (ISO 19005-1, ISO 19005-2 et ISO 19005-3) et apportent au PDF classique des caractéristiques adaptées à l’archivage.

La principale restriction par rapport au PDF concerne tout ce qui touche à l’aspect dynamique et le caractère non-autoporteur qui sont antinomiques avec l’archivage. Donc le PDF/A « embarque » les polices de caractères, n’autorise pas un affichage dynamique (le format PDF peut afficher des informations ou non suivant des paramètres), n’autorise pas l’inclusion de scripts d’action…

Cependant, comme énoncé plus haut, il existe 3 versions (avec différents niveaux de conformité dans chacune d’elle) :

  • PDF/A-1 (ISO 19005-1:2005) est basée sur le format PDF v1.4. Le cryptage du document n’est pas autorisé
  • PDF/A-2 (ISO 19005-2:2010) est basée sur le format PDF v1.7 (lui même  ISO 32000-1:2008). Il permet d’utiliser la transparence, d’insérer d’autres fichiers PDF/A, supporte le JPGEG2000 et peut inclure une signature numérique
  • PDF/A-3 (ISO 19005-3:2012) est basée sur le format PDF v1.7. Il permet d’insérer des documents de tout format

Le PDF/A est un des formats à considérer pour l’archivage. Notamment pour tous les documents bureautiques. Mais il faut préciser exactement la version et le niveau de conformité retenus. Et n’oubliez pas de mettre en place un processus de validation du format avec un outil qui testera que le fichier est bien conforme à ce qu’il prétend être.

Pour l’archivage, la version PDF/A-3 est à utiliser avec précaution. En effet, il est possible d’inclure dans le fichier PDF, un fichier au format propriétaire. Une utilisation possible est de mettre, par exemple, le fichier Word source inséré dans le fichier PDF qui pourrait représenter le document signé. On a ainsi l’ensemble des informations dans un seul fichier. Une autre utilisation potentielle de la version A-3 est de représenter un email…
L’alternative, que je préfère, est d’archiver les fichiers séparément tout en gardant un lien (via une métadonnée indiquant la référence par exemple).

Ma préférence va donc au format PDF/A-2.

Pour aller plus loin sur le PDF et PDF/A, voici quelques ressources supplémentaires :