Archivage & Open Source font-ils bon ménage ?

Un mois de mars 2015 riche dans le domaine des archives :

  • La publication le 18 mars 2015 par le NARA (The U.S. National Archives and Records Administration) d’une liste d’outils autour du Records Management
  • L’annonce faite le 10 mars 2015 par le gouvernement du lancement officiel du programme VITAM (Valeurs Immatérielles Transmises aux Archives pour Mémoire)
  • Un nouveau module RM pour Maarch annoncé le 24 mars 2015

Ces 3 événements ont un lien commun car ils parlent tous d’Open Source. Est-ce une tendance de fond ? Est-ce une « bonne » idée d’introduire de l’Open Source dans un système d’archivage ?

Pour moi la question n’est pas là : le système doit répondre aux besoins exprimés et standards du marché avec une gestion de la durée de la conservation, une écriture en Y des contenus, une réversibilité, la gestion des empreintes pour garantir l’intégrité des données et les fonctions habituelles autour du document (accès, métadonnées, recherche…).

Dans le cadre de VITAM,  des briques Open Source seront utilisées  pour fournir un service de dépôt et consultation à base d’API. Pour certains composants, on peut penser qu’ils vont suivre le SILL (Socle Interministériel de Logiciels Libres dont la dernière version est sortie au début du mois de mars)  avec Apache, Tomcat, OpenLDAP, MangoDB (plutôt que PostgreSQL), ElasticSearch…

Mais cela ne concerne que les composants techniques. Il y aura donc des développements autour des spécificités de l’archivage pour implémenter les principes de l’OAIS, de MEDONA, de la 42-013 de MOREQ…

Développements qui seront eux-mêmes proposés en Open Source.

Bref, un beau projet qui n’est pas sans risques notamment au niveau de la capacité à proposer un modèle assez générique pour répondre au versement des différentes applications sources…

PS : Concernant la liste du NARA, j’y reviendrai dans d’autres articles en détaillant certaines solutions intéressantes.

 

Archivage et technologie NoSQL

Les résultats d’une étude  du projet VITAM (projet d’archivage électronique porté par le ministère des Affaires étrangères, le ministère de la Défense et le ministère de la Culture, dont les Archives nationales ; VITAM voulant dire Valeurs Immatérielles Transférées aux Archives pour Mémoire) ont été publiés en septembre 2013.

Cette étude détaille un POC (Proof Of Concept) visant à évaluer l’intérêt de la technologie NoSQL pour des systèmes d’archivages.

Habituellement, les bases de données sont représentées sous forme de modèle relationnel. Ce modèle  peut avoir des limites (volumétrie et performances) et manquer de souplesse (architecture, modèle de données) dans certains cas.

D’où l’apparition de cette « nouvelle » approche baptisée « NoSQL ». Attention, cela ne veut pas dire « No SQL » mais « Not Only SQL », la nuance est importante… (pour aller plus loin sur le NoSQL, une présentation rapide et claire).

Le POC réalisé utilise la base MongoDB et les conclusions sont assez enthousiastes :

…perfect choice in term of performance, requests capabilities and adaptation to the digital administration and to the future digital information governance