Cela fait plus de trois mois désormais que je travaille pour le projet EDEN au sein de la TIB (Leibniz Information Centre for Science and Technology and University Library). Le temps et l’énergie me manquent pour poursuivre ce blog, et c’est bien dommage, mais je vais essayer de le continuer malgré tout. J’ai publié, au cas où vous l’auriez manqué, un billet assez velu sur une restauration numérique de PDF sur le site de l’OPF. Cette activité, pourtant secondaire, de technical analysis, m’a amené à me plonger dans les entrailles de PDF particulièrement tordus et à découvrir les beautés et les complexités parfois difficilement justifiables de ce format.

Mais mon activité principale, actuellement, est de mener une petite équipe chargée de décrire formellement une trentaine de processus qui forment le cœur de ce qu’on appelle « préservation numérique ». C’est exigeant, assez stimulant, mais parfois on ne peut éviter de se cogner la tâche qui me déprime le plus dans mon métier :

Tenter de concilier un modèle conceptuel avec la réalité pratique de notre activité

Et, au premier rang de ces modèles, il y en a un que j’ai pas mal pratiqué et dont le nom me plonge toujours dans l’effroi le plus profond, j’ai nommé

OAIS

pour Open Archival Information System.

Pour celles et ceux qui ne le connaissent pas, il s’agit d’une norme produite par le CCSDS, organisme international de normalisation spécialisé dans les études spatiales, et ensuite portée à l’ISO en 2002 (v. 1), en 2007 (v. 2) et en 2024 (v. 3) sous l’identifiant ISO 147211. L’idée est de proposer un modèle pour l’information numérique préservée par des organisations de conservation (le modèle informationnel) et un autre pour les fonctions de ces dernières (le modèle fonctionnel). Il s’agit d’un cadre conceptuel qui n’adopte volontairement pas de termes liés à une réalité pratique ou à un secteur d’activité donné, ce qui force à créer des alignements de ces termes avec ceux de l’activité en question.

La réflexion purement conceptuelle me donne l’impression désagréable d’avoir brutalement intégré une disputatio entre théologiens scolastiques débattant du nombre d’anges pouvant tenir sur une tête d’épingle. Cette capacité purement spéculative et hautement arbitraire, qui paraissait le summum de la réflexion, efface totalement le monde réel2. Est-ce une bonne chose ? Dans les années 1990, les futurs auteurs de cette norme, issus des études spatiales ont été confrontés plus tôt que les autres secteurs au besoin de préserver à long terme l’information numérique et sa compréhensibilité. Ils ont eu l’intuition que la problématique les dépassait et ont tenté d’intégrer à leur réflexion des institutions patrimoniales. C’est ainsi que des agents de la BnF ont été invités à contribuer à la rédaction de la première version de la norme. Cet effort d’abstraction, certes utile et méritoire, a plusieurs conséquences que j’aime à rappeler. Les voici donc à la suite.

OAIS ne vous apprend pas la préservation numérique.

OAIS n’est pas votre mentor, c’est le boss final. OAIS ne vous apprend pas les bases de la préservation numérique, il vous donne un cadre – au demeurant très difficile à comprendre si vous n’avez jamais manipulé, analysé ou transformé des données numériques. Autrement dit : OAIS ne vous apprendra rien de la pratique, il vous donnera les moyens de parler de votre pratique avec des termes que peut-être d’autres personnes comprendront (et encore, ce n’est pas gagné).

Par conséquent, ce n’est pas un moyen d’enseigner la préservation numérique. Lorsque je fais des introductions à ce domaine, je ne parle jamais d’OAIS. Je montre des choses très pratiques – comment faire un transfert propre, comment calculer une empreinte numérique, comment identifier le format d’un fichier, comment le valider. OAIS viendra plus tard, quand vous aurez intégré les bases de la pratique.

L’Archive décrite dans OAIS n’est pas un système mais une organisation.

C’est sans doute le point le plus important et celui qui a généré le plus d’incompréhension. Non seulement le modèle OAIS est un modèle conceptuel, mais c’est un modèle qui s’aligne sur l’ensemble de l’organisation de conservation, et SURTOUT PAS sur un système ou sur un service/prestataire de stockage.

La norme devrait en réalité être utilisée pour analyser l’intégralité des services qui se chargent de préservation numérique, et pas seulement le système (c.-à-d. le couple logiciel + infrastructure) qui vous a été vendu comme solution de préservation numérique. Prenons l’exemple de la BnF : lorsque SPAR (l’outil logiciel et matériel de préservation numérique de la BnF) a été conçu à la fin des années 2000, on l’a imaginé comme un ensemble de modules inspirés du modèle fonctionnel d’OAIS. Il avait un module Versement, un module Stockage, un module Accès, etc.

Sauf que SPAR est venu s’insérer dans une organisation où des services et systèmes opéraient déjà les fonctions que l’OAIS décrivait – ainsi, la chaîne d’entrées réalisait déjà des opérations de contrôle qualité, Gallica et la Wayback Machine étaient des outils qui assuraient l’accès aux collections, etc., le département de l’Audiovisuel réalisait déjà des opérations de « planification de la préservation » sans les appeler ainsi, etc.

Cette tendance des systèmes de stockage et des personnes qui les pilotent à revendiquer des fonctions déjà opérées par d’autres instances a donné lieu à des conflits de périmètre et de nombreuses erreurs et doublonnements. Ainsi, les contrôles réalisés par la chaîne d’entrées étaient redondants, mais ne se recoupaient pas intégralement, avec ceux que réalisait le module de Versement du système SPAR. Nous avons eu des problèmes de communication réguliers avec les prestataires de numérisation dans le cas où la première disait « oui » et le second « non ». De même, les difficultés à reconnaître et à valoriser l’expertise de personnes du département de l’Audiovisuel – certes très peu formalisée et localisée en une ou deux personnes – a produit des conflits personnels et beaucoup d’incompréhension.

Bref : n’utilisez pas OAIS pour concevoir votre système de préservation, et souvenez-vous que le modèle fonctionnel doit être aligné sur une structure organisationnelle et pas sur un système.

Il faut également que je précise que, depuis que je suis parti de la BnF, je m’aperçois que ce problème est commun à beaucoup de structures. Et il se répète notamment parce que ce sont souvent des opérationnels, voire des concepteurs de logiciels, qui s’emparent de la norme, et non pas des cadres.

Cette conception a été si généralisée qu’elle a donné lieu à la création de notions parasites qui n’avaient pas lieu d’être dans la logique de la norme originelle, ainsi celle du « pré-versement ». Cette notion vient du fait que les systèmes logiciels de préservation adoptés par les institutions de conservation avaient des exigences fortes sur la structuration des données qu’ils acceptaient (par exemple, des conteneurs ZIP avec un fichier METS à la racine qui contient des empreintes numériques dans un élément XML bien précis, etc.). Ces systèmes, qui avaient un module de Versement, exigeaient donc des SIP (Submission Information Packages, ou Paquets d’information à verser) dans une forme très spécifique. Nos collègues ont donc été confrontés au fait que les données qu’ils collectaient devaient être ré-organisées pour correspondre à la structure attendue d’un Paquet, et iels ont appelé cette étape « pré-versement ».

Sauf que, dans la logique initiale d’OAIS, la fonction de Versement était l’interface entre le Producteur des données et l’Archive. Et non, bien sûr, le composant logiciel du système de préservation qui ne pouvait bien sûr prendre en entrée que des Paquets déjà ordonnés.

Il me semble également que cette incompréhension est liée à notre incapacité à identifier les compétences multiples nécessaires à l’évolution des systèmes et services de préservation numérique, et à l’attente d’un outil clé en main qu’il suffirait de déployer pour assurer toutes les fonctions nécessaires.

Si OAIS est un modèle conceptuel, un système ne peut pas être OAIS-compliant.

Les conséquences des considérations évoquées plus haut sont que les agent·e·s chargées de la préservation numérique dans les institutions, au lieu de réfléchir à l’adaptation globale de leurs métiers et compétences et de leur structure organisationnelle, ont eu tendance à vouloir acheter un outil. OAIS étant la norme incontournable, des éditeurs logiciels se sont mis à vendre des systèmes « OAIS-compliant« , c’est-à-dire « conformes à l’OAIS ». Ce qui, si vous m’avez suivi jusqu’ici, non seulement n’existe pas, mais en plus tend à dédouaner de la responsabilité de la réflexion organisationnelle.

Globalement, une organisation ne peut pas déléguer sa responsabilité de préservation numérique. Ni à un système, ni à un prestataire de service.

Bref, si on vous vend un produit OAIS-compliant, il y a déjà un problème. Méfiez-vous.

En complément, je rajouterai que la communauté de la préservation numérique, influencée par cet alignement erroné du modèle fonctionnel OAIS sur un système et non sur une organisation, a tenté de peser sur la version 3 de la norme pour faire reconnaître l’importance de ces activités de « pré-versement ». Et je ne peux qu’acquiescer : la partie la plus importante de la préservation numérique se fait hors des systèmes de préservation numérique (SPAR, VITAM, Archivematica, etc.). Elle se fait dans l’acquisition, le transfert et l’accès aux données.

Mais OAIS ne contredisait pas une telle idée. La pression de la communauté a donc eu un effet relativement limité : l’intégration d’une section sur les services de préservation distribués et la notion d’inner OAIS (en gros, le système ou le prestataire de stockage) et l’outer OAIS (l’organisation de préservation).

Une dernière chose, importante : gardez à l’esprit que les prestataires de service de préservation, qu’il s’agisse du service de tiers-archivage de la BnF, du CINES ou de tout prestataire privé, ne font que de la préservation du train d’octets. Autrement dit, une grande partie des compétences et actions nécessaires à la préservation à long terme vous incombe toujours (fabrication des paquets, identification des dépendances, etc.).

Si OAIS est conceptuel, il est nécessaire de créer des alignements spécifiques à chaque secteur d’activité.

C’est une partie qu’on néglige bien souvent, mais il me semble que la condition à laquelle OAIS devient utile, c’est l’existence d’un alignement du modèle informationnel et conceptuel d’OAIS avec les réalités d’un secteur de production particulier, qui consiste à prendre les types d’information du modèle informationnel et les fonctions du modèle fonctionnel et à décrire quelles réalités concrètes elles représentent pour un cas précis. Le cas précis, en l’occurrence, ne peut être « le secteur des bibliothèques / des archives » mais bien plutôt des secteurs de production industrielle, scientifique ou artistique – on aurait donc un alignement pour la préservation de la numérisation en mode image, un autre pour les applications Android, un autre pour le graphisme web, etc.

A ma connaissance, ces alignements systématiques n’existent quasiment pas. Et c’est pourtant de ceux-là que nous aurions besoin pour passer d’un modèle conceptuel à des applications pratiques. Et c’est pour cela qu’OAIS n’est pas d’une grande aide pour les débutants.

Conclusion

OAIS a connu un fort désaveu, voire désamour, de la part de la communauté de la préservation numérique ces derniers temps. Je comprends ce phénomène, mais je pense que la responsabilité nous en incombe également, car nous avons mal utilisé cette norme.

Je suis désormais très circonspect quand la discussion aborde OAIS : à chaque fois, je constate que cela ne produit pas plus de clarté, ce que l’on attendrait de l’appel à un modèle abstrait, mais plutôt de la confusion. Et souvent, je finis par me fâcher (et je culpabilise ensuite).

Bref, je ne déteste pas OAIS. Je lui reconnais des mérites, mais m’en méfie, car l’utilisation qui en a été faite a souvent été fondée sur une incompréhension fondamentale de son périmètre.

  1. Pour les acharné·e·s qui voudraient s’en faire une idée par elleux-mêmes, les versions d’OAIS successives, y compris une traduction de la v. 2 à laquelle j’ai contribué, sont diffusées gratuitement par le CCSDS. ↩︎
  2. Cette capacité spéculative à raisonner sur des modèles purement théoriques a longtemps été vue comme une prérogative masculine, tandis que les femmes tendaient à s’empêcher de juger sans considérer les circonstances spécifiques. Voir à ce propos Une voix différente : La morale a-t-elle un sexe ?, Carol Gilligan, Paris : Flammarion, coll. « Champs essais », 2019 (1re éd. 1986). ↩︎