Catégorie : TIL

Renvoyer les valeurs non décodées des métadonnées internes avec Exiftool

Je sors d’une semaine de vacances pendant laquelle, alas, je n’ai pas pu rédiger de billet de blog. J’avais pourtant prévu de vous raconter par le menu comment j’ai mis en pratique le guide Copy that Floppy! et ai patiemment réuni le matériel pour extraire des données de disquettes 3 pouces 1/2. J’espère que ça viendra bientôt…

En attendant, je m’étais promis de faire de tout petits billets sur les petit tips que j’apprenais. Je ne l’ai pas beaucoup fait, et c’est dommage. Plutôt que de pouetter un message sur Mastodon, je me lance ce matin.

Vous connaissez sans doute exiftool, qui est un outil ABSOLUMENT INCONTOURNABLE pour la préservation numérique. En gros, il s’agit d’un extracteur de métadonnées pratiquement universel. Il analyse vos fichiers et vous renvoie plein d’informations utiles sous une forme structurée. Mais il est aussi capable de les éditer – ce qui est très puissant et un peu dangereux, à tel point que mon ex-collègue Thomas Ledoux m’avait fait mettre en exergue d’un petit manuel d’édition de métadonnées internes avec cet outil la phrase suivante :

Un grand pouvoir implique de grandes responsabilités

Je découvre très régulièrement de nouveaux moyens d’utiliser exiftool, de nouveaux trucs, de nouvelles options. Cette fois-ci, c’est la possibilité de renvoyer la valeur d’une métadonnée sous sa forme non décodée. En gros, Exiftool décode les valeurs codées et renvoie une chaîne de caractères compréhensible par un humain. Par exemple, si je reprends l’exemple de ce billet, l’appel à Exiftool renverra

$ exiftool -ExposureProgram 000010.tif
Exposure Program : Bulb

(Je rappelle pour celles et ceux qui n’avaient pas lu le précédent billet : on interroge ici le mode d’exposition utilisé par l’appareil photo. « Bulb » correspond à une pose longue.)

Mais je peux vouloir savoir ce qui se cache derrière cette valeur décodée, car Exiftool choisit des libellés qui ne sont pas forcément alignés avec d’autres documents de référence. Pour obtenir la valeur décodée, il suffit d’utiliser l’option --printConv, ou sa version abrégée -n.

$ exiftool --printConv -ExposureProgram 000010.tif
Exposure Program : 9

C’est tout pour aujourd’hui !

Deux façons de calculer une somme de contrôle sous Windows

Alors rien de révolutionnaire dans ce mini-billet mais je m’étais promis de noter ici tout ce que j’apprenais d’utile et de le présenter rapidement.

J’utilise au quotidien GNU/Linux et n’ai donc que rarement besoin de la ligne de commande sous Windows. Mais ça peut arriver, et en outre je sais que l’écrasante majorité d’entre vous, par choix ou non, doit s’accommoder de ce système d’exploitation. J’essaie donc de mémoriser les commandes DOS correspondant à ce que je fais en Bash au cas où j’aurais un jour à proposer un atelier sur l’utilisation d’outils en ligne de commande pour la préservation numérique.

Aujourd’hui, la commande concerne le calcul d’une somme de contrôle, ou empreinte numérique (si vous ne savez pas ce que c’est, je vous invite à consulter cette page qui est forcément très bien puisque c’est moi qui l’ai écrite). Il me semble me souvenir qu’une enquête de la DPC avait révélé qu’une moitié des archivistes manipulant des données numériques ne savait pas comment en calculer une. On va ici proposer deux moyens rapides, parmi les plus simples, pour calculer unitairement la somme de contrôle d’un fichier (et si vous voulez en savoir plus – comment le faire sur le contenu d’un dossier complet, par exemple – manifestez-vous avec un commentaire !).

Visualiser rapidement le poids de dossiers

Un des enjeux lorsqu’on aborde une arborescence est d’identifier les parties les plus conséquentes en termes de poids (et de nombre de fichiers, d’ailleurs, mais on n’en parlera pas ici).

L’explorateur de fichiers Windows ne donne pas, lorsqu’on navigue dans une arborescence, le poids des fichiers contenus dans les répertoires, notamment parce que cela prend du temps de calcul et que cela ralentirait donc la navigation. Il faut passer par un clic droit sur chacun des dossiers puis cliquer sur Propriétés pour en avoir une idée.

Alors je sais que, pour visualiser des arborescences, on a des outils comme Archifiltre ou Treesize. Mais bon, comme je pense que les bons outils sont les plus simples et les plus éprouvés – et qu’ils ont donc l’avantage d’être bien maintenus et libres – je vais partager avec vous une petite ligne de commande Bash que je trouve pratique.

Today I learned…

J’aime bien la rubrique « Today I learned » du blog d’Alex Chan : des petits morceaux de connaissance pratique, sur plein de sujets différents. Je prévois de classer dans cette rubrique de petits billets du même tonneau.

Fièrement propulsé par WordPress & Thème par Anders Norén