Étiquette : bash

Un disque dur externe connecté à un ordinateur portable avec un câble PATA/IDE-USB.

Explorer un disque dur interne

Cela fait plusieurs mois que je n’ai pas écrit dans ce blog, et ça me navre. Mon activité professionnelle ne me laisse pas assez d’énergie pour me lancer dans une telle entreprise après une journée de travail. Depuis avril dernier, je ne publie donc plus que pendant mes vacances. Or je suis en vacances, et rien ne semble venir. Je vais donc me forcer un peu et vous faire part de quelques dernières expérimentations, dans le prolongement de mon précédent billet.

Il se trouve en effet que j’avais un ordinateur familial acheté au début des années 2000 qui achevait son séjour au purgatoire dans la maison de mes parents, avant de s’envoler vers les tristes cieux des DEEE.

Dans ce billet, je vais donc faire un pas de plus et vous raconter comment j’ai fait une image de ce disque, puis je passerai en revue les méthodes et outils permettant

  • D’identifier bon nombre de fichiers système automatiquement ;
  • De récupérer beaucoup d’informations importantes sur les fichier supprimés – et pas que les fichiers supprimés eux-mêmes, comme on avait vu dans le précédent billet ;
  • De restaurer individuellement un de ces fichiers.

Prêt·e·s ? C’est parti !

Acquérir des données depuis des disquettes ZIP : une expérience

Un petit point d’attention avant de commencer : je débute dans le domaine des digital forensics. Le sujet m’amuse beaucoup, donc je profite de cet enthousiasme pour écrire mes aventures et les partager avec vous. Je préfère revenir ensuite sur mes billets pour les corriger plutôt que d’approfondir le sujet et risquer de perdre l’élan initial. Cet enthousiasme du débutant, c’est peut-être un petit effet Dunning-Kruger, mais il m’encourage.

Un peu de contexte

Il y a quelques semaines, Felix Burger, un de mes collègues de la TIB a évoqué cinq disquettes ZIP qu’il avait récupérées de Kamel Louafi, un architecte algéro-allemand. Ces disquettes étaient susceptibles de contenir des données liées au réaménagement du parc Welfengarten, où se trouve la Leibniz University Hanover.

Aurais-je fait une boulette ?

Quand on fait de la préservation numérique appliquée, on doit souvent intervenir sur des fichiers. Que ce soit pour rectifier une structure de format incorrecte, pour créer une copie de préservation dans un format préféré ou même pour créer une copie de diffusion conforme à nos standards de qualité, il est très utile de pouvoir comparer deux fichiers, l’original et le transformé.

Je vous propose donc ci-dessous quelques-unes de mes méthodes pour évaluer la distance entre la source et la cible d’une transformation (étant entendu que cette transformation a pour but d’être la moins destructive qui soit, donc n’affecter strictement que ce qu’on souhaite changer).

Cet article, comme les autres, a vocation à être enrichi au fur et à mesure de mes découvertes. Donc il commence petit mais il espère devenir plus conséquent ! Par ailleurs, si vous avez des méthodes similaires à me conseiller, je les prends avec avidité et gourmandise.

Visualiser rapidement le poids de dossiers

Un des enjeux lorsqu’on aborde une arborescence est d’identifier les parties les plus conséquentes en termes de poids (et de nombre de fichiers, d’ailleurs, mais on n’en parlera pas ici).

L’explorateur de fichiers Windows ne donne pas, lorsqu’on navigue dans une arborescence, le poids des fichiers contenus dans les répertoires, notamment parce que cela prend du temps de calcul et que cela ralentirait donc la navigation. Il faut passer par un clic droit sur chacun des dossiers puis cliquer sur Propriétés pour en avoir une idée.

Alors je sais que, pour visualiser des arborescences, on a des outils comme Archifiltre ou Treesize. Mais bon, comme je pense que les bons outils sont les plus simples et les plus éprouvés – et qu’ils ont donc l’avantage d’être bien maintenus et libres – je vais partager avec vous une petite ligne de commande Bash que je trouve pratique.

Informations personnelles et sensibles : comment rechercher dans un ensemble de fichiers

Récemment nous avons reçu les archives de la grande commande photographique. Cent soixante-dix gigaoctets de données contenant les dossiers envoyés par les candidat·e·s et documentant le processus décisionnel aboutissant à la sélection des deux cents photographes lauréat·e·s et toutes les activités de valorisation du projet. Vingt-trois mille fichiers environ répartis dans près de 3000 répertoires. Et, bien évidemment, des données personnelles à la pelle.

Le désarroi de notre collègue archiviste, confronté à une telle masse était visible. L’idée de parcourir cet ensemble à l’aide de l’explorateur de fichiers et de les ouvrir un par un nous décourageait tous et nous condamnait à l’impuissance et à l’inaction.

Le billet qui suit vise à répondre à un besoin particulier, celui de la recherche dans le contenu de fichiers de formats variés, localisés dans une arborescence. Le traitement de ce fonds d’archives numériques ne se limite pas à cette opération, mais il m’a semblé plus utile de me concentrer sur ce sujet, qui fournit déjà matière à un billet beaucoup trop long.

Réunir un corpus de fichiers

J’avais précédemment engagé mon honneur et promis de faire un premier billet sur le transfert sécurisé de données. Et je vais sans aucune vergogne me dédire, parce que j’ai un autre sujet sur le feu qui m’amuse plus. On verra le transfert une autre fois.

Je vous propose donc un premier billet sur la recherche de fichiers exemples. Quand on fait de la préservation numérique sérieuse, on a besoin d’un corpus de test assez conséquent pour vérifier que nos procédures d’identification, de validation ou d’analyse fonctionnent bien sur une diversité de fichiers. Où allons-nous donc trouver cette diversité si nous ne l’avons pas déjà sous la main ? Il y a plusieurs solutions complémentaires que je vais vous détailler ici. N’hésitez pas si vous en voyez d’autres à me les signaler en commentaire !

Fièrement propulsé par WordPress & Thème par Anders Norén