samedi 20 mars 2021

Réflexions sur l’archivage des données numériques.


D’abord un peu d’histoire.
Ce problème est aussi ancien que l’informatique elle-même mais limitons nous ici au cas des postes individuels depuis l’arrivée de l’IBM-PC et du MacIntosh. Ces derniers arrivent un peu après 1980. ils se diffusent lentement dans les entreprises et les administrations. Côté professionnel, il s’y traite du texte, des nombres (premiers tableurs), les premières bases de données et du développement logiciel.  Côté public, pas grand-chose. Le jeu est encore rudimentaire en 1990 mais la bureautique familiale s’installe.

L’archivage s’impose d’autant plus que le disque dur est encore rare et cher. On utilise les « floppy disks » disques souples ou disquettes, disquette 5 ‘’1/4 (360 ko) sur PC-XT (1981), haute densité 1,2 Mo sur PC-AT (1984). Aujourd’hui une clé USB ordinaire contient mille fois plus de données. Ces supports ne sont pas d’une fiabilité absolue : parfois, on se retrouve avec des données corrompues sans avoir rien fait. Les petites disquettes 3’’1/2, classiques sur MAC, arrivent sur le marché en 1987 sur les PC ; plus rigides, elles stockent 720 ko (modèle standard), 1440 ko en haute densité. On commence donc à transférer les données du 5 pouces vers le 3 pouces. Entre temps, le disque dur s’est démocratisé. Point de vue fiabilité, ces disquettes 3 pouces ne sont pas trop mauvaises : j’ai pu relire des données écrites il y a 25 ans. A l’époque, j’en avais une centaine, rangées dans des boites comme pour des fiches carton. Pour du stockage plus massif, on trouvait des supports plus exotiques : disquettes « ZIP », petites cassettes à bandes magnétiques ressemblant un peu aux cassettes audio. En outre les réseaux internes arrivent dès 1990 (Ethernet, Token Ring, Apple Share, …) dans les entreprises. Une machine centrale pouvait déjà fournir un vrai serveur de fichiers. A la maison, il faut encore se contenter des disquettes. Le CDROM est inventé depuis longtemps, mais son usage informatique ne commence guère avant 2000. Il permet de stocker 700 Mo d’un coup. Mon CD d’archivage le plus ancien date de 1999. Il contient toutes mes données personnelles depuis 1986 … et il est toujours lisible. Donc, aussitôt possible, on ramasse toute ses disquettes et on en transfert toutes les données sur un ou deux CDROM.

En France, Internet est arrivé à l’université un peu après 1990. La quantité de données stockées par un poste de travail explose : elle comporte les données produites localement (textes, comptabilités sur tableur, constitution de SGBD, et parfois développement de logiciels) mais aussi les données attachées aux messages et celles téléchargées depuis des sites distants. Même chose en plus modeste sur les postes privés. Peu à peu, on va donc produire de plus en plus de CDROM de sauvegarde (de même dimension que les vieilles disquettes 5 pouces). On peut récupérer les vieilles boites de rangement. Au bureau, les serveurs de données se multiplient. Si le service informatique a bien fait son travail, chacun peut sauvegarder son poste personnel sur les disques du serveur distant : copie complète de temps en temps, copie incrémentée chaque soir. Chez soi, il faut se contenter des CD qui vont s’empiler dans les boîtes de rangement. L’avènement de la photo numérique et le téléchargement de vidéos depuis le web vont gonfler les besoins privés. Depuis 2005, d’autres solutions apparaissent : d’une part les disques externes à haute capacité et bon marché, de l’autre le « cloud » internet, version récente du serveur de fichiers.  Ces solution sont exportables aux usages privés.

Si les besoins sont bien cadrés dans le milieu professionnel (à condition qu’il existe une service compétent) les choses sont plus compliquées dans le cadre privé pour un utilisateur très actif. Il y a longtemps que j’ai copié tous mes CDROM sur des disques durs externes. Je dispose donc maintenant de trois disques où toutes mes archives 1986-2021 sont dispersées de façon anarchiques. Ces données ont été créées à partir d’une bonne dizaine de machines au cours du temps, plus si je compte les machines du bureau : systèmes MS-DOS, Windows 2, 2.2, 3, 3.1, 95, 98, millénium, Vista, XP, Seven, NT, linux. Données professionnelles et données privées y sont donc emmêlées. Il m’est arrivé deux ou trois fois de perdre des données, ayant négligé la sauvegarde puis subit un crash disque majeur. Indépendamment de problèmes matériels, les données textuelles ne sont pas toujours lisibles : aucun logiciel de 2021 ne peut lire du Framework ou du Multiplan des années 80. Word 5 pour Dos semble lisible par Libre Office. On peut faire tourner des vieux logiciels DOS sous Windows avec un logiciel d’émulation approprié sauf s’il met en jeu des sorties écran. La photo numérique apparaît lentement après 2000 puis s’installe de façon hégémonique après 2005. Le nombre de photos explose. Chez moi, c’est rangé par année et par mois … mais il est compliqué de les retrouver sur les disques durs. La bonne solution face à ce stockage anarchique, c’est d’imprimer  entièrement le répertoire du disque externe. Seul linux permet de réaliser proprement cette opération grace à une commande du (disk use).  

 du « nom du disque »  >  fichier.txt

Le fichier texte généré (qui peut faire 100 pages) peut être ensuite récupéré dans du word pour une mise en forme plus ergonomique. La possibilité d’avoir sous les yeux le contenu du disque sous forme papier me semble beaucoup plus rapide que les recherches avec l’explorateur de fichiers quoique les deux méthodes ne soient pas contradictoires. A la réflexion, il me paraît nécessaire de n'archiver que le nécessaire. Avec le recul, il me paraît évident que 95% des données sauvegardées ne serviront jamais à rien.


Belle série d'articles intéressants sur ZeroHedge : 

Les nouvelles directives du CDC américain permettent aux étudiants de s’asseoir plus près tant qu’ils portent me masque (ZeroHedge).   : 1 mètre (3 pieds) au lieu de 2 (6 pieds) vaccin ou pas. Les enseignants devront maintenir 2 mètres... chez eux comme chez nous, vaccin ou pas, la dictature est faite pour durer si on ne se révolte pas.

Bill Gates s’est connecté sur Reddit pour répondre aux questions : « Demandez moi tout ce que vous voulez (sur les vaccins, la viande de synthèse, etc.) … sauf sur ses relations étroites avec Jeffrey Epstein. Ahhh. (ZeroHedge). Si la justice découvre que Billou se tapait des petites filles, est-ce-que sa richesse va le sauver ?

Affaire Epstein, encore. Un magistrat de Manhattan juge les détails de l’affaire Ghislaine Maxwell trop « sensationnels et impurs » pour être révélés au public (ZeroHedge). Mère maquerelle, tu es cuite ...

Plus de suicides que de cas covid chez les enfants (ZeroHedge).

Kesington Avenue à Philadelphie. Les morts vivants drogués au cocktail fentanyl-héroine ($5 le sachet). https://www.youtube.com/watch?v=cOBoDT-3oM0  La face sombre de l’Amérique. Effroyable.

Woke culture, féminisme 2.0. Les ‘guerriers de la justice sociale’ (SJW) se sont lâchés cette semaine (ZeroHedge).   Pour protéger les femmes, un politicien anglais suggère un couvre-feu à 18h pour les hommes … entre autre absurdité. Dans le même ordre d’idée, de Blasio, maire de New York, demande à sa police de rendre visite à ceux qui se sont rendus coupable d’un comportement ou commentaires « blessants » vis à vis d’autres personnes même si l’action n’est pas illégale (ZeroHedge ... https://www.zerohedge.com/political/mayor-de-blasio-tells-nypd-pay-people-home-visits-hurtful-comments). Dans le même temps les collèges et les université abandonnent tout test d’entrée (SAT, ou ACT en anglais) pour ne retenir que la "curiosité intellectuelle". La fabrication du crétin est avancé là-bas aussi (ZeroHedge). L'occident est foutu.

Traces numériques : comment la FBI identifie, trace et encercle les dissidents (ZeroHedge). Pas mieux chez nous. 

La NASA teste la fusée « la plus puissante du monde » en préparation de la mission lunaire de 2024. Voyez NASA, programme Artemis : https://www.nasa.gov/specials/artemis/

Le ministre syrien de l’énergie révèle que les USA on volé pour $92milliards de brut au pays (ZeroHedge)... et Biden qui relance la guerre.

Le rêve du transhumanisme. L’immortalité devrait devenir possible grâce à l’IA qui permettrait un téléchargement du cerveau (ZeroHedge).  OK si l’humain est effectivement réductible à son cerveau. Mais s’il existe une autre composante hors du plan physique, cet humain reconstitué sera juste de la foutaise robotisée.

Les tireurs de ficelles : l’État profond existe-t-il réellement ? (ZeroHedge

Grand Reset : la version « ferme des animaux » (référence à Orwell). (ZeroHedge).











Aucun commentaire:

Enregistrer un commentaire

Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.