Vue normale

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.
À partir d’avant-hierFlux principal

Arx – L’outil d’archivage qui surpasse Tar

Par : Korben
16 juillet 2024 à 07:00

Vous utilisez Tar pour archiver vos fichiers et dossiers et vous trouvez ça un peu lent ? Alors ça tombe bien puisqu’aujourd’hui, je vous présente Arx. C’est un outil d’archivage nouvelle génération développé par le talentueux Jubako, qui va vous bluffer par ses performances et ses fonctionnalités.

Arx met la vitesse au cœur de son fonctionnement grâce à son algorithme hyper optimisé, ce qui lui permet de traiter vos fichiers à une vitesse fulgurante, laissant tar sur place. Par exemple, pour accéder à un fichier individuel dans une archive contenant l’intégralité du code source de Linux, Arx est jusqu’à 5 692 fois plus rapide que tar ! Plus l’archive est volumineuse, plus l’écart se creuse.

Mais la rapidité n’est pas le seul atout d’Arx puisqu’il offre également un accès aléatoire direct aux fichiers archivés. Cela permet de récupérer n’importe quel fichier de votre archive en un clin d’œil, sans avoir à la décompresser entièrement. C’est moins de temps perdu à naviguer dans des archives monolithiques. Et comme le temps c’est de l’argent, vous serez rapidement riche ^^.

Les commandes sont simples à capter, vous permettant de créer, mettre à jour et extraire vos archives sans avoir besoin de vous prendre la tête avec des options obscures. D’ailleurs, Arx regorge de petites astuces qui vont vous faire gagner un temps précieux comme pouvoir ajouter des fichiers à une archive existante sans avoir à la recréer entièrement ou encore, extraire seulement les fichiers modifiés depuis le dernier archivage.

L’outil est également également économe en ressources puisqu’il permet d’obtenir des archives compactes sans compromis sur la qualité. C’est votre disque dur qui vous remerciera et vous pourrez en stocker encore plus !!

Si ça vous branche de le tester, c’est dispo sur Github ici ou vous pouvez l’installer avec Cargo (oui c’est du Rust) :

cargo install arx

Ensuite, pour commencer à créer une archive, lancez la commande suivante :

arx create -o mon_archive.arx -r mon_repertoire

Cela génèrera un fichier mon_archive.arx contenant le répertoire mon_repertoire.

Pour extraire (décompresser) une archive, utilisez la commande :

arx extract mon_archive.arx -C mon_repertoire_de_sortie

Et si vous souhaitez lister le contenu (la liste des fichiers) de l’archive, lancez :

arx list mon_archive.arx

Pour accéder au contenu d’un seul fichier, vous pouvez également utiliser les commandes suivantes :

arx dump mon_archive.arx mon_repertoire/chemin/vers/mon_fichier > mon_fichier
# ou
arx dump mon_archive.arx mon_repertoire/chemin/vers/mon_fichier -o mon_fichier

Si vous êtes sous Linux, vous avez aussi la possibilité de monter l’archive en utilisant fuse :

mkdir point_de_montage
arx mount mon_archive.arx point_de_montage

Notez que arx sera en cours d’exécution jusqu’à ce que vous démontiez point_de_montage.

Et pour convertir un zip en une archive arx, utilisez la commande :

zip2arx -o mon_archive.arx mon_archive_zip.zip

De même, pour convertir une archive tar en une archive arx, lancez :

tar2arx -o mon_archive.arx mon_archive_tar.tar.gz

Voilà, vous savez tout !

Monolith – L’outil parfait pour sauvegarder le web

Par : Korben
22 juin 2024 à 07:00

Je vais vous parler aujourd’hui d’un outil vraiment cool pour faire de l’archivage de pages web. Alors oui, je sais, on peut déjà enregistrer une page web avec le navigateur, mais cet outil baptisé Monolith permet de faire 1000 fois mieux que ça. Il va non seulement sauvegarder la page cible, mais aussi embarquer d’un coup tous les éléments CSS, images et JavaScript dans un seul et unique fichier HTML5.

Et contrairement à une sauvegarde classique ou même avec wget, Monolith intègre tous les assets en URLs de données. Ça veut dire que votre navigateur va pouvoir afficher la page exactement comme elle était sur le web, même sans connexion Internet !

Pour l’installer, c’est ultra simple. Que vous soyez sur Windows, macOS, GNU/Linux ou même sur des devices exotiques avec des processeurs ARM, ça marchera forcement :

  • Avec Cargo (cross-platform) : cargo install monolith
  • Via Homebrew (macOS et GNU/Linux) : brew install monolith
  • Avec Snapcraft (GNU/Linux) : snap install monolith
  • Et plein d’autres options encore…

Ensuite, pour sauvegarder par exemple cet article de mon site, il vous suffit d’entrer la commande suivante :

monolith https://korben.info/monolith-archivage-web-html-autonome.html -o monolith.html

Et paf, ça vous génère direct un fichier monolith.html avec tout ce qu’il faut dedans. Vous pouvez l’ouvrir tranquillou dans votre navigateur même sans accès internet, c’est magique.

Mais Monolith a encore plein d’autres tours dans son sac. Vous pouvez par exemple l’utiliser directement avec une entrée STDIN :

cat index.html | monolith -aMcIiFfv -b https://site.com/ - > result.html

Ici, on lui passe le contenu HTML via l’entrée standard, avec quelques options en plus :

  • -a pour virer les audios
  • -M pour ne pas ajouter les infos de date et d’URL
  • -c pour exclure les CSS
  • -I pour isoler le document
  • -i pour retirer les images
  • -F pour exclure les web fonts
  • -f pour zapper les frames
  • -v pour virer les vidéos

Bref, vous avez un contrôle total sur ce que vous voulez garder ou non.

Vous pouvez aussi spécifier les domaines autorisés ou interdits pour récupérer les assets, genre :

monolith -I -d example.com -d www.example.com https://example.com -o example-only.html

Là on autorise uniquement les domaines example.com et www.example.com. Tout ce qui vient d’ailleurs sera zappé. Ou à l’inverse, on peut dégager des domaines, typiquement ceux qui servent de la pub :

monolith -I -B -d .googleusercontent.com -d googleanalytics.com -d .google.com https://example.com -o example-no-ads.html

Après, faut savoir que Monolith n’embarque pas de moteur JavaScript. Donc pour les pages web un peu complexes qui vont chercher des données après le chargement initial, ça peut être limité. Mais pas de panique ! On peut utiliser un navigateur headless comme Chromium en amont, pour pré-processer la page avant de la passer à Monolith :

chromium --headless --incognito --dump-dom https://github.com | monolith - -I -b https://github.com -o github.html

Et hop, problème réglé !

Parfait donc pour les archivistes du web ou les data hoarders qui veulent garder une trace de tout, voire automatiser tout ça dans leurs scripts.

❌
❌