Bato.to c'est fini - Le roi du scan manga coulé par la police

30 janvier 2026 à 12:11

Yop les amis !

Mauvaise nouvelle pour les amateurs de lecture japonaises qui avaient leurs petites habitudes sur Bato.to. Le site, véritable institution du scantrad manga, a été mis hors ligne et cette fois, c'est pas une simple maintenance qui a mal tourné ou un serveur qui a pris feu (quoi que, ça arrive plus souvent qu'on ne le pense ^^).

Non, c'est la CODA (Content Overseas Distribution Association), c'est à dire l'organisme japonais de lutte contre le piratage, qui en collaboration avec les autorités chinoises, ont fait arrêter l'opérateur du site fin novembre. Le gars a admis opérer non seulement Bato.to mais aussi une soixantaine de sites liés comme xbato.com ou mangapark.io.

Honnêtement, impossible de se connecter ce matin, c'est le désert total. Apparemment, la base de données a été saisie et les serveurs sont aux fraises.

Du coup, c'est tout un empire qui s'effondre. Pour vous donner une idée de l'ampleur du truc, Bato.to c'était 350 millions de visites cumulées sur l'ensemble du réseau rien que pour le mois de mai 2025. Et niveau thunes, ça brassait pas mal puisque les revenus publicitaires montaient jusqu'à 400 000 yuans par mois lors des pics d'audience, soit environ 57 000 dollars. Ça commence à faire une belle somme pour de la scanlation illégale, surtout quand on sait que la plupart des traducteurs font ça pour la gloire (ou pour le kiff).

Perso, je trouve ça super moche de voir disparaître des archives communautaires aussi énormes parce que même si c'était pas "légal" c'était quand même un peu le temple du scan manga où l'on trouvait des pépites introuvables ailleurs, même si la qualité variait selon les équipes. Mais bon, faut pas se leurrer, quand y'a autant d'oseille en jeu, c'était inévitable...

Si vous êtes en manque de lecture, sachez que l'offre légale a quand même méga bougé. Avant c'était la galère absolue, mais maintenant on a des trucs comme Manga Plus (qui appartient à la Shueisha , donc c'est la source directe) ou Mangas.io . C'est quand même plus propre pour soutenir les mangakas qui triment sur leurs planches, sauf si vous lisez des trucs hyper obscurs qui n'arriveront jamais chez nous, là c'est plus compliqué...

D'ailleurs, pour ceux qui galèrent avec les chapitres qui sortent uniquement en japonais, y'a des outils incroyables maintenant. J'avais testé Manga Net sur Android et plus récemment Koharu, un traducteur de mangas par IA codé en Rust et franchement, ça automatise une grande partie du boulot de nettoyage et de trad. C'est peut-être ça l'avenir du scantrad finalement... des outils persos pour lire ce qu'on veut localement sans dépendre de gros sites qui finissent par se faire chopper.

Bref, une page se tourne. L'opérateur a été libéré sous caution en attendant la suite de la procédure, mais ne comptez pas trop sur un retour du site de sitôt. Va falloir trouver une autre crémerie ou, folie suprême, commencer à acheter vos tomes préférés.

Ahahaha !

Source

Anna's Archive vient de sauvegarder la totalité de Spotify

Korben

21 décembre 2025 à 09:25

Vous connaissez Anna's Archive , cette bibliothèque pirate qui sauvegarde tous les livres et articles scientifiques de l'humanité ? Hé bien ils viennent de s'attaquer à un nouveau chantier : sauvegarder Spotify (en tout cas le plus possible), c'est à dire des millions de morceaux + de la métadonnées, soit ~300 téraoctets de données !!

Anna's Archive se focalise normalement sur le texte (livres, et documents de recherche) parce que c'est ce qui a la plus haute densité d'information mais leur mission, c'est de préserver le savoir et la culture de l'humanité, et ça inclut donc aussi la musique. Et comme ils ont trouvé un moyen de scraper Spotify à grande échelle, ils se sont dit "Hey pourquoi pas ? On est des oufs".

Et ça donne la plus grande base de données de métadonnées musicales jamais rendue publique, avec 186 millions d'ISRCs uniques (ces codes qui identifient chaque enregistrement). Pour vous donner un ordre de grandeur, MusicBrainz n'en a que 5 millions. Niveau fichiers audio, ils ont aussi archivé environ 86 millions de morceaux, ce qui représente 99,6% des écoutes sur la plateforme (même si ça ne fait "que" 37% du catalogue total). Donc si vous écoutez un morceau au hasard sur Spotify, y'a 99,6% de chances qu'il soit dans l'archive.

Pour trier tout ça, ils ont utilisé la métrique "popularité" de Spotify qui va de 0 à 100. Ainsi, pour les morceaux avec une popularité supérieure à 0, ils ont récupéré quasiment tout en qualité originale (OGG Vorbis 160kbit/s) et pour les morceaux à popularité 0 (soit ~70% du catalogue, des trucs que personne n'écoute), ils ont réencodé en OGG Opus 75kbit/s pour gagner de la place… mais ils ne sont pas allés au bout de la longue traîne (trop de stockage pour trop peu de gain, et pas mal de contenu “bof” à popularité 0). Pour 99% des gens ça sonne pareil, même si je sais que les audiophiles vont me tuer dans les commentaires ^^.

En regardant les stats qu'ils ont produit à partir de ce qui a été scrappé, les 3 morceaux les plus populaires (Die With A Smile de Lady Gaga et Bruno Mars, BIRDS OF A FEATHER de Billie Eilish, et DtMF de Bad Bunny) ont été streamés plus de fois que les 20 à 100 millions de morceaux les moins populaires combinés. Bon, ils précisent aussi que la popularité est très dépendante du moment, donc ce top est un peu arbitraire mais ça montre à quel point la longue traîne est looooongue sur les plateformes de streaming...

Après le problème avec la préservation musicale actuelle (ce qu'on retrouve sur les sites de Torrent par exemple), c'est qu'elle se concentre uniquement sur les artistes populaires et la qualité maximale (FLAC lossless). Du coup, y'a plein de musique obscure qui ne survit que si une seule personne décide de la partager. Et ces fichiers sont souvent mal seedés. Et c'est pour ça que je trouve l'approche d'Anna's Archive plutôt pas mal car elle consiste à archiver tout ce qui existe (ou presque), même en qualité "suffisante", plutôt que de se concentrer sur un sous-ensemble en qualité parfaite.

Et comme vous vous en doutez, tout est distribué via des torrents, avec les métadonnées déjà disponibles (moins de 200 Go compressés) et les fichiers audio qui arrivent progressivement par ordre de popularité. Note la base s'arrête à juillet 2025, donc tout ce qui est sorti après peut ne pas être là (même s'il y a quelques exceptions).

Bref, c'est la première archive de préservation musicale vraiment ouverte, que n'importe qui peut mirrorer s'il a assez de stockage et voilà comment grâce à l'aide de tout le monde, le patrimoine musical de l'humanité sera protégé pour toujours des catastrophes naturelles, des guerres, des coupes budgétaires et autres désastres... Par contre, pas sûr que ça la protège de la boulimie des IA génératives.

Merci à Lilian pour l'info !

Source

Vue lecture