Menu

Une Bibliothèque Complète Cachée Dans Le Code Source Des Dépôts Debian

Quand tu ouvres un dépôt Debian, tu t’attends à du code hardcore… pas à du Shakespeare.

Franchement, quand on pense “dépôt Debian”, on imagine des forêts de code obscur, des scripts bash rédigés en ancien elfique, et des commentaires tellement cryptiques qu’ils feraient frissonner un intégrateur HTML à l’âme sensible.
Mais sûrement pas les œuvres complètes de William Shakespeare ou les aventures de la petite Alice tombée dans un terrier.

Et pourtant.

Un certain Jakub Wilk, développeur et explorateur de l’étrange, a mis le doigt sur un truc : les sources Debian, c’est un peu comme une bibliothèque d’Alexandrie du code… avec, planquées entre deux fonctions C, des classiques littéraires vieux de plusieurs siècles.
Une sorte de Room of Requirement pour barbus à claviers, où les trésors apparaissent quand tu tapes les bonnes commandes magiques.

 

 

Mais alors… pourquoi cacher des bouquins dans du code source ??? C’est quoi ce délire encore ?

Et c’est là que ça devient vraiment intéressant 😏

Ces textes ne sont pas là juste parce qu’un dev Debian s’est découvert une passion pour la littérature victorienne entre deux apt-get.
Non, non, non. Ces fichiers sont là pour une bonne raison technique : ils servent de données de test standardisées pour plein d’outils et d’algos.

Par exemple, si tu bosses sur un algorithme de compression (genre bzip3 ou snappy), il te faut des textes riches, réalistes, avec de vrais motifs linguistiques. Et quoi de mieux que les œuvres complètes de Shakespeare ?
Ce bon vieux Will te balance un cocktail de répétitions, de variations lexicales et de structures syntaxiques parfait pour tordre ton algo dans tous les sens.

Même chose pour "Alice au pays des merveilles", qui n’a pas juste inspiré des générations de rêveurs… mais aussi des batteries de tests pour snappy, golang, et d’autres outils pas toujours très poétiques.

Et c’est quand même plus classe de tester son code avec du Shakespeare qu’avec un bon vieux “Lorem ipsum dolor sit amet” répété 10 000 fois !

Voici donc un petit tour d’horizon complet des pépites littéraires triées par années, que Jakub a pu repérer dans cette bibliothèque clandestine :

 

 

Maintenant, si vous voulez explorer vous-même cette étrange collection littéraire, rien de plus simple.

D’abord, installez les outils nécessaires :

sudo apt install apt-source devscripts

Configurez les sources Debian (si ce n’est pas déjà fait) :

echo "deb-src http://deb.debian.org/debian/ stable main" | sudo tee -a /etc/apt/sources.list sudo apt update

Puis téléchargeons les sources d’un package contenant un texte intéressant, comme snappy qui héberge Alice au pays des merveilles :

apt-get source snappy cd snappy-* find . -name “*.txt”

Et voilà ! Vous devriez trouver plusieurs fichiers .txt, dont certains sont des fameux classiques littéraires. Et pour lire Alice :

less testdata/alice29.txt

Ce qui est vraiment fascinant dans cette histoire, c’est que ces fichiers .txt sont devenus, au fil du temps, un corpus de référence dans le monde du dev.
À force d’utiliser les mêmes textes partout, les développeurs peuvent comparer les perfs de leurs algos dans des conditions similaires.
Une sorte de benchmark littéraire underground, né spontanément, sans comité officiel ni norme ISO — mais adopté par toute une communauté. La magie du libre, quoi.

Et ce n’est pas juste pratique, c’est aussi diablement malin :
Ces textes sont pour la plupart dans le domaine public (pas de galère de droits), riches et variés, avec des styles et des structures différents qui permettent de tester à fond les limites d’un programme.
Parfaits pour les compresseurs, les parseurs, les moteurs de recherche, ou les systèmes d’encodage de caractères.
Bref, tout ce qui touche au texte, à un moment donné, passe par un petit voyage au pays des merveilles (ou chez Shakespeare, au choix).

Certains appellent ça une solution pratique à un problème technique.
D’autres y voient une forme moderne de conservation culturelle.
Mais moi ? Moi je pense surtout que les barbus du libre ont un gros faible pour les classiques littéraires. Et ça me régale. 😄

Donc voilà…
📚 Si vous cherchez des livres gratos en anglais, y’a de quoi faire dans vos /usr/src.
Et si un jour vous tombez sur un fichier texte étrange dans le code source…
Peut-être que c’est pas un test. Peut-être que c’est un auteur qui s’est faufilé là, incognito.

Et si jamais vous avez envie de planquer un de mes articles dans vos builds, franchement… faites-vous plaisir hein 😏

Ajouter un commentaire