Par Bloc Zéro
Et si on arrêtait de croire que l’intelligence artificielle n’est réservée qu’aux géants du cloud et aux machines hors de prix ? Une équipe de hackers indépendants, EXO Labs, vient de prouver le contraire en faisant tourner un modèle de langage moderne sur un Pentium II de 1997 avec seulement 128 Mo de RAM. Une claque à la course au gigantisme. Un souffle d’air frais dans un monde saturé de serveurs et de silicium.
Un moteur maison pour une machine d’avant l’an 2000
Imaginez : un processeur à 350 MHz, 128 Mo de mémoire, Windows 98… et pourtant, une IA fonctionnelle qui répond à vos questions. Comment ? Grâce à un moteur d’inférence ultra-léger, llama98.c, écrit en C pur, inspiré du projet open source llama2.c d’Andrej Karpathy. Résultat : 35 tokens par seconde. Sur un dinosaure numérique.
BitNet : l’IA ternaire, la revanche du minimalisme
La clef de cette magie s’appelle BitNet b1.58, une architecture où chaque paramètre du modèle est réduit à trois états : -1, 0 ou 1. Moins de mémoire, moins de calculs, mais une efficacité diabolique. On abandonne les nombres à virgule flottante pour revenir à l’essentiel : du binaire intelligent, compressé, presque poétique.
Pourquoi c’est important ?
1. Réappropriation technologique
Pas besoin de GPU à 3 000 €. N’importe qui peut relancer une vieille tour, la compiler et faire tourner une IA locale. C’est une porte grande ouverte vers l’autonomie numérique.
2. Recyclage militant
Dans un monde noyé de déchets électroniques, cette démarche montre que les machines dites « obsolètes » ont encore un rôle à jouer. Plutôt que jeter, on recycle. Plutôt que consommer, on transforme.
3. IA pour tous, partout
Cette approche rend l’IA accessible dans des zones sans infrastructures modernes : écoles rurales, ateliers autonomes, communautés isolées. Pas besoin d’un datacenter pour avoir un assistant intelligent.
Ne pas se méprendre : c’est un début
Le modèle utilisé ici est minuscule comparé aux géants du marché. On parle de 260 000 paramètres contre plusieurs milliards pour les versions complètes de Llama 2. Mais c’est une preuve de concept. Un acte politique. Un signal : l’IA n’a pas besoin d’être massive pour être utile.
Bloc Zéro soutient ce type d’initiatives
Parce qu’elles redonnent le pouvoir aux mains de ceux qui bricolent, qui récupèrent, qui détournent. Parce qu’elles posent les bonnes questions : et si le progrès, c’était justement de faire mieux avec moins ?
Et si l’avenir de l’intelligence, c’était l’élégance du minimalisme et la puissance de la débrouille ?
