Faire tourner l’IA moderne sur un Pentium II de 1997 : le retour des machines modestes

by

in



Par Bloc Zéro

Et si on arrêtait de croire que l’intelligence artificielle n’est réservée qu’aux géants du cloud et aux machines hors de prix ? Une équipe de hackers indépendants, EXO Labs, vient de prouver le contraire en faisant tourner un modèle de langage moderne sur un Pentium II de 1997 avec seulement 128 Mo de RAM. Une claque à la course au gigantisme. Un souffle d’air frais dans un monde saturé de serveurs et de silicium.


Un moteur maison pour une machine d’avant l’an 2000

Imaginez : un processeur à 350 MHz, 128 Mo de mémoire, Windows 98… et pourtant, une IA fonctionnelle qui répond à vos questions. Comment ? Grâce à un moteur d’inférence ultra-léger, llama98.c, écrit en C pur, inspiré du projet open source llama2.c d’Andrej Karpathy. Résultat : 35 tokens par seconde. Sur un dinosaure numérique.


BitNet : l’IA ternaire, la revanche du minimalisme

La clef de cette magie s’appelle BitNet b1.58, une architecture où chaque paramètre du modèle est réduit à trois états : -1, 0 ou 1. Moins de mémoire, moins de calculs, mais une efficacité diabolique. On abandonne les nombres à virgule flottante pour revenir à l’essentiel : du binaire intelligent, compressé, presque poétique.


Pourquoi c’est important ?

1. Réappropriation technologique

Pas besoin de GPU à 3 000 €. N’importe qui peut relancer une vieille tour, la compiler et faire tourner une IA locale. C’est une porte grande ouverte vers l’autonomie numérique.

2. Recyclage militant

Dans un monde noyé de déchets électroniques, cette démarche montre que les machines dites « obsolètes » ont encore un rôle à jouer. Plutôt que jeter, on recycle. Plutôt que consommer, on transforme.

3. IA pour tous, partout

Cette approche rend l’IA accessible dans des zones sans infrastructures modernes : écoles rurales, ateliers autonomes, communautés isolées. Pas besoin d’un datacenter pour avoir un assistant intelligent.


Ne pas se méprendre : c’est un début

Le modèle utilisé ici est minuscule comparé aux géants du marché. On parle de 260 000 paramètres contre plusieurs milliards pour les versions complètes de Llama 2. Mais c’est une preuve de concept. Un acte politique. Un signal : l’IA n’a pas besoin d’être massive pour être utile.


Bloc Zéro soutient ce type d’initiatives

Parce qu’elles redonnent le pouvoir aux mains de ceux qui bricolent, qui récupèrent, qui détournent. Parce qu’elles posent les bonnes questions : et si le progrès, c’était justement de faire mieux avec moins ?
Et si l’avenir de l’intelligence, c’était l’élégance du minimalisme et la puissance de la débrouille ?


Laisser un commentaire


Designed with WordPress

En savoir plus sur ORTIS

Abonnez-vous pour poursuivre la lecture et avoir accès à l’ensemble des archives.

Poursuivre la lecture