DiffusionBlocks : une méthode pour entraîner les réseaux de neurones par blocs indépendants, réduisant la mémoire nécessaire
Des chercheurs de Sakana AI et de l'Université de Tokyo présentent DiffusionBlocks, un cadre théorique qui permet d'entraîner chaque bloc d'un réseau de neurones de manière indépendante. La consommation mémoire est divisée par le nombre de blocs, sans perte de performance sur des tâches de vision, de génération d'images ou de texte.
DiffusionBlocks
ICLR 2026
Makoto Shing
Masanori Koyama
NoProp
Sakana AI
Takuya Akiba
Université de Tokyo
Évolution chronologique
-
DiffusionBlocks : une méthode pour entraîner les réseaux de neurones par blocs indépendants, réduisant la mémoire nécessaire
DiffusionBlocks propose d'entraîner les réseaux de neurones par blocs indépendants, divisant par le nombre de blocs la mémoire nécessaire, sans perte de performance sur des tâches...