Orbit, un framework open source pour le post-entraînement de modèles massifs comme DeepSeek V4-Pro sur un nœud unique
Une équipe de développeurs a publié Orbit, un framework open source conçu pour le post-entraînement par renforcement de modèles de langage à l'échelle de plusieurs billions de paramètres, capable de fonctionner sur une seule machine. L'outil vise à rendre le fine-tuning avancé de modèles comme DeepSeek V4-Pro accessible à un plus grand nombre d'acteurs.
DeepSeek V4 Pro
Orbit
spherelab.ai
Tim