Ben Nuttall, un développeur qui a reçu le jeu FIFA Soccer Manager 97 pour son neuvième anniversaire, a passé d’innombrables heures à y jouer dans son enfance. Des années plus tard, il a entrepris d’extraire les données cachées du jeu à l’aide de l’intelligence artificielle Claude, dans le but de les rendre exploitables et consultables.
En pointant Claude vers le répertoire d’installation de Wine sous Linux, il a demandé à l’IA de se concentrer sur les éléments correspondant au monde réel du football — joueurs, équipes, stades. L’IA a rapidement localisé le fichier SM97.DAT et a pu répondre à des questions simples comme « quel est le plus grand stade ? » ou « qui est le joueur le mieux noté ? ». Claude a ensuite produit une page HTML résumant l’ensemble des données, puis des fichiers CSV pour vérification.
Nuttall a rencontré quelques problèmes de désorganisation des données, mais Claude a pu les corriger facilement. Pour les noms de colonnes des statistiques des joueurs, il a lancé le jeu et noté manuellement les intitulés ainsi que les statistiques de David Seaman, permettant à l’IA de calibrer ses interprétations. Le champ d’étude a ensuite été étendu à tous les joueurs et clubs, et pas seulement aux ligues anglaises.
Un site web complet et des découvertes inattendues
Une fois les fichiers CSV jugés fiables, toutes les requêtes ultérieures ont été scriptées à partir de ces fichiers, évitant toute nouvelle extraction ou hallucination. Nuttall a demandé à Claude de créer un site web plus complet avec de nombreux liens internes, site désormais accessible à l’adresse fsm.bennuttall.com. Il a également publié sur GitHub l’ensemble du code Python nécessaire pour reproduire le processus sans outil d’IA.
L’exploration des données a révélé des éléments fascinants. Par exemple, le jeu contient des informations qui ne sont pas utilisées en jeu : les noms complets des joueurs (alors que l’affichage ne montre que l’initiale du prénom et le nom), les noms des managers, les surnoms des clubs, les noms des stades, et même la ville ou la première ligne de l’adresse des clubs. Nuttall a ainsi découvert que Peter Shilton, ancien gardien de l’équipe d’Angleterre, figurait bien dans le jeu à Leyton Orient jusqu’en 1997 à 47 ans, et que le champion olympique de décathlon Daley Thompson apparaissait comme joueur à Mansfield Town, un clin d’œil des développeurs.
L’équipe EA All Stars et les joueurs-développeurs
Parmi les statistiques mises en avant, une page dédiée aux meilleurs joueurs montre une série de notes très élevées pour les membres d’un club nommé « EA All Stars ». Il s’agit en réalité des développeurs et du personnel d’EA Sports ayant travaillé sur le jeu. Le producteur associé Mark Bergan s’est attribué l’une des meilleures notes, au même niveau que des stars comme David Seaman, George Weah ou Romario.
Le site présente également des pages spéciales : meilleurs joueurs, meilleurs joueurs par tranche d’âge, joueurs-managers (certains managers étaient aussi listés comme joueurs), et stades par capacité. Nuttall a corrigé les noms des clubs et des stades, qui étaient souvent abrégés ou comportaient des erreurs de saisie (par exemple « Sheffield W » transformé en « Sheffield Wednesday », « Bramall Lane Ground » en « Bramall Lane »).
Partage de stades et méthode d’extraction
Une autre découverte concerne plusieurs clubs partageant le même stade, comme Wimbledon et Crystal Palace à Selhurst Park. Nuttall s’est interrogé sur le comportement du jeu si l’on agrandit son stade en tant que manager de Wimbledon : le stade vu lors d’un match à l’extérieur contre Crystal Palace serait-il celui par défaut ou la version améliorée ? La communauté Reddit a confirmé qu’ils apparaissent comme des stades différents.
Pour illustrer la méthode d’extraction, Nuttall a détaillé le format binaire des données. Par exemple, David Seaman est le premier enregistrement de joueur dans le bloc d’Arsenal. Ses 87 octets bruts contiennent son prénom et son nom en texte, suivis d’un bloc de statistiques commençant à l’octet 42. Le code hexadécimal permet d’identifier la nationalité, les notes de compétences, etc. Cette documentation est disponible sur GitHub dans le fichier data-extraction.md.
Grâce à ce travail, Nuttall a non seulement assouvi sa nostalgie, mais il a aussi offert à la communauté un outil open source pour explorer les entrailles d’un jeu culte de la fin des années 1990.