Une nouvelle génération pour la musique créée par intelligence artificielle
La société ElevenLabs, connue pour ses technologies de synthèse vocale, a dévoilé une version majeure de son modèle de génération musicale. Ce nouvel outil, désigné sous le nom de Music v2, se distingue par sa capacité à changer de genre musical en plein milieu d’une piste. Selon la société, le modèle peut ainsi passer d’un air d’opéra au heavy metal, puis revenir à l’opéra, tout en conservant une cohérence sonore.
Cette annonce intervient près de dix mois après le lancement de la première version du générateur musical d’ElevenLabs. La startup met en avant la capacité du modèle à gérer des compositions complexes, tant sur le plan vocal que sur le plan instrumental.
Des fonctionnalités inédites pour les artistes
Avec Music v2, les utilisateurs peuvent désormais sélectionner une partie spécifique d’une chanson et la régénérer à l’aide d’une instruction textuelle, sans affecter les autres segments du morceau. La plateforme permet également de construire une chanson par sections distinctes (introduction, couplet, refrain), qui peuvent ensuite être assemblées.
Le modèle est également en mesure d’intégrer des effets sonores non musicaux, comme des bruits d’ambiance, et de gérer des paroles rapides sans perte de clarté. ElevenLabs indique que Music v2 offre des performances plus fiables sur le plan des langues, des paroles, des voix et des arrangements.
Un marché en pleine accélération
Ces nouveaux outils s’inscrivent dans une course effrénée entre les laboratoires d’intelligence artificielle pour produire des morceaux de qualité professionnelle. Au cours des derniers mois, plusieurs acteurs majeurs ont présenté leurs propres modèles. Google a notamment dévoilé une nouvelle version de son modèle de génération musicale lors de sa conférence I/O, avec la possibilité de créer des reprises, d’éditer des chansons par sections et de générer des clips musicaux via son outil Flow Music. De son côté, Stability AI a publié un modèle audio capable de créer des morceaux d’une durée pouvant atteindre six minutes. La plateforme Suno a également mis à jour son offre avec des fonctionnalités étendues.
Un modèle entraîné sur des données sous licence
ElevenLabs insiste sur le fait que Music v2 a été entraîné uniquement sur des données sous licence et que les morceaux générés sont autorisés pour une utilisation commerciale. Les utilisateurs peuvent donc exploiter librement les pistes produites, sans risque de violation de droits d’auteur. Cette démarche répond aux préoccupations croissantes de l’industrie musicale concernant l’utilisation non autorisée d’œuvres existantes pour l’entraînement de modèles d’IA.
La société n’a pas précisé la date de disponibilité générale de Music v2 ni les tarifs associés. Elle a indiqué que le modèle était d’ores et déjà accessible via sa plateforme pour les utilisateurs existants.