Google a présenté cette semaine Gemini Omni, une fonctionnalité de création vidéo alimentée par intelligence artificielle qui permet de générer des séquences à partir d’une simple description textuelle, d’une image, d’un fichier audio ou d’une vidéo existante. L’entreprise place cet outil dans la continuité de Nano Banana, son générateur d’images, mais appliqué cette fois au format vidéo.
Des capacités élargies pour les créateurs
Selon les informations communiquées par Google, Omni est présenté comme « le point de rencontre entre la capacité de raisonnement de Gemini et sa capacité de création ». L’outil permet notamment de générer des vidéos intégrales, de modifier des séquences existantes par commandes en langage naturel, et surtout de produire des avatars – des doubles numériques de personnes réelles – capables de s’exprimer devant la caméra.
Les créateurs pourraient ainsi produire plus facilement des vidéos de qualité, ou augmenter considérablement le volume de contenu sur des plateformes comme YouTube. Dans son annonce, Google compare cette avancée à l’amélioration de la génération d’images intervenue après le lancement de Nano Banana, suggérant un saut qualitatif pour la vidéo générée par IA.
Un outil qui interroge sur la confiance
Si la promesse technique est ambitieuse, la possibilité de créer un double vidéo de soi-même ou d’autrui soulève des questions éthiques. L’entreprise elle-même évoque le besoin d’encadrer ces usages, sans pour autant détailler de mesures précises dans l’immédiat. Les observateurs pointent le risque de voir se multiplier les contenus trompeurs, notamment sur les plateformes sociales, où la distinction entre une vidéo authentique et une vidéo synthétique pourrait devenir difficile.
Google n’a pas précisé de calendrier de déploiement ni les conditions d’accès à Omni. Toutefois, l’outil devrait être intégré à l’écosystème Gemini, déjà utilisé pour la génération d’images et de texte.
Une étape dans la convergence des médias
Avec Omni, Google franchit une nouvelle étape dans la convergence entre intelligence artificielle et production audiovisuelle. L’outil combine plusieurs modalités (texte, image, audio, vidéo) en un seul modèle, permettant une édition naturelle et un rendu réaliste. Les avatars générés par IA pourraient simplifier la création de contenu pour les professionnels, mais aussi démocratiser des pratiques jusqu’alors réservées à des studios.
L’impact sur la confiance dans les médias visuels reste à évaluer. Plusieurs associations de défense des droits numériques appellent déjà à une régulation claire des avatars et des vidéos générées, afin de prévenir les usages malveillants. Google n’a pas annoncé de système de filigrane ou de vérification d’authenticité spécifique pour Omni.
Vers une généralisation de la vidéo synthétique ?
Si les capacités techniques d’Omni sont confirmées, la barrière à l’entrée pour créer des vidéos réalistes sera considérablement abaissée. L’outil pourrait séduire les créateurs indépendants, les spécialistes du marketing et les formateurs, mais aussi inquiéter les acteurs de l’information et les autorités en matière de désinformation.
Google mise sur la double nature de Gemini – raisonnement et création – pour justifier une approche plus sûre. Reste à savoir si cette promesse tiendra ses engagements face à des usages qui, par le passé, ont souvent dépassé les garde-fous des technologies émergentes.