OpenAI a présenté le mois dernier un impressionnant modèle de génération de vidéos baptisé Sora. Celui-ci offre des résultats bien plus complexes que ceux que l’on avait vu jusqu’à présent, avec des vidéos quasi réalistes pouvant durer jusqu’à une minute. Bonne nouvelle : la CTO de l’entreprise Mira Murati a confié au Wall Street Journal que le service allait être rendu disponible au grand public dans le courant de l’année.
Sora n’a pour le moment été proposé qu’a une poignée de partenaires, et on pouvait craindre que la technologie ne reste accessible qu’aux professionnels. Aucune date n’a été communiquée, mais Mira Murati estime que la sortie « pourrait être dans quelques mois ». Elle ajoute qu’OpenAI envisage d’incorporer une partie sonore aux créations, ce qui devrait rendre les vidéos encore plus réalistes.
Nombreuses sont les personnes mal intentionnées réussissant à détourner les garde-fous des IA pour leur faire générer des fausses informations et autres deepfakes : voir un outil aussi puissant que Sora rendu accessible pendant une année d’élection aux États-Unis a de quoi inquiéter. À la façon de DALL-E, il ne devrait pas être possible de générer de vidéos représentant des personnalités publiques. Un filigrane sera apposé sur les vidéos en plus de métadonnées identifiant son aspect artificiel. OpenAI est actuellement en train de travailler à rendre le modèle plus sûr en cherchant ses failles, ses biais et en cherchant des méthodes pour éviter les résultats dangereux. On peut rester sceptique, le scandale des images pornographiques de Taylor Swift créées avec Microsoft Designer (DALL-E 3) étant encore frais dans les mémoires.
L’interview est l’occasion d’en apprendre un peu plus sur le modèle. Interrogée sur les données utilisées pour entraîner Sora, la CTO reste évasive et ne confirme pas si les vidéos de YouTube, Facebook et Instagram ont été exploitées. Certains contenus de Shutterstock ont été utilisés, les deux entreprises ayant passé un partenariat. Des vidéos 720p d’une vingtaine de secondes peuvent être générées en quelques minutes, et les ingénieurs travaillent désormais sur des façons d’optimiser tout cela en réduisant la facture.
La présentation de l’outil a fait du bruit tant il représente une grande avancée dans le domaine des vidéos générées par IA, qui étaient jusqu’à présent d’assez mauvaise qualité. Le modèle peut créer des plans avec des mouvements de caméra et des personnages crédibles. Les quelques exemples dévoilés par OpenAI impressionnent, mais l’entreprise a également pointé les nombreux détails à perfectionner trahissant l’aspect artificiel des vidéos.