Ouvrir le menu principal

MacGeneration

Recherche

Google présente une IA impressionnante pouvant générer une musique à partir d'une ligne de texte

Félix Cattafesta

lundi 30 janvier 2023 à 13:30 • 102

Ailleurs

Alors que les avancées fulgurantes dans le domaine des IA de génération d'image ont été quelque peu mises au second plan par le phénomène ChatGTP, Google vient d'annoncer une nouvelle IA permettant de créer une musique à partir d'une poignée de mots. Si le résultat est bluffant, Google explique ne pas vouloir rendre public ce projet pour le moment.

Images générées avec DALL-E 2.

Dans un billet, la firme de Mountain View explique que son algorithme baptisé MusicLM peut générer « de la musique à 24 kHz qui reste cohérente pendant plusieurs minutes ». L'IA a été entraînée à partir de 5 millions de clips audio, soit 280 000 heures d'enregistrement. Il suffit d'entrer une commande (en anglais) pour obtenir un résultat bluffant. Voici quelques exemples :

La bande sonore principale d'un jeu d'arcade. Elle est rythmée et entraînante, avec un riff de guitare électrique accrocheur. La musique est répétitive et facile à mémoriser, mais avec des sons inattendus, comme des coups de cymbale ou des roulements de tambour.
Un synthé montant joue un arpège avec beaucoup de réverbération. Il est soutenu par des pads, une ligne de basse et une batterie douce. Cette chanson est pleine de sons synthétiques créant une atmosphère apaisante et incitant à l'aventure. Elle peut être jouée dans un festival pendant deux chansons pour une montée en puissance.

Si ces deux extraits ne font que 30 secondes, Google a également publié des morceaux allant jusqu'à 5 minutes. Un mode permet d'ajuster précisément le processus de création : on pourra par exemple réclamer une musique commençant de manière douce et devenant de plus en plus rythmée, ou une piste alternant différents styles. Le résultat sonne bien et les transitions sont correctes. Voici un exemple d'une minute dans lequel on a demandé une musique dont le tempo s'accentue toutes les 15 secondes :

L'IA peut également réinterpréter certaines mélodies, et il suffit d'envoyer un enregistrement (sifflé, fredonné ou joué) pour que l'IA vous la transpose dans un autre style. Un bête fredonnement de ‌Bella ciao prit à la va-vite avec le micro de votre téléphone peut devenir un chant d'opéra ou un solo de guitare. On pourra aussi lui demander de jouer une piste à l'aide d'un seul instrument ou de paramétrer le niveau du « musicien » créant le morceau (expert, débutant…).

L'enregistrement de Bella Ciao donné à MusicLM.
Sa reprise jazz.
En solo de guitare.

Google préfère pour le moment garder son projet privé et ne pas le proposer publiquement. Tout comme pour son IA de génération d'images Imagen, l'entreprise explique craindre les dérives d'une diffusion plus large. La question des droits d'auteurs se pose notamment : les sons peuvent reprendre du contenu sous licence et occasionnellement offrir un résultat très similaire. L'IA a été entraîné sur une grosse base de données avec de nombreux contenus protégés, ce qui incite Google à la prudence.

Si le résultat présenté est bluffant, il a aussi sans doute besoin d'un coup de polish. Les parties chantées sont pour le moment plutôt médiocres et il est bien difficile de discerner ce qui est dit (on comprend parfois quelques mots d'anglais mais il s'agit généralement de charabia). Google montre uniquement des morceaux concluants, et on peut imaginer qu'un paquet de brouillons décevants ont été mis de côté. Vous pouvez trouver tous les exemples mis en ligne par Google sur la page dédiée au projet.

Piste générée par MusicLM avec différents styles. La partie vocale est incompréhensible et sonne très robotique.

Cette présentation montre que Google souhaite mettre le paquet sur l'IA pour les années à venir. La sortie de ChatGPT a mis un coup de pression à l'entreprise : Sundar Pichai aurait réorganisé plusieurs groupes et demandé de mettre les bouchées doubles sur les projets liés à l'IA. Google n'est pas seul sur le créneau de la génération de musique : plusieurs projets similaires sont déjà accessibles à tous depuis quelques temps, et OpenAI (ChatGPT) planche sur une IA baptisée Jukebox.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Test des iPad Pro M5 : toujours plus forts, pas vraiment plus pros

10:48

• 15


Cyberpunk 2077 : le MacBook Pro M5 explose le MacBook Air M4

08:45

• 96


Sortie de veille : à peine lancé, l’iPhone Air est-il déjà condamné ?

08:00

• 78


Le MacBook avec puce iPhone peut-il sortir d'ici la fin de l'année ?

24/10/2025 à 21:56

• 25


Réparer des photos anciennes, floues ou bruitées avec Aiarty Image Enhancer (licence à vie à -45 %) 📍

24/10/2025 à 18:12

• 0


AirDrop surveille des canaux Wi-Fi et peut perturber votre appareil Apple si vous ne les utilisez pas

24/10/2025 à 17:00

• 29


Alors qu’Apple Intelligence se traîne, Apple livre en avance ses serveurs d’IA « made in USA »

24/10/2025 à 15:20

• 53


Crayola s’associe à Sandisk pour lancer des clés USB format crayon

24/10/2025 à 14:20

• 14


Comme ChatGPT, Claude se base sur les conversations précédentes, mais c’est payant pour le moment

24/10/2025 à 12:30

• 26


Microsoft ressuscite Clippy avec Mico, un nouvel assistant vocal carburant à l’IA

24/10/2025 à 10:28

• 9


La fin de Windows 10 donne un coup de fouet aux ventes de Mac

24/10/2025 à 09:05

• 49


OpenAI achète Sky, l’outil d’automatisation basé sur IA des créateurs de Raccourcis

24/10/2025 à 08:30

• 15


Amplify : les chaussures électriques signées Nike

24/10/2025 à 08:13

• 115


Apple : la fin annoncée du panneau “Autoriser le suivi” (ATT) en Europe ?

24/10/2025 à 08:13

• 116


Apple sauterait l’iPhone 19, pour atteindre l’iPhone 20 à temps pour le vingtième anniversaire 🆕

24/10/2025 à 06:39

• 69


Apple ferait partie des entreprises intéressées par le catalogue de films et séries de Warner Bros. Discovery

24/10/2025 à 06:39

• 49