Ouvrir le menu principal

MacGeneration

Recherche

MusicLM, la nouvelle IA de Google, a transformé nos idées en musique

Félix Cattafesta

vendredi 12 mai 2023 à 16:00 • 45

Ailleurs

Google a profité de sa grande conférence annuelle pour déployer une bêta de MusicLM, son modèle permettant de générer une musique à partir d'une description textuelle. Le projet a été présenté au mois de janvier et est désormais accessible sur invitation. Il est possible de s'inscrire sur la plateforme d'expérimentation avec l'IA de Google, qui devrait s'enrichir d'autres démos du même genre par la suite.

L'interface de la démo.

La démo de MusicLM fonctionne de manière très simple : une boîte de texte permet d'entrer son idée, et il suffit de valider pour laisser l'algorithme générer deux pistes. Les résultats ne prennent ensuite qu'une poignée de secondes à apparaître et il n'y a pas de limitation au nombre d'essais. Les commandes doivent être entrées en anglais, mais le modèle semble comprendre le français.

Le résultat est bluffant pour certaines commandes, plutôt bizarre sur d'autres. J'ai joué un peu avec différents styles, et le résultat dépend surtout de la commande rédigée. Google recommande d'être très descriptif et d’indiquer l'ambiance, l'atmosphère ou l'émotion voulue. L'entreprise précise que les sons d'instruments électroniques ou classiques offrent un meilleur rendu. Voici quelques exemples :

Une musique calme pour m'aider à me détendre pendant mes révisions. Le rythme est assez simple et lent. Il n'y a qu'un piano.
Bande sonore d'un jeu vidéo. Musique entraînante pour un niveau sous-marin. Le rythme est facile à mémoriser. Sonorités aquatiques.
Morceau funky avec un rythme fort et dansant avec une ligne de basse. Une mélodie entraînante provenant d'un clavier ajoute une couche de richesse et de complexité à la chanson.
La musique enjouée d'une taverne médiévale pour une soirée jeu de rôle.

Il est possible de donner un petit trophée à la piste la plus convaincante, un choix que Google utilisera pour améliorer son modèle. L'expérience peut fonctionner via navigateur sur iOS, mais est aussi disponible en passant par une app dédiée (qui n'est pas encore sur l'App Store français). Un bouton permet de télécharger ses créations au format .mp3 pour les partager.

Évidemment, Google a mis en place quelques limitations pour éviter les abus. On ne pourra par exemple pas demander d'imiter le style d'un artiste, et les pistes produites ne durent que 20 secondes. Le modèle ne génère pas de voix, ce qui n'est pas vraiment surprenant : la technologie ne semblait pas du tout au point à ce niveau lors de la première présentation en début d'année.

Exemple de Google d'une piste générée par MusicLM avec différents styles. La partie vocale est incompréhensible.

Un déploiement plus poussé n'est sans doute pas à l'ordre du jour, ce type d'IA posant de nombreuses questions légales. Le système a été entraîné sur une énorme base de données sans tenir compte du droit d'auteur. En janvier, Google expliquait que les sons pouvaient reprendre du contenu sous licence et occasionnellement offrir un résultat très similaire.

Cette démo est publiée alors que le débat sur la musique générée par IA commence à prendre de l'ampleur. Le label Universal Music s'est alarmé de l'utilisation de telles technologies, de plus en plus accessibles. Récemment, un faux duo entre les artistes Drake et The Weeknd est devenu viral, faisant des millions de vues sur les différentes plateformes. Spotify et Apple Music ont commencé à faire le tri sur leurs serveurs.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Sniffnet, un outil de surveillance du réseau simple, gratuit, open-source et multiplateforme

14:00

• 0


Avec Grok 3, Elon Musk continue de courir après OpenAI

11:50

• 31


Deux nouveaux adaptateurs Ethernet 10 Gb/s chez QNAP, en USB4 et Thunderbolt

10:35

• 7


Le Mexique menace d’attaquer Google en justice pour l’appellation « golfe d’Amérique »

09:59

• 33


Image Playground peut verser dans les stéréotypes pour générer des visages

17/02/2025 à 21:45

• 50


Incogni : on l'a testé, notre bilan après 12 mois d'utilisation 📍

17/02/2025 à 20:55


Nos conseils pour acheter des produits Apple à prix réduit

17/02/2025 à 18:51

• 35


Le métro parisien de nouvelle génération rajeunit l'USB-A

17/02/2025 à 16:30

• 230


De nouveaux problèmes de compatibilités entre macOS Sequoia et Microsoft Exchange ?

17/02/2025 à 15:00

• 24


Sosh : le forfait 20 Go en Série limitée va augmenter sauf refus de votre part

17/02/2025 à 12:40

• 80


Western Digital divorce de SanDisk (et veut fabriquer des disques de 100 To)

17/02/2025 à 11:00

• 21


Arm vendrait son premier processeur clé en main à Meta

17/02/2025 à 10:07

• 3


Spotify lancerait en 2025 une option payante pour les super fans de musique

17/02/2025 à 09:32

• 39


Des écrans, mais surtout des robots humanoïdes. Futur joyeux ou apocalyptique ? La semaine de Gurman

16/02/2025 à 20:30

• 34


Promo : le MacBook Air M3 16 Go à 1099 € (+ une cagnotte de 109 € chez Leclerc)

16/02/2025 à 18:16

• 21


Easter Egg : quand Apple cache des petites blagues dans ses produits

16/02/2025 à 10:00

• 18