Stable Audio : le générateur de musique par IA passe la deuxième

Félix Cattafesta |

Si les générateurs d’images par IA ont fait des progrès remarquables ces dernières années, la musique n’est pas en reste. L’entreprise derrière le bien connu Stable Diffusion vient de lancer Stable Audio 2.0, la seconde mouture de son générateur de musique. Les pistes peuvent désormais durer jusqu’à 3 minutes, le tout avec une structure cohérente (intro, progression et outro).

Le résultat est perfectible, mais arrive parfois à être étonnement cohérent. Les voix et les paroles ne sont pas vraiment prises en charge, ce qui donne un résultat à mi-chemin entre le simlish et une musique que l’on croirait sortie d’un rêve. D’autres acteurs du secteur font beaucoup mieux sur les paroles, comme l’entreprise Suno qui a récemment vu sa technologie ajoutée au Copilot de Microsoft. Voici deux exemples générés avec Stable Audio, que vous pouvez essayer gratuitement sur son site :

« Une musique de rock classique »
« Une chanson de variété française »

Une autre nouveauté est qu’il est désormais possible de modifier une piste envoyée à Stable Audio. On pourra lui demander de la réinterpréter à l’aide de simples commandes textuelles. Autrement dit, vous pourrez siffloter un air dans votre micro avant de demander à le transformer en ligne de basse ou en rythme hip-hop. L’entreprise précise que les morceaux envoyés doivent être libres de droits.

Plusieurs aspects d’une piste peuvent être modifiés : on pourra ajuster la force de l’invite sur le résultat, ou encore en retoucher uniquement certaines parties. L’utilisateur peut également ajouter quelques effets sonores, comme des notes de clavier ou le grondement d’une foule. Une vingtaine d’essais sont gratuits chaque mois, et il faudra ensuite mettre la main à la poche pour un abonnement permettant de créer 500 pistes pour 12 dollars.

Les entreprises sont nombreuses à travailler sur le domaine de l’audio par IA. Google dispose par exemple de MusicLM, un concurrent à Stable Audio. De son côté, OpenAI a récemment présenté un outil permettant de cloner une voix à partir d’un simple extrait de 15 secondes. Le timing pour lancer cet outil n’est pas des mieux choisi : plus de 200 artistes viennent de signer une lettre ouverte incitant à se méfier de la musique générée par IA.

Accédez aux commentaires de l'article