Stability AI ha anunciado el lanzamiento de su generador de audio AI y afirma que ofrece un rendimiento de primera clase.
En los últimos meses, hemos visto una serie de generadores de audio AI con un rendimiento variable, pero Stable Audio parece haber subido el listón.
Con Stable Audio puedes introducir un texto y el programa generará música o audio basándose en él. Ya hemos visto este tipo de funcionalidad en los productos MusicLM de Google y AudioCraft de Meta.
MusicLM aún sólo está disponible en Google's Test Kitchen y genera música a 24 kHz. AudioCraft de Meta es realmente impresionante, pero sólo genera música a 32 kHz.
Stable Audio es el primer generador de texto a audio que emite audio a 44,1 kHz, que es la frecuencia de muestreo de la música con calidad de CD.
La otra característica impresionante de Stable Audio es la longitud de las pistas que produce. La mayoría de los generadores de audio AI producen piezas musicales más cortas que se repiten rápidamente o pierden el rumbo. Stable Audio produce música más matizada de unos 90 segundos sin perder coherencia.
Hoy estamos encantados de lanzar Stable Audio, nuestro primer producto de IA para la generación de música y sonido.
Pruébelo gratis aquí. 1TP5EstabilidadAI #stableaudio #nuevoanuncio
https://t.co/pRK3Qs9Fak pic.twitter.com/cZfbK1mZYA- Estabilidad AI (@StabilityAI) 13 de septiembre de 2023
Puede consultar algunos muestras del audio generado aquí.
He aquí un ejemplo de una pista que pude generar utilizando la herramienta con la siguiente indicación:
"Post-Rock, Guitarras, Batería, Bajo, Cuerdas, Eufórico, Elevador, Moody, Fluido, Crudo, Épico, Sentimental, 125 BPM"
Eso suena bastante bien en realidad.
El modelo se basa en la técnica de difusión latente de Stability que utiliza para sus otros productos de IA generativa. Utiliza algunos códecs inteligentes durante inferencia que, según afirma, permite generar 95 segundos de música a 44,1 kHz en 1 segundo utilizando una GPU Nvidia A100.
Cuestiones de formación y derechos de autor
Stability AI produjo Stable Audio en cooperación con Harmonai, un laboratorio de investigación de aprendizaje profundo centrado en la creación de modelos de audio generativos de código abierto. El equipo de audio de Stability AI creó un nuevo modelo basado en su anterior modelo Dance Diffusion, que HarmonAI entrenó.
El conjunto de datos utilizado para entrenar Stable Audio procedía de AudioSparx, que suministró unas 800.000 canciones de los artistas de música independiente a los que representa.
Se dio a los artistas la opción de excluir sus obras del conjunto de datos, lo que al parecer hicieron alrededor de 10%.
Los artistas que opten por incluir sus obras en el conjunto de datos participarán en el acuerdo de reparto de beneficios que han suscrito Stability AI y AudioSparx.
No hay artistas de grandes sellos en el conjunto de datos, pero Stable Audio no te impide añadir el nombre de un artista o grupo a tu pregunta.
Aunque la biblioteca AudioSparx no contiene obras de un grupo como AC/DC, por ejemplo, sí contiene un montón de música descrita como del estilo de AC/DC.
Sigues sin poder registrar los derechos de autor de la música que generas con una herramienta de IA. Y los términos de uso dicen que usted "es responsable de asegurar la legalidad de todo el Contenido" hecho usando Stable Audio.
Además, las condiciones establecen que "usted declara y garantiza que es propietario de todos los derechos, títulos e intereses necesarios sobre dichas indicaciones, incluidos, entre otros, todos los derechos de autor y derechos de publicidad que contengan".
Así que mejor no añadas "Metallica" a tu pregunta. Esos tipos hacen buena música, pero también les encantan las demandas por derechos de autor.
¿Cuánto cuesta Stable Audio?
Puede prueba Stable Audio de forma gratuita, pero estarás limitado a generar 20 pistas no comerciales al mes, cada una de ellas con una duración máxima de 20 segundos. Además, sus servidores están saturados, así que se tarda bastante en generar una pista.
Estamos encantados de que la demanda para el lanzamiento de Stable Audio de hoy se haya disparado. Pero nuestros servidores están ahora a plena capacidad, por lo que es posible que no puedas acceder al producto. Si no puede, le rogamos que vuelva en 24 horas para intentarlo de nuevo.
Mientras tanto, trabajamos duro...
- Estabilidad AI (@StabilityAI) 13 de septiembre de 2023
La suscripción Pro te costará $11,99 al mes y te permitirá generar 500 pistas comercializables de hasta 90 segundos de duración cada mes.
Los créditos de generación no utilizados no se transfieren al mes siguiente, así que úsalos o piérdelos.
Si tiene una aplicación, un sitio web o un software con más de 100.000 usuarios, debe ponerse en contacto con Stability para obtener el precio de su plan para empresas.
Stability dice que "abrirá pronto un modelo de generación de música, entrenado con datos diferentes."
Con su producto Stable Audio, quizá Stability AI haya encontrado por fin la forma de hacer ganar dinero a sus inversores.