Stability AI ha annunciato il rilascio del suo generatore audio AI e sostiene che offre prestazioni di prim'ordine.
Negli ultimi mesi abbiamo visto diversi generatori di audio AI con prestazioni variabili, ma Stable Audio sembra aver alzato il livello.
Con Stable Audio è possibile inserire una richiesta di testo e generare musica o audio in base alla richiesta. Abbiamo già visto questo tipo di funzionalità da Google con i suoi prodotti MusicLM e AudioCraft di Meta.
MusicLM è ancora disponibile solo nel Test Kitchen di Google e genera musica a 24 kHz. AudioCraft di Meta è davvero impressionante, ma genera musica solo a 32 kHz.
Stable Audio è il primo generatore di testo-audio che produce audio a 44,1 kHz, ovvero la frequenza di campionamento della musica di "qualità CD".
L'altra caratteristica impressionante di Stable Audio è la lunghezza delle tracce che produce. La maggior parte dei generatori di audio AI produce brani musicali più brevi che si ripetono rapidamente o perdono la loro strada. Stable Audio produce musica più sfumata di circa 90 secondi senza perdere coerenza.
Oggi siamo entusiasti di lanciare Stable Audio, il nostro primo prodotto AI per la musica e la generazione del suono!
Provatelo qui gratuitamente! #stabilitàAI #stableaudio #nuovo annuncio
https://t.co/pRK3Qs9Fak pic.twitter.com/cZfbK1mZYA- Stability AI (@StabilityAI) 13 settembre 2023
È possibile controllare alcuni campioni dell'audio generato qui.
Ecco un esempio di traccia che sono riuscito a generare utilizzando lo strumento con il seguente prompt:
"Post-Rock, Chitarre, Batteria, Basso, Archi, Euforico, Sollevante, Lunatico, Scorrevole, Crudo, Epico, Sentimentale, 125 BPM"
Sembra piuttosto buono, in effetti.
Il modello si basa sulla tecnica di diffusione latente che Stability utilizza per altri prodotti di intelligenza artificiale generativa. Utilizza alcuni codec intelligenti durante inferenza che, a suo dire, consente di generare 95 secondi di musica a 44,1 kHz in 1 secondo utilizzando una GPU Nvidia A100.
Domande sulla formazione e sul copyright
Stability AI ha prodotto Stable Audio in collaborazione con Harmonai, un laboratorio di ricerca sul deep learning focalizzato sulla creazione di modelli audio generativi open-source. Il team audio di Stability AI ha creato un nuovo modello basato sul precedente modello Dance Diffusion, addestrato da Harmonai.
Il set di dati utilizzato per l'addestramento di Stable Audio proviene da AudioSparx, che ha fornito circa 800.000 brani degli artisti musicali indipendenti che rappresenta.
Agli artisti è stata data la possibilità di scegliere di escludere le loro opere dal set di dati, cosa che, secondo quanto riferito, è stata fatta da circa 10%.
Gli artisti che hanno scelto di includere le loro opere nel set di dati parteciperanno all'accordo di condivisione dei profitti stipulato da Stability AI e AudioSparx.
Non ci sono artisti di grandi marche nel set di dati, ma Stable Audio non vi impedisce di aggiungere il nome di un artista o di una band nel vostro prompt.
Sebbene la libreria di AudioSparx non contenga lavori di band come gli AC/DC, ad esempio, contiene un'ampia quantità di musica descritta come nello stile degli AC/DC.
Non si può comunque mettere sotto copyright la musica generata con uno strumento di intelligenza artificiale. E i termini d'uso dicono che l'utente "è responsabile della liceità di tutti i contenuti" realizzati con Stable Audio.
I termini stabiliscono inoltre che "l'utente dichiara e garantisce di possedere tutti i diritti, i titoli e gli interessi necessari su tali messaggi, compresi, senza limitazioni, tutti i necessari diritti d'autore e i diritti di pubblicità in essi contenuti".
Quindi forse non aggiungete "Metallica" al vostro prompt. Quei ragazzi fanno grande musica, ma amano anche una buona causa per copyright.
Quanto costa Stable Audio?
È possibile provare Audio stabile ma sarete limitati a generare 20 tracce non commerciabili al mese, ciascuna della durata di 20 secondi. Inoltre, i loro server sono assolutamente intasati al momento, quindi ci vuole un po' di tempo per generare un brano.
Siamo entusiasti del fatto che la domanda per il lancio di Stable Audio di oggi sia stata fuori scala! Ma i nostri server sono ora al massimo della capacità, quindi potreste non essere in grado di accedere al prodotto. Se non ci riuscite, vi chiediamo gentilmente di tornare a controllare tra 24 ore per riprovare.
Nel frattempo, stiamo lavorando sodo...
- Stability AI (@StabilityAI) 13 settembre 2023
L'abbonamento Pro costa $11,99 al mese e consente di generare ogni mese 500 tracce commercializzabili della durata massima di 90 secondi.
I crediti di generazione non utilizzati non vengono trasferiti al mese successivo, quindi o li usi o li perdi.
Se avete un'applicazione, un sito web o un software con più di 100.000 utenti, dovete contattare Stability per ottenere i prezzi del piano aziendale.
Stability afferma che "presto renderà disponibile un modello di generazione musicale, addestrato su dati diversi".
Con il suo prodotto Stable Audio, forse Stability AI ha finalmente trovato un modo per far guadagnare i suoi investitori.