Stable Audio produce musica generata dall'intelligenza artificiale ad alta fedeltà

14 settembre 2023

Stability AI ha annunciato il rilascio del suo generatore audio AI e sostiene che offre prestazioni di prim'ordine.

Negli ultimi mesi abbiamo visto diversi generatori di audio AI con prestazioni variabili, ma Stable Audio sembra aver alzato il livello.

Con Stable Audio è possibile inserire una richiesta di testo e generare musica o audio in base alla richiesta. Abbiamo già visto questo tipo di funzionalità da Google con i suoi prodotti MusicLM e AudioCraft di Meta.

MusicLM è ancora disponibile solo nel Test Kitchen di Google e genera musica a 24 kHz. AudioCraft di Meta è davvero impressionante, ma genera musica solo a 32 kHz.

Stable Audio è il primo generatore di testo-audio che produce audio a 44,1 kHz, ovvero la frequenza di campionamento della musica di "qualità CD".

L'altra caratteristica impressionante di Stable Audio è la lunghezza delle tracce che produce. La maggior parte dei generatori di audio AI produce brani musicali più brevi che si ripetono rapidamente o perdono la loro strada. Stable Audio produce musica più sfumata di circa 90 secondi senza perdere coerenza.

È possibile controllare alcuni campioni dell'audio generato qui.

Ecco un esempio di traccia che sono riuscito a generare utilizzando lo strumento con il seguente prompt:

"Post-Rock, Chitarre, Batteria, Basso, Archi, Euforico, Sollevante, Lunatico, Scorrevole, Crudo, Epico, Sentimentale, 125 BPM"

Sembra piuttosto buono, in effetti.

Il modello si basa sulla tecnica di diffusione latente che Stability utilizza per altri prodotti di intelligenza artificiale generativa. Utilizza alcuni codec intelligenti durante inferenza che, a suo dire, consente di generare 95 secondi di musica a 44,1 kHz in 1 secondo utilizzando una GPU Nvidia A100.

Domande sulla formazione e sul copyright

Stability AI ha prodotto Stable Audio in collaborazione con Harmonai, un laboratorio di ricerca sul deep learning focalizzato sulla creazione di modelli audio generativi open-source. Il team audio di Stability AI ha creato un nuovo modello basato sul precedente modello Dance Diffusion, addestrato da Harmonai.

Il set di dati utilizzato per l'addestramento di Stable Audio proviene da AudioSparx, che ha fornito circa 800.000 brani degli artisti musicali indipendenti che rappresenta.

Agli artisti è stata data la possibilità di scegliere di escludere le loro opere dal set di dati, cosa che, secondo quanto riferito, è stata fatta da circa 10%.

Gli artisti che hanno scelto di includere le loro opere nel set di dati parteciperanno all'accordo di condivisione dei profitti stipulato da Stability AI e AudioSparx.

Non ci sono artisti di grandi marche nel set di dati, ma Stable Audio non vi impedisce di aggiungere il nome di un artista o di una band nel vostro prompt.

Sebbene la libreria di AudioSparx non contenga lavori di band come gli AC/DC, ad esempio, contiene un'ampia quantità di musica descritta come nello stile degli AC/DC.

Non si può comunque mettere sotto copyright la musica generata con uno strumento di intelligenza artificiale. E i termini d'uso dicono che l'utente "è responsabile della liceità di tutti i contenuti" realizzati con Stable Audio.

I termini stabiliscono inoltre che "l'utente dichiara e garantisce di possedere tutti i diritti, i titoli e gli interessi necessari su tali messaggi, compresi, senza limitazioni, tutti i necessari diritti d'autore e i diritti di pubblicità in essi contenuti".

Quindi forse non aggiungete "Metallica" al vostro prompt. Quei ragazzi fanno grande musica, ma amano anche una buona causa per copyright.

Quanto costa Stable Audio?

È possibile provare Audio stabile ma sarete limitati a generare 20 tracce non commerciabili al mese, ciascuna della durata di 20 secondi. Inoltre, i loro server sono assolutamente intasati al momento, quindi ci vuole un po' di tempo per generare un brano.

L'abbonamento Pro costa $11,99 al mese e consente di generare ogni mese 500 tracce commercializzabili della durata massima di 90 secondi.

I crediti di generazione non utilizzati non vengono trasferiti al mese successivo, quindi o li usi o li perdi.

Se avete un'applicazione, un sito web o un software con più di 100.000 utenti, dovete contattare Stability per ottenere i prezzi del piano aziendale.

Stability afferma che "presto renderà disponibile un modello di generazione musicale, addestrato su dati diversi".

Con il suo prodotto Stable Audio, forse Stability AI ha finalmente trovato un modo per far guadagnare i suoi investitori.

Partecipa al futuro


ISCRIVITI OGGI

Chiaro, conciso, completo. Per conoscere gli sviluppi dell'IA con DailyAI

Eugene van der Watt

Eugene proviene da un background di ingegneria elettronica e ama tutto ciò che è tecnologico. Quando si prende una pausa dal consumo di notizie sull'intelligenza artificiale, lo si può trovare al tavolo da biliardo.

×

PDF GRATUITO ESCLUSIVO
Rimanere all'avanguardia con DailyAI

Iscriviti alla nostra newsletter settimanale e ricevi l'accesso esclusivo all'ultimo eBook di DailyAI: 'Mastering AI Tools: La tua guida 2024 per una maggiore produttività".

*Iscrivendosi alla nostra newsletter si accetta la nostra Informativa sulla privacy e il nostro Termini e condizioni