Stability AI har lanserat sin AI-ljudgenerator och hävdar att den levererar förstklassig prestanda.
Under de senaste månaderna har vi sett ett antal AI-ljudgeneratorer med varierande prestanda, men Stable Audio verkar ha höjt ribban.
Med Stable Audio kan du ange en textprompt och den kommer att generera musik eller ljud baserat på prompten. Vi har sett den typen av funktionalitet från Google med dess MusicLM och Meta's AudioCraft-produkter.
MusicLM är fortfarande bara tillgängligt i Googles testkök och genererar musik på 24 kHz. Meta's AudioCraft är verkligen imponerande, men den genererar bara musik på 32 kHz.
Stable Audio är den första text-till-ljud-generatorn som matar ut ljud i 44,1 kHz, vilket är samplingsfrekvensen för musik i "CD-kvalitet".
Den andra imponerande egenskapen hos Stable Audio är längden på spåren som den producerar. De flesta AI-ljudgeneratorer producerar kortare musikstycken som snabbt upprepas eller tappar sin väg. Stable Audio producerar mer nyanserad musik på cirka 90 sekunder utan att tappa sammanhanget.
Idag är vi glada över att kunna lansera Stable Audio, vår första AI-produkt för musik och ljudgenerering!
Prova det här gratis! #stabilitetAI #stabilaudio #nytt tillkännagivande
https://t.co/pRK3Qs9Fak pic.twitter.com/cZfbK1mZYA- Stabilitet AI (@StabilitetAI) 13 september 2023
Du kan kolla in några prov på det genererade ljudet här.
Här är ett exempel på ett spår som jag kunde skapa med hjälp av verktyget med följande uppmaning:
"Post-Rock, Gitarrer, Trumset, Bas, Stråkar, Euforisk, Upplyftande, Stämningsfull, Flödande, Rå, Episk, Sentimental, 125 BPM"
Det låter faktiskt ganska bra.
Modellen bygger på Stabilitys teknik för latent diffusion som används för andra generativa AI-produkter. Den använder några smarta codecs under Slutsats som enligt uppgift gör det möjligt att generera 95 sekunders 44,1 kHz-musik på 1 sekund med hjälp av en Nvidia A100 GPU.
Frågor om utbildning och upphovsrätt
Stability AI producerade Stable Audio i samarbete med Harmonai, ett forskningslabb för djupinlärning som fokuserar på att skapa generativa ljudmodeller med öppen källkod. Stability AI:s ljudteam skapade en ny modell baserad på deras tidigare Dance Diffusion-modell, som HarmonAI tränade.
Datasetet som användes för att träna Stable Audio kom från AudioSparx som levererade cirka 800.000 låtar från de oberoende musikartister som de representerar.
Konstnärerna gavs möjlighet att välja att utesluta sina verk från datasetet, vilket cirka 10% enligt uppgift gjorde.
Artister som valt att låta sina verk ingå i datasetet kommer att få ta del av det vinstdelningsarrangemang som Stability AI och AudioSparx har ingått.
Det finns inga stora artister i datasetet, men Stable Audio hindrar dig inte från att lägga till ett artist- eller bandnamn i din prompt.
Även om AudioSparx-biblioteket inte innehåller verk av ett band som AC/DC till exempel, innehåller det gott om musik som beskrivs som i stil med AC/DC.
Du kan fortfarande inte upphovsrättsskydda den musik du genererar med ett AI-verktyg. Och användarvillkoren säger att du "är ansvarig för att säkerställa lagligheten i allt innehåll" som görs med Stable Audio.
I villkoren anges vidare att "du intygar och garanterar att du äger alla nödvändiga rättigheter, titlar och intressen i och till sådana uppmaningar, inklusive, utan begränsning, alla nödvändiga upphovsrätter och publicitetsrättigheter som ingår i dessa".
Så lägg kanske inte till "Metallica" i din prompt. De där killarna gör fantastisk musik, men de älskar också en bra upphovsrättsstämning.
Hur mycket kostar Stable Audio?
Du kan prova Stable Audio ut gratis men du kommer att vara begränsad till att generera 20 icke-kommersiella spår per månad, var och en begränsad till en längd av 20 sekunder. Och deras servrar är helt slammade just nu så det tar ett tag att generera ett spår.
Det är fantastiskt att efterfrågan på vår lansering av Stable Audio idag har varit så stor! Men våra servrar har nu full kapacitet, så det kan hända att du inte kan komma åt produkten. Om du inte kan det ber vi dig vänligen att komma tillbaka om 24 timmar för att försöka igen.
Under tiden arbetar vi hårt för att...
- Stabilitet AI (@StabilitetAI) 13 september 2023
En Pro-prenumeration kommer att köra dig $11.99 per månad vilket gör att du kan generera 500 kommersialiserbara spår på upp till 90 sekunder långa varje månad.
Oanvända generationskrediter flyttas inte över till nästa månad, så använd dem eller förlora dem.
Om du har en app, webbplats eller programvara som har mer än 100 000 användare måste du kontakta Stability för att få pris på deras företagsplan.
Stability säger att de kommer att "öppna en musikgenereringsmodell snart, utbildad på olika data".
Med sin produkt Stable Audio har Stability AI kanske äntligen hittat ett sätt att tjäna pengar åt sina investerare.