Stability AI annoncerede udgivelsen af sin AI-lydgenerator og hævder, at den leverer førsteklasses ydeevne.
I løbet af de sidste par måneder har vi set en række AI-lydgeneratorer med varierende ydeevne, men Stable Audio ser ud til at have hævet barren.
Med Stable Audio kan du indtaste en tekstprompt, og den vil generere musik eller lyd baseret på prompten. Vi har set den slags funktionalitet fra Google med MusicLM og Metas AudioCraft-produkter.
MusicLM er stadig kun tilgængelig i Googles testkøkken og genererer musik ved 24 kHz. Meta's AudioCraft er virkelig imponerende, men den genererer kun musik ved 32 kHz.
Stable Audio er den første implementerede tekst-til-lyd-generator, der udsender lyd ved 44,1 kHz, som er samplingsfrekvensen for musik i "cd-kvalitet".
Den anden imponerende egenskab ved Stable Audio er længden af de numre, den producerer. De fleste AI-lydgeneratorer producerer kortere musikstykker, der hurtigt gentages eller mister deres retning. Stable Audio producerer mere nuanceret musik på omkring 90 sekunder uden at miste sammenhængen.
I dag er vi glade for at kunne lancere Stable Audio, vores første AI-produkt til musik- og lydgenerering!
Prøv det gratis her! #stabilityAI #stableaudio #ny bekendtgørelse
https://t.co/pRK3Qs9Fak pic.twitter.com/cZfbK1mZYA- Stabilitet AI (@StabilitetAI) 13. september 2023
Du kan tjekke nogle eksempler på den genererede lyd her.
Her er et eksempel på et spor, jeg var i stand til at generere ved hjælp af værktøjet med følgende prompt:
"Post-Rock, Guitarer, Trommesæt, Bas, Strygere, Euforisk, Opløftende, Stemningsfuld, Flydende, Rå, Episk, Sentimental, 125 BPM"
Det lyder faktisk ret godt.
Modellen er baseret på Stabilitys latente diffusionsteknik, som de bruger til deres andre generative AI-produkter. Den bruger nogle smarte codecs under slutning som efter sigende gør det muligt at generere 95 sekunders 44,1 kHz musik på 1 sekund ved hjælp af en Nvidia A100 GPU.
Spørgsmål om uddannelse og ophavsret
Stability AI producerede Stable Audio i samarbejde med Harmonai, et forskningslaboratorium for dyb læring med fokus på at skabe open source generative lydmodeller. Stability AI's lydteam skabte en ny model baseret på deres tidligere Dance Diffusion-model, som HarmonAI trænede.
Datasættet, der blev brugt til at træne Stable Audio, kom fra AudioSparx, som leverede omkring 800.000 sange fra de uafhængige musikkunstnere, de repræsenterer.
Kunstnerne fik mulighed for at vælge at få deres arbejde udelukket fra datasættet, hvilket omkring 10% angiveligt gjorde.
Kunstnere, der har valgt at lade deres arbejde indgå i datasættet, får del i den overskudsdeling, som Stability AI og AudioSparx har indgået.
Der er ikke nogen store kunstnere i datasættet, men Stable Audio forhindrer dig ikke i at tilføje et kunstner- eller bandnavn i din prompt.
Selv om AudioSparx-biblioteket ikke indeholder værker af et band som AC/DC, indeholder det masser af musikken beskrives som værende i stil med AC/DC.
Du kan stadig ikke ophavsretligt beskytte den musik, du genererer med et AI-værktøj. Og i brugsbetingelserne står der, at du "er ansvarlig for at sikre lovligheden af alt indhold", der er lavet ved hjælp af Stable Audio.
Vilkårene siger endvidere, at "du repræsenterer og garanterer, at du ejer alle nødvendige rettigheder, titler og interesser i og til sådanne meddelelser, herunder, uden begrænsning, alle nødvendige ophavsrettigheder og publicitetsrettigheder indeholdt deri."
Så måske skal du ikke tilføje 'Metallica' til din opfordring. De laver fantastisk musik, men de elsker også en god retssag om ophavsret.
Hvor meget koster Stable Audio?
Du kan Prøv stabil lyd gratis, men du er begrænset til at generere 20 ikke-kommercielle spor om måneden, som hver især er begrænset til en længde på 20 sekunder. Og deres servere er helt overbelastede i øjeblikket, så det tager et stykke tid at generere et spor.
Vi er begejstrede over, at efterspørgslen på vores Stable Audio-lancering i dag har været enorm! Men vores servere har nu fuld kapacitet, så det er muligt, at du ikke kan få adgang til produktet. Hvis du ikke kan, beder vi dig venligst om at komme tilbage om 24 timer og prøve igen.
I mellemtiden arbejder vi hårdt...
- Stabilitet AI (@StabilitetAI) 13. september 2023
Et Pro-abonnement koster $11,99 pr. måned, hvilket giver dig mulighed for at generere 500 kommercialiserbare numre på op til 90 sekunder hver måned.
Ubrugte generationskreditter overføres ikke til den følgende måned, så brug dem eller mist dem.
Hvis du har en app, et website eller en software, der har mere end 100.000 brugere, skal du kontakte Stability for at få priser på deres virksomhedsplan.
Stability siger, at de snart vil "open source en musikgenereringsmodel, der er trænet på forskellige data."
Med sit Stable Audio-produkt har Stability AI måske endelig fundet en måde at tjene penge til sine investorer på.