Stable Audio producerer hi-fidelity AI-genereret musik

14. september 2023

Stability AI annoncerede udgivelsen af sin AI-lydgenerator og hævder, at den leverer førsteklasses ydeevne.

I løbet af de sidste par måneder har vi set en række AI-lydgeneratorer med varierende ydeevne, men Stable Audio ser ud til at have hævet barren.

Med Stable Audio kan du indtaste en tekstprompt, og den vil generere musik eller lyd baseret på prompten. Vi har set den slags funktionalitet fra Google med MusicLM og Metas AudioCraft-produkter.

MusicLM er stadig kun tilgængelig i Googles testkøkken og genererer musik ved 24 kHz. Meta's AudioCraft er virkelig imponerende, men den genererer kun musik ved 32 kHz.

Stable Audio er den første implementerede tekst-til-lyd-generator, der udsender lyd ved 44,1 kHz, som er samplingsfrekvensen for musik i "cd-kvalitet".

Den anden imponerende egenskab ved Stable Audio er længden af de numre, den producerer. De fleste AI-lydgeneratorer producerer kortere musikstykker, der hurtigt gentages eller mister deres retning. Stable Audio producerer mere nuanceret musik på omkring 90 sekunder uden at miste sammenhængen.

Du kan tjekke nogle eksempler på den genererede lyd her.

Her er et eksempel på et spor, jeg var i stand til at generere ved hjælp af værktøjet med følgende prompt:

"Post-Rock, Guitarer, Trommesæt, Bas, Strygere, Euforisk, Opløftende, Stemningsfuld, Flydende, Rå, Episk, Sentimental, 125 BPM"

Det lyder faktisk ret godt.

Modellen er baseret på Stabilitys latente diffusionsteknik, som de bruger til deres andre generative AI-produkter. Den bruger nogle smarte codecs under slutning som efter sigende gør det muligt at generere 95 sekunders 44,1 kHz musik på 1 sekund ved hjælp af en Nvidia A100 GPU.

Spørgsmål om uddannelse og ophavsret

Stability AI producerede Stable Audio i samarbejde med Harmonai, et forskningslaboratorium for dyb læring med fokus på at skabe open source generative lydmodeller. Stability AI's lydteam skabte en ny model baseret på deres tidligere Dance Diffusion-model, som HarmonAI trænede.

Datasættet, der blev brugt til at træne Stable Audio, kom fra AudioSparx, som leverede omkring 800.000 sange fra de uafhængige musikkunstnere, de repræsenterer.

Kunstnerne fik mulighed for at vælge at få deres arbejde udelukket fra datasættet, hvilket omkring 10% angiveligt gjorde.

Kunstnere, der har valgt at lade deres arbejde indgå i datasættet, får del i den overskudsdeling, som Stability AI og AudioSparx har indgået.

Der er ikke nogen store kunstnere i datasættet, men Stable Audio forhindrer dig ikke i at tilføje et kunstner- eller bandnavn i din prompt.

Selv om AudioSparx-biblioteket ikke indeholder værker af et band som AC/DC, indeholder det masser af musikken beskrives som værende i stil med AC/DC.

Du kan stadig ikke ophavsretligt beskytte den musik, du genererer med et AI-værktøj. Og i brugsbetingelserne står der, at du "er ansvarlig for at sikre lovligheden af alt indhold", der er lavet ved hjælp af Stable Audio.

Vilkårene siger endvidere, at "du repræsenterer og garanterer, at du ejer alle nødvendige rettigheder, titler og interesser i og til sådanne meddelelser, herunder, uden begrænsning, alle nødvendige ophavsrettigheder og publicitetsrettigheder indeholdt deri."

Så måske skal du ikke tilføje 'Metallica' til din opfordring. De laver fantastisk musik, men de elsker også en god retssag om ophavsret.

Hvor meget koster Stable Audio?

Du kan Prøv stabil lyd gratis, men du er begrænset til at generere 20 ikke-kommercielle spor om måneden, som hver især er begrænset til en længde på 20 sekunder. Og deres servere er helt overbelastede i øjeblikket, så det tager et stykke tid at generere et spor.

Et Pro-abonnement koster $11,99 pr. måned, hvilket giver dig mulighed for at generere 500 kommercialiserbare numre på op til 90 sekunder hver måned.

Ubrugte generationskreditter overføres ikke til den følgende måned, så brug dem eller mist dem.

Hvis du har en app, et website eller en software, der har mere end 100.000 brugere, skal du kontakte Stability for at få priser på deres virksomhedsplan.

Stability siger, at de snart vil "open source en musikgenereringsmodel, der er trænet på forskellige data."

Med sit Stable Audio-produkt har Stability AI måske endelig fundet en måde at tjene penge til sine investorer på.

Deltag i fremtiden


TILMELD DIG I DAG

Klar, kortfattet, omfattende. Få styr på AI-udviklingen med DailyAI

Eugene van der Watt

Eugene har en baggrund som elektronikingeniør og elsker alt, hvad der har med teknologi at gøre. Når han tager en pause fra at læse AI-nyheder, kan du finde ham ved snookerbordet.

×

GRATIS PDF EKSKLUSIVT
Vær på forkant med DailyAI

Tilmeld dig vores ugentlige nyhedsbrev og få eksklusiv adgang til DailyAI's seneste e-bog: 'Mastering AI Tools: Din 2024-guide til forbedret produktivitet'.

*Ved at tilmelde dig vores nyhedsbrev accepterer du vores Politik for beskyttelse af personlige oplysninger og vores Vilkår og betingelser