Stability AI har lansert sin AI-lydgenerator og hevder at den leverer førsteklasses ytelse.
I løpet av de siste månedene har vi sett en rekke AI-lydgeneratorer med varierende ytelse, men Stable Audio ser ut til å ha hevet standarden.
Med Stable Audio kan du skrive inn en tekstmelding, og den vil generere musikk eller lyd basert på ledeteksten. Vi har sett den typen funksjonalitet fra Google med MusicLM og Metas AudioCraft-produkter.
MusicLM er fortsatt bare tilgjengelig i Googles Test Kitchen og genererer musikk ved 24 kHz. Meta's AudioCraft er virkelig imponerende, men den genererer bare musikk ved 32 kHz.
Stable Audio er den første tekst-til-lyd-generatoren som gir lyd ved 44,1 kHz, som er samplingsfrekvensen for musikk i "CD-kvalitet".
Den andre imponerende egenskapen ved Stable Audio er lengden på sporene den produserer. De fleste AI-lydgeneratorer produserer kortere musikkstykker som raskt gjentar seg eller mister tråden. Stable Audio produserer mer nyansert musikk på rundt 90 sekunder uten å miste sammenhengen.
I dag er vi glade for å kunne lansere Stable Audio, vårt første AI-produkt for musikk- og lydgenerering!
Prøv det gratis her! #stabilityAI #stableaudio #ny kunngjøring
https://t.co/pRK3Qs9Fak pic.twitter.com/cZfbK1mZYA- Stabilitet AI (@StabilityAI) 13. september 2023
Du kan sjekke ut noen eksempler på den genererte lyden her.
Her er et eksempel på et spor jeg klarte å generere ved hjelp av verktøyet med følgende ledetekst:
"Post-Rock, Gitarer, Trommesett, Bass, Strykere, Euforisk, Oppløftende, Stemningsfull, Flytende, Rå, Episk, Sentimental, 125 BPM"
Det høres faktisk ganske bra ut.
Modellen baserer seg på Stabilitys latente diffusjonsteknikk, som også brukes i andre generative AI-produkter. Den bruker noen smarte kodeker under slutning som ifølge selskapet gjør det mulig å generere 95 sekunder med 44,1 kHz musikk på 1 sekund ved hjelp av en Nvidia A100 GPU.
Opplæring og spørsmål om opphavsrett
Stability AI produserte Stable Audio i samarbeid med Harmonai, et forskningslaboratorium for dyp læring som fokuserer på å skape generative lydmodeller med åpen kildekode. Stability AIs lydteam skapte en ny modell basert på deres tidligere Dance Diffusion-modell, som HarmonAI har trent opp.
Datasettet som ble brukt til å trene Stable Audio, kom fra AudioSparx, som leverte rundt 800 000 sanger fra de uavhengige musikkartistene de representerer.
Kunstnerne fikk muligheten til å velge om de ville at verkene deres skulle utelukkes fra datasettet, noe rundt 10% angivelig gjorde.
Artister som har valgt å få arbeidet sitt inkludert i datasettet, vil få ta del i ordningen med overskuddsdeling som Stability AI og AudioSparx har inngått.
Det finnes ingen store artister i datasettet, men Stable Audio hindrer deg ikke i å legge til et artist- eller bandnavn i ledeteksten din.
Selv om AudioSparx-biblioteket ikke inneholder verker av et band som AC/DC, for eksempel, inneholder det massevis av musikken beskrives som i stil med AC/DC.
Du kan fortsatt ikke opphavsrettslig beskytte musikken du genererer med et AI-verktøy. Og i bruksvilkårene står det at du "er ansvarlig for å sikre lovligheten av alt innhold" som er laget ved hjelp av Stable Audio.
Vilkårene sier videre at "du erklærer og garanterer at du eier alle nødvendige rettigheter, titler og interesser i og til slike meldinger, inkludert, uten begrensning, alle nødvendige opphavsrettigheter og publisitetsrettigheter som finnes der."
Så kanskje du ikke bør legge til "Metallica" i ledeteksten din. De lager fantastisk musikk, men de elsker også å bli saksøkt for opphavsrett.
Hvor mye koster Stable Audio?
Du kan prøv Stable Audio gratis, men du vil være begrenset til å generere 20 ikke-kommersialiserbare spor per måned, hver begrenset til en lengde på 20 sekunder. Og serverne deres er helt overbelastet for øyeblikket, så det tar en stund å generere et spor.
Vi er glade for at etterspørselen etter Stable Audio-lanseringen vår i dag har vært skyhøy! Men serverne våre har nå full kapasitet, så det kan hende at du ikke får tilgang til produktet. Hvis du ikke får tilgang, ber vi deg om å komme tilbake om 24 timer for å prøve igjen.
I mellomtiden jobber vi hardt...
- Stabilitet AI (@StabilityAI) 13. september 2023
Et Pro-abonnement vil koste deg $11.99 per måned, noe som lar deg generere 500 kommersialiserbare spor på opptil 90 sekunder hver måned.
Ubrukte generasjonskreditter overføres ikke til neste måned, så bruk dem eller mist dem.
Hvis du har en app, et nettsted eller en programvare som har mer enn 100 000 brukere, må du kontakte Stability for å få priser på bedriftsabonnementet deres.
Stability sier at de snart vil "åpne en musikkgenereringsmodell som er trent på andre data".
Med produktet Stable Audio har Stability AI kanskje endelig funnet en måte å tjene penger på for investorene sine.