Stability AI kondigde de release van zijn AI audio generator aan en beweert dat het eersteklas prestaties levert.
De afgelopen maanden hebben we een aantal AI-audiogeneratoren gezien met wisselende prestaties, maar Stable Audio lijkt de lat hoger te hebben gelegd.
Met Stable Audio kun je een tekstprompt invoeren en er wordt muziek of audio gegenereerd op basis van de prompt. Dat soort functionaliteit hebben we al gezien bij Google met MusicLM en Meta's AudioCraft producten.
MusicLM is nog steeds alleen beschikbaar in Google's Test Kitchen en genereert muziek op 24 kHz. Meta's AudioCraft is echt indrukwekkend, maar het genereert alleen muziek op 32 kHz.
Stable Audio is de eerste tekst-naar-audiogenerator die audio uitvoert op 44,1 kHz, de bemonsteringsfrequentie van muziek van "cd-kwaliteit".
De andere indrukwekkende eigenschap van Stable Audio is de lengte van de tracks die het produceert. De meeste AI-audiomakers produceren kortere stukken muziek die snel herhalen of de weg kwijtraken. Stable Audio produceert meer genuanceerde muziek van ongeveer 90 seconden zonder de samenhang te verliezen.
Vandaag lanceren we Stable Audio, ons eerste AI-product voor het genereren van muziek en geluid!
Probeer het hier gratis uit! #stabiliteitAI #stabielaudio #nieuwbericht
https://t.co/pRK3Qs9Fak pic.twitter.com/cZfbK1mZYA- Stability AI (@StabilityAI) 13 september 2023
Je kunt een aantal voorbeelden van de gegenereerde audio hier.
Hier is een voorbeeld van een track die ik kon genereren met behulp van de tool met de volgende prompt:
"Post-Rock, Gitaren, Drumstel, Bas, Snaren, Euforisch, Opzwepend, Humeurig, Vloeiend, Rauw, Episch, Sentimenteel, 125 BPM"
Dat klinkt eigenlijk best goed.
Het model maakt gebruik van de latente diffusietechniek die Stability gebruikt voor zijn andere generatieve AI-producten. Het gebruikt een aantal slimme codecs tijdens inferentie waarmee naar eigen zeggen 95 seconden 44,1 kHz muziek in 1 seconde kan worden gegenereerd met behulp van een Nvidia A100 GPU.
Vragen over training en auteursrecht
Stable AI produceerde Stable Audio in samenwerking met Harmonai, een deep learning onderzoekslab dat zich richt op het maken van open-source generatieve audiomodellen. Het audioteam van Stability AI creëerde een nieuw model op basis van hun eerdere Dance Diffusion-model, dat HarmonAI trainde.
De dataset die werd gebruikt om Stable Audio te trainen was afkomstig van AudioSparx, dat ongeveer 800.000 nummers leverde van de onafhankelijke muziekartiesten die het vertegenwoordigt.
De kunstenaars konden ervoor kiezen om hun werk uit te sluiten van de dataset, wat ongeveer 10% naar verluidt deden.
Artiesten die ervoor hebben gekozen om hun werk op te nemen in de dataset zullen delen in de winstdeling die Stability AI en AudioSparx zijn aangegaan.
Er zitten geen artiesten van grote labels in de dataset, maar Stable Audio weerhoudt je er niet van om een artiest of bandnaam toe te voegen aan je prompt.
Hoewel de AudioSparx bibliotheek geen werk bevat van bijvoorbeeld een band als AC/DC, bevat het wel veel muziek beschreven als zijnde in de stijl van AC/DC.
Je kunt nog steeds geen copyright nemen op de muziek die je genereert met een AI-tool. En in de gebruiksvoorwaarden staat dat je "verantwoordelijk bent voor het waarborgen van de rechtmatigheid van alle inhoud" die je maakt met Stable Audio.
In de voorwaarden staat verder dat "u verklaart en garandeert dat u de eigenaar bent van alle noodzakelijke rechten, aanspraken en belangen in en op dergelijke prompts, inclusief, zonder beperking, alle noodzakelijke auteursrechten en publicatierechten die hierin zijn opgenomen."
Dus voeg misschien geen 'Metallica' toe aan je prompt. Die jongens maken geweldige muziek, maar ze houden ook van een goede rechtszaak over auteursrechten.
Hoeveel kost Stable Audio?
U kunt Probeer Stable Audio gratis uit, maar je bent beperkt tot het genereren van 20 niet-commerciële tracks per maand, elk beperkt tot een lengte van 20 seconden. En hun servers zijn momenteel helemaal overbelast, dus het duurt even om een track te genereren.
Blij dat de vraag naar onze lancering van Stable Audio vandaag uit de pan is gerezen! Maar onze servers zitten nu op volle capaciteit, dus het kan zijn dat je geen toegang hebt tot het product. Als dat niet lukt, vragen we je vriendelijk om over 24 uur terug te komen om het opnieuw te proberen.
Ondertussen werken we hard...
- Stability AI (@StabilityAI) 13 september 2023
Voor een Pro-abonnement betaal je $11,99 per maand, waarmee je elke maand 500 commercialiseerbare tracks van maximaal 90 seconden kunt genereren.
Ongebruikte opwekkingskredieten worden niet overgedragen naar de volgende maand, dus gebruik ze of raak ze kwijt.
Als je een app, website of software hebt met meer dan 100.000 gebruikers, moet je contact opnemen met Stability voor de prijs van hun enterprise plan.
Stability zegt dat het "binnenkort een muziekgeneratiemodel zal open-sourcen, getraind op andere gegevens".
Met zijn product Stable Audio heeft Stability AI misschien eindelijk een manier gevonden om geld te verdienen voor zijn investeerders.