Meta lança o seu gerador de texto para áudio AudioCraft

3 de agosto de 2023

Gerador de música Meta AudioCraft AI

A Meta lançou esta semana a sua IA generativa de texto para áudio chamada AudioCraft e as amostras do seu resultado são impressionantes.

O espaço da IA generativa tem registado um desenvolvimento exponencial na geração de texto, imagem e voz, mas não temos tido muitas novidades no espaço da geração de áudio por IA. AudioCraft é uma das primeiras ferramentas de texto para áudio do seu género que estão disponíveis para serem experimentadas corretamente.

No início deste ano, a Google deu-nos uma espreitadela ao seu gerador de texto para música MusicLM, mas já lá vão 8 meses e ainda só o pode experimentar se for aceite na sua Cozinha de Testes de IA.

Os modelos pré-treinados da AudioCraft estão disponíveis para transferência no GitHub e a Meta espera que a sua estratégia de código aberto impulsione a adoção e os testes para melhorar os modelos.

O AudioCraft é composto pelos modelos MusicGen, AudioGen e Encodec do Meta.

O modelo MusicGen foi treinado com música especificamente licenciada e propriedade da Meta e produz música a partir de um pedido de texto. O exemplo no blogue do Meta utilizou o seguinte pedido: "Faixa de dança pop com melodias cativantes, percussões tropicais e ritmos animados, perfeita para a praia"

A saída de música soa muito bem e corresponde exatamente ao que é pedido. A amostra foi provavelmente selecionada a dedo, mas não deixa de ser impressionante. Pode ouvir mais amostras aqui.

Embora existam algumas ferramentas de texto para música que pode experimentar online, o modelo AudioGen é bastante único. O modelo foi treinado com efeitos sonoros públicos e gera efeitos sonoros complexos com base em mensagens de texto. O exemplo no blogue do Meta era: "Sirenes e um motor a zumbir aproximam-se e passam" e soou muito bem. Aqui estão mais alguns Efeitos de amostragem AudioGen.

A possibilidade de gerar efeitos sonoros a partir de descrições de texto de forma gratuita será muito importante para os criadores de conteúdos. Imagine fazer um clip para as redes sociais ou um vídeo do Youtube e obter exatamente o efeito sonoro certo sem ter de pagar para o descarregar de um sítio Web de efeitos sonoros.

O modelo Encodec é provavelmente a parte mais interessante do AudioCraft. É um codec de áudio alimentado por IA. Um codec é uma peça de software que pega nos dados e os comprime, perdendo o mínimo de dados possível. Se já reproduziu um ficheiro de música MP3, então utilizou um codec.

O Encodec retira a maior quantidade possível de dados do ficheiro de áudio gerado e, em seguida, utiliza a IA para preencher as lacunas quando o áudio tiver de ser reproduzido novamente. O resultado é que os ficheiros de áudio comprimido podem ser 10 vezes mais pequenos do que se fossem armazenados como MP3.

O Meta ainda não tem um codec semelhante para vídeo, mas consegue imaginar as implicações de comprimir vídeo e áudio por um fator de 10 sem perder qualquer fidelidade? Poderá libertar 90% de espaço no seu disco rígido ou transmitir música e vídeo 10 vezes mais depressa com a mesma largura de banda.

Será interessante ver como os programadores utilizam a ferramenta de texto para áudio da Meta. Parece que a Meta treinou os seus modelos de forma responsável, mas outros utilizadores dos modelos podem não partilhar as suas preocupações éticas e legais. Espera-se um debate aceso sobre se a música protegida por direitos de autor é um jogo justo para treinar a IA.

E enquanto actores e argumentistas continuam em greveA partir de agora, os músicos e os artistas de efeitos sonoros poderão também juntar-se aos piquetes de greve com ferramentas musicais gratuitas como o AudioCraft.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Eugene van der Watt

Eugene vem de uma formação em engenharia eletrónica e adora tudo o que é tecnologia. Quando faz uma pausa no consumo de notícias sobre IA, pode encontrá-lo à mesa de snooker.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições