A OpenAI e a MidJourney estão a tentar comprar dados do WordPress e do Tumblr

28 de fevereiro de 2024

AI tumblr wordpress

A Automattic, a empresa por detrás do WordPress e do Tumblr, está a discutir um acordo de dados e conteúdos com a MidJourney e a OpenAI.

Esta informação, inicialmente coberta por 404 Media e com base em relatórios de uma fonte anónima da Automattic, indica que um acordo com a OpenAI e a MidJourney pode estar iminente.  

Isto vem na sequência de rumores que circulam no Tumblr sobre um potencial acordo com a MidJourney que poderia introduzir um novo fluxo de receitas para a plataforma.

404 diz que o processo de negócio tem sido confuso até agora, incluindo uma transferência de dados parcialmente falhada para a OpenAI e a MidJourney que continha, nas palavras de um dos gestores de produto do Tumblr:

"Mensagens privadas em blogues públicos, mensagens em blogues eliminados ou suspensos, perguntas não respondidas (normalmente não são públicas até serem respondidas), respostas privadas (estas só aparecem para o destinatário e não são públicas), mensagens marcadas como 'explícitas' / NSFW / 'maduras' pelos nossos padrões mais modernos (isto pode não ser um grande problema, não sei)."

As implicações deste facto ainda não são claras e estão para breve mais pormenores sobre o acordo.

A corrida ao ouro dos dados de treino de IA sobe de nível

E, sem mais nem menos, a corrida ao ouro dos dados de treino de IA aumentou de velocidade. 

Sim, as empresas de IA generativa sempre precisaram de grandes quantidades de dados - mas agora estão a apressar-se a pagar por eles em vez de os recolherem gratuitamente. 

Há apenas alguns dias, O Reddit terá discutido licenciar a sua vasta gama de conteúdos gerados pelos utilizadores a uma empresa de IA ainda não revelada, um negócio que poderá valer cerca de $60 milhões por ano. Isto surge no momento em que o Reddit se prepara para uma oferta pública em março, com o objetivo de obter uma avaliação próxima de $5 mil milhões.

Este potencial acordo de licenciamento alinha-se com uma tendência crescente entre as empresas de tecnologia para garantir acordos legítimos de utilização de dados, especialmente face aos crescentes riscos de direitos de autor.

As batalhas legais em curso, como a Processo judicial do New York Times, aumentaram a urgência de conteúdos negócios. 

A iniciativa da Automattic de negociar com empresas de IA levanta questões sobre a utilização de conteúdos gerados pelos utilizadores para o treino de IA.

Alegadamente, a empresa anunciou planos para introduzir uma nova funcionalidade que permite aos utilizadores optarem por não partilhar os seus dados com terceiros, incluindo empresas de IA. 

Automatismo fez um declaração pública publicado após o relatório 404, afirmando: "Atualmente, bloqueamos, por defeito, os principais rastreadores de plataformas de IA - incluindo os das maiores empresas de tecnologia - e actualizamos as nossas listas à medida que são lançados novos rastreadores" e "partilharemos apenas conteúdos públicos alojados no WordPress.com e no Tumblr de sites que não tenham optado por não participar". 

E continua: "Também estamos a trabalhar diretamente com empresas de IA seleccionadas, desde que os seus planos estejam de acordo com o que interessa à nossa comunidade: atribuição, opt-outs e controlo."

No entanto, optar por não permitir que as suas informações sejam utilizadas para o treino de IA pode penalizar as contas dos utilizadores.

Uma nova FAQ, ainda não publicada, intitulada "O que acontece quando se opta por não participar?" afirma: "Se optar por não participar desde o início, bloquearemos o acesso dos crawlers ao seu conteúdo, adicionando o seu sítio a uma lista de não permitidos. Se mudar de ideias mais tarde, também tencionamos atualizar todos os parceiros sobre as pessoas que optaram por não participar e pedir que o seu conteúdo seja removido de fontes anteriores e de formação futura."

Atualmente, vivemos num mundo em que tudo o que se publica na Internet pode ser vendido para fins de treino de IA - se não for recolhido gratuitamente.

E à medida que a IA evolui, o debate sobre a utilização de dados e a privacidade irá provavelmente intensificar-se.

As empresas que possuem minas de ouro de dados podem ganhar muito, mas a que custo para o utilizador médio da Internet?

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições