Porque é que o mundo da IA se está a queixar dos morangos?

28 de agosto de 2024

  • A OpenAI está alegadamente a trabalhar num projeto secreto com o nome de código "Strawberry"
  • Poderá estar relacionado com o projeto Q*, discutido pela primeira vez em novembro de 2023
  • Pouco se sabe sobre o Strawberry, embora possa ser/vir a ser uma parte do GPT-5

A OpenAI voltou a ficar bastante silenciosa, com as tão badaladas funcionalidades de conversação por voz do GPT-4o a serem implementadas muito mais lentamente do que se previa. 

Mas tem havido murmúrios sobre novos projectos em curso, incluindo PesquisarGPTque combina a IA generativa e a navegação na Web e o mais misterioso "Projeto Strawberry".

As origens do Strawberry remontam a novembro de 2023, quando um modelo (mais propriamente uma técnica de treino) chamado Q* apareceu no fugas da Reuters.

Chegou-se mesmo a especular que a Q* era potencialmente perigosa e que desempenhou algum papel na contratação e despedimento do diretor executivo Sam Altman no ano passado. 

O Q* foi concebido para combinar um modelo de raciocínio avançado com um agente de IA capaz de explorar a Internet.

Apesar dos títulos dramáticos, "A OpenAI está sentada num modelo apocalipticamente poderoso", a sua legitimidade foi muito contestada na altura. 

Em maio e junho deste ano, surgiram mais pormenores sobre o projeto Q*, que passou a chamar-se Projeto Strawberry ou apenas Strawberry. De acordo com a ReutersO Strawberry envolve um método especializado de treino de modelos de IA para explorar a Internet de forma autónoma e realizar "investigação profunda".

O Q refere-se provavelmente ao Q-learning, uma técnica de aprendizagem por reforço (RL) estabelecida há muito tempo. Quanto à estrela (*), há mais incertezas. Segundo a Reuters, é semelhante a um método desenvolvido em Stanford chamado "Self-Taught Reasoner" ou "STaR". Outros dizem que está relacionado com um algoritmo de pesquisa chamado A*.

As fontes mencionaram que a OpenAI pretende que o modelo conduza a investigação através da navegação autónoma na Web, assistida por um "agente de utilização do computador" (CUA) - que é também um componente-chave do SearchGPT.

De acordo com essas fontes, a OpenAI quer que o Strawberry execute "tarefas de longo alcance" (LHT), que envolvem planeamento e execução complexos durante longos períodos. 

Noah Goodman, professor de Stanford e um dos criadores do STaR, falou à Reuters sobre a tecnologia, "Se as coisas continuarem a ir nessa direção, teremos coisas sérias em que pensar como seres humanos".

Quando questionado sobre a Strawberry, um porta-voz da OpenAI fez uma declaração geral sobre os objectivos de desenvolvimento da IA da empresa:

"Queremos que os nossos modelos de IA vejam e compreendam o mundo mais como nós. A investigação contínua de novas capacidades de IA é uma prática comum na indústria, com a crença partilhada de que estes sistemas irão melhorar o raciocínio ao longo do tempo."

Os meios de comunicação social agitam a panela

Pouco tempo depois da reportagem da Reuters, no início de agosto, Altman publicou uma fotografia de morangos acompanhada da legenda "adoro o verão no jardim", reacendendo a especulação sobre o projeto Strawberry.

Em seguida, o utilizador iruletheworldmo, uma espécie de conta meme/sátira centrada na IA (com uma fotografia de perfil de Theodore Twombly, interpretado por Joaquin Phoenix, do filme Her, que se tornou associado a Altman), começou a publicar conteúdos relacionados com morangos, sugerindo um potencial avanço de "nível dois" na IA.

O utilizador publicou: "Bem-vindo ao nível dois. Como te sentes? Fiz-te sentir? Altman, CEO da OpenAI, respondeu com "amazing tbh".

Esta troca desencadeou uma reação em cadeia de mensagens com o tema do morango e especulações em massa no X e no Reddit. 

O morango dá mais uma volta

Ainda recentemente, A informação revelada que a OpenAI está a preparar-se para lançar uma versão do Strawberry como parte de um chatbot e possivelmente integrá-lo no ChatGPT já no próximo outono. 

A OpenAI também terá alegadamente demonstrado as capacidades da Strawberry a funcionários da segurança nacional dos EUA.

Curiosamente, de acordo com o The Information, a OpenAI está a desenvolver duas versões distintas do Strawberry:

  1. Esta versão mais pequena e simplificada destina-se a ser integrada em aplicações baseadas em conversação, como o ChatGPT. O seu objetivo é melhorar as capacidades de raciocínio em cenários em que os utilizadores exigem respostas mais ponderadas e detalhadas em vez de respostas rápidas.
  2. Esta versão maior e mais potente é utilizada para gerar dados de treino "sintéticos" de alta qualidade para o próximo modelo de linguagem emblemático da OpenAI, com o nome de código "Orion".

Os dados sintéticos gerados pelo Strawberry podem reduzir a dependência de textos e imagens extraídos da Internet para a formação.

Isto poderá conduzir a modelos de IA mais precisos e fiáveis, resolvendo questões persistentes como as "alucinações" da IA ou colapso do modelo

Estranhamente, porém, estas caracterizações de Strawberry não se alinham muito bem com as descrições anteriores de Q*.

Talvez possamos especular que o Strawberry, o agente autónomo, navega autonomamente na Web e utiliza a sua "pesquisa profunda" para, em última análise, sintetizar dados.

Talvez seja mais eficiente do ponto de vista computacional e mais útil para o treino de modelos do que simplesmente recolher os dados em bruto?

A IA não sabe quantos R's existem no morango

Agora, é aqui que a história toma um rumo bizarro e irónico. 

Strawberry pode ter o nome de uma palavra que os actuais modelos de IA, incluindo alguns dos mais avançados, têm frequentemente dificuldade em soletrar corretamente. 

Pergunte a uma IA quantos 'r's existem em "strawberry" (morango) e há uma hipótese de ela responder com confiança "two" (dois) em vez do correto "three" (três).

Parece ridículo, não é? Eu própria não acreditava nisso até o experimentar com o Claude. 

Morango

Quando isto veio a lume pela primeira vez, houve quem alegasse que se tratava de uma espécie de "easter egg" ou piada nos sistemas da OpenAI.

Mas como o Claude reage da mesma forma que o ChatGPT, a menos que as empresas de IA estejam a conspirar em piadas de nicho sobre morangos nos bastidores, isso parece improvável. 

A explicação para este facto é elegante na sua simplicidade.

Os modelos de linguagem, apesar do nome, são sistemas baseados na matemática. Não compreendem "verdadeiramente" as palavras. O texto é traduzido em código, arriscando-se assim a perder o contexto e o significado ao nível da palavra.

A razão pela qual o morango desencadeia de forma fiável esta lacuna é a questão mais misteriosa. 

Em todo o caso, não se sabe se a OpenAI escolheu o nome "Strawberry" (morango) como uma brincadeira com este obstáculo comum da IA ou por pura coincidência. Parece algo que Altman poderia fazer, quer Strawberry seja real ou não. 

O que se vai passar a seguir nesta história bizarra, mas muito interessante (...), é uma incógnita. Para ser honesto, tenho a sensação, nesta fase, de que nenhuma das "provas" especulativas que temos dos principais meios de comunicação social é totalmente representativa do que se está a passar na OpenAI.

Teremos de esperar pelo SearchGPT e/ou GPT-5 para ver até que ponto os produtos da OpenAI evoluíram com o Strawberry e os seus outros projectos.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições