A OpenAI voltou a ficar bastante silenciosa, com as tão badaladas funcionalidades de conversação por voz do GPT-4o a serem implementadas muito mais lentamente do que se previa.
Mas tem havido murmúrios sobre novos projectos em curso, incluindo PesquisarGPTque combina a IA generativa e a navegação na Web e o mais misterioso "Projeto Strawberry".
As origens do Strawberry remontam a novembro de 2023, quando um modelo (mais propriamente uma técnica de treino) chamado Q* apareceu no fugas da Reuters.
Chegou-se mesmo a especular que a Q* era potencialmente perigosa e que desempenhou algum papel na contratação e despedimento do diretor executivo Sam Altman no ano passado.
O Q* foi concebido para combinar um modelo de raciocínio avançado com um agente de IA capaz de explorar a Internet.
Apesar dos títulos dramáticos, "A OpenAI está sentada num modelo apocalipticamente poderoso", a sua legitimidade foi muito contestada na altura.
Em maio e junho deste ano, surgiram mais pormenores sobre o projeto Q*, que passou a chamar-se Projeto Strawberry ou apenas Strawberry. De acordo com a ReutersO Strawberry envolve um método especializado de treino de modelos de IA para explorar a Internet de forma autónoma e realizar "investigação profunda".
O Q refere-se provavelmente ao Q-learning, uma técnica de aprendizagem por reforço (RL) estabelecida há muito tempo. Quanto à estrela (*), há mais incertezas. Segundo a Reuters, é semelhante a um método desenvolvido em Stanford chamado "Self-Taught Reasoner" ou "STaR". Outros dizem que está relacionado com um algoritmo de pesquisa chamado A*.
As fontes mencionaram que a OpenAI pretende que o modelo conduza a investigação através da navegação autónoma na Web, assistida por um "agente de utilização do computador" (CUA) - que é também um componente-chave do SearchGPT.
De acordo com essas fontes, a OpenAI quer que o Strawberry execute "tarefas de longo alcance" (LHT), que envolvem planeamento e execução complexos durante longos períodos.
Noah Goodman, professor de Stanford e um dos criadores do STaR, falou à Reuters sobre a tecnologia, "Se as coisas continuarem a ir nessa direção, teremos coisas sérias em que pensar como seres humanos".
Quando questionado sobre a Strawberry, um porta-voz da OpenAI fez uma declaração geral sobre os objectivos de desenvolvimento da IA da empresa:
"Queremos que os nossos modelos de IA vejam e compreendam o mundo mais como nós. A investigação contínua de novas capacidades de IA é uma prática comum na indústria, com a crença partilhada de que estes sistemas irão melhorar o raciocínio ao longo do tempo."
Os meios de comunicação social agitam a panela
Pouco tempo depois da reportagem da Reuters, no início de agosto, Altman publicou uma fotografia de morangos acompanhada da legenda "adoro o verão no jardim", reacendendo a especulação sobre o projeto Strawberry.
adoro o verão no jardim pic.twitter.com/Ter5Z5nFMc
- Sam Altman (@sama) 7 de agosto de 2024
Em seguida, o utilizador iruletheworldmo, uma espécie de conta meme/sátira centrada na IA (com uma fotografia de perfil de Theodore Twombly, interpretado por Joaquin Phoenix, do filme Her, que se tornou associado a Altman), começou a publicar conteúdos relacionados com morangos, sugerindo um potencial avanço de "nível dois" na IA.
O utilizador publicou: "Bem-vindo ao nível dois. Como te sentes? Fiz-te sentir? Altman, CEO da OpenAI, respondeu com "amazing tbh".
Esta troca desencadeou uma reação em cadeia de mensagens com o tema do morango e especulações em massa no X e no Reddit.
Bem-vindo ao nível dois.
como é que se sente?
fiz-te sentir?
- 🍓🍓🍓🍓 (@iruletheworldmo) 7 de agosto de 2024
O morango dá mais uma volta
Ainda recentemente, A informação revelada que a OpenAI está a preparar-se para lançar uma versão do Strawberry como parte de um chatbot e possivelmente integrá-lo no ChatGPT já no próximo outono.
A OpenAI também terá alegadamente demonstrado as capacidades da Strawberry a funcionários da segurança nacional dos EUA.
Curiosamente, de acordo com o The Information, a OpenAI está a desenvolver duas versões distintas do Strawberry:
- Esta versão mais pequena e simplificada destina-se a ser integrada em aplicações baseadas em conversação, como o ChatGPT. O seu objetivo é melhorar as capacidades de raciocínio em cenários em que os utilizadores exigem respostas mais ponderadas e detalhadas em vez de respostas rápidas.
- Esta versão maior e mais potente é utilizada para gerar dados de treino "sintéticos" de alta qualidade para o próximo modelo de linguagem emblemático da OpenAI, com o nome de código "Orion".
Os dados sintéticos gerados pelo Strawberry podem reduzir a dependência de textos e imagens extraídos da Internet para a formação.
Isto poderá conduzir a modelos de IA mais precisos e fiáveis, resolvendo questões persistentes como as "alucinações" da IA ou colapso do modelo.
Estranhamente, porém, estas caracterizações de Strawberry não se alinham muito bem com as descrições anteriores de Q*.
Talvez possamos especular que o Strawberry, o agente autónomo, navega autonomamente na Web e utiliza a sua "pesquisa profunda" para, em última análise, sintetizar dados.
Talvez seja mais eficiente do ponto de vista computacional e mais útil para o treino de modelos do que simplesmente recolher os dados em bruto?
A IA não sabe quantos R's existem no morango
Agora, é aqui que a história toma um rumo bizarro e irónico.
Strawberry pode ter o nome de uma palavra que os actuais modelos de IA, incluindo alguns dos mais avançados, têm frequentemente dificuldade em soletrar corretamente.
Pergunte a uma IA quantos 'r's existem em "strawberry" (morango) e há uma hipótese de ela responder com confiança "two" (dois) em vez do correto "three" (três).
- Rob DenBleyker (@RobDenBleyker) 26 de agosto de 2024
Parece ridículo, não é? Eu própria não acreditava nisso até o experimentar com o Claude.
Quando isto veio a lume pela primeira vez, houve quem alegasse que se tratava de uma espécie de "easter egg" ou piada nos sistemas da OpenAI.
Mas como o Claude reage da mesma forma que o ChatGPT, a menos que as empresas de IA estejam a conspirar em piadas de nicho sobre morangos nos bastidores, isso parece improvável.
A explicação para este facto é elegante na sua simplicidade.
Os modelos de linguagem, apesar do nome, são sistemas baseados na matemática. Não compreendem "verdadeiramente" as palavras. O texto é traduzido em código, arriscando-se assim a perder o contexto e o significado ao nível da palavra.
A razão pela qual o morango desencadeia de forma fiável esta lacuna é a questão mais misteriosa.
Em todo o caso, não se sabe se a OpenAI escolheu o nome "Strawberry" (morango) como uma brincadeira com este obstáculo comum da IA ou por pura coincidência. Parece algo que Altman poderia fazer, quer Strawberry seja real ou não.
O que se vai passar a seguir nesta história bizarra, mas muito interessante (...), é uma incógnita. Para ser honesto, tenho a sensação, nesta fase, de que nenhuma das "provas" especulativas que temos dos principais meios de comunicação social é totalmente representativa do que se está a passar na OpenAI.
Teremos de esperar pelo SearchGPT e/ou GPT-5 para ver até que ponto os produtos da OpenAI evoluíram com o Strawberry e os seus outros projectos.