A OpenAI lança a série "o1", alargando os limites do raciocínio da IA

12 de setembro de 2024

  • A OpenAI lança dois novos modelos avançados: o1-preview e o1-mini
  • São capazes de um raciocínio avançado em várias etapas, ideal para perguntas complexas
  • o1-preview já provou ser superior ao GPT-4o para determinadas tarefas
o1

A OpenAI lançou novos modelos de raciocínio avançado, designados por série "o1". 

O o1 está atualmente disponível em duas versões - o1-preview e o1-mini - e foi concebido para realizar tarefas de raciocínio complexas, marcando o que a OpenAI descreve como "um novo paradigma" no desenvolvimento da IA.

"Isto é o que consideramos o novo paradigma nestes modelos", explicou Mira Murati, Diretora de Tecnologia da OpenAI, num declaração para Com fio. "É muito melhor a lidar com tarefas de raciocínio muito complexas".

Ao contrário das iterações anteriores, que se destacaram principalmente pela escala, por exemplo, ao lançar a computação num problema, o o1 tem como objetivo replicar o processo de pensamento humano de "raciocinar através" dos problemas. 

Em vez de gerar uma única resposta, o modelo funciona passo a passo, considerando várias abordagens e revendo-se quando necessário, um método conhecido como "cadeia de pensamento". 

Isto permite-lhe resolver problemas complexos em matemática, codificação e outros domínios com um nível de precisão que os modelos existentes, incluindo o GPT-4o, têm dificuldade em atingir.

Mark Chen, Vice-Presidente de Investigação da OpenAI, explicou o processo de aprendizagem do o1 e como este difere do raciocínio típico dos modelos de linguagem. "O modelo aperfeiçoa o seu pensamento e afina as estratégias que utiliza para chegar à resposta", disse Chen. 

Demonstrou o modelo com vários puzzles matemáticos e questões de química avançada que anteriormente não conseguiam resolver o GPT-4o. 

Um puzzle que confundia os modelos anteriores perguntava: "Uma princesa tem a idade que o príncipe terá quando a princesa tiver o dobro da idade que o príncipe tinha quando a idade da princesa era metade da soma das suas idades actuais. Qual é a idade do príncipe e da princesa?" 

O modelo o1 determinou a resposta correta: o príncipe tem 30 anos e a princesa tem 40 anos.

Como aceder a o1

Os utilizadores do ChatGPT Plus já podem aceder ao o1 a partir do ChatGPT.

É uma surpresa, uma vez que a funcionalidade de voz do GPT-4o ainda está a ser implementada meses após a sua demonstração. Poucos esperavam que a o1 fosse lançada tão abruptamente, ultrapassando o habitual período de preparação.

o1

o1 parece estar relacionado com o projeto de nome de código "Strawberry" da OpenAI. Agora, aqui está uma coisa engraçada: a maioria dos modelos de IA não sabe quantos Rs existem em "morango". Isso atrapalha as suas capacidades de raciocínio.

Testei isto na o1. E eis que acertou em cheio. Claramente, a abordagem do o1 ao raciocínio ajuda a resolver estas questões de forma eficiente.

A recente onda de conversas de Sam Altman nas redes sociais sobre morangos pode estar ligada a este famoso problema de IA com sabor a morango e ao nome de código da o1 "Project Strawberry". Se não, é uma estranha coincidência.

Uma mudança radical na resolução de problemas

A capacidade do modelo o1 para "raciocinar" na resolução de problemas representa um progresso na IA - algo que poderá revelar-se bastante inovador se o seu desempenho no mundo real for comprovado "in the wild".

Os novos modelos já demonstraram um bom desempenho em testes como o American Invitational Mathematics Examination (AIME). 

De acordo com a OpenAI, o novo modelo resolveu 83% dos problemas apresentados no AIME, em comparação com apenas 12% do GPT-4o.

Embora os pontos fortes da o1 sejam evidentes, ela tem algumas desvantagens.

O modelo demora mais tempo a gerar respostas devido às suas metodologias mais ponderadas. O tempo dirá qual o impacto deste facto na usabilidade geral. 

as estranhas origens da o1

o1 surge na sequência de conversas em torno de um projeto OpenAI com o nome de código "Strawberry". que surgiu no final de 2023.

Inicialmente, havia rumores de que se tratava de um modelo de IA capaz de explorar a Web de forma autónoma, concebido para realizar "investigação profunda".

A conversa em torno do Strawberry intensificou-se há pouco tempo, quando o The Information divulgou algumas informações sobre os projectos internos da OpenAI. Nomeadamente, a OpenAI está alegadamente a desenvolver duas formas de Strawberry.

  1. Uma é uma versão mais pequena e simplificada destinada a ser integrada no ChatGPT. O seu objetivo é melhorar as capacidades de raciocínio em cenários em que os utilizadores necessitam de respostas mais ponderadas e detalhadas em vez de respostas rápidas. Isto parece-me que poderia ser o1.
  2. Outra é uma versão maior e mais poderosa que é utilizada para gerar dados de treino "sintéticos" de alta qualidade para o próximo modelo de linguagem emblemático da OpenAI, com o nome de código "Orion". Este pode ou não estar ligado ao o1.

A OpenAI não forneceu esclarecimentos diretos sobre o que é realmente o Strawberry. No entanto, tem sido amplamente assumido que o1 é o Strawberry.

Um complemento, não um substituto

Murati sublinhou que a o1 não foi concebida para substituir a GPT-4o, mas sim para a complementar. 

"Há dois paradigmas", disse ela. "O paradigma da escala e este novo paradigma. Esperamos que os juntemos". 

Enquanto a OpenAI continua a desenvolver a GPT-5, que provavelmente será ainda maior e mais poderosa do que a GPT-4o, os modelos futuros poderão incorporar as funções de raciocínio da o1. 

Esta fusão poderia resolver as limitações persistentes dos modelos de linguagem de grande dimensão (LLM), como a sua dificuldade em resolver problemas aparentemente simples que exigem dedução lógica, por exemplo, o problema do morango acima referido. 

A Anthropic e a Google estão alegadamente a tentar integrar caraterísticas semelhantes nos seus modelos. O projeto AlphaProof da Google, por exemplo, também combina modelos de linguagem com aprendizagem por reforço para resolver problemas matemáticos difíceis. 

No entanto, Chen acredita que a OpenAI está em vantagem. "Penso que fizemos alguns progressos neste domínio", disse, "penso que faz parte da nossa vantagem. Na verdade, é bastante bom em termos de raciocínio em todos os domínios".

Yoshua Bengio, um dos principais investigadores em matéria de IA e galardoado com o prestigiado Prémio Turing, elogiou os progressos realizados, mas apelou à prudência.

 "Se os sistemas de IA demonstrassem um raciocínio genuíno, isso permitiria a coerência dos factos, dos argumentos e das conclusões da IA" disse ao FT.

Segurança e considerações éticas

Como parte do seu compromisso para com uma IA responsável, a OpenAI reforçou as funcionalidades de segurança da o1, incluindo ferramentas de segurança de conteúdos "activadas por defeito". 

Estas ferramentas ajudam a evitar que o modelo produza resultados nocivos ou inseguros.

"Temos o prazer de anunciar que os Prompt Shields e os Materiais Protegidos para Texto estão agora disponíveis no Azure OpenAI Service", afirmou a OpenAI num comunicado de imprensa. Publicação no blogue da Microsoft

A série o1 está disponível para acesso antecipado no Azure AI Studio e nos Modelos GitHub da Microsoft, com um lançamento mais alargado planeado para breve. 

A OpenAI espera que a o1 permita aos programadores e às empresas inovar de forma mais rentável, alinhando-se com a sua missão mais vasta de tornar a IA mais acessível aos utilizadores empresariais. 

"Acreditamos que isso nos permitirá enviar inteligência mais barata", concluiu Chen. "E penso que essa é realmente a principal missão da nossa empresa."

Em suma, um lançamento emocionante. Será muito interessante ver quais as questões, problemas e tarefas em que o o1 se vai concentrar.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições