Um misterioso chatbot chamado 'gpt2-chatbot' provocou imenso entusiasmo e especulação na comunidade da IA.
Este chatbot, que pode encontrar e experimentar no site LMSys Chatbot Arenaé considerado por alguns utilizadores como sendo mais avançado do que os modelos actuais de última geração, como o GPT-4 e o Claude 3 Opus.
Surgindo aparentemente do nada, as suas origens são totalmente desconhecidas. Poderá ser um projeto experimental de um importante laboratório de IA ou uma estranha fuga de informação?
Há um novo modelo misterioso chamado gpt2-chatbot acessível a partir de um grande site de benchmarking de LLM. Ninguém sabe quem o criou ou o que é, mas tenho estado a brincar um pouco com ele e parece estar no mesmo nível de capacidade do GPT-4. Um modelo misterioso da classe GPT-4? Fixe! pic.twitter.com/1s2iEreaiT
- Ethan Mollick (@emollick) 29 de abril de 2024
Os utilizadores do Reddit pensam principalmente que é de OpenAI uma vez que o modelo admite que o estilo e o tom das respostas parecem diferentes do GPT-4 e do GPT-4 Turbo, mas o limiar de conhecimentos difere do atualmente disponível OpenAI modelos.
O gpt2-chatbot é louco em arte ascii, muito à frente de qualquer outro modelo pic.twitter.com/1IwEaJyU7Q
- Phil (@phill__1) 29 de abril de 2024
Eu próprio perguntei ao gpt2-chatbot "Quem és tu", ao que ele respondeu:
"Fui criado por OpenAIA empresa de investigação da União Europeia, a GFK, é uma organização de investigação que se concentra no desenvolvimento e promoção de IA amigável para benefício da humanidade. O meu desenvolvimento baseia-se na série de modelos de linguagem GPT (Generative Pre-trained Transformer), especificamente a versão GPT-4, que é uma evolução de modelos anteriores como o GPT-3. Estes modelos são treinados numa gama diversificada de texto da Internet, mas foram concebidos para gerar texto semelhante ao humano com base nas instruções que recebem.
OpenAI foi criada com o objetivo de assegurar que a inteligência artificial geral (AGI) beneficie toda a humanidade. Realizam investigação no domínio da IA com o objetivo de desenvolver e orientar as tecnologias de inteligência artificial de forma a beneficiar a humanidade no seu conjunto, sem obrigações financeiras para com os investidores.
Se tiver mais perguntas sobre a IA, OpenAIou tecnologias relacionadas, não hesite em perguntar!"
Quando lhe perguntei por que razão se chamava gpt2-chatbot, respondeu-me:
"Para resumir, não me chamo "GPT-2"; sou uma variante da GPT-4, concebida especificamente para aplicações interactivas, como este formato de conversação. A minha conceção inclui melhorias no tratamento de diálogos, características de segurança, considerações éticas e qualidade geral das respostas. Se vir referências ao "GPT-2", é provável que estejam a discutir o modelo que veio antes do GPT-3 e do GPT-4."
O desempenho do gpt2-chatbot suscita especulações
Relativamente ao desempenho, um utilizador do Fórum Y Combinator discutiram o conhecimento do domínio do bot em ciência dos materiais, discutindo o fabrico de pás de turbinas com uma profundidade que não tinham visto de outra forma.
Outro utilizador, o conhecido cientista de dados Simon Wilson, ficou impressionado com a forma como lida com consultas altamente personalizadas, sugerindo que tem uma compreensão detalhada dos antecedentes pessoais das pessoas.
Pode experimentar o misterioso gpt2-chatbot em https://t.co/4ARf9G6RHb (seleccione "Conversa direta" e escolha-a no menu)
Impressões iniciais: Estou muito impressionado. Deu-me uma resposta melhor para uma pesquisa do ego ("Quem é Simon Willison?") do que qualquer outro modelo que experimentei https://t.co/MCJMVhNs8k
- Simon Willison (@simonw) 29 de abril de 2024
Outros identificaram as deficiências habituais do LLM, tais como alucinações e imprecisões factuais.
Tendo-o utilizado eu próprio, concordo que parece uma variante do GPT-4.
Quanto ao facto de ser melhor do que o GPT-4, como alguns especulam, vale a pena salientar que muitos sentiram que o desempenho do GPT-4 diminuiu ao longo do tempo (possivelmente coincidindo com OpenAI dedicar recursos informáticos à formação de novos modelos).
Portanto, essa variante potencialmente não adulterada pode parecer com a GPT -4 quando foi lançada. Se adicionarmos uma ligeira diferenciação no comportamento e desempenho em tarefas específicas, podemos ver porque é que a especulação é elevada.
Quando as discussões sobre o gpt2-chatbot chegaram ao X, alguns especularam inevitavelmente que se tratava de uma prova de GPT-4.5, GPT-5 ou mesmo AGI. No entanto, a maioria não tem a certeza se representa um progresso concreto em relação aos modelos actuais.
De um modo geral, não é possível que uma empresa de IA treine um chatbot totalmente novo como este e o lance desta forma. É quase certo que se trata de uma variante do GPT-4.
Em última análise, é um boato até que o criador saia de trás das cortinas e reclame a propriedade.