Recentemente, a Google foi criticada pelo seu vídeo promocional que apresenta o Gemini, o seu concorrente multimodal do GPT-4 da OpenAI.
O vídeo, intitulado "Hands-on with Gemini: Interacting with multimodal AI", foi concebido para mostrar a capacidade do Gemini para reconhecer e responder a estímulos visuais.
Lançado na quarta-feira, este vídeo causou grande entusiasmo pelo que parecia ser o reconhecimento visual avançado em tempo real e a interação vocal do Gemini. No entanto, os utilizadores do X e Parmy Olson da Bloomberg O entusiasmo foi atenuado pelo facto de o vídeo promocional da Gemini ter sido fortemente editado.
No seu relatório, Olson revela que a equipa da Google manipulou o vídeo utilizando imagens fixas e entradas de texto, seleccionando e sintetizando as respostas mais bem sucedidas para criar uma impressão enganadora de interação em tempo real.
As legendas do vídeo indicam que este consiste nas "interacções favoritas" da Google com a modelo, mas, mesmo assim, parece que exageraram um pouco na promoção.
Em resposta às revelações, um porta-voz da Google disse: "A narração do utilizador no vídeo é composta por excertos reais das instruções utilizadas para produzir o resultado Gemini que se segue".
Apesar da controvérsia, é importante notar que o Gemini da Google possui credenciais impressionantes e está amplamente alinhado com as capacidades do modelo multimodal GPT-4V da OpenAI quando a versão Ultra do modelo Gemini for lançada no próximo ano.
O Gemini atual é mais parecido com uma versão multimodal do GPT-3.5. É possível visualizar Os impressionantes valores de referência do Ultra aqui - supera o GPT-4 em 30/32 testes.
Para alguns, a reação às pessoas que criticam o vídeo de marketing da Google tem sido desconcertante. Afinal de contas, é "apenas" um vídeo de marketing. Em última análise, os modelos de IA são produtos. Pode argumentar-se que os compradores, em particular os programadores, precisam de fazer as devidas diligências como fariam para qualquer outro produto.
Mesmo assim, o incidente desencadeou uma conversa mais alargada no mundo da tecnologia sobre as implicações éticas do marketing de IA.
Tudo isto mostra como as empresas de IA estão a esbater a linha entre o serviço público e a obtenção de lucros para os accionistas.
As empresas de IA têm a responsabilidade de manter uma transparência total em todas as suas comunicações, incluindo os vídeos de marketing? Legalmente, não - pelo menos em muitas jurisdições.
Moral e eticamente? A maioria concordaria que estão vinculadas a uma maior responsabilidade do que outras empresas, que é a de serem obrigadas por quadros, regulamentos e legislação.
Mas, por outro lado, quando foi a última vez que se queixou de que o seu Big Mac não parecia tão suculento como nos anúncios?
As empresas com responsabilidade pública continuam a fazer publicidade, mesmo quando os seus produtos causam um risco ético ou para a saúde pública indiscutivelmente maior do que a IA.
No entanto, a IA já provou a sua capacidade de criar uma grande expetativa poucos minutos depois de grandes anúncios. Imaginem como vai ser o GPT-5.