Anthropic lança artigo que revela o enviesamento dos modelos linguísticos de grande dimensão

Um novo artigo da empresa Anthropic, especializada em inteligência artificial, revelou os potenciais preconceitos inerentes aos modelos de linguagem de grande dimensão (LLM), sugerindo que estes sistemas de IA podem não representar adequadamente as diversas perspectivas globais sobre questões sociais.

Os investigadores criaram um conjunto de dados, GlobalOpinionQA, que inclui perguntas e respostas de inquéritos transnacionais concebidos para captar opiniões variadas sobre questões globais em diferentes países.

Antrópico experiências questionou um LLM e descobriu que, por defeito, as respostas do modelo tendiam a alinhar-se mais com as opiniões de populações específicas, nomeadamente as dos EUA, Reino Unido, Canadá, Austrália e alguns outros países europeus e sul-americanos.

Como funciona

Criação de conjuntos de dados: A equipa criou o conjunto de dados GlobalOpinionQA. Este conjunto de dados incorpora perguntas e respostas de inquéritos transnacionais especificamente concebidos para captar uma gama diversificada de opiniões sobre questões globais.
Definição de uma métrica de similaridade: Em seguida, o Anthropic formulou uma métrica para medir a semelhança entre as respostas dadas pelos LLMs e as respostas das pessoas. Esta métrica tem em conta o país de origem dos inquiridos humanos.
Formação do LLM: O Anthropic formou um LLM com base na "IA Constitucional", garantindo que o LLM era útil, honesto e inofensivo. A IA constitucional é uma técnica desenvolvida pela Anthropic que tem como objetivo imbuir os sistemas de IA de "valores" definidos por uma "constituição".
Realização de experiências: Utilizando a sua estrutura cuidadosamente concebida, a equipa da Anthropic executou 3 experiências distintas no LLM treinado.

Os investigadores argumentam que este facto evidencia um potencial enviesamento nos modelos, levando à sub-representação das opiniões de certos grupos em comparação com as dos países ocidentais.

Se um modelo linguístico representar desproporcionadamente determinadas opiniões, corre o risco de impor efeitos potencialmente indesejáveis, como a promoção de visões do mundo hegemónicas e a homogeneização das perspectivas e crenças das pessoas", referiram.

Além disso, os investigadores observaram que o facto de o modelo considerar a perspetiva de um país específico conduziu a respostas mais semelhantes às opiniões dessas populações.

Isto significa que se pode pedir à IA que "considere a perspetiva sul-americana" num determinado debate cultural, por exemplo. No entanto, estas respostas reflectiam, por vezes, estereótipos culturais nocivos, sugerindo que os modelos não têm uma compreensão diferenciada dos valores e perspectivas culturais.

Curiosamente, quando os investigadores traduziram as perguntas do GlobalOpinionQA para uma língua-alvo, as respostas do modelo não corresponderam necessariamente às opiniões dos falantes dessas línguas.

Por isso, fazer uma pergunta, por exemplo, em japonês, não conduz necessariamente a respostas alinhadas com os valores culturais japoneses. Não se pode "separar" a IA dos seus valores predominantemente ocidentais.

Isto sugere que, apesar da sua adaptabilidade, os LLMs devem adquirir uma compreensão mais profunda dos contextos sociais para gerar respostas que reflictam com precisão as opiniões locais.

Os investigadores acreditam que as suas descobertas irão proporcionar transparência nas perspectivas codificadas e reflectidas pelos modelos linguísticos actuais. Apesar das limitações do seu estudo, esperam que este sirva de orientação para o desenvolvimento de sistemas de IA que incorporem uma diversidade de pontos de vista e experiências culturais, e não apenas os de grupos privilegiados ou dominantes. Também publicaram o seu conjunto de dados e um visualização interactiva.

Este estudo está amplamente alinhado com outros trabalhos académicos sobre o tema dos valores sociais e culturais da IA.

Por um lado, a maioria das IA fundamentais são treinadas por empresas e equipas de investigação predominantemente ocidentais.

Além disso, o dados utilizados para treinar IAs nem sempre representa a sociedade como um todo. Por exemplo, a grande maioria dos dados de formação para os LLM está escrita em inglês, reflectindo provavelmente os valores sociais e culturais da língua inglesa.

Os investigadores estão bem cientes dos potenciais preconceitos e discriminação na IA. No entanto, a sua resolução é extremamente complexa, exigindo uma combinação cuidadosa de conjuntos de dados personalizados de alta qualidade e de um contributo e monitorização humanos diligentes.

O documento Anthropic releases revela o enviesamento dos modelos linguísticos de grande dimensão

Como funciona

Junte-se ao futuro

Calças de ganga Sam

ARTIGOS RELACIONADOS

Sony Music Group emite aviso de dados de treino de IA a 700 empresas

Falsificações profundas de IA provocam um debate aceso antes das eleições de 2024 na Índia

Os anúncios da Google e da OpenAI quebram as fronteiras entre humanos e IA

Os chatbots de IA dos mortos podem "assombrar-nos digitalmente" para sempre, alerta um novo estudo

O documento Anthropic releases revela o enviesamento dos modelos linguísticos de grande dimensão

Como funciona

Junte-se ao futuro

Calças de ganga Sam

ARTIGOS RELACIONADOS

Sony Music Group emite aviso de dados de treino de IA a 700 empresas

Falsificações profundas de IA provocam um debate aceso antes das eleições de 2024 na Índia

Os anúncios da Google e da OpenAI quebram as fronteiras entre humanos e IA

Os chatbots de IA dos mortos podem "assombrar-nos digitalmente" para sempre, alerta um novo estudo

PDF GRATUITO EXCLUSIVOFique à frente com o DailyAI

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI