A aprendizagem automática revela o conteúdo de pergaminhos e tábuas de pedra antigos

13 de outubro de 2023

Luke Farritor, um estudante de ciências informáticas de 21 anos da Universidade de Nebraska-Lincoln, revelou o texto contido num pergaminho carbonizado da antiga Herculano. 

Este pergaminho tem estado ilegível desde a erupção vulcânica de 79 d.C. que também engoliu Pompeia. O algoritmo de aprendizagem automática da Farritor identificou com sucesso letras gregas no papiro enrolado, incluindo a palavra πορϕυρας (porphyras), que significa "púrpura". 

A sua técnica baseava-se na identificação de pequenas diferenças na textura da superfície para treinar a sua rede neural na deteção de tinta e, por sua vez, de letering. 

"Quando vi a primeira imagem, fiquei chocado". disse Federica Nicolardi, papirologista da Universidade de Nápoles. "Foi um sonho", continuou, "poder ver de facto algo do interior de um pergaminho".

Os pergaminhos, enterrados pela erupção do Monte Vesúvio em 79 d.C., permaneceram em grande parte inacessíveis devido ao seu estado frágil. 

Ao desenrolar manualmente os pergaminhos carbonizados, estes desfazem-se, levando os estudiosos a recear que o seu conteúdo permaneça um mistério para sempre. 

Rolagem de IA
Um pergaminho de Herculano carbonizado que não pode ser desenrolado. Fonte: Natureza.

Como explicou Nicolardi, "são objectos tão loucos. Estão todos amassados e esmagados".

Reconhecendo o desafio de decifrar os pergaminhos, o Desafio do Vesúvio foi criado, oferecendo vários prémios, incluindo um grande prémio de US$700.000 pela decifração de várias passagens de um pergaminho.

Em 12 de outubro, foi anunciado que Farritor tinha ganho um prémio de $40.000 por ter identificado mais de 10 caracteres numa pequena secção do papiro. 

Outro participante, Youssef Nader, da Universidade Livre de Berlim, recebeu $10.000 pelo segundo lugar.

A historiadora da Grécia e Roma antigas, Thea Sommerschield, descreveu a capacidade de finalmente discernir letras e palavras dentro dos pergaminhos como "extremamente excitante". 

Sommerschield referiu que a sua interpretação poderia "revolucionar o nosso conhecimento da história e literatura antigas" da região. 

Não é a primeira vez que os investigadores tentam ler estes antigos pergaminhos carbonizados. Em 2019, Brent Seales, professor de Ciência da Computação especializado em leitura virtual e preservação de pergaminhos antigos, tentou "desembrulhar virtualmente" os pergaminhos usando tomografia computadorizada de raios-X (TC). 

Em 2016, Seales teve sucesso com um antigo pergaminho hebraico encontrado em 1970 em Ein Gedi, Israel, revelando partes do Livro do Levítico. 

No entanto, os pergaminhos de Herculano colocavam um desafio diferente: a tinta, feita de carvão e água, não se destacava nas digitalizações.

Foi aqui que Farritor conseguiu concentrar-se numa textura subtil específica, designada por "crepitação", para os vestígios de tinta. 

Farritor disse: "Estava a saltar para cima e para baixo", depois de o seu algoritmo ter revelado cinco letras de um segmento recentemente lançado. "Oh, meu Deus, isto vai mesmo funcionar", apercebeu-se. 

Pouco tempo depois, aperfeiçoou o seu modelo e identificou as dez letras necessárias para o prémio, com a palavra "púrpura" não identificada anteriormente nos pergaminhos de Herculano.

O grande prémio do Vesuvius Challenge ainda não foi revelado, estando o prazo de entrega fixado para 31 de dezembro. 

IA para descodificar línguas antigas

Há seis milénios, os sumérios estabeleceram-se na Mesopotâmia, a terra que banha os rios Tigre e Eufrates. 

Esta região, que abrange os actuais Iraque, Kuwait, Turquia e Síria, testemunhou a evolução de pequenas comunidades agrárias para grandes civilizações urbanas. Cidades como Uruk floresceram, integrando intrincados canais, estruturas de irrigação e centros de governação. Foi uma época crítica para o progresso e a evolução da humanidade. 

Os sumérios escreviam com uma escrita conhecida como cuneiforme. Este sistema de escrita exigia a prensagem de canas em argila, gerando inscrições logosilábicas complexas. O cuneiforme não é uma língua - é uma escrita que engloba cerca de 15 línguas ao longo de três milénios.

Cuneiforme AI
Exemplo de uma tábua cuneiforme contendo um texto chamado "Hino a Marduk". Fonte: Wikimedia Commons.

Embora as escritas cuneiformes tenham sido utilizadas principalmente como ferramentas administrativas para tarefas como o registo de gado ou de transacções, por volta de 2700 a.C., surgiu uma vasta gama de escritos mais filosóficos e criativos. 

Um dos mais notáveis destes escritos é o Epopeia de Gilgameshque se estende por doze comprimidos.

Enrique Jiménez, da Universidade Ludwig Maximilians de Munique, afirma que "metade da história da humanidade está encapsulada nestas tábuas cuneiformes". 

No entanto, apenas 75 indivíduos, de acordo com Nova CiênciaA Comissão Europeia, apesar das dezenas de milhares de tabuletas não traduzidas em todo o mundo, consegue descodificar o cuneiforme.

A aprendizagem automática está agora a ajudar os investigadores a desvendar as histórias gravadas nas tábuas de pedra, ajudando-os a preencher lacunas e a ordenar os textos cronologicamente para descobrir mais sobre como viviam os antigos sumérios. 

O papel da aprendizagem automática na descodificação de textos antigos

Enrique Jiménez e a sua equipa fundaram a Literatura eletrónica da Babilónia, uma colaboração entre arqueólogos, cientistas de dados e historiadores.

Para analisar as tabuinhas cuneiformes, a equipa utilizou uma técnica de aprendizagem automática originalmente concebida para a comparação de sequências genéticas. Esta IA prevê o conteúdo das secções em falta e os limites em que os fragmentos se alinham.

Esta técnica levou a descobertas como secções em falta da Epopeia de Gilgamesh e a um novo género mesopotâmico que descreve paródias educativas e piadas para crianças. 

Em 2020, um modelo distinto, DeepScribefoi treinado com 6.000 imagens anotadas do Arquivo da Fortificação de Persépolisque especifica aproximadamente 100 000 símbolos da língua elamita (do atual Irão), datados de cerca de 500 a.C.

Aproveitando os recursos do Centro de Computação de Investigação da UChicago, Krishnan e Eddie Williams treinaram um modelo capaz de descodificar estes sinais com uma impressionante precisão de 80%. 

A equipa tenciona transformar o DeepScribe numa ferramenta de decifração versátil, treinável para outras línguas para além do Elamite. 

IA do DeepScribe
O DeepScribe tenta ler símbolos da antiga língua Elamita. Fonte: DeepScribe.

A DeepMind também investigou a descodificação de línguas antigas com recurso à aprendizagem automática - neste caso, de tabletes gregos antigos danificados.

Nomeado ÍtacaEste modelo restaurou textos com uma precisão de 72%, aproximou a sua idade em três décadas e até supôs a sua origem com uma exatidão de 71%. 

DeepMind Ithaca
O DeepMind Ithaca preenche as lacunas das tábuas gregas fragmentadas. Fonte: DeepMind.

A formação da Ithaca envolveu 60 000 textos de 700 a.C. a 500 d.C., marcados com dados sobre o seu tempo e lugar em 84 territórios antigos.

A intersecção de textos antigos e IA de ponta mostra como mesmo os mistérios milenares não são imunes aos avanços da tecnologia moderna. 

Ao misturarem o antigo com o novo, os investigadores estão a preservar a história e a descobrir coisas até então desconhecidas conhecimento arqueológico.

Estas descobertas sublinham as possibilidades ilimitadas quando combinamos a curiosidade humana com as capacidades tecnológicas, provando que existe uma nova lente através da qual podemos ver as maravilhas do nosso passado coletivo.

Junte-se ao futuro


SUBSCREVER HOJE

Claro, conciso e abrangente. Fique a par dos desenvolvimentos da IA com DailyAI

Calças de ganga Sam

Sam é um escritor de ciência e tecnologia que trabalhou em várias startups de IA. Quando não está a escrever, pode ser encontrado a ler revistas médicas ou a vasculhar caixas de discos de vinil.

×

PDF GRATUITO EXCLUSIVO
Fique à frente com o DailyAI

Subscreva a nossa newsletter semanal e receba acesso exclusivo ao último livro eletrónico do DailyAI: 'Mastering AI Tools: Seu guia 2024 para aumentar a produtividade'.

*Ao subscrever a nossa newsletter, aceita a nossa Política de privacidade e o nosso Termos e condições