Como a Islândia está usando o GPT-4 para preservar sua língua.

 


A Islândia, uma nação insular no meio do Atlântico Norte, tem uma indústria de tecnologia vibrante e um turismo em expansão. No entanto, enquanto a maioria de seus cerca de 370.000 cidadãos fala inglês ou outra segunda língua, sua integração com os Estados Unidos e a Europa colocou a língua nativa do país, o islandês, em risco. Hoje, há uma preocupação crescente de que, em algumas gerações, se o islandês não puder permanecer como o idioma padrão do país em face da rápida digitalização, o idioma possa enfrentar extinção de facto.

O islandês é querido aos corações dos islandeses. O governo do país mantém um Departamento de Planejamento Linguístico que cunha termos islandeses para novas ideias, em vez de adotar as chamadas "palavras emprestadas" de outras línguas. Um computador, por exemplo, é uma tölva ("profetisa numérica"). Como resultado desses esforços, a língua permanece relativamente "puro" no sentido linguístico, e perto de suas raízes nórdicas antigas.

Publicidade

No iniciativa do presidente do país, Sua Excelência Guðni Th. Jóhannesson, e com a ajuda da indústria privada, a Islândia fez uma parceria com a OpenAI para usar o GPT-4 no esforço de preservação da língua islandesa – e para transformar uma posição defensiva em uma oportunidade para inovar.

A parceria foi concebida não apenas como uma maneira de aumentar a capacidade do GPT-4 de atender a um novo canto do mundo, mas também como um passo em direção à criação de recursos que poderiam servir para promover a preservação de outras linguagens de poucos recursos.


"Queremos garantir que a inteligência artificial seja usada não apenas para ajudar a preservar a língua, a cultura e a história, mas também para sustentar a prosperidade econômica", diz Jóhanna Vigdís Guðmundsdóttir, CEO da Almannarómur, um centro de tecnologia linguística sem fins lucrativos. "O islandês é um caso um pouco peculiar", ela admite, "mas vimos a oportunidade de nos tornarmos pioneiros para outras línguas de cauda longa, ajudar a criar condições equitativas e evitar uma 'divisão da IA'. Não basta reunir dados e construir software localmente para o islandês; temos que colocar nossa linguagem no software e nos aplicativos que as pessoas usam todos os dias."

Os modelos GPT da OpenAI são treinados em grandes quantidades de texto na internet. Assim, a maior parte do conjunto de treinamento do modelo está em inglês e outros idiomas principais, o que significa que o GPT não tem as mesmas habilidades ou amplitude de compreensão em idiomas menores. Os modelos melhoraram ao longo do tempo, mas não produzem consistentemente traduções islandesas claras e corretas.



Islândia




Postar um comentário

Postagem Anterior Próxima Postagem