A Islândia, uma nação insular no meio do Atlântico Norte, tem uma indústria de tecnologia vibrante e um turismo em expansão. No entanto, enquanto a maioria de seus cerca de 370.000 cidadãos fala inglês ou outra segunda língua, sua integração com os Estados Unidos e a Europa colocou a língua nativa do país, o islandês, em risco. Hoje, há uma preocupação crescente de que, em algumas gerações, se o islandês não puder permanecer como o idioma padrão do país em face da rápida digitalização, o idioma possa enfrentar extinção de facto.
O islandês é querido aos corações dos islandeses. O governo do país mantém um Departamento de Planejamento Linguístico que cunha termos islandeses para novas ideias, em vez de adotar as chamadas "palavras emprestadas" de outras línguas. Um computador, por exemplo, é uma tölva ("profetisa numérica"). Como resultado desses esforços, a língua permanece relativamente "puro" no sentido linguístico, e perto de suas raízes nórdicas antigas.
Publicidade
No iniciativa do presidente do país, Sua Excelência Guðni Th. Jóhannesson, e com a ajuda da indústria privada, a Islândia fez uma parceria com a OpenAI para usar o GPT-4 no esforço de preservação da língua islandesa – e para transformar uma posição defensiva em uma oportunidade para inovar.
A parceria foi concebida não apenas como uma maneira de aumentar a capacidade do GPT-4 de atender a um novo canto do mundo, mas também como um passo em direção à criação de recursos que poderiam servir para promover a preservação de outras linguagens de poucos recursos.
Os modelos GPT da OpenAI são treinados em grandes quantidades de texto na internet. Assim, a maior parte do conjunto de treinamento do modelo está em inglês e outros idiomas principais, o que significa que o GPT não tem as mesmas habilidades ou amplitude de compreensão em idiomas menores. Os modelos melhoraram ao longo do tempo, mas não produzem consistentemente traduções islandesas claras e corretas.