Equipe de IA diz esforço apoiado por eticistas cristãos, mas 'o mesmo não é verdade' para o Alcorão e outros textos
Meta | iStock/Kira-Yan |
Quando se trata de traduções da Bíblia, podemos estar no caminho certo para o Evangelho ser pregado em “toda língua”.
A Meta, empresa controladora do Facebook e do Instagram, anunciou planos de usar a Bíblia e outros textos religiosos para processar mais de 4.000 idiomas com o objetivo final de preservar esses idiomas.
Mas por que as Escrituras?
Como parte de um esforço para coletar dados para seu projeto Massively Multilingual Speech (MMS), a equipe de pesquisa de Meta Artificial Intelligence voltou-se para a Bíblia e outros textos religiosos para lidar com a assustadora perspectiva de coletar tais dados para milhares de idiomas, uma vez que os conjuntos de dados de fala existentes atualmente não ultrapassam 100 idiomas.
Ao recorrer à Bíblia, que foi traduzida em todo o mundo e compartilhada em gravações de áudio dessas traduções, os pesquisadores conseguiram criar um conjunto de dados de leituras do Novo Testamento em mais de 1.100 idiomas, abrangendo uma média de 32 horas de dados em cada idioma. .
Para cobrir os 27 livros e 260 capítulos do Novo Testamento, a Meta usou dados de Bible.com, GoTo.Bible e FaithComesByHearing.com, incluindo texto original e gravações de áudio.
A equipe da Meta AI desenvolveu esse trabalho usando “gravações não rotuladas de várias outras leituras religiosas cristãs” e, embora sejam faladas principalmente por falantes do sexo masculino, os pesquisadores da Meta acreditam que os modelos de linguagem “têm um desempenho igualmente bom para vozes masculinas e femininas”.
Os pesquisadores também realizaram “consultas” com eticistas cristãos, que, de acordo com Meta, “concluíram que a maioria dos cristãos não consideraria o Novo Testamento e suas traduções sagrados demais para serem usados em aprendizado de máquina. “
Eles também disseram, no entanto, que “o mesmo não é verdade para todos os textos religiosos: por exemplo, o Alcorão originalmente não deveria ser traduzido”.
O artigo também destacou o precedente para o uso da Bíblia dessa maneira, citando o esforço CMU Wilderness de 2019 que criou modelos de síntese de fala para quase 700 idiomas.
O projeto MMS, disse a equipe, “segue uma longa linha de pesquisa utilizando o Novo Testamento para treinar e avaliar modelos de aprendizado de máquina”.
O trabalho de pesquisa também observou o risco de “dados de treinamento religioso” influenciarem e potencialmente até criarem vieses para os modelos de linguagem “com relação a uma visão de mundo específica”, presumivelmente ligada à Bíblia e ao cristianismo.
No entanto, a equipe da Meta AI descartou o risco, acrescentando que a linguagem produzida pelos modelos “exibe apenas um pequeno viés em comparação com os modelos de linha de base treinados em outros domínios”.
Em última análise, o projeto, segundo os pesquisadores, é preservar línguas que podem ser extintas nos próximos anos.
“Muitas das línguas do mundo estão em perigo de desaparecer, e as limitações do reconhecimento de fala atual e da tecnologia de geração de fala só vão acelerar essa tendência”, disse a equipe. “Vislumbramos um mundo onde a tecnologia tenha o efeito oposto, incentivando as pessoas a manter vivas suas línguas, pois podem acessar informações e usar a tecnologia falando em seu idioma preferido.”
Apesar de sua ambição de escala sem precedentes, não é a primeira vez que a IA é usada para ampliar a mensagem atemporal da Bíblia.
Em junho de 2020, os criadores do aplicativo de meditação cristã Soultime lançaram o que era então a primeira versão em áudio da Bíblia lida na íntegra por uma voz de inteligência artificial. O produto final apresentava 100 horas de Escritura audível.
Os desenvolvedores da empresa disseram anteriormente ao The Christian Post que “avaliaram uma variedade de plataformas de conversão de texto em fala, mas acharam o Wavenet do Google o som mais natural”. Mas, “porque o texto bíblico é extremamente complexo”, os desenvolvedores do aplicativo tiveram que “trabalhar muito para modificar a leitura básica para criar algo que soasse natural e fosse realmente agradável de ouvir”.