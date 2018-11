A Universidade Cidade de Macau e a Universidade de Évora estão a trabalhar no desenvolvimento de um novo sistema de tradução chinês-português cujos primeiros resultados devem surgir daqui a um ano. Paulo Quaresma, um dos investigadores responsáveis pelo projecto, disse ao PONTO FINAL que a equipa está agora a trabalhar nas candidaturas a programas de investimento em Macau e Portugal.

Catarina Vila Nova

A Universidade Cidade de Macau e a Universidade de Évora estão a colaborar na criação de um laboratório de tradução automática chinês-português. O projecto foi apresentado por Paulo Quaresma, professor associado do Departamento de Informática da Universidade de Évora, durante a primeira conferência sobre inovação de conhecimento entre a China e os países de língua portuguesa e latino-americanos que ontem decorreu na Universidade Cidade de Macau. Ao PONTO FINAL, o académico e um dos seis coordenadores do laboratório disse esperar obter os primeiros resultados daqui a um ano. Para breve estão as candidaturas a programas de financiamento, tanto em Portugal como em Macau, com a equipa a esperar obter cerca de um milhão de euros (cerca de nove milhões de patacas) para arrancar com o projecto.

O processo nasceu há um ano, durante o qual a equipa de investigadores esteve a preparar as candidaturas que serão brevemente apresentadas, em Macau, ao Fundo para o Desenvolvimento das Ciências e da Tecnologia (FDCT), e em Évora, ao programa de fundos comunitários Alentejo 2020. Com cada candidatura a equipa espera obter entre 400 mil a 500 mil euros (entre 3,6 milhões e 4,5 milhões de patacas), destinados a financiar a infra-estrutura tecnológica de grande desempenho computacional, que ficará localizada em Évora, e a equipa de investigadores a tempo inteiro durante dois anos que será constituída por três doutorados e, pelo menos, cinco doutorandos. Actualmente, a trabalhar no projecto estão quatro investigadores das áreas da informática e da linguística da Universidade de Évora e outros dois docentes da Universidade Cidade de Macau.

Segundo explicou Paulo Quaresma, trabalhar com o par chinês-português constitui um desafio particular, quando comparado, por exemplo, com português-inglês, e especialmente devido às diferenças que separam as duas línguas e à falta de recursos de tradução. “Temos este grande desafio de trabalhar especificamente para o par de língua chinês-português. Temos que usar, por exemplo, as publicações oficiais do Governo [de Macau] que estão nas duas línguas oficiais como ‘input’ destes novos sistemas de aprendizagem automática que vão tentando criar um modelo mais adequado para a tradução automática nos dois sentidos”, explicou o investigador, doutorado em Informática.

Para Paulo Quaresma, o que vai distinguir este novo sistema de tradução de outros já existentes como, por exemplo, o Google Translate, é a introdução e utilização de informações específicas do chinês e português aplicadas ao conhecimento do mundo. “Para se conseguir dar um salto qualitativo grande nos sistemas actuais, nomeadamente neste par de línguas é preciso algo que normalmente os sistemas actuais não estão a incorporar, que é informação específica das línguas em casa. Os sistemas de hoje em dia são um processo automatizado e, no fundo, recebem como ‘input’ grandes quantidade de documentos em português e em chinês e tentam criar um modelo”, explicou o docente.

“Precisamos de ter informação de facto linguística das duas línguas e conhecimento do mundo como ‘input’ para melhorar os sistemas de tradução. O que nós defendemos é que não se pode esquecer todo o trabalho de investigação que foi feito em dezenas de anos na área da linguística de perceber como é que a língua portuguesa e a língua chinesa funcionam, quais os seus modelos e os sistemas actuais esquecem um pouco isso, é tudo automatizado”, defendeu. A comprovar-se esta abordagem, os primeiros resultados deste novo sistema de tradução devem aparecer daqui a um ano, disse Paulo Quaresma.