Projeto inovador junta CINTESIS, FEUP e U. Aveiro para “dar voz” a quem não tem

Não ter voz pode ser um pesadelo. Afeta a comunicação e a autoestima, promove a frustração e pode desencadear a depressão. Para dar resposta a milhões de pessoas que são afetadas por falta de voz – ou voz disfónica – um grupo de investigadores portugueses acaba de dar início a um projeto que visa criar um sistema inovador para a reconstrução da voz natural.

Designado por DyNaVoiceR, o projeto reúne engenheiros, médicos especialistas em otorrinolaringologia e terapeutas da fala, da Faculdade de Engenharia da U.Porto (FEUP), do CINTESIS e da Universidade de Aveiro, respetivamente. “O objetivo é criar um assistente tecnológico avançado que converta sinais de fala sussurrada em sinais de fala natural”, adianta Aníbal Ferreira, investigador principal e professor da (FEUP), realçando que não se conhece nenhum sistema eficaz que dê solução convincente ao problema da comunicação oral dos pacientes com voz disfónica.

Ou seja, o projeto quer criar uma app que se apresente como uma solução para todos aqueles doentes que sofrem de um tipo de voz disfónica particular: a afonia (temporária ou permanente), que pode resultar de doenças oncológicas (como o cancro da tiroide ou da laringe), de transtornos neurológicos (como esclerose múltipla ou Parkinson), distúrbios psicológicos (como a ansiedade), entre outras causas.

“A voz é produzida pela vibração do ar que é expulso dos pulmões pelo diafragma e que passa pelas pregas vocais sendo depois modificado pela língua, palato e lábios. A emissão de uma voz saudável designa-se por eufonia, enquanto uma voz ‘doente’, ou seja, com algumas das suas características alteradas, tem o nome de disfonia”, explica Jorge Spratley, médico otorrinolaringologista e investigador do CINTESIS, responsável pela área clínica do projeto.

As pessoas que sofrem de afonia de forma crónica, falando através de sussurros ou com muita rouquidão, veem a sua capacidade de comunicação muito diminuída e ficam condicionados na interação natural, já que a voz disfónica não transmite nem emoções nem a identidade do orador. O sistema a desenvolver deverá servir como um “amplificador modificado, mas inteligente”, que não só projeta a voz realçando a mensagem linguística, mas também a corrige, devolvendo a sua sonoridade natural e até a assinatura sonora do falante.

Tecnicamente, a voz pode ser decomposta e reconstruída para corrigir os aspetos pretendidos, incluindo a inserção de componentes em falta. Neste sentido, caberá ao CINTESIS recolher amostras da voz no local e momento em que ela é gerada pelas cordas vocais. “É como ir buscar a água diretamente à nascente, antes de passar por quaisquer riachos ou poluição que a alterem”, explica Jorge Spratley. Para isso, os investigadores vão recorrer a uma amostra de falantes voluntários saudáveis. O exame, não-invasivo, vai decorrer no Centro Hospitalar de São João e servirá para ajudar a recolher essa “impressão vocal” individual.

Essa informação será depois trabalhada pelos especialistas em engenharia, que ficarão encarregues de desenvolver técnicas e ferramentas para a síntese precisa e controlo das diferentes componentes do sinal de voz, fundamentais para a reconstrução de voz natural a partir de voz disfónica. Muito resumidamente, pretende-se “preservar e destacar a informação linguística, transmitir elementos distintivos da voz de um indivíduo, além de melhorar a projeção vocal”, explicam os investigadores.

O DyNaVoiceR surge na sequência de outros projetos na área da voz falada e cantada, como o projeto ARTTS, por exemplo, também liderado por Aníbal Ferreira.

Financiado pela Fundação para a Ciência e Tecnologia (FCT), o projeto conta ainda com a participação da Faculdade de Medicina da Universidade do Porto (FMUP), do Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência (INESC TEC) e do Instituto de Engenharia Electrónica e Telemática de Aveiro (IEETA).