Project Description

DyNaVoiceR

Com financiamento da FCT, o projeto DyNaVoiceR – Reconstrução de voz disfónica para voz natural foca-se em tecnologia avançada permitindo ajudar pacientes afetados por disfonia vocal, principalmente afonia temporária ou permanente, a comunicar de forma eficaz e confortável. A nossa visão é que a tecnologia assistiva captura a voz disfónica por meio de um microfone e reconstrói voz natural, em tempo real, que é reproduzida de forma impercetível. Neste projeto, contamos com uma equipa multidisciplinar excecional, com comprovada competência e experiência nas áreas de Engenharia, Otorrinolaringologia e Terapia da Fala, a fim de realizar I&D dedicado, conduzindo ao projeto e realização de um sistema de Reconstrução de Voz Disfónica para Voz Natural, totalmente inovador e de forma automática (DyNaVoiceR). Este sistema converterá sons de fala sussurrada em fala natural, através da implantação de vozeamento sintético, cuidadosamente modeladas em frequência e tempo, de modo a preservar e realçar a informação linguística, a transmitir elementos idiossincráticos de uma assinatura de voz, e a melhorar a sua projeção.

Abstract

Esta proposta de projecto envolve I&D multidisciplinar com o objetivo de realizar um assistente tecnológico avançado que, tanto quanto é conhecido, não se encontra ainda disponível para milhões de pessoas que são afetadas por voz disfónica, mormente afonia temporária ou permanente. Estes problemas de voz causam dificuldades de comunicação que têm um impacto negativo na atividade profissional, na inclusão social e, ademais, promovem a info-exclusão, isolamento pessoal, baixa auto-estima, e até mesmo frustração e depressão. O objetivo do assistente tecnológico é reconstruir voz natural a partir de voz disfónica de modo a permitir que aqueles pacientes comuniquem eficaz e confortavelmente, em ambos os cenários humano-para-humano e humano-para-máquina, usando o seu aparelho fonético de forma inalterada.

Reúne-se neste projeto uma equipa com competência e experiência comprovadas nas áreas da Engenharia (Univ. Porto, Fac. Engenharia e INESC Tec), da Otorrinolaringologia (Univ. Porto, Fac. Medicina e Cintesis), e da Terapia da Fala (Univ. Aveiro e IEETA), com o propósito de realizar I&D dedicada que conduza ao projeto e implementação de um sistema inovador e automático para a Reconstrução de Voz Natural a partir de Voz Disfónica (DyNaVoiceR). Este sistema converterá sinais de fala sussurrada em sinais de fala natural através da implantação de vozeamento sintético que é cuidadosamente moldado na frequência e no tempo, de modo a preservar e destacar a informação linguística, a transmitir elementos idiossincráticos da assinatura vocal de um indivíduo, e a melhorar a projeção vocal.

Para além da tarefa de gestão, o projeto estrutura-se em quatro tarefas principais abrangendo múltiplos estágios desde o conceito até à prova do conceito. A primeira tarefa é dedicada à análise e modelização precisa de sinais de voz, para além da segmentação fonética de voz disfónica. Dado ser determinante para todas as restantes tarefas, esta tarefa divide-se em cinco sub-tarefas que ocupam o primeiro ano e meio do projeto. A segunda tarefa é dedicada a técnicas e ferramentas inovadoras para a síntese precisa e controlo de componentes do sinal de voz que são fundamentais para a reconstrução de voz natural a partir de voz disfónica. Divide-se também em duas sub-tarefas, uma delas abrangendo aspetos de excitação de fonte glótica, e outra abrangendo aspetos de filtragem do trato vocal.

As restantes duas tarefas do projeto envolvem a integração e realização da tecnologia assistiva na forma de uma app para smartphones e, também, aspetos de usabilidade e afinação.

Crê-se estarem reunidas as condições para o sucesso dos objetivos do projeto que foi concebido para alavancar a competência multidisciplinar dos seus membros, assim como também a experiência prévia de colaboração em projetos. Acresce que membros da equipa têm estado fortemente envolvidos na investigação de voz disfónica. Um exemplo é um artigo convidado (2016) que lança as sementes da presente proposta.

Entidade Financiadora

FCT

Montante global

239.058,46 €

Montante CINTESIS

13.125,00 €

Referência

POCI-01-0145-FEDER-029308

Duração

01/06/2018 – 31/5/2021

Investigadores CINTESIS envolvidos

Jorge Spratley