Pagina:Codifica numerica del segnale audio.djvu/245

Questa pagina è stata trascritta e formattata, ma deve essere riletta.

6 - Codifica per modelli

227

a frequenze del pitch comprese tra 50 e 400 Hz.I parametri del filtro di sintesi a lungo termine possono essere calcolati in catena aperta sul segnale vocale con i metodi classici [Hes83], oppure possono essere determinati in catena chiusa, come per il segnale di eccitazione, minimizzando anche in questo caso l’errore pesato percettivamente. In ogni caso devono essere quantizzati e trasmessi al ricevitore ad ogni frante o anche più rapidamente, in considerazione del cambiamento delle caratteristiche del segnale. Si vedrà in seguito come anche questo blocco possa essere sostituito da strutture più sofisticate, al fine di consentire una miglior fedeltà di riproduzione della frequenza fondamentale.

Il segnale ${\hat {r}}(n)$ così prodotto prende il nome di segnale residuo ricostruito ed alimenta un secondo filtro lineare di sintesi, responsabile dell’introduzione dell’informazione legata alle formanti e cioè relativa alla correlazione a breve termine. Di tale filtro e dei dettagli relativi al calcolo e trasformazione dei parametri si è già parlato nei capitoli precedenti. In alcuni casi particolari, con lunghezza del vettore molto corta (4 o 5 campioni), i parametri possono essere calcolati sul segnale vocale ricostruito (in backward) e pertanto non devono essere trasmessi in quanto possono essere ricavati anche al ricevitore. È il caso ad esempio del codec ITU-T G.728 (LD-CELP). L’uscita del filtro P_LT(z) rappresenta il segnale vocale ricostruito ${\hat {X}}(n)$ .

Il blocco successivo è costituito dal filtro lineare tempo variante W(z), impiegato per sagomare spettralmente il segnale errore di quantizzazione ε(n). L’idea dell’introduzione di questo blocco trae origine dall’osservazione che a basse velocità di trasmissione, il rapporto segnale su rumore ottenibile è di soli pochi dB. In queste condizioni, un errore di quantizzazione a spettro piatto, quale si otterrebbe senza nessuna sagomatura del segnale errore ε(n), porterebbe alla situazione illustrata in figura 6.16 in cui l’SNR può essere molto alto in corrispondenza della prima formante, ma anche negativo in certe porzioni dello spettro.

L’idea è quindi quella di sagomare spettralmente il segnale £(n), al fine di ottenere un segnale errore del quale minimizzare l’energia nel processo di selezione del vettore di eccitazione. La funzione di trasferimento impiegata nel blocco W(z) è quella originariamente proposta da Atal negli studi sulla tecnica di codifica APC (Adaptive Predictive Coding) [Ata79] e successivamente impiegata nel codificatore Multipulse. Il blocco prende il nome di filtro di pesatura spettrale ed è definito dalla funzione di trasferimento