Pagina:Codifica numerica del segnale audio.djvu/190

Questa pagina è stata trascritta e formattata, ma deve essere riletta.

172

Codifica numerica del segnale audio

di x sono confinate nell'intervallo [+1,-1]. Con tali posizioni, il metodo di calcolo consiste nel determinare, per opportuni incrementi, il cambiamento di segno del polinomio e quindi rifinire la ricerca con bisezioni successive.

Interpolazione di spettri

I parametri LPC, comunque trasformati, sono impiegati in codificatori cosiddetti parametrici. In considerazione della stazionarietà a breve termine del segnale vocale, tali coefficienti sono da considerarsi rappresentativi delle caratteristiche spettrali del segnale vocale per un intervallo di tempo limitato.

Questo intervallo (frame) è in generale di durata compresa tra 2 e 40 ms. Dato che i parametri LPC devono essere aggiornati e trasmessi ad ogni frame, un frame lungo è spesso richiesto per consentire una bassa velocità di trasmissione. Tuttavia un frame troppo lungo determina parametri spettrali non sufficientemente rappresentativi della dinamica articolatoria, con conseguente introduzione di distorsioni spettrali. Inoltre la lunghezza del frame di analisi determina un contributo fisso al ritardo algoritmico della tecnica di codifica ed anche il ritardo di trasmissione è un elemento da minimizzare in un sistema di codifica. Queste considerazioni sono alla base dell’esistenza di codificatori con lunghezze di trama diverse. E. valore più ampiamente utilizzato rimane forse 20 ms.

Come già detto tuttavia, la soluzione ottima consisterebbe in un frame variabile di lunghezza dipendente dal particolare fonema pronunciato. L’impiego di un frame di lunghezza variabile trova applicazione negli schemi di codifica a velocità variabile di cui si parlerà in seguito. Viceversa, nel caso in cui la lunghezza del frame sia costante, diventa importante assicurare una graduale transizione nel passare da un set di coefficienti ad un set successivo. Tale graduale cambiamento è intrinsecamente giustificato dal modello di produzione del segnale vocale che è caratterizzato da una variazione graduale continua dell’assetto articolatorio. Il metodo più semplice per ottenere tale transizione smussata, consiste nell'interpolazione, solitamente lineare, dei parametri spettrali relativi a set adiacenti. Non tutti i set di coefficienti spettrali esaminati prima forniscono le stesse prestazioni da questo punto di vista.

Una misura della bontà delle prestazioni in questo caso è data dalla distorsione spettrale misurata tra lo spettro interpolato e lo spettro effettivo, nel punto di interpolazione. La figura 5.24 [Toh79] riporta l’andamento della distorsione spettrale per diversi tipi di parametri. Si nota che, nell'intervallo di