Pagina:Codifica numerica del segnale audio.djvu/294

Questa pagina è stata trascritta e formattata, ma deve essere riletta.

276

Codifica numerica del segnale audio

flusso generato [ITU-T G.802], La quantizzazione è adattativa e per l’aggiornamento del quanto si utilizzano solamente i quattro bit più significativi. In questo modo l'algoritmo non è influenzato dalla modalità di funzionamento.

Il predittore è simile a quanto descritto a proposito della raccomandazione G.721, con una struttura data dalla combinazione di un filtro a soli poli del 2° ordine ed uno a soli zeri del 6° ordine. I coefficienti di entrambi i filtri sono adattati tramite LMS con crosscorrelazione di polarità tra segnale ed errore.

7.2.3 Codifica per sottobande tramite modelli percettivi

La codifica di forma d’onda per sottobande precedentemente esposta tende alla ricostruzione fedele del segnale emesso dalla sorgente tramite una quantizzazione adattativa variabile per le differenti componenti spettrali. D’altra parte, grazie alla rappresentazione in frequenza fornita dalla codifica per sottobande, sarebbe possibile ottenere migliori rapporti di compressione sfruttando gli aspetti percettivi dell’apparato uditivo, eliminando componenti non rilevanti del segnale.

In particolare, la soglia di udibilità statica non è uniforme in frequenza, per cui è possibile sopprimere in fase di codifica quelle componenti spettrali la cui ampiezza è inferiore al valore della soglia per quella particolare frequenza. Inoltre, per quanto riguarda le componenti non mascherate e continuando a considerare esclusivamente la soglia di udibilità statica, la sua non uniformità permette di distribuire non uniformemente lo spettro del rumore di quantizzazione utilizzando quanti differenti per ciascuna sottobanda.

Il vantaggio maggiore, però, si ha considerando gli effetti di mascheramento. Come descritto nella presentazione dell’apparato uditivo, si ha una variazione locale e variabile nel tempo della soglia di udibilità in corrispondenza delle componenti spettrali del segnale. Questo permette di fissare per ciascuna sottobanda il livello ammissibile del rumore di quantizzazione, assegnando un opportuno numero di bit, in modo tale che questo si trovi al di sotto della soglia di udibilità istantanea e, quindi, non sia percepibile. Inoltre è possibile evitare totalmente la trasmissione di informazioni relative a sottobande che risultano totalmente mascherate.

Ciò richiede la realizzazione di un modello dell’apparato uditivo, detto modello psicoacustico o percettivo, in grado di fornire in tempo reale la soglia