Pagina:Codifica numerica del segnale audio.djvu/313

Da Wikisource.

7 - Codifica nel dominio della frequenza 295

Fig. 7.17 - Codifica MPEG-l/Audio/Layer III.

larghezza di banda dei filtri (750 Hz) era eccessiva se paragonata a quella delle bande critiche (100 Hz) (vedi tab. 1.1). La trasformata viene eseguita su blocchi di dimensioni variabili da 12 (considerando separatamente ciascun sottoblocco) a 18 campioni (considerando l’intero blocco scomposto in due parti). Questo è fatto per tenere in conto fenomeni di pre-eco dovuti a variazioni di dinamica del segnale. Considerando una MDCT su 18 campioni, si ottiene una risoluzione in frequenza di circa 40 Hz, sufficiente per risolvere le bande critiche. Ovviamente, la risoluzione temporale viene peggiorata.

Come detto, la dimensione della finestra di analisi è resa variabile in funzione delle caratteristiche del segnale, classificato in quattro differenti stati (normal, start, stop, short). La rilevazione di un transitorio avviene in funzione dello scostamento del risultato della bit allocation dal valor medio, con relativo accesso al bit reservoir. Questo approccio si giustifica per il fatto che nei transitori sono presenti sia campioni con ampiezze elevate (che portano ad innalzare la soglia di saturazione del quantizzatore e quindi il fattore di scala), sia porzioni di segnale con ampiezze modeste (che richiedono quanti di ampiezza ridotta e quindi elevato numero di livelli): questo complessivamente provoca un brusco aumento di bit richiesti nella codifica.

Il modello psicoacustico utilizzato per il Layer III è basato su FFT, ma si adotta una finestra variabile di 1024 o 256 campioni, in funzione della stazionarietà del segnale (Modello II). Inoltre, calcolato Io spettro in modulo e fase, tali valori vengono anche stimati da quelli ottenuti nei precedenti due blocchi. Per non appesantire eccessivamente gli aspetti computazionali, tale