Speciale audio per il broadcast: interpretare i numeri

ITU- R BS 1770, EBU R 128, sono la base dei documenti di riferimento sulla questione del loudness. LRA, EBU SCALE, dBTP, sono elementi utili e indispensabili utilizzare per comprendere una misurazione loudness.

Riprendiamo con questo secondo articolo la disamina della questione del loudness che, tanto in tv, come nel cinema e nella discografia, risulta essere indispensabile come nuovo punto di riferimento della misurazione della percezione sonora. Riepilogando alcuni concetti fondamentali già citati nel primo approfondimento, ricordo che il loudness ci permette di avere una realistica e veritiera misurazione della percezione sonora di un programma audio, sia esso musicale che televisivo o cinematografico. Questo non era possibile seguendo semplicemente la misura ottenuta dai peak meter presenti nei nostri banchi audio i quali ci davano solamente un’indicazione del livello elettrico della media o dei picchi di segnale ma non della percezione sonora.

Il risultato del loudness è stato raggiunto grazie a un nuovo algoritmo descritto nella norma ITU R BS 1770 e sue successive modifiche e dalla norma EBU R128 e documenti allegati. Ricordo nuovamente che il riferimento di tale misura è il -23 LUFS, + o - 0,5 LU o + o -1 LU per i programmi audio live. A questo proposito, EBU indica la possibilità di misurare il loudness secondo due metodi di misura, una relativa e l’altra assoluta. La misura relativa viene indicata da LU (Loudness Unit) mentre la misura assoluta da LUFS (Loudness Unit Full Scale). Date queste premesse è bene sottolineare come -23 LUFS è uguale a 0 LU. Andiamo ora ad approfondire alcune tematiche collaterali di cui potete trovare descrizione nei documenti EBU TECH 3341, 3342, 3343, 3344. Il gruppo di lavoro EBU PLoud, facendo riferimento alla norma ITU 1770, ha implementato alcune misure non solo del loudness ma anche della misurazione peak meter e della variazione loudness nel tempo. Innanzitutto è bene ricordare i tre tipi di misurazione del loudness introdotti da EBU: momentary, short e integrated. I primi due sono stati pensati per misurazioni di programmi di breve durata, mentre il terzo è stato concepito per misurazioni di interi programmi sonori di più lunga durata. Un pratico esempio della differenza fra un mix che ha come riferimento il Peak meter e uno con il Loudness, viene ben esplicitato dalla figura, tratta dal documento EBU TECH 3343. 2.1 Peak vs. Loudness.

Il concetto di normalizzazione attraverso il picco massimo, avveniva con un riferimento di livello massimo permesso a -9 dBFS. La sicurezza di questa famosa e temuta soglia psicologica e tecnica dei -9 dBFS era, per il broadcast, garanzia di trasmissioni televisive senza picchi o distorsioni. Questo permetteva di avere programmi sonori uniformi dal punto di vista dei picchi ma molto vari nel livello loudness. La variazione di livello era dipendente dal programma stesso e dal grado di compressione dinamica del segnale. Una normalizzazione di tipo loudness invece, raggiunge lo scopo lasciando variare il livello di picco a seconda del contenuto e della volontà artistica e tecnica. Ciononostante il livello loudness rimane costante permettendo all’ascoltatore di avere una percezione sonora uniforme durante tutto il programma senza dover ricorrere a continui aggiustamenti del volume d’ascolto.

Una volta definito questo concetto, si è voluti andare oltre queste colonne d’Ercole dell’audio per permettere dei mix più dinamici, senza però dover correre il rischio di distorsioni del segnale. Questo non era possibile con i classici QPPM in quanto non potevano rilevare picchi minori di 10 ms. Si era visto che picchi più veloci di 10 ms avevano un’escursione variabile da 6 a 8 dB in più rispetto al valore visualizzato. Per tale motivo con la misurazione a mezzo QPPM, nel broadcast, non si permetteva di superare la soglia massima di -9 dBFS proprio per non avvicinarsi allo 0 dBFS digitale. Ecco che -9 dBFS era una soglia di sicurezza accettabile.

A tale proposito, quindi, EBU ha introdotto una nuova misurazione del picco di segnale: il TruePeak meter cioè un meter che, sovracampionando il segnale digitale, è capace di rilevare eventuali picchi fra sample e sample o comunque minori di 10 ms. Questo ha permesso di ottenere un programma sonoro più dinamico dove i picchi possono raggiungere un livello molto più alto con un valore massimo di -1 dBTP! Una bella differenza in termini dinamici e di sicurezza dei livelli misurati. Passiamo ora ad esaminare il terzo aspetto presente nella EBU R128 ovvero: Loudness Range Average.

Il Loudness Range Average, da ora abbreviato con LRA, quantifica la variazione della misurazione loudness nel tempo. LRA è visto come elemento complementare al Programme Loudness di EBU R 128. Loudness Range misura la variazione loudness in una scala macrotemporale in unità di LU (Loudness Units cioè con scala relativa). Il calcolo di LRA è basato sulle già note specifiche di misura loudness della ITU-R BS.1770 ma con una diversa soglia di gating. L’algoritmo capace di effettuare tale misurazione è basato su una computazione statistica del loudness misurato. Anche qui, il risultato che si vuole ottenere, cerca di escludere dalla misurazione momenti sonori brevi come picchi improvvisi, così come elementi con livello audio troppo basso come un fade out. La finestra di analisi si basa su porzioni audio di 3 secondi con una sovrapposizione fra due misurazioni consecutive per prevenire eventuali imprecisioni nella misurazione di programmi di breve durata. La misurazione prevede inoltre due tipi di gating, con soglie differenti. La prima si trova a -70 LUFS definita come thresold minima di livello audio sotto il quale generalmente non si riscontrano segnali audio rilevanti. La seconda si trova a -20 LU, visti cioè in scala relativa. L’applicazione di queste soglie ci permette di acquisire nella misurazione solamente il segnale audio che abbia una certa robustezza e continuità nel tempo, tralasciando picchi improvvisi troppo alti o segnali di sottofondo molto bassi che potrebbero compromettere la misurazione stessa. L’ampiezza di questa distribuzione di loudness level lungo il programma sonoro, viene poi calcolata secondo una misurazione percentile dalla quale sono esclusi le parti minori del 10% e maggiori del 95% della misurazione. Il risultato di questo calcolo esprime il valore numerico di LRA. Non esiste un valore massimo permesso, EBU solamente incoraggia il suo utilizzo per aiutare il fonico a decidere eventuali correzioni in termini dinamici. Solo come esempio vengono citate alcune esperienze di broadcaster che hanno come riferimento un massimo valore di 20 LU per i programmi in multicanale, senza dover utilizzare delle riduzioni dinamiche. Per i programmi stereo è stato rilevato come significativo un valore di riferimento di 15 LU.

Affinchè un loudness meter possa definirsi EBU compliant, deve passare attraverso dei test di misura minimi, durante i quali sono richieste alcune tolleranze di LRA come indicato nella tabella qui sotto. La misurazione del loudness, secondo EBU, può avvenire attraverso l’uso di due scale di misura dette : EBU +9 Scale e EBU +18 Scale con i loro relativi diversi valori minimi e massimi di misurazione in versione relativa (LU) e assoluta (LUFS). La prima viene raccomandata per la misurazione della maggior parte dei programmi sonori. La seconda invece, viene consigliata per programmi sonori con un ampio LRA.

range -18.0 LU to +9.0 LU (-41.0 LUFS to -14.0 LUFS), chiamata ‘EBU +9 scale’.
range -36.0 LU to +18.0 LU (-59.0 LUFS to -5.0 LUFS), chiamata ‘EBU +18 scale’

Nel broadcasting il sistema di allineamento consiste di un segnale sinusoidale tipicamente a una frequenza di 1 kHz che viene usato per un allineamento tecnico dei programmi sonori. La norma, in ambito digitale, ci dice che il suo livello deve essere 18 dB più basso del massimo livello consentito indipendentemente dal campionamento (−18 dBFS). L’introduzione della misurazione loudness non cambia assolutamente questo approccio. Un allineamento tecnico di questo tipo, non obbliga a una relazione con il metering o la misurazione del loudness. Ciononostante, è bene aggiungere che in termini di livelli di allineamento dei segnali, un tono da 1 kHz in fase in un canale stereo a -18 dBFS, verrà visualizzato sul Loudness meter a -18 LUFS o +5 LU. Qualora invece si utilizzasse un canale mono, il livello loudness visualizzato dovrà essere di -21 LUFS o +2 LU.

Giunti a questo punto, la domanda che ci poniamo è: qual è il livello d’ascolto espresso in dBSPL corretto in relazione al -23 LUFS di loudness? Detto in altre parole, la questione riguarda quale deve essere il corretto allineamento acustico da tenere all’interno della nostra control room in relazione alla misura loudness di -23 LUFS. Anche il gruppo PLoud si è posto questa domanda partendo dai riferimenti EBU riguardanti il livello di ascolto e modificandoli in base alle esperienze avute. Ciò che viene definito come Reference Listening Level di un sistema di riproduzione sonoro, rappresenta la sensibilità di un sistema di playback che corrisponde allo 0 dBr nel potenziometro di controllo del volume di una CR. Questo dovrebbe essere il livello di ascolto di riferimento corretto. Ovviamente, a questo livello di ascolto corrisponde un livello di pressione sonora, tanto nella nostra sala di mix quanto in un home theatre di casa. Partendo dal documento EBU Tech Doc 3276-E-1998 e sue successive modifiche, è stato rilevato che quest’ultimo non era utilizzabile per un contesto di normalizzazione loudness e andava modificato come segue. La procedura descritta è valida per sistemi che vanno dal 1.0 al 5.1.

Ogni speaker va tarato secondo la seguente indicazione:

LLISTref = 73 dBC SPL, usando un segnale (rumore rosa) da 500-2000 Hz a −23 LUFS

Per fare ciò, si invia un segnale monofonico di rumore della stessa energia per ottava (rumore rosa) che copra le frequenze da 500 Hz a 2000 Hz. Per generare questo segnale filtrato, viene richiesto un filtro da un terzo d’ottava in accordo con la norma IEC 61260. Il segnale di test deve raggiungere il livello di −23 LUFS. In queste condizioni, il gain di ogni speaker deve essere settato fino a raggiungere un livello SPL di 73 dBC. La misurazione va effettuata nella posizione normale di ascolto, posizionando il microfono all’altezza delle orecchie con una pesatura C a risposta lenta (slow response). Lo scostamento del livello fra due altoparlanti non dovrebbe essere superiore a 1 dBSPL.

Nei sistemi surround 5.1, il canale dedicato alla riproduzione delle basse frequenze LFE, necessita di una calibrazione separata che non tratteremo in questo articolo. La sopracitata taratura di allineamento acustico è valida per delle mixing room con una grandezza compresa tra i 125 e i 250 metri cubi.Il link al file audio di test è disponibile al seguente indirizzo web: https://tech.ebu.ch/publications/rll001

Si è constatato che il livello medio di un programma sonoro in accordo con EBU R128 è tipicamente 3 LU più basso dello stesso programma livellato sulla normalizzazione QPPM. La procedura di allineamento acustico sopra descritta, assicura un alto rapporto segnale rumore e un ottimo livello di ascolto anche per segnali audio con grande dinamica. Permette inoltre di riportare l’ascolto al corretto livello in relazione alla misurazione loudness. Si consiglia perciò, non solo di utilizzare il loudness meter come nuovo strumento di misura, ma di allineare il vostro ascolto a questo nuovo parametro. Al momento non è stato trovato un metodo soddisfacente di misura della pressione sonora per l’ascolto in cuffia. EBU suggerisce di settare il livello di percezione loudness di queste ultime in modo che sia comparabile con quello dei vostri near field.

Ultimo ma non meno importante aspetto legato al loudness, riguarda la sua gestione all’interno delle molteplici piattaforme audio-video digitali presenti nel web. Dato che di fatto non esiste ancora un punto comune a riguardo, le varie piattaforme di streaming audio hanno dei parametri e dei target level diversi. Al momento attuale, posso citare i suggerimenti espressi dal comitato tecnico dell’AES nell’ottobre del 2015 nel documento tecnico AES TD1004.1.15-10 “Recommendation for Loudness of Audio Streaming and Network File Playback”: si consiglia di tenere un livello di riferimento loudness per i mobile devices di -16 LUFS. Questo livello serve a evitare eccessivi peak limiting e permettere un adeguato range dinamico del programma sonoro.

Si raccomanda un target loudness non più basso di -20 LUFS. Si è visto infatti che tale livello risulta essere già troppo basso per un buon volume di ascolto attraverso i device mobili.

Si raccomanda che per i programmi di breve durata (massimo 60 secondi) il parametro di maximum short-term loudness sia al massimo 5 LU più alto del target loudness: questo ci assicura che le inserzioni commerciali o altri programmi audio così corti, abbiano un livello consistente di loudness.

Si raccomanda infine di non superare i limite massimo di −1.0 dB TP: questo per prevenire clipping quando si utilizzano lossy encoders. I livelli attuali di riferimento di alcune piattaforme sono i seguenti:

Apple music: - 16 LUFS

YouTube: -13 LUFS

Spotify: -14 LUFS

Tidal: -14 LUFS

Questi diversi livelli di normalizzazione loudness, non vanno raggiunti durante il proprio mix ma verranno implementati automaticamente dal player di riproduzione stesso.

In questi due articoli ho cercato di esaminare e descrivere gli aspetti più importanti della tematica loudness, ben conscio che ci sarebbero ancora molti argomenti correlati di cui parlare. A questo proposito, per chi volesse approfondire, consiglio i seguenti link EBU dove trovare i riferimenti corretti per la vostra curiosità.

https://tech.ebu.ch/docs/tech/tech3341.pdf

https://tech.ebu.ch/docs/tech/tech3342.pdf

https://tech.ebu.ch/docs/tech/tech3343.pdf

https://tech.ebu.ch/docs/tech/tech3344.pdf

Si ringraziano Simone Corelli e Claudio Pezzotta per il proficuo scambio di idee e suggerimenti.

Allegati