Sign in / Join
0

Sabino Cannone: dall’audio immersivo a Dolby Atmos – L’intervista


Sabino Cannone non ha bisogno di presentazioni in Italia ed è molto apprezzato all’estero. Il suo punto di vista sull’audio immersivo e il significato di Dolby Atmos per la prossima discografia non è affatto scontato.

Sabino ha ottenuto la certificazione della sua mixing room per Dolby Atmos 7.1.4, ma da anni lavora nell’audio immersivo per progetti specifici, che gli hanno consentito di esplorare, verificare e sperimentare con una serie di rendering e plug-in diversi da Atmos. Per questa ragione, il suo parere sull’attuale situazione assume un valore unico, perché è in grado di dirci i vantaggi e i limiti dei diversi sistemi.

Luca Pilla Da anni lavori per l'audio immersivo: Dolby Atmos è diventato improvvisamente "necessario" per la scelta operata da Apple. Ti chiedo subito cosa ne pensi. Mossa commerciale e di marketing per offrire qualcosa di nuovo agli utenti e aprire un nuovo mercato?

Sabino Cannone Ci sono più prospettive con cui guardare questa faccenda, e la risposta non è immediata e univoca a mio giudizio. Bisogna fare una piccola digressione su come si è arrivati all’Atmos. Dolby Atmos rappresenta l’evoluzione dei formati “classici” surround. La differenza principale sta nel fatto che la tipologia di mix è “ad Oggetti”. [** box** vedi sotto]
Dolby ha inventato il mix ad oggetti? La risposta è No, Dolby ha però creato un formato, l’Atmos appunto, in cui troviamo assieme una sintesi evoluta dei formati classici che diventano il 7.1.2 (denominati beds) e in più tutta la parte dedicata espressamente al mix degli oggetti. L’Atmos presuppone sempre l’utilizzo di Speakers reali, ma permette anche di essere fruito in una forma emulata attraverso il binaurale usando le cuffie e altri dispositivi. La forma emulata è, nella stragrande maggioranza dei casi, la metodologia di fruizione dell’Atmos attualmente più diffusa per gli utenti finali.

E’ ovvio che quasi nessuno possiede un sistema con 12 speakers, ma moltissimi possiedono cuffie, soundbars o sistemi combo in grado di replicare una forma di Atmos che è sempre una esemplificazione di quello che si può vivere con gli speakers reali. Il Binaurale è una tecnologia che esiste da tantissimo tempo e da sempre è utilizzata tramite vari plug-in per conferire a certi elementi del mix delle posizioni tridimensionali simulando posizioni spaziali che vanno oltre il fronte stereo a costi (e con sforzi) decisamente più contenuti. La Apple ha deciso ad un certo punto di supportare questo formato e il binomio Dolby&Apple sta diventando sorprendentemente un “must have”; la pubblicazione di diversi album in questo formato sono la riprova che c’è comunque interesse a questo formato da parte dei produttori e delle label.

E’ quindi un fatto positivo per i creatori di contenuti: l’argomento Dolby Atmos sta avviando in certi contesti alcuni business, nella musica non legata al cinema, con prospettive però sul lungo termine di cui al momento è difficile prevederne l’esatta evoluzione e consistenza. Il mondo del business si muove grazie al marketing non è un mistero, c’è molto marketing dietro questa operazione e quello che è venduto è un prodotto di altissimo livello tecnologico ma veicolato (vedi streamig binaurale) a una frazione del suo potenziale reale semplicemente perché l’utente finale non ha quasi mai i mezzi per poterne beneficiare al meglio attualmente. Ma dagli speaker reali (situazione ottimale) alle cuffie (situazione minima) stanno comparendo sul mercato diversi device che permettono sempre più di avere una emulazione del suono immersivo più dettagliato.

La diffusione di sistemi di qualità domestici sarà la chiave del futuro per far collimare in modo più consistente la potenza dell’Atmos e la fruizione da parte degli utenti finali.

MoReVoX Studio dolby Atmos surround mixing sabino cannone intervista luca pilla audiofader audio immersivo

LP Conosci alla perfezione i sistemi di audio immersivo Barco, Flux e Dolby Atmos. Puoi dirmi le differenze, i pregi e i difetti di ognuno di essi?

SC Il Sistema Flux è senza ombra di dubbio il software più evoluto attualmente disponibile. Flux permette di configurare qualsiasi sistema di ascolto con una flessibilità totale, inoltre include un potentissimo ed evoluto processore di riverbero multicanale. Flux è l’unico sistema che supporta più leggi di panning immersivo. In un modo simile al mix stereo, nel mix immersivo esistono più formati di panning i più noti sono VBAP, VBIP, ma ci sono altri anche altri molto interessanti e di più recente sviluppo. Il Render Binaurale di Flux inoltre è flessibilissimo e permette varie configurazioni.

Il Sistema Barco, come quello Flux, ha una grande flessibilità di configurazione, si integra perfettamente con i sistemi Nuendo, ma è un sistema decisamente votato alle installazioni multimediali fisse e presuppone l’utilizzo di hardware specifico per il playback finale. Dolby Atmos è un formato definito e chiuso pensato principalmente per geometrie simmetriche. Il suo standard, pur limitandolo in qualche modo è il suo punto di forza, è un sistema pensato per la diffusione in larga scala garantendo la portabilità uniforme dei media.

LP Steinberg Nuendo nasce nativo per l'audio immersivo, mentre per Avid Pro Tools occorre avere i relativi plug-in. Che differenze operative hai trovato tra le due DAW, anche in termini di risultati?

SC Nuendo già con i formati chiamiamoli pre Atmos è sempre stato evolutissimo. Usando Nuendo si ha la chiara sensazione che dietro ci sia un team di persone, consulenti e professionisti reali che si sono fatti già le tue domande e tu trovi già pronta la risposta. Nuendo infatti, seguendo questa fantastica flessibilità, supporta direttamente Atmos. I risultati finali sono i medesimi, ma il fatto di usare il Renderer Dolby esterno con Pro Tools rende ovviamente tutto il routing più macchinoso e meno immediato oltre a pesare, per ovvie ragioni, maggiormente sul carico CPU.

LP Convertire uno studio classico in audio immersivo non è solo un problema di numero di speaker e posizionamento. Il mix a oggetti che sfide pone rispetto al classico mix stereo?

SC Il mix ad oggetti, come il mix surround classico, presuppone un modo diverso di approcciarsi da diversi punti di vista. L’estetica e la proiezione nella costruzione dei mix è totalmente differente.
Ovvio le nozioni base di processing sono le medesime, ma l’approccio al panning è per forza di cosa totalmente differente. L’approccio varia inoltre in modo molto più sensibile rispetto alla tipologia di progetto. In un brano Jazz o di musica classica ad esempio si dovrebbe tendere più a ricreare un environment di ascolto più che a creare automazioni bizzarre; allo stesso modo brani di natura elettronica si prestano maggiormente a panning e movimenti più estremi.

L’obbiettivo resta sempre il medesimo per me, creare una situazione di coinvolgimento superiore allo stereo evitando il più possibile distrazioni d’ascolto. Anche il numero di speaker coinvolto negli spostamenti e nel panning gioca un ruolo importante e le relazioni fra speaker è fondamentale per creare una solidità di immagine sonora (vedi gestione dei beds in Atmos).

MoReVoX Studio dolby Atmos surround mixing sabino cannone intervista luca pilla audiofader audio immersivo

LP Se ci vorrà una trasformazione di interi cataloghi da stereo a Dolby Atmos, occorrerà avere le tracce originali o prevedi un sistema per enfatizzare la parte binaurale partendo da un master stereo?

SC I mix immersivi dovrebbero essere realizzati partendo dalle tracce separate, inoltre non sempre gli stem stereo funzionano quando usati come submix per un risultato ottimale specie quando sono poi ascoltati in binaurale. Nel caso di Stem è sempre preferibile quantomeno avere la parte Dry e quella Wet separate, specie per le parti Lead. Pensare a sistemi di Upmix pseudo-automatico è una cosa che probabilmente in certi casi accadrà, perché per forza di cose per una miriade di brani non saranno disponibili ne gli stem ne tanto meno i multitraccia, senza considerare la complessità di gestione di tutto ciò che concerne l’approvazione da parte dei legittimi proprietari intellettuali e produttori questi nuovi mix.

Non è difficile capire perché molti dei mix che si stanno eseguendo attualmente siano fatti pensando principalmente al binaurale; questo molto spesso perché si pensa che l’utilizzo primario sarà quello, in seconda battuta perché è eseguito da Stem insufficienti a creare un reale mix immersivo; queste due considerazioni ci portano a capire come mai l’approccio utilizzato nei mix sia spesso basic: posiziono gli effetti dietro e la parte diretta davanti e stop, non c’è una estetica e una creazione immersiva. Il mix surround/immersivo necessita una conoscenza dei mezzi e la creazione attraverso gli effetti di un ambiente di ascolto ad hoc, cioè fatto il mix stereo la versione immersiva non dovrebbe essere un effetto applicato ma un’opera a parte per esprimersi al meglio.

Tuttavia con le logiche attuali di produzione dove si lavora sempre in remoto, già la difficoltà di dialogo studio/produttore/artista per fa valutare un mix immersivo pone in partenza molti limiti (ndr, vedi il tutorial per Avid Carbon, Pro Tools e Dolby Atmos). Il punto nodale della questione è proprio questo: la complessità e potenza del formato e la consistenza di dialogo in fase di produzione prima e di distribuzione dopo.

LP Nel caso di dowmix, sono certo che avrai fatto delle prove: quale tra i sistemi che hai usato riesce meglio nel riportare il mix in stereo?

SC Si equivalgono abbastanza. Flux ha una grande flessibilità perché permette di cambiare l’algoritmo. Dolby permette di variare la posizione degli oggetti con cui il render binaurale considererà il posizionamento in quattro posizioni Off/Near/Mid/Far; questi parametri possono cambiare in modo abbastanza radicale il mix binaurale finale. Bisogna considerare però anche che ogni sistema di streaming si comporterà comunque in modo leggermente differente, per cui il binaurale di Apple sarà diverso da quello di Amazon.

MoReVoX Studio dolby Atmos surround mixing sabino cannone intervista luca pilla audiofader audio immersivo

LP Il mix a oggetti pone problemi inediti anche per equalizzazioni, compressioni ed effetti: cosa hai imparato in questi anni quando devi applicare effetti a canali che non siano centrali?

SC E’ un argomento complesso che ha diverse considerazioni da fare. A grandi linee il processing di base delle tracce singole è il medesimo, anche se spesso è necessario fare dei fine-tuning sulle equalizzazioni quando si costruisce il mix immersivo cercando di replicare il tono del mix stereo. Questo cambia perché, per ovvie ragioni fisiche di propagazione, un suono frontale raggiunge le nostre orecchie con una risposta in frequenza differente da quello che succede se lo stesso suono è posto in alto o dietro. Quello che cambia realmente è il processing sul Master bus del mix stereo prima dell’immersivo, e poi bisogna considerare che il mix immersivo non ha un master su cui applicare processi globali.

Cioè mixando in stereo se adotto ad esempio un bus compressor, o un EQ dinamico, questo sarà influenzato dal mix nella sua interezza e se decido di ricavare degli stem anche accurati con tracce dry ed efx separati, questi non daranno luogo al suono del mix originale quando sommati. Cioè qualsiasi processing globale sul master stereo non potrà o potrà essere usato solo in parte quando si creerà il mix immersivo. Quindi le tracce dovranno necessariamente essere riprocessate per ricreare il suono del mix originale in stereo e farle collimare anche con le equalizzazioni rese necessarie dal posizionamento immersivo. Ricreare il glue delle tracce in immersivo a volte può essere difficile. Gli unici processing multicanale globali che si possono fare sono sui Beds, che vanno utilizzati come jolly per ricreare in molti casi le fondamenta del nostro mix musicale.

LP Se si muove Apple, e così è stato anche per il valore LUFS che era differente da quello previsto dallo standard, tutti drizzano le orecchie. La scelta di Dolby Atmos ti sembra la più adatta per chi ascolta in streaming?

SC Dolby Atmos, come dicevo prima, è un sistema pensato per la larga diffusione. L’assenza della possibilità di configurare il setup di speaker con geometrie asimmetriche (cosa che invece è possibile con gli altri sistemi) è dettato dal fatto di creare uno standard anche nella tipologia delle sale di ascolto; Dolby Atmos è stato pensato principalmente per il cinema ed è l’evoluzione dei vecchi formati surround standard che vede come matrice di derivazione la 7.1 nella configurazione music (da non confondere con la SDDS). Dolby è sempre stato lo standard più diffuso a livello mondiale. Apple doveva adottare un sistema che abbracciasse tutti i formati (video e audio) e che fosse universale, non credo avrebbe potuto prendere decisione diversa (ndr Apple e Dolby sono anche fisicamente vicine). Sarebbe stato interessante vedere una proposta alternativa di DTS, storico competitor di Dolby!

LP La dinamica di Dolby Atmos pone molte sfide in fase di mix: che idea ti sei fatto nell'audio immersivo circa la gestione della dinamica secondo i generi musicali?

SC Non farei una differenza per generi ma di approccio generale al mix. L’impossibilità di utilizzare processing finali globali impone di controllare le dinamiche sulle singole tracce in modo molto più dettagliato e spesso di creare molte più relazioni di sidechain fra le tracce. Anche in questo caso l’utilizzo dei beds può tornare utile per creare, quando possibile, una certa consistenza dinamica Il limite max di -18 LUFS e l’assenza di un master processing saranno forse il motivo per cui si inizieranno a vedere realmente dei mix dinamici. Questo approccio condizionerà inevitabilmente sempre di più anche i relativi mix stereo.

LP Se un sound engineer decidesse di approfondire il tema dell'audio immersivo, cosa consiglieresti?

SC E’ un argomento totalmente nuovo e ci sono approcci e filosofie diverse del mix immersivo. Come sempre una conoscenza approfondita dei Tools (vedi studio dei manuali) è un grande punto di partenza, ci sono diverse valide risorse video anche gratuite e poi come sempre prove e test sul campo. Ascoltare le storie e le esperienze di colleghi aiuta come sempre a imparare, a farsi un’idea e a maturare la propria visione per un argomento che ripeto si sta ancora scrivendo.

Il mix ad oggetti

Il Mix ad Oggetti è una tipologia di mix in cui gli elementi non sono legati agli speaker utilizzati ma il panning viene registrato in forma di metadata in modo che il mix si possa adattare al numero degli speaker utilizzato mantenendo le proporzioni di posizionamento e automazione dei movimenti. Ad esempio, nel caso dell’Atmos, un mix creato su una matrice standard 7.1.4 può essere riprodotta su un sistema ridotto come un 5.1.2 e più grande mantenendo uniforme la relazione dei movimenti.

MoReVoX Studio dolby Atmos surround mixing sabino cannone intervista luca pilla audiofader audio immersivo