(da Audio Review n.71 – aprile 1988)
di Renato Giussani
Limiti della stereofonia tradizionale e proposte di superamento
AUDIOreview ha già pubblicato diversi articoli concernenti l’ascolto stereofonico e le tecniche non convenzionali.
A parte troverete un breve elenco.
Come vedete, l’ultimo articolo della lista pubblicato a mia firma risale al dicembre del 1984.
Nei tre anni e tre mesi trascorsi da quel momento, mentre sul fronte delle tecniche di registrazione e riproduzione abbiamo assistito ad una notevole rivoluzione del mercato causata dal progressivo e inarrestabile imporsi delle tecniche digitali, CD in testa, per quel che riguarda le possibilità di intervento più diretto sulla qualità della ricostruzione stereofonica non è cambiato quasi nulla.
Eppure, i limiti accertati posti dall’uso pratico della stereofonia classica, sono ormai numerosissimi e l’impegno profuso in questi ultimi anni per superarli, sia dai centri di ricerca e dai progettisti delle aziende, sia dagli studiosi indipendenti, è stato più rilevante di quanto comunemente non si creda.
Una migliore comprensione dei problemi che rimangono da risolvere e che si frappongono al funzionamento ottimale di un normalissimo sistema stereo può aiutare anche noi utenti a migliorare la qualità dei nostri ascolti.
Premessa storica
All’inizio era l’alta fedeltà, poi venne la stereofonia.
Potrà sembrare una affermazione assurda e forzatamente scandalistica, ma purtroppo non è proprio questo il caso. Il risultato che voleva perseguire Edison quando costruì il suo primo grammofono era relativamente semplice: consentire di interporre uno o più intervalli di tempo lunghi a piacere fra la emissione di un suono e la sua percezione, sia pure distorta ma tale da permetterne un sufficiente riconoscimento, da parte dell’ascoltatore. Detto in altre parole, il suono avrebbe dovuto essere congelato sul cilindro in modo da poterne essere estratto a comando, quando e quante volte si volesse, rendendo così possibile sia una vera e propria archiviazione dei suoni che una fruizione differita da parte di un numero qualsiasi di ascoltatori. Tralasciando di sottolineare in questa sede le incredibili inferenze pratiche, sia sul piano culturale che su quello sociale della tecnica regalataci da Edison, proveremo invece ad accertare se e quanto lo stato evolutivo cui questa è pervenuta con più di un secolo di storia debba essere considerato uno stadio finale ormai ottimizzato, piuttosto che il punto di partenza per ulteriori evoluzioni in grado di influire ancora più profondamente sul modo di vivere dei nostro futuro.
Nel processo di registrazione-riproduzione proposto da Edison, tutta l’attenzione era inizialmente rivolta al suono captato della tromba-microfono ed era implicitamente considerato sufficiente riuscire a riprodurre una approssimazione di quel suono, senza particolari attenzioni alle caratteristiche della scena acustica da cui esso proveniva.
Ciò non toglie che, grazie alla apertura mentale dei più fantasiosi fra gli esperti e gli appassionati coinvolti in prima persona, anche con un solo canale di registrazione del suono e con la qualità (per così dire) di quei tempi, sia stato egualmente possibile superare i limiti teorici della tecnica adottata.
Non spaventatevi, non ho intenzione di ripercorrere tutta la storia della registrazione dei suono da allora ad oggi.
Il breve richiamo storico mi è servito solo per poter sottolineare come, fino all’avvento della stereofonia, la filosofia di base attorno alla quale ha ruotato tutta la tecnica della, registrazione dei suoni sia rimasta di fatto per più di un secolo la stessa di Edison.
La registrazione/riproduzione con un canale
Anzitutto, deve essere chiaro che la fedeltà della riproduzione, da sola, non basta a garantire una stretta aderenza all’originale, inteso come evento acustico reale.
Ciò detto, deve essere altrettanto chiaro che senza una ragionevole fedeltà di riproduzione non avrebbe senso cercare di spaccare il capello in quattro come cercheremo di fare nel seguito.
Eccoci quindi costretti a superare d’un balzo tutto il periodo di tempo che intercorre tra Edison e il raggiungimento di un elevato grado di fedeltà, pur rimanendo ancora nell’ambito della monofonia.
Per prima cosa, un ottimo impianto di riproduzione (monofonico o stereofonico che sia) non può prescindere completamente dalle condizioni in cui il suono è stato registrato, che saranno state scelte anche in relazione alle caratteristiche dell’evento acustico che si voleva realmente registrare. E notate che se ho usato la definizione evento acustico invece della più semplice parola suono è perché lo stesso suono assume una valenza del tutto differente a seconda dei contesto in cui viene emesso e/o percepito.
Ammettiamo, per esempio, di voler registrare il suono emesso da un sassofonista che suona.
Avremo naturalmente un sassofonista che suona, presumibilmente in un ambiente chiuso (ma potrebbe benissimo trovarsi su un prato), ed un microfono atto a rilevare e trasformare in segnali elettrici le variazioni di pressione dell’aria che sono l’essenza stessa delle onde acustiche che lo raggiungono.
Il fatto è che queste onde saranno molto diverse, così come lo sarebbe la percezione che avrebbe di quel suono un ascoltatore che sostituisse idealmente il microfono, nel caso che il microfono fosse posto davanti al sassofono ad una distanza di 5 centimetri, di 1 metro o di dieci metri, a maggior ragione se l’ambiente circostante fosse chiuso e riverberante (una stanza vuota).
La qualità di registrazione/riproduzione resa possibile dalle tecniche oggi disponibili consentirebbe nel primo caso (ripresa a 5 cm dal sassofono) di ingannare molti ascoltatori bendati e far loro credere, durante la riproduzione, che il sassofonista sia presente nella stanza d’ascolto in quello stesso momento.
Da notare che per ottenere questo risultato sarebbe necessario e sufficiente utilizzare un solo canale ed un solo altoparlante (o sistema di altoparlanti, ovvero cassa acustica).
Prima di addentrarci in ragionamenti che necessariamente coinvolgeranno anche un certo numero di nozioni tecniche specifiche, proviamo un momento a verificare la validità di alcuni concetti dati spesso per scontati.
Il microfono posto di fronte al sassofonista che suona, nonostante le apparenze e la nostra affermazione sul risultato conseguibile in caso di ripresa da distanza ravvicinata, non ha mai registrato le onde sonore emesse dal sassofono, bensì le onde sonore che hanno raggiunto il microfono.
Questa semplice considerazione ci permette di affermare che la sensazione fornita dall’ascolto dei suono registrato riprodotto dall’altoparlante non potrà mai essere identica a quella che si proverebbe di fronte al sassofonista che suona nello stesso ambiente, se non nel caso in cui si riuscisse a captare il suono con le esatte caratteristiche che possiede mentre viene emesso. è evidente che il suono possiederà tali caratteristiche, a voler essere particolarmente pignoli, solo nell’istante in cui abbandona la bocca dei sassofono.
Dunque, il problema della corretta registrazione del suono di un singolo strumento potrebbe essere risolto ponendo il microfono esattamente alla bocca dello strumento?
Non esattamente.
Anzitutto si deve osservare che il suono emesso dal sassofono, come dalla maggior parte delle sorgenti acustiche che qui ci interessano, è costituito da uno spettro di molte componenti diverse. Vi sono le note fondamentali, le loro armoniche e tutta una serie di suoni spuri prodotti dallo strumento durante il suo funzionamento, che in molti casi assumono comunque rilevanza musicale.
Anche fermando la nostra attenzione solo alle fondamentali ed alle loro armoniche, possiamo facilmente introdurre un, fenomeno che, come vedremo, merita una considerazione maggiore di quanta non gli venga normalmente riservata.
Intendiamo parlare delle caratteristiche di dispersione del suono da parte delle sorgenti acustiche naturali e degli altoparlanti e di come queste influiscano in modo determinante sia sulle scelte riguardanti le tecniche di ripresa sia sui risultati forniti dagli altoparlanti durante l’ascolto del suono riprodotto.
Immaginate di porvi all’aperto di fronte ad una persona che parla e di farle pronunciare delle parole ricche di sibilanti, ad esempio proprio la parola “sassofonista”.
Ora immaginate di proseguire l’esperimento girando intorno al parlatore fino ad arrivargli dietro, mentre lui continua, imperterrito, a pronunciare: “sassofonista, sassofonista, sassofonista …”.
State pensando di sentire lo stesso suono di quando gli eravate di fronte?
Evidentemente no, e la differenza sta soprattutto in quelle sibilanti, ora meno chiare e quasi attutite.
Il fatto è che il suono emesso pronunciando la parola sassofonista è formato da diverse componenti di frequenza diversa e, mentre le frequenze più basse quando vengono emesse si propagano facilmente in tutte le direzioni, quelle più alte procedono prevalentemente nella direzione verso cui è orientata la sorgente che le emette, in questo caso la bocca dei parlatore.
Ovviamente un fenomeno analogo avviene anche con gli strumenti musicali e, ad esempio, anche con il sassofono.
Tornando al nostro sassofonista, proviamo quindi a registrare il suono ponendo prima il microfono davanti allo strumento e poi via via ad angolazioni diverse rispetto alla direzione frontale: otterremo suoni caratterizzati da timbriche diverse.
Questo significa che lo strumento non emette un unico suono ben definito, ma tanti suoni diversi, uno per ciascuna direzione si prenda in considerazione, e questo è vero per tutti gli strumenti!
Detto più propriamente, lo strumento emette le frequenze che costituiscono un suono complesso (cioè quasi tutti i suoni naturali) con dispersioni diverse.
Immaginiamo di avere effettuato una registrazione ponendo il microfono esattamente all’altezza della bocca di uscita dello strumento.
Ora chiediamo ad un ascoltatore bendato se il suono che viene riemesso dal nostro altoparlante proviene da uno strumento reale o è registrato.
Se il nostro ascoltatore è seduto su un prato, ad una certa distanza di fronte all’altoparlante, molto probabilmente non sarà in grado di dare una risposta sicura. Se invece gli consentiremo di cambiare la sua posizione rispetto all’altoparlante e di girargli intorno, sia pure senza variare di molto la distanza di ascolto, il suo compito sarà enormemente facilitato.
Infatti, mentre il suono che l’altoparlante emette frontalmente ha una elevata probabilità di somigliare abbastanza a quello che si udirebbe di fronte allo strumento reale, il suono che emette ad angolazioni diverse dipende dalla sua dispersione, la quale non varia per tutte le frequenze emesse in modo automaticamente o necessariamente uguale a quello del sassofono.
Chiediamo al nostro amico ancora un poco di pazienza, portiamolo in un ambiente chiuso e ripetiamo l’esperimento.
Ora il suono emesso dall’altoparlante viene riflesso e diffratto dalle pareti, dal pavimento, dal soffitto e dagli oggetti contenuti nell’ambiente e raggiunge l’ascoltatore più volte, con caratteristiche sempre diverse. Queste superfici si trovano tutt’intorno all’altoparlante e ovviamente il suono le raggiunge secondo tante angolazioni diverse.
Anche in questo caso perciò se l’altoparlante avesse a tutte le frequenze la stessa dispersione del sassofono il risultato complessivo potrebbe essere lo stesso.
Ma questa non è certamente la soluzione più desiderabile dato che, se in altre occasioni volessimo ascoltare la registrazione di un violino, o un flauto, o un tamburello, o una voce umana, l’altoparlante-sassofono non fornirebbe più il risultato desiderato. Seguendo questo ragionamento potremmo addirittura arrivare a concludere di dover disporre di altoparlanti specializzati tutti diversi!
Mentre questa via è evidentemente non percorribile, una soluzione ingegneristicamente valida potrebbe però essere quella di scegliere un unico modello di altoparlante caratterizzato da una dispersione tale da avere la più alta probabilità di approssimare al meglio la dispersione del maggior numero possibile di sorgenti acustiche reali (almeno fra quelle che vengono usate più di frequente in ambito musicale).
Due canali
L’approccio filosofico che abbiamo seguito finora, anche se è una base da cui tutte le tecniche di registrazione non possono prescindere, non può assolutamente essere sviluppato al punto di approssimare al meglio il suono di un’intera orchestra.
Immaginare di usare un altoparlante per ogni strumento musicale (oltre ad un canale di registrazione/riproduzione indipendente) è affascinante, ma sbagliato.
Infatti, in questo caso la vostra stanza dovrebbe essere identica all’ambiente in cui avvenne l’esecuzione originale e tutti gli altoparlanti-strumenti dovrebbero essere posizionati come nell’originale reale.
Inoltre, i limiti della capacità di riprodurre la realtà che affliggono un tale sistema sono ben più gravi di quanto non potrebbe a prima vista apparire.
Ad esempio, sarebbe impossibile riprodurre le conseguenze acustiche di qualsiasi movimento degli esecutori, come un cantante che cammina sulla scena.
Scartata l’ipotesi di riuscire a trasportare ciascuna sorgente acustica nel nostro ambiente di ascolto mantenendo le sue caratteristiche inalterate, si può pensare di limitarsi a cercare di offrire una riproduzione capace di creare uno scenario acustico ragionevolmente simile all’originale.
Abbandonata la preoccupazione di riprodurle esattamente il suono di ciascuna sorgente acustica reale, separatamente l’una dall’altra, il nuovo soggetto da registrare e riprodurre diventa il suono emesso dall’insieme di tutte le sorgenti contemporaneamente, ad esempio il suono di tutta un’orchestra sinfonica considerato nel suo complesso. Ponendo un microfono di fronte all’orchestra si potrebbe pensare di captare il suono che sarebbe ascoltato da una persona le cui orecchie fossero poste più o meno nella stessa posizione.
Il modo corretto di riascoltare questa registrazione non sarebbe però quello di farne emettere il suono da un altoparlante, quanto quello di presentarlo direttamente alle orecchie dell’ascoltatore, ad esempio usando una cuffia.
Un ovvio e conseguente perfezionamento di questa tecnica potrebbe consistere nella registrazione separata del suono captato da due microfoni posti alla stessa distanza che separerebbe le due orecchie dell’ascoltatore.
Inviando poi i due segnali ai due padiglioni della cuffia, l’ascoltatore, posto che non si muova, potrebbe provare sensazioni molto simili a quelle che avrebbe provato se fosse stato effettivamente presente all’evento acustico originale.
Questo metodo di registrazione-riproduzione è stato realmente sperimentato e perfezionato al punto da risultare a tutt’oggi quello che può fornire le riproduzioni acustiche più simili alla realtà e prende il nome di registrazione/riproduzione binaurale.
Dato che anche i microfoni posseggono, come gli altoparlanti (e le orecchie), delle ben precise e differenti caratteristiche direzionali a seconda di come sono realizzati, è logico pensare che in questo caso si debbano scegliere dei microfoni che sentono i suoni a seconda della loro direzione di provenienza, in modo simile alle orecchie umane, che per fortuna si somigliano abbastanza un po’ tutte.
Ma, purtroppo, l’ascolto attraverso una cuffia non è generalmente considerato molto realistico.
Anzitutto, isola l’ascoltatore dall’ambiente esterno e tende a trasportarlo troppo drasticamente in un ambiente acustico totalmente separato ed indipendente dalla sua sala di ascolto.
Evidentemente questa condizione è tutto fuorché naturale dato che, mentre l’udito offre sensazioni correlate all’evento registrato, tutti gli altri sensi continuano a ricondurre ad una situazione ambientale differente. Questo è, ad esempio, il motivo per cui normalmente una registrazione binaurale dovrebbe essere preferibilmente ascoltata stando comodamente seduti, ben fermi ad occhi chiusi.
Nonostante continuino a mancare le sensazioni offerte dalle vibrazioni che si accompagnano sempre ai suoni di intensità elevata, questa è a tutt’oggi la migliore riproduzione di un evento acustico registrato che ci sia stato dato modo di sperimentare.
Ma tenendo conto del fatto che le controindicazioni dell’ascolto in cuffia non ne hanno potuto (e forse non ne potranno mai) permettere un notevole sviluppo commerciale, è chiaro che i maggiori sforzi dei costruttori si siano concentrati sulla riproduzione attraverso altoparlanti.
Gli altoparlanti
Abbiamo visto come nel caso dell’ascolto in cuffia nel passaggio dalla registrazione con un solo microfono a quella con due (in sostituzione delle orecchie dell’ascoltatore) il risultato di ascolto si possa trasformare da una approssimazione più o meno accurata dei suono dell’orchestra ad una ottima approssimazione dell’intera scena acustica. Questo potrebbe significare che due canali siano sufficienti a contenere e trasferire buona parte delle informazioni necessarie ad una ottima ricostruzione della sensazione fornita dall’evento acustico reale.
Saltando rapidamente alle conclusioni, sembrerebbe allora che per realizzare una ottima riproduzione dei suono di un’orchestra sinfonica possa bastare decidere quale segnale fornire a due altoparlanti e in quale disposizione installarli nell’ambiente.
Naturalmente, la posizione più ovvia per un altoparlante è di fronte all’ascoltatore, da cui ne deriva che la posizione più intuitiva per due altoparlanti sarebbe comunque di fronte alla posizione di ascolto, a sostituire idealmente il fronte che nella realtà sarebbe occupato dall’orchestra.
In verità i ragionamenti e la filosofia di funzionamento che sono alla base della stereofonia sono un po’ più articolati e sottili ed un loro rapido esame ci potrà consentire di capire anche quali dovrebbero essere le caratteristiche dei segnale con cui alimentare gli altoparlanti.
La stereofonia classica
In precedenza siamo giunti alla conclusione che per poter sostituire un sassofono con un altoparlante dovremmo registrare il suono con un microfono posto in corrispondenza della bocca di emissione dello strumento. Analogamente, per trasportare l’intero fronte di emissione del suono di un’orchestra in corrispondenza degli altoparlanti che lo emetteranno, si dovrebbe prelevare il suono in corrispondenza di una finestra ideale tracciata di fronte alla posizione di ascolto di cui si vogliono simulare le sensazioni, alla stessa distanza che separerà gli altoparlanti dall’ascoltatore durante la riproduzione.
Anche se le ipotesi di lavoro ed i metodi di registrazione adottati in pratica sono generalmente diversi da quello qui ipotizzato, l’esempio che abbiamo usato gode dei vantaggio di rendere abbastanza evidente come due soli microfoni (e due soli altoparlanti) abbiano qualche difficoltà a registrare e riprodurre l’intero fronte acustico che attraversa la finestra.
Tenete presente, poi, che quest’ultima approssima soltanto la superficie attraverso la quale passano le onde acustiche che forniscono le sensazioni di ascolto originali, dato che l’ascoltatore durante l’evento acustico reale è raggiunto da onde sonore provenienti praticamente da tutte le direzioni intorno a lui.
In ogni caso, la stereofonia si basa sull’ipotesi che ricostruire parzialmente il solo fronte d’onda anteriore possa essere sufficiente e noi, almeno per ora e visti anche gli insuccessi della quadrifonia, cercheremo di non essere più esigenti.
Quello che ci preme sottolineare a questo punto è in realtà un’altra cosa, e cioè che quando si effettua il passaggio logico dal caso della riproduzione in cuffia a quello tramite altoparlanti è molto facile cadere nell’errore di confondere la sensazione d’ascolto con lo stesso evento acustico ricostruito.
In effetti, la stereofonia ufficialmente non ha mai preteso di poter ricostruire l’evento acustico con tutte le sue caratteristiche oggettive, quanto invece la sensazione soggettiva che l’ascoltatore potrebbe provare in presenza di quell’evento acustico reale.
Nel caso della riproduzione in cuffia questa limitazione è evidente: basta prendere atto del fatto che la scena acustica non è di fronte all’ascoltatore, bensì è rigidamente bloccata alla sua testa e non risente in alcun modo (almeno fino a che non si dovesse strappare il filo … ) dei suoi spostamenti. Nel caso degli altoparlanti invece, il solo fatto che il suono raggiunge l’ascoltatore in modo dei tutto simile alla situazione naturale e che più ascoltatori possono sentire il suono riprodotto nello stesso ambiente, provando sensazioni.simili, conduce facilmente all’errore di credere che la distanza fra la riproduzione e la realtà si sia quasi annullato.
Nulla di più falso.
Basta tornare un attimo a considerare l’esempio che abbiamo chiamato della finestra per rendersi conto che la posizione dei microfoni, quella degli altoparlanti e quella dell’ascoltatore sono rigidamente interdipendenti.
Perché il tutto funzioni come previsto in fase di registrazione l’ascoltatore deve trovarsi ad una ben precisa distanza sull’asse dei segmento congiungente i due altoparlanti, che a loro volta devono essere distanziati secondo le indicazioni di chi ha effettuato la registrazione.
Qualsiasi variazione della distanza fra i due altoparlanti, così come della distanza di ascolto comporterebbe infatti una conseguente variazione delle dimensioni orizzontali soggettive dell’orchestra. Ma la differenza maggiore esistente fra l’ascolto stereo (fonico) classico e la realtà è che mentre un evento musicale reale è fatto per poter essere ascoltato da un pubblico normalmente abbastanza numeroso e comunque da un numero di persone sempre superiore ad “1″. la stereofonia può funzionare davvero solo quando ad ascoltare è una persona sola, che si trovi alla giusta distanza dalle casse, la ua testa sia alla giusta altezza da terra e la sua ricerca del “centro” della zona d’ascolto ottimale sia terminata prima della sua pazienza.
Se poi questa ricerca non è neanche mai iniziata, o l’ascoltatore crede che non sia importante, allora è molto probabile che non abbia mai provato neanche le sensazioni che la vera stereofonia dovrebbe poter comunque offrire.
Ma anche un impianto stereofonico ottimizzato ed ascoltato a dovere non potrà mai estrarre esattamente dal segnale stereo delle informazioni che nessuno vi ha mai scientemente codificato.
Ecco quindi che la scena acustica offerta dalla stereofonia tradizionale si riduce per il suo unico ascoltatore ad un fronte, ampio e profondo quanto si vuole, ma pur sempre limitato nelle informazioni sulla sua altezza dall’assenza di qualsiasi codifica ufficiale prevista allo scopo.
è anche partendo da queste considerazioni che numerosi ricercatori hanno cercato di superare il concetto di stereofonia classica, finendo per proporre soluzioni che, offerte il più delle volte come capaci di aumentare il realismo dell’ascolto, ottengono questo risultato proprio perché cercano di combattere i limiti cui abbiamo appena accennato.
Gli altoparlanti non convenzionali
Anzitutto osserviamo che, mentre nel caso della registrazione a distanza ravvicinata, a maggior ragione se effettuata all’aperto, il suono captato dal microfono sarebbe composto solo dalla componente diretta, effettuando la ripresa da distanze maggiori in ambiente chiuso, il suono captato dal microfono risulta composto in percentuali diverse da almeno due componenti distinte: il suono diretto ed il suono riverberato dall’ambiente. Abbiamo anche visto, nel caso della registrazione/riproduzione di un solo strumento, che la timbrica dei suono riprodotto dipende dalla dispersione degli altoparlanti utilizzati e che questa in quel caso dovrebbe essere simile a quella dello strumento reale.
Quale dispersione devono avere allora gli altoparlanti di un sistema stereo? Ovvero: “Come devono disperdere intorno a loro le diverse frequenze di cui è composto il suono dell’orchestra?”.
Come vedremo fra poco, il parametro che è stato preso più di mira dai ricercatori e dai progettisti delle varie case specializzate in altoparlanti hi-fi è proprio la dispersione. L’approccio, valido per il caso di un solo strumento, di dotare l’altoparlante della stessa dispersione dello strumento reale, con l’orchestra non è evidentemente attuabile.
Ricordiamo poi che i due altoparlanti del nostro sistema stereo non sono affatto lì a sostituire l’orchestra, bensì quella ipotetica finestra attraverso la quale dovrebbero passare tutte le più importanti onde acustiche destinate a raggiungere il nostro povero ascoltatore.
Le più importanti direttrici seguite da diversi ricercatori si possono facilmente ricondurre, a tre orientamenti filosofici principali:
1 – Maggiore considerazione dei suono che si propaga verso l’ascoltatore seguendo cammini diversi da quello diretto.
2 – Maggiore attenzione al suono che viene emesso verso l’area di ascolto a quote diverse.
3 – Maggiore attenzione al suono che viene emesso verso zone dell’area di ascolto diverse da quella centrale.
Al primo gruppo appartengono i sistemi Direct/Reflecting di Bose, gli omnidirezionali e tutti quelli che genericamente emettono segnali diversi verso le pareti dell’ambiente.
Al secondo tutte le casse a sviluppo verticale accentuato.
Al terzo tutti i sistemi in cui la dispersione dei due canali è opportunamente differenziata.
Da notare che esistono anche sistemi di altoparlanti che cercano di implementare più filosofie contemporaneamente. Come già detto, tutte le filosofie riguardanti sistemi di altoparlanti non convenzionali cercano di rendere più realistica la sensazione d’ascolto dei sistema stereo combattendone quelli che i loro propugnatori considerano i difetti più gravi.
Il primo gruppo
Nel primo caso, il difetto preso di mira è proprio quello cui accennavamo in apertura di paragrafo, ovvero la difficoltà da parte dei sistemi convenzionali di ricreare nell’ambiente dell’ascoltatore sia un campo di onde acustiche dirette che uno di onde riverberate uguale a quello che si può percepire nella situazione reale.
La filosofia Direct/Reflecting prende le mosse dalla considerazione che in un auditorium l’ascoltatore è investito da una notevole percentuale di energia riverberata: molta più di quanta si formi spontaneamente in un ambiente domestico utilizzando due casse convenzionali.
In questo caso la dispersione degli altoparlanti viene perciò modellata per ottenere una emissione del suono molto maggiore in direzione delle pareti che non direttamente verso l’ascoltatore. Al riverbero dell’ambiente di ascolto viene quindi affidato il compito di produrre sulla percezione dell’evento acustico riprodotto effetti simili a quelli che aveva il riverbero dell’auditorium sulla percezione dell’evento acustico originale. Sempre al primo gruppo appartengono le Magic Speaker dell’Acoustic Research e le Tie dell’RCF. In questo caso, la considerazione fatta dai progettisti è stata che fosse possibile ottenere il risultato ricercato da Bose seguendo una via diversa e più indipendente dalle caratteristiche dell’ambiente di ascolto impiegato.
Il primo passo è consistito nell’appurare che il suono che raggiunge l’ascoltatore, nella situazione d’ascolto naturale, da direzioni diverse da quella frontale, è presente nel segnale stereofonico ed è possibile estrarlo separandolo dal segnale diretto effettuando una operazione di sottrazione fra i segnali dei due canali.
L’idea è quindi di riemettere questo segnale differenza in modo che raggiunga l’ascoltatore dopo essere stato riflesso dalle pareti dei suo ambiente di ascolto. In questo modo potrà più facilmente generare sensazioni simili a quelle che l’ascoltatore proverebbe nell’auditorium originale.
Per spingere oltre la simulazione, si giunge a separare completamente i sistemi di altoparlanti preposti alla emissione del segnale diretto e di ouello differenza curando che la dispersione del segnale diretto sia opportunamente ridotta al fine di non far nascere un eccessivo campo riverberato locale, che potrebbe far nascere sensazioni d’ascolto in conflitto con quelle generate dal segnale riverberato originale.
Al tempo stesso, nelle AR, il segnale differenza viene anche ritardato per simulare il tempo necessario a raggiungere ed essere riflesso dalle pareti di un ambiente più grande (quello originale) di quello in cui avviene l’ascolto della riproduzione.
Il secondo gruppo
Al secondo gruppo appartengono sistemi come gli Infinity Reference Standard, Magneplanar, Acoustat, Beveridge, Mc Intosh, i Vertical della Serie 7 ESB e che gli esclusi mi perdonino la dimenticanza.
Da notare, che mentre nel primo gruppo (nonostante Bose dichiari ed ottenga una buona invarianza dei risultato con la posizione di ascolto) ci trovavamo ancora di fronte ad un tentativo di accrescere il realismo dell’ascolto basandosi soprattutto sulla creazione di un maggiore realismo soggettivo, in questo caso assistiamo ad un importante slittamento della filosofia di progetto verso il tentativo di dotare la scena acustica di un maggiore realismo oggettivo.
Il suono viene emesso da sorgenti che sono in grado di simulare una più o meno convincente dimensione verticale della scena acustica e di ottenere una maggiore invarianza della sensazione di ascolto con la posizione dell’ascoltatore.
Detto in parole povere, le casse dei secondo gruppo consentono all’ascoltatore di spostarsi nell’ambiente, alzarsi, sedersi, senza che gli venga negata la possibilità di immaginare che la scena acustica proiettata di fronte a lui abbia una sua pur labile consistenza oggettiva.
Il principio di base che permette alle casse estese di dotare l’ascolto di un maggiore realismo va ricercato proprio nella loro estensione, che permette ovviamente loro di approssimare meglio le dimensioni della finestra di cui al paragrafo precedente. La caratteristica tecnica più importante cui si rifanno le casse verticali è che il suono viene emesso con modalità tali da variare meno con la distanza di ascolto rispetto a quello emesso da sistemi compatti, assimilabili a sorgenti acustiche puntiformi. Il suono che raggiunge direttamente un ascoltatore seduto, fermo al suo posto, non è molto diverso da quello che percepirebbe di fronte a due sistemi convenzionali (ad esempio due o tre vie bookshelf), ma il suono che lo raggiunge dopo essere stato riverberato dall’arnbiente è molto differente, dato che la dispersione di una cassa estesa è molto diversa da quella di una cassa compatta.
Inoltre, non appena l’ascoltatore si dovesse muovere, anche di poco, la maggiore invarianza del suono percepito potrà ricondurlo più facilmente alla sensazione dell’ascolto reale di quanto non avvenga con casse che non permettono il benché minimo spostamento pena variazioni della timbrica e della localizzazione del tutto innaturali.
Il terzo gruppo
Al terzo gruppo appartengono la ESB 7/05 (1980) e tutti gli altri modelli della Serie 7, la Wharfedale Option 1 (1983) e sistemi derivati, la DBX Soundfield 1 (1984), ecc., la JBL Everest (1987), la Bose 401 (1987). L’elenco potrebbe non essere completo ma, anche in questo caso, non voletemene, le eventuali omissioni non sono certamente volontarie.
Questa volta siamo proprio arrivati al traguardo, dato che tutti i progettisti dei sistemi sopracitati hanno cercato di dotare la scena acustica di una tridimensionalità oggettiva tale da poter fornire sia a più persone contemporaneamente, sia ad ogni ascoltatore che si fosse mosso entro l’area di ascolto, sensazioni molto simili a quelle che avrebbero provato di fronte ad una scena acustica reale.
Dato che la serie 7 ESB deriva dagli studi e dai progetti che io stesso ho effettuato e sviluppato presso la casa di Aprilia negli anni che vanno dal 1979 al 1985, oltre a considerare doveroso informarvi di questa circostanza, posso senz’altro chiarire un po’ meglio i concetti cui mi sono nell’occasione affidato.
Da notare che, mentre alcuni dei progettisti dei sistemi di altoparlanti citati si sono sicuramente ispirati alle ESB 7/05 e 7/06 che tanto scalpore suscitarono all’epoca negli Stati Uniti, altri hanno probabilmente proceduto in modo dei tutto autonomo.
Sta di fatto che i tempi erano senz’altro maturi perché il problema venisse affrontato anche secondo questa prospettiva e la ESB con il suo DSR si è mossa indubitabilmente per prima.
Anche in questo caso l’approccio è stato condotto a partire dall’esame dei difetti che venivano considerati i principali ostacoli all’ottenimento di una ricostruzione realistica.
In particolare:
1 – La scena acustica stereofonica offerta da un sistema di altoparlanti convenzionali, ad ogni spostamento dell’ascoltatore, oltre subire una distorsione timbrica, subisce una importante distorsione prospettica, tendendo ad ammassarsi verso la cassa che viene a trovarsi più vicina. Ciò rende impossibile, fra I’altro, un buon ascolto stereofonico a più persone contemporaneamente.
2 – Se l’ascoltatore cambia quota di ascolto (alzandosi o sedendosi) di fronte a due sistemi compatti convenzionali, si rende facilmente conto che la scena acustica è praticamente priva di qualsiasi dimensione verticale. D’altro canto, il realismo della percezione soggettiva di una dimensione verticale di fronte a sistemi estesi di tipo planare o a sorgente lineare è fortemente dipendente dal tipo di sorgente reale riprodotta.
La soluzione adottata per risolvere il punto numero 1 è molto simile per tutti i sistemi citati e si può esemplificare dicendo che la dispersione di ciascuna cassa è modellata in modo da compensare la variazione di livello e di tempo di arrivo dei suono diretto che normalmente causa lo slittamento laterale delle sorgenti virtuali e conseguente distorsione prospettica della scena acustica.
In pratica, il livello di emissione di ciascuna delle due casse varia su tutta l’area di ascolto in modo da essere massima verso le posizioni più lontane e minima verso quelle più vicine.
Per ottenere un effetto di tridimensionalità ancora più spinto, che faciliti la ricostruzione di una sensazione di profondità della scena acustica ricostruita, almeno nel caso delle ESB, la compensazione è diversa per le diverse frequenze componenti lo spettro acustico del suono emesso, da cui la denominazione Distributed Spectrum Radiation (Emissione a Spettro Distribuito). La considerazione utilizzata per decidere la natura e l’entità di questa differenziazione è che, quando si registra il suono di uno strumento musicale in un ambiente chiuso, il suo suono è più povero di frequenze alte quanto più è lontano dal microfono.
Per fissare le idee, immaginiamo ora un ascoltatore che ascolti due violini posti a distanze diverse di fronte a lui, uno ad un metro ed uno a venti metri. Per guardare verso entrambi i violini gli basterà guardare di fronte a lui.
Se ora l’ascoltatore si sposta lateralmente di un metro, per guardare il violino vicino dovrà voltarsi lateralmente di 45 gradi, mentre per guardare quello lontano gli basterà voltarsi di 2,86 gradi.
Immaginiamo ora che l’ascoltatore si trovi di fronte ad un sistema stereo.
Passando dalla posizione centrale a quella laterale dovrà vedere il violino vicino ad un metro dietro al centro fra le due casse, mentre quello lontano dovrà apparirgli secondo una direzione che passa molto più prossima alla cassa più vicina.
Un sistema stereo convenzionale, in assenza di qualsiasi tecnica di compensazione della posizione apparente dei due violini, in conseguenza di uno spostamento dell’ascoltatore di simile entità farebbe vedere entrambi i violini più o meno allineati secondo una direzione passante in prossimità della cassa più vicina.
Ciò significa che un sistema stereo progettato per compensare l’effetto degli spostamenti dell’ascoltatore deve compensare di più lo slittamento della posizione apparente del violino vicino, e di meno quella del violino lontano. Vista la citata differenza fra gli spettri del suono emesso dai due violini, questo effetto può essere ottenuto affidando alle frequenze alte la maggiore responsabilità della compensazione prospettica, e questo è proprio ciò che è stato implementato nel DSR.
Quanto alla dimensione verticale della scena acustica, per ottenere che questa sia opportunamente differenziata per i diversi suoni registrati, in modo che l’espansione verticale sia diversa per le diverse sorgenti acustiche registrate (e il contrabbasso possa apparire effettivamente più grande della chitarra), la soluzione escogitata è del tutto originale: “La emissione delle diverse frequenze dello spettro avviene senza soluzione di continuità da quote diverse”.
In questo modo uno strumento il cui spettro si estenda in prevalenza sulla parte media ed alta dello spettro apparirà posizionato più in alto di uno caratterizzato prevalentemente da note basse e medie. L’orchestra sinfonica, il cui spettro si estende su tutta la gamma delle frequenze audio, apparirà dotata della massima dimensione verticale offerta dal sistema DSR, corrispondente alla ricezione di tutti i suoni diversi dalla finestra verticale rappresentata dall’intera distanza che separa il woofer dal tweeter.
Gli altri articoli di Audio Review
Su Stereofonia e Percezione
(fino ad aprile 1988)
[1] Nuti P. – Percezione, invarianza e i 5 parametri – n. 1, settembre 1981, pp. 86-90.
[2] Giussani R. – Altoparlanti hi-fi, le misure e l’ascolto – n. 3, novembre 1981, pp. 4244.
[3] Giussani R. – Diffusori ESB 7/05, filosofia della caratteristica di dispersione a “Spettro Distribuito” – n. 5, febbraio 1982, pp. 96-99.
[4] Nuti P. – Gli elaboratori di immagine sonora – n. 7, maggio 1982, pp. 46-49.
[5] Ramaglia M. – Jecklin, Peerless e tecnica di ripresa OSS – n. 8, luglio 1982, pp. 4245.
[6] Arnklit Bo, Gatta F., Nuti P. – Kit. Audio lmage Processor, un elaboratore di immagine sonora a basso costo – n. 8, luglio 1982, pp. 82-89.
[7] Nuti P. – Renato Giussani, intervista sullo spettro distribuito – n. 11, novembre 1982, pp. 46-50.
[8] Mazza L., Trojano G. – Sennheiser MKE 2002, microfono stereo per testa artificiale – n. 11, novembre 1982, pp. 52-55.
[9] Giussani R. – Costruiamo una 7/06 – n. 18, giugno 1983, pp. 98-107.
[10] Ramaglia M. – Microfoni Bruel & Kjaer e registrazione dal vivo – n. 29, giugno 1984, pp. 42-48.
[11] Nuti P., Moroni B. – L’olografia Sonora di Bob Carver – n. 33, novembre 1984, pp. 50-53.
[12] Giussani R. – Prospettiva sonora e sorgenti virtuali nei sistemi di altoparlanti stereofonici n. 34, dicembre 1984, pp. 61-64.
[13] Polk M. – Sistemi di altoparlanti Polk Audio SDA, progettati per lo stereo – n. 36, febbraio 1985, pp. 47-54.
[14] Kantor K.L. – Il Magic speaker della Acoustic Research – n. 43, ottobre 1985, pp. 6672.
[15] Nuti P. – DSP-1 e Yamaha creò lo spazio – n. 53, settembre 1986, pp. 32-35.
Collegamenti di riferimento importanti
DSR & NPS
Diffusori acustici NPS-1000