(Prima puntata della serie sul progetto delle reti di crossover, pubblicata su AUDIO REVIEW n. 45 – dicembre 1985)
La funzione principale di un sistema hi-fi è quella di emettere un suono le cui caratteristiche siano strettamente correlate a quelle del segnale presente al suo ingresso. Dato che i sistemi hi-fi sono basati su tecnologie elettroniche, alla loro uscita principale troveremo sempre degli altoparlanti.
Qualsiasi “filosofia” di progetto venga adottata, gli altoparlanti dovranno garantire che il suono percepito contenga la maggior parte delle frequenze presenti nel segnale elettrico originale, e con livelli relativi il più possibile invariati.
La risposta in frequenza di un altoparlante
Durante il funzionamento di un altoparlante in un normale ambiente domestico, un ascoltatore percepisce un livello acustico che dipende da tre fattori principali:
- Il suono che lo raggiunge direttamente dall’altoparlante senza avere subito alcuna riflessione.
- Il suono che lo raggiunge dopo avere subito solo poche riflessioni.
- Il suono riverberato (caratterizzato generalmente da uno spettro contenente alte frequenze in misura molto minore del suono diretto).
Lo spettro dei suono percepito in regime permanente (ad es.: un accordo tenuto d’organo) è pari alla somma vettoriale degli spettri dei tre segnali acustici che abbiamo individuato. La condizione che abbiamo posto nel primo paragrafo vorrebbe che questo spettro complessivo fosse identico a quello del segnale in ingresso al sistema hi-fi.
Le cose però si complicano quando si considerano segnali aventi spettro rapidamente variabile in funzione del tempo (ad es.: un esercizio al pianoforte). In questo caso entra in gioco la capacità dell’udito umano di separare i segnali di primo arrivo da quelli che lo raggiungono dopo un certo numero di millisecondi e dal riverbero. Generalmente si ritiene che lo spettro dei segnale di primo arrivo e quello delle riflessioni che raggiungono l’ascoltatore entro un intervallo di tempo inferiore ai 20 ms, vengano riunite dal sistema uditivo in una sensazione unica, capace di influenzare: timbrica, informazioni direzionali (spaziali) e segnali transienti; quanto alle riflessioni successive ai 20 ms, si ritiene che possano influenzare sia la timbrica che la percezione delle informazioni direzionali, mentre al campo riverberato è attribuita (non da tutti) una influenza sulla timbrica ma non sulle prestazioni relative alla ricostruzione spaziale e temporale.
Una diversa considerazione dei fenomeni psicoacustici in gioco, può condurre a filosofie progettuali differenti e, ad esempio, a considerare ottimali rapporti molto diversi fra i contributi dei tre spettri individuati al segnale complessivo percepito. Ciononostante, tutte le filosofie di progetto dovrebbero in ogni caso rispettare almeno una condizione comune:
- Realizzare una risposta in frequenza “complessiva” (misurabile in ambiente d’ascolto con rumore rosa ed analizzatore a terzi d’ottava) caratterizzata da un andamento monotono, cioè caratterizzato da una pendenza sempre dello stesso segno. Infatti, qualsiasi enfasi o attenuazione “localizzata” della risposta complessiva, si traduce inevitabilmente in una colorazione, sia che dipenda dal campo diretto come da quello di prima riflessione, o da quello riverberato (FIGURA 1).
Supposto che l’ambiente di ascolto abbia un tempo di riverbero costante (cioè che non varia per segnali di diversa frequenza), la condizione perché la risposta in frequenza complessiva del sistema sia “piatta” (a meno di una eventuale rotazione rigida rispetto all’asse delle frequenze) è che la risposta in frequenza sull’asse dell’altoparlante (solo campo diretto) sia rettilinea e la sua dispersione sia costante o al più vari esponenzialmente con la frequenza (ad es.: dispersione a 4000 Hz = 180°, disp. a 8000 Hz = 127,3°, disp. a 16000 Hz = 90°) (FIGURA 2).
Nelle condizioni fissate è anche possibile ottenere uno spettro complessivo corretto compensando ad esempio eventuali alterazioni della dispersione con alterazioni di segno opposto della risposta sull’asse e viceversa.
Il risultato d’ascolto sarà senz’altro migliore di quello percepibile in condizioni di spettro complessivo alterato, ma con segnali non permanenti il nostro udito sarà ancora in grado di percepire l’anomalia (FIGURA 3).
D’ora in poi, quando parleremo di risposta in frequenza di un altoparlante, ci riferiremo alla sua risposta sull’asse principale (se non diversamente specificato). Quando vorremo riferirci alle variazioni della potenza acustica totale emessa, al variare della frequenza, parleremo invece di “power response”, in italiano: risposta in potenza.
Un altoparlante verrà considerato a risposta “piatta” sia che questa sia orizzontale, sia che sui consueti grafici bilogaritmici (Hz/dB) sia rappresentata da una retta inclinata.
I normali ambienti di ascolto domestici sono caratterizzati da un tempo di riverbero decrescente all’aumentare della frequenza.
In questo caso un altoparlante dotato di risposta in frequenza piatta e risposta in potenza piatta, in assenza di “prime riflessioni” in grado di degradare pesantemente l’andamento dello spettro riprodotto, fornirà all’ascoltatore uno spettro complessivo dipendente dalla distanza di ascolto.
A distanza ravvicinata prevarrà il segnale diretto e quindi la risposta in frequenza “percepita” tenderà a quella sull’asse di ascolto; a grande distanza la risposta “percepita” tenderà ad essere quella relativa allo spettro del segnale riverberato, ovvero la risposta in potenza dell’altoparlante “pesata” con l’andamento in funzione della frequenza dei tempo di riverbero dell’ambiente (FIGURA 4).
I segnali audio
Il segnale elettrico applicato all’ingresso di un sistema hi-fi contiene per lo più frequenze suscettibili di essere percepite dal sistema uditivo umano.
Sebbene lo spettro dei segnali acustici presenti in natura sia molto ampio e si estenda dalle frequenze infrasoniche tipiche dei movimenti tellurici (frazioni di Hz), agli ultrasuoni presenti nel rumore di rottura dei metalli (centinaia o migliaia di kHz), di solito vengono considerate udibili solo le frequenze comprese fra i 20 ed i 20.000 Hz. Ciò non vuol dire che le frequenze esterne a tale intervallo non possano in taluni casi essere “percepite”, ma di solito questo avviene secondo meccanismi che non chiamano in causa il sistema uditivo.
Nel seguito, quando ci riferiremo allo spettro dei segnali audio, sarà implicito che stiamo considerando solo segnali compresi nell’intervallo 20-20000 Hz.
Perché i filtri di crossover
Riassumendo quanto già detto:
1) La risposta in frequenza dell’altoparlante dovrebbe avere andamento orizzontale su tutto l’intervallo di frequenze interessato dallo spettro del segnale. E’ generalmente considerata accettabile una leggera rotazione della retta, rappresentante la risposta in frequenza, che può variare nell’intervallo di ±1 dB/ottava, rispetto agli 0°.
2) La dispersione dell’altoparlante (ove non sia possibile o desiderabile che sia costante) dovrebbe diminuire esponenzialmente con la frequenza.
3) Entrando per un attimo nel merito di problematiche che verranno toccate nel seguito, la dispersione dell’altoparlante dovrebbe anche essere tale da garantire la percezione di un campo diretto privo di discontinuità, entro un volume di ascolto compatibile con le normali condizioni di installazione domestiche.
4) Inoltre i segnali acustici dovrebbero essere percepiti dall’ascoltatore ad un livello soggettivo simile a quello dei segnali reali che vogliono riprodurre (anche quando questa realtà fosse solo quella stabilita da un compositore di musica elettronica davanti alle sue casse monitor).
A tutt’oggi nessun costruttore è riuscito a costruire un altoparlante hi-fi “monovia” che riuscisse a rispondere al meglio e contemporaneamente alle quattro condizioni appena poste (e per bloccare sul nascere le proteste dei sostenitori dei sistemi elettrostatici aggiungeremo: ad un costo e con ingombri ragionevoli).
Un altoparlante capace di riprodurre con le desiderate caratteristiche di risposta e ad un livello acustico ragionevole i 20 Hz non è assolutamente in grado di riprodurre altrettanto correttamente (stesso livello, bassa distorsione, corretta dispersione) i 20000 Hz, e questa affermazione rimane più che valida (in ambito hi-fi) anche se invece di parlare di 20 e 20000 Hz parliamo solo di 100 e 10000 Hz. Ciò non vuol dire che, riducendo le pretese, non sia possibile trovare piccoli altoparlanti biconici o sistemi elettrostatici che, con o senza circuiti di equalizzazione annessi, riescano a riprodurre la gamma 100-10000 Hz con una qualità più che onesta sia per l’uso in apparecchi televisivi o radio portatili, che per applicazioni general-purpose di alto livello.
Quando si parla di hi-fi invece le cose sono diverse; nonostante le normative minime stabilite dal CEI (Comitato Elettrotecnico Italiano) perché un altoparlante possa essere definito hi-fi siano abbastanza restrittive, i desiderata degli audiofili sono generalmente superiori. In questo caso l’unica via percorribile per conseguire caratteristiche congruenti con le condizioni di alta fedeltà sopra esposte è quella che conduce alla utilizzazione di sistemi multivia.
Dividendo lo spettro audio in due porzioni, l’una contenente solo “basse frequenze” e l’altra solo “alte frequenze”, diventa possibile fare riprodurre i bassi e gli alti ad una coppia di altoparlanti specializzati nella emissione delle rispettive bande di frequenza, ottenendo in uscita una emissione di caratteristiche prossime a quelle desiderate. Questo “sistema di altoparlanti” è detto a due vie ed è costituito da un woofer, un tweeter ed un filtro di crossover (passivo o attivo che sia).
La funzione dei filtro è proprio quella di separare gli alti dai bassi, consegnando a ciascun altoparlante solo le frequenze che esso può riprodurre rispettando le condizioni di progetto. Volendo suddividere lo spettro audio fra un maggior numero di altoparlanti, ciascuno specializzato nella riproduzione di specifiche bande di frequenza, si passerà alla progettazione di sistemi a tre, quattro o più vie.
Come vedremo però ciascuna divisione operata con gli opportuni filtri di crossover comporta un certo degrado di alcune caratteristiche del segnale, da cui la necessità di mediare fra la esigenza di massima specializzazione dei trasduttori e quella di limitare il numero di filtri introdotto.
Numero di vie e frequenze di incrocio
La configurazione più adottata per sistemi acustici di caratteristiche che possono variare da basse ad alte, ma raramente possono diventare “altissime” è quella a due vie, per sistemi di caratteristiche da basse ad altissime viene scelto normalmente il sistema a tre vie; in taluni casi particolari il quattro vie può presentare dei vantaggi concreti; un numero di vie superiore a quattro è di uso poco frequente.
E bene chiarire che, se il numero degli altoparlanti non può essere inferiore a quello delle vie, non è vero il viceversa. Ad esempio, non è raro imbattersi in sistemi dotati di due midrange collegati in parallelo, montati simmetricamente rispetto al tweeter per conseguire una migliore dispersione verticale. I midrange sono collegati alla stessa cella di filtro e quindi, pur essendo due, corrispondono ad una sola via (FIGURA 5).
La frequenza che viene assunta a confine fra la banda affidata ad un altoparlante e l’adiacente è quella alla quale le curve rappresentanti le risposte in frequenza si “incrociano”; da cui la comune denominazione di “frequenza di incrocio”, in inglese (crossover frequency).
Lo spettro e la fase
In FIGURA A è rappresentato in funzione dei tempo un generico segnale audio. Il suo spettro altro non è che la distribuzione dei suo livello in funzione della frequenza.
La rappresentazione grafica di uno spettro è quella di FIGURA B, nella quale ciascuna riga verticale rappresenta un segnale sinusoidale di diversa frequenza. La frequenza di ciascuna sinusoide è indicata sull’asse orizzontale [Hz], mentre su quello verticale è riportato il suo modulo [dB].
La somma vettoriale (con gli angoli di fase originali) di tutte le componenti sinusoidali dello spettro fornisce un segnale identico all’originale. Se la somma delle componenti dello spettro viene effettuata con angoli di fase diversi dagli originali, la forma d’onda dei segnale cos¡ ottenuto sarà diversa da quella dell’originale (FIGURA C). Ciononostante lo spettro dei due segnali sarà identico.
Si è sempre ritenuto, e si ritiene tuttora, che il nostro sistema uditivo non sia in grado di percepire alcuna differenza fra due segnali continui aventi lo stesso spettro ma caratterizzati da diversi angoli di fase fra le singole componenti. Ricordate tuttavia che spettri acustici uguali possono fornire sensazioni di ascolto molto differenti in relazione al livello di ascolto adottato. Uno dei motivi principali di questo effetto è la variazione della curva di sensibilità dell’orecchio in funzione della frequenza, al variare dei livello dei segnale (FIGURA D).
Non è quindi detto che sistemi di altoparlanti chiamati a riprodurre lo stesso segnale a livelli acustici sostanzialmente differenti (piccoli impianti domestici o sistemi da discoteca) debbano essere caratterizzati dalla stessa risposta in frequenza.
La presenza di un cammino acustico nell’aria fra l’altoparlante e l’orecchio, introduce una rotazione di fase (rispetto alla sorgente, owero l’altoparlante) che aumenta proporzionalmente all’aumentare della frequenza (FIGURA E).
Anticipando alcuni concetti su cui torneremo in seguito, possiamo quindi dedurre che, l’ascolto di un segnale acustico costituito dalla somma delle emissioni di più altoparlanti posti a distanze diverse dall’ascoltatore, comporta una variazione della fase relativa fra le varie bande di segnale coinvolte. Se è vero che in regime permanente (segnali continui) questo sfasamento non dovrebbe costituire un problema, in presenza di segnali transienti il differente tempo di arrivo delle diverse frequenze costituenti il fronte d’onda (group delay), può causare (almeno al di sopra di certi limiti) un degrado dell’ascolto. Per essere certi che le rotazioni di fase eventualmente introdotte dai sistema di altoparlanti fra le componenti di un segnale musicale siano minime, si dovrebbe perciò curare che la distanza fra i singoli componenti ed il punto di ascolto sia la stessa. In questo modo, la fase relativa con cui vengono percepite le varie frequenze dello spettro è la stessa con cui vengono emesse e la curva che rappresenta l’andamento della fase assoluta dei sistema assume un andamento senza discontinuità.
Gli altoparlanti “rifusati” vengono detti anche linear-phase, owero a fase lineare (FIGURA F).
Alcuni ricercatori ritengono che il requisito di fase lineare sia molto importante per conseguire una corretta percezione dei segnali composti, in particolare durante i fenomeni transienti, altri invece hanno ricavato delle caratteristiche di sensibilità dell’orecchio alle rotazioni di fase abbastanza blande (FIGURA G).
Frequenza e dispersione
Gli altoparlanti emettono il suono grazie alle vibrazioni di una membrana posta a contatto dell’aria. Quando la membrana si sposta in “avanti” imprime all’aria una sovrapressione positiva, quando si sposta indietro il segno della variazione di pressione rispetto al valore statico (barometrico) diventa negativo. Se la membrana si muove alternativamente avanti e indietro ad una certa velocità le onde positive e negative si susseguono ad intervalli di tempo pari a 1/2 dei periodo di oscillazione, propagandosi nell’ambiente alla velocità di 344 m/s (FIGURA H).
Queste onde acustiche non si allontanano dall’altoparlante solo frontalmente, ma anche in altre direzioni:
- Quanto più l’altoparlante è piccolo tanto più la emissione tende ad essere “omnidirezionaie”, al limite il fronte di propagazione delle onde acustiche diventerebbe sferico.
Ricordatevi però che le dimensioni degli altoparlanti non devono mai essere considerate “grandi” o “piccole” in assoluto, ma vanno poste in relazione alla lunghezza d’onda dei suono che devono emettere.
La lunghezza d’onda di un segnale acustico periodico è la distanza che percorre viaggiando (in aria a 344 m/s) per un tempo pari al suo periodo. Ad esempio, un suono il cui spettro sia composto solo da una frequenza a 1000 Hz, compiendo mille periodi ogni secondo, ha un periodo lungo 1/1000 di secondo: la sua lunghezza d’onda in aria, essendo pari allo spazio che percorre in un millesimo di secondo, sarà 344xl /1 000 = 0,344 metri. Ovvero la lunghezza d’onda in aria di un suono a 1000 Hz è pari a 34,4 cm.
Un altoparlante circolare comincia ad essere più grande rispetto al suono che deve emettere quando il suo diametro eguaglia metà della lunghezza d’onda. Un midrange a cono da 17 cm di diametro è grande per le frequenze superiori ai 1000 Hz e piccolo per quelle inferiori. Ciò significa che la emissione di questo midrange diventerà sempre più direttiva all’aumentare della frequenza al di sopra dei 1000 Hz e sempre meno per frequenze inferiori. Per un midrange a cupola da 50 mm la frequenza di “confine” fra una caratteristica di dispersione ampia ed una stretta è pari a 344/(0.050 x 2) 3440 Hz.
- Quanto più l’altoparlante è grande tanto più tende ad essere “unidirezionale”, al limite il fronte d’onda diventerebbe piano (FIGURA I).
Il campo riverberato
Quando un altoparlante emette onde acustiche in un ambiente chiuso, le onde che lo lasciano, dopo un certo tempo incontrano le superfici di chiusura della stanza (pareti, pavimento e soffitto). Una parte dei suono viene assorbito dalle superfici, una parte le attraversa e viene “trasmesso” all’esterno, la restante parte viene riflessa verso un’altra superficie (FIGURA L).
Se l’altoparlante continua ad emettere suono nell’ambiente, il numero di onde che ne attraversano l’aria e incontrano le superfici di confine tende ad aumentare. Dal momento in cui la somma dei suono assorbito e trasmesso raggiunge lo stesso valore di quello immesso dall’altoparlante nella stanza, il livello acustico nell’ambiente rimane costante. Se l’altoparlante cessa improvvisamente di emettere onde acustiche, il livello dei suono tende a diminuire e raggiunge un valore 60 dB inferiore in quello che per definizione si chiama “tempo di riverbero,” di quell’ambiente (FIGURA M).
Il tempo di riverbero aumenta all’aumentare delle dimensioni dell’ambiente (passa più tempo fra ciascun assorbimento e il successivo) e della quantità di suono riflessa da ogni superficie. li livello di pressione acustica associato alle onde che hanno subito innumerevoli riflessioni è quello che d’ora in poi chiameremo livello dei campo acustico “riverberato”, ed il suo valore dipende sia dal tempo di riverbero dell’ambiente che dalla energia immessa nell’ambiente ogni secondo, ovvero dalla potenza acustica emessa dall’altoparlante in tutte le direzioni.
A parità di risposta in frequenza sull’asse principale, un altoparlante immette tanta più energia in ambiente quanto più ampia è la sua dispersione.
Abbiamo visto come il requisito di base di una riproduzione Hi-Fi, ovvero la capacità da parte di un altoparlante di consegnare all’ascoltatore uno spettro dei segnale acustico il più simile possibile a quello dell’originale, sia fortemente dipendente dalle caratteristiche di emissione del componente, da quelle dell’ambiente di ascolto e dalla distanza e posizione relativa altoparlante-ascoltatore. E’ abbastanza intuitivo attendersi che, in presenza di un sistema a due o più vie, la capacità di cui sopra risulti fortemente influenzata anche dal valore delle frequenze di incrocio prescelte. Ciò che non può essere evidente da quanto fin qui esposto è che, la presenza ed il tipo di filtro di crossover utilizzato per un sistema di altoparlanti, non ha effetto solo sullo spettro di emissione, ma influenza fortemente (direttamente o indirettamente) anche molti altri importantissimi aspetti della riproduzione, come ad esempio
- Il rapporto fra il campo diretto e quello riverberato.
- L’andamento della dispersione.
- La evoluzione dei segnale nel dominio del tempo (ad esempio per il tramite dello smorzamento delle risonanze fondamentali dei trasduttori).
- Le caratteristiche di carico presentate all’amplificatore.
- L’andamento della distorsione.
- L’andamento del MIL.
- L’andamento del MOL.
- ecc. ecc.
Nella seconda parte entreremo nel merito di alcune di queste problematiche esaminando le ragioni della scelta della frequenza di incrocio che ottimizza le prestazioni di un sistema di altoparlanti.