joomla stats

Percepire l’impercettibile

di Mario Bon

L’ apparato uditivo (nel seguito a.u.) una volta stimolato, fornisce comunque una risposta (percezione uditiva) che può essere giusta, sbagliata, incerta, confusa o inventata. L’a.u. cerca di svolgere il proprio compito nel minor tempo e con il minor sforzo possibile. In pratica è uno scansafatiche precipitoso.
L’apparato uditivo, sostanzialmente, sente quello che vuole sentire.
Fatevene una ragione.

Se fosse vero tutto quello che si dice, non sarebbe necessario investire migliaia di euro per acquistare un impianto stereo: basterebbe andare in un centro commerciale, comprare una coppia di diffusori acustici amplificati per PC (Manhattan modello 150200, 2 vie bass reflex amplificati, 80 euro) e quindi dotarsi di quella particolare ciabatta, cambiare il cavo di alimentazione, girare la spina nella presa, mettere un foglio blu sotto al vaso di fiori, spostare gli oggetti dentro i cassetti, cospargere il pavimento di petali di rosa, disporre sassolini sopra e davanti ai diffusori acustici, ….. secondo alcuni, ognuno di questi espedienti, comporta drammatici miglioramenti (“impossibili” da non percepire) alla qualità del suono riprodotto aumentando la spazialità, il dettaglio, il “nero infrastrutturale”, dinamica, ecc. ecc. . Aumenta di qua e aumenta di là, alla fine la riproduzione diventa perfetta. Poi, spostando qualche sassolino, migliora ulteriormente….. Ma cosa succede quando, all’insaputa dell’ignaro audiofilo, qualche avventato sposta gli oggetti dentro ai cassetti? e se una corrente d’aria sposta i petali di rosa? e se i sassolini non sono stati raccolti lungo le rive del Gange ma in un campo dove un tempo c’era un cimitero Maya con annessa maledizione? sono domande drammatiche.

Una delle questioni che tormenta le notti insonni degli audiofili , riguarda la udibilità di qualsiasi variazione apportata all’ impianto stereo. Tali variazioni possono essere macroscopiche (sostituzione dei diffusori) o microscopiche quali la nascita di un nuovo acaro tra le fibre del tappeto o delle tende.

Diciamo subito che:

Affinché la variazione di una qualità sonora (attributo) possa essere giudicata percepibile, lo deve essere per almeno il 71% di una popolazione formata da individui dall’udito perfetto. Per la psicoacustica l’individuo medio non è “mezzo sordo” ma possiede “udito perfetto”.
(Un eventuale individuo con super-poteri acustici rientrerebbe nel 71%)

Ad ogni quantità monodimensionale corrisponde una soglia minima di udibilità (al di sotto della quale non si sente) e una soglia differenziale di percezione che misura la minima variazione percepibile. Per esempio un suono diventa percepibile quando supera il livello di 20 micro Pascal a 1000 Hz ( 0 Phon, soglia di udibilità). La minima variazione di livello SPL diventa percepibile quando supera 0.5 dB (secondo alcuni e ancor meno secondo altri: dipende dalla banda passante sulla quale avviene questa variazione e dal particolare “suono” utilizzato).

Ciò non esclude che un individuo possa percepire un enorme aumento di profondità della scena acustica perché ha posto un sassolino davanti ad un diffusore ma, probabilmente, è l’unico a goderne. Quello che non deve accadere, e che purtroppo accade, è che la percezione di un singolo individuo venga elevata a standard di percezione per tutta la popolazione.

Piccola digressione:
Poniamoci una domanda: il tempo di riverberazione è definito come il tempo che impiega il campo riverberato per attenuarsi di 60 dB. Perché questa definizione non è cambiata negli ultimi 100 anni (anche se sono disponibili strumentazioni con 130 dB di rapporto segnale/rumore)? l nostro apparato uditivo ha dei limiti e, pochi secondi dopo una esposizione ad un suono con livello di X dB, un suono a X-60 dB non è udibile (ipoacusia temporanea). E’ ben vero che la dinamica dell’apparato uditivo è di 120-130 dB (dalla soglia di udibilità fino alla soglia del dolore) ma, per apprezzare un suono a 0 dB (20 micro Pascal di Pressione) si deve rimanere immersi nel silenzio per almeno 15-30 minuti in modo che la soglia di percezione si porti al suo massimo (l’orecchio ripristina l’amplificazione massima di circa 30 dB).
Questo per dire che le soglie di percezione (assolute e differenziali) dipendono dalle condizioni ambientali contingenti. L’apparato uditivo è un sistema dotato di memoria e ogni percezione è condizionata dalle percezioni precedenti e condiziona le percezioni successive. Questo va tenuto presente.
(fine della digressione)

Ripercorriamo brevemente la strada del suono dal timpano al cervello:

Trasformazione acustico meccanica
La variazione di pressione (stimolo) mette in moto il timpano e una serie di “leve” meccaniche (catena degli ossicini) che, alla fine, portano il moto alla membrana basilare ed alle cellule ciliate nell’organo del Corti.

Trasformazione meccanico elettrica
Le cellule ciliate trasformano lo stimolo meccanico in treni di impulsi elettrici che vengono incanalati nel nervo acustico (sensazione). Più precisamente vengono discriminate circa 1500 frequenze diverse. Di queste due terzi coprono l’estensione della tastiera del pianoforte e solo un terzo le frequenze oltre 4000 Hz. Ne segue che sulle ultime due ottave l’a.u. è sensibile ma non selettivo. Alle basse frequenza invece l’a.u. è poco selettivo e poco sensibile. L’ a.u. è specializzato nella percezione della voce (gamma media) e in tale range di frequenze è sensibile e selettivo. Le cellule ciliate producono impulsi elettrici che hanno sempre la stessa forma ed in numero proporzionale all’intensità (fino ad un massimo di 150 impulsi al secondo).

Trasmissione elettrica
Il nervo acustico trasmette i segnali a diverse zone del cervello dove vengono elaborati. Per prima cosa il cervello decide se il “messaggio sonoro” contiene un segnale di pericolo (se è il caso viene prodotta adrenalina in quantità). Questo è un possibile meccanismo che produce “emozione collegata alla dinamica” (ma questa è una mia supposizione da prendere con le pinze).

Elaborazione – Processo di percezione
La sorgente viene localizzata e il messaggio viene interpretato diversamente a seconda si tratti di musica, parola o rumore. Il cervello riconosce il timbro confrontandolo con i pattern memorizzati e lo memorizza a sua volta.
A questo punto percepiamo il suono in forma conscia.
Nel frattempo una quantità di impulsi nervosi, circa 20 volte superiore a quelli pervenuti al cervello, viene inviata dal cervello alle cellule ciliate esterne per modificare lo stimolo percepito.

Ricapitolando per quanto riguarda sensibilità e selettività:
Basse < 100 Hz circa): L’udito è Non Selettivo e Non Sensibile Medie (voce) : L’udito è Selettivo , Selettivo Alte (> 4000 Hz): L’udito è Non Selettivo, Sensibile

(*) il fatto che l’a.u. non sia sensibile sotto i 100 Hz si deduce dalle curve di loudness e non vuol dire “che non si sentono” ma che si sentono “meno” delle frequenza medie a parità di livello SPL. Dire che l’a.u. non è selettivo significa che fatica o non riesce a determinare la frequenza con precisione.

Finalmente il risultato della elaborazione viene percepito dall’individuo come “suono”. Il suono è il risultato del processo di percezione che avviene nel cervello.

Per quanto possa dispiacere ai patiti “dell’analogico senza controreazione”, l’apparato uditivo è un sistema che converte una variazione di pressione (analogica) sul timpano in un treno di impulsi (segnale elettrico digitale). Il sistema è dotato di (almeno) tre anelli di retroazione negativa di cui due eseguono un controllo automatico del guadagno (tipo AGC) ed il terzo (gestito direttamente dal cervello) ne fa di tutti i colori e tra queste sopprimere gli echi di uno specifico suono nell’intervallo di integrazione.
Il sistema di retroazione dell’ a.u. utilizza almeno tre “dispositivi”:

- il muscolo stapedio (collegato alla staffa – retroazione meccanica)
- il muscolo tensore del timpano (collegato al martello – retroazione meccanica)
- le cellule ciliate esterne (nell’organo del Corti – retroazione elettrica).

Il “suono” che udiamo ci appare oggettivo, perché è quello che “sentiamo”, ma è soggettivo perché la sensazione cambia da individuo a individuo (per cause anatomiche) e la percezione cambia da individuo a individuo in base alle esperienze pregresse, cultura, stato psicofisico contingente, ecc.. Ciò avviene anche, banalmente, a causa della natura fermionica dei corpi solidi: due individui non possono trovarsi nello stesso posto nello stesso istante. Ciascuno di noi assiste allo stesso evento (un concerto) da punti di ascolto diversi ed è sottoposto a stimoli oggettivamente diversi. Una delle difficoltà dell’audiofilo sta nell’accettare la relatività delle percezioni: si tende a dare alle proprie percezioni un valore assoluto che non hanno e, peggio ancora, le si vorrebbe imporre anche agli altri. Nel tentativo di ottenere questo risultato si amplificano sfumature impercettibili (o inesistenti) descrivendole con superlativi assolutamente fuori luogo. Si dovrebbero, per cominciare, moderare i termini del linguaggio. Una sfumatura è una sfumatura non un cambiamento epocale.

Un microfono trasforma una variazione di pressione in una tensione elettrica ad essa proporzionale. La parte dell’ a.u. simile al microfono finisce con la catena degli ossicini. E’ interessante notare che il cervello non riceve nulla che somigli all’andamento della pressione sonora (analogica) che ha eccitato il timpano: riceve una serie di segnali digitali (treni di impulsi). La sensazione uditiva è determinata dalla combinazione di molti fattori che agiscono contemporaneamente nel tempo.

La formazione della percezione uditiva è una operazione olistica (gestalt) condizionata dallo “stato” fisico, psicofisico e culturale del soggetto e dell’ambiente che lo circonda.

Tra i fenomeni che determinano lo stato del soggetto citiamo i pregiudizi e la memoria delle percezioni pregresse. La memorizzazione delle percezioni pregresse è un processo continuo quindi lo “stato” del soggetto muta continuamente nel tempo.

Può succedere che, anche ascoltando lo stesso brano due volte di seguito, si abbia l’impressione di percepire delle differenze. La causa può essere meramente “meccanica”: se stiamo mangiando le patate fritte il tensore del timpano interviene per ridurre la sensibilità rispetto al rumore della masticazione e noi diventiamo “un po’ più sordi” anche a tutto il resto quindi non sentiamo più la musica allo stesso modo. Se ci soffiamo il naso muta la pressione tra il cavo faringeo e l’orecchio medio. Ne segue che non si devono magiare le patatine fritte e tanto meno soffiare il naso quando si ascolta musica.
Anche a parità di condizioni al contorno, lo stato psico-fisico di chi ascolta muta continuamente nel tempo. Infatti:

- il grado di attenzione posto nell’ascolto non è costante (e anche difficilmente controllabile).
- l’ascolto critico continuato porta a concentrarsi su aspetti diversi del fenomeno sonoro ottenendone percezioni diverse.
- ogni ascolto modifica la memoria precedente del fenomeno e quindi la sua percezione successiva (che sulla memoria è basata).
- la fatica da ascolto aumenta nel tempo e interferisce con l’ascolto critico.
- altre cose ancora…

Ci sono anche variazioni strettamente fisiche: una persona produce 0,1-2,1 kg di vapore ogni ora. La presenza di più persone in un ambiente chiuso altera il grado di umidità dell’aria e, con essa, le condizioni di propagazione del suono. Lo stesso vale per la temperatura dell’ambiente e dei dispositivi (basta pensare al riscaldamento causato dagli amplificatori a valvole e alla compressione termica per gli altoparlanti). Ascoltare la musica da soli o in compagnia non è la stessa cosa.
Riassumendo, nel tempo, si osservano variazioni sia fisiche (ambienti, nei dispositivi) che psico-fisiche del soggetto: è normale mutino anche le percezioni. A questo punto si potrà obiettare che si tratta di variazioni minime… saranno anche minime ma sicuramente fisicamente più rilevanti di quelle prodotte da un cartoncino blu posto sotto ad un vaso da fiori (magari per un ascolto al buio).

Ascolto Critico
Sia data la registrazione di una conversazione (per esempio una normale intercettazione telefonica). Ad un primo ascolto la conversazione appare non completamente intelligibile. Allora la stessa registrazione viene riascoltata più volte fino a comprenderne tutto il contenuto. Durante questa operazione il cervello sfodera tutte le sue risorse (ascolto critico, completamento automatico, completamento euristico, interpretazione dal contesto, ecc.). Una volta “decriptata”, riascoltando la stessa registrazione inizialmente non intelligibile, questa sarà immediatamente riconosciuta perché il suo contenuto è stato memorizzato: il suono è collegato al messaggio e il cervello “salta” direttamente al contenuto del messaggio memorizzato (manco lo scolta più).
Vogliamo imparare un assolo di chitarra di Jimi Hendrix. In questo caso si devono riconoscere tutte le note eseguite per poi rieseguirle con la chitarra (possibilmente una Fender Stratocaster). La procedura è la stessa: l’assolo viene riascoltato più volte e, ad ogni ascolto, si scopre qualche cosa di nuovo. Alla fine sentiamo distintamente tutte le note che non potevamo riconoscere al primo ascolto. L’assolo è stato memorizzato e non “suonerà” mai più come la prima volta che lo abbiamo sentito. Probabilmente, dopo averlo ascoltato decine di volte, ci verrà a noia.
In questi processi l’attività di analisi dei suoni operata dal cervello, la memoria e l’ ascolto critico sono determinanti ed è evidente come la memoria del fenomeno ne modifichi la percezione successiva.

Quando confrontiamo due cavi di segnale facciamo la stessa cosa: ascoltiamo ripetutamente lo stesso brano o lo stesso frammento musicale e ogni ascolto modifica l’ascolto successivo. Se la differenza è superiore alla soglia differenziale di percezione (per un qualche attributo) la differenza “sonora” percepita è oggettiva. Quando le differenze sono al di sotto della soglia differenziale di percezione, l’attesa di sentire una differenza, o un pregiudizio, può indurre a percepire anche le differenze che non ci sono. Quando le differenze sono troppo piccole o non ci sono, l’apparato uditivo, se ne ha motivo, è perfettamente in grado di inventarsele. Dato che non possiamo distinguere le due situazioni, l’unico modo per venirne fuori è utilizzare sia l’ascolto che le misure.

Gli strumenti di misura
Gli strumenti di misura sono molto più sensibili e precisi dell’orecchio. Una delle caratteristiche delle misure è la ripetibilità. I microfoni hanno un range dinamico lineare superiore, distorcono molto meno e la risposta in frequenza è più ampia, piatta e indipendente dal livello SPL. L’organo del Corti analizza circa 1500 frequenze ogni 50-100 millisecondi (intervallo di integrazione). L’ analizzatore di spettro FFT “analizza” segmenti temporali anche di decine di minuti con una risoluzione in frequenza migliaia di volte superiore.
Stando così le cose, se l’orecchio rileva qualche differenza, a maggior ragione dovrebbero poterlo fare gli strumenti di misura (con le procedure adeguate e spesso le procedure non sono adeguate). Se lo strumento di misura non rileva differenze si deve concludere che queste non ci sono anche se si sentono. Uno strumento, correttamente utilizzato, non si inventa nulla, l’apparato uditivo si.

Ciò non significa che le misure siano esaustive: le misure si fanno su una grandezza (attributo) per volta, la formazione della percezione sonora è un processo olistico. Le misure producono dati riassunti in grafici e tabelle, l’ascolto può essere sintetizzato in “mi piace/non mi piace”.
Per stabilire la corrispondenza tra risultati delle misure e qualità del suono riprodotto si dovrebbero elaborare i risultati delle misure in senso olistico come farebbe il cervello (inserendo anche gli elementi caratteristici di diverse popolazioni di audiofili). Attualmente possiamo solo misurare gli attributi del suono e confrontarli con quello che sappiamo sulle soglie della percezione dei diversi attributi.

Ciò non toglie che il progettista di diffusori acustici non sia in grado di progettare un sistema “ben suonante” anche senza eseguire alcuna prova di ascolto: dipende dai mezzi che ha a disposizione. Per esempio basta realizzare un diffusore secondo i criteri elaborati da Toole: il risultato è sicuramente un ottimo diffusore (anche se non il migliore in assoluto per tutti come del resto avviene sempre).

Differenze Oggettive e Soggettive
Dopo un’ora di ascolto a livelli SPL anche normali (tipo qualche Watt RMS) la risposta dei diffusori acustici non è la stessa rispetto a quando l’ascolto è iniziato. La temperatura degli altoparlanti è aumentata (anche nei magneti), il ferrofluido (se c’è) ha viscosità minore, i componenti del filtro cross-over non hanno più gli stessi valori. Tanto per fare un esempio: una variazione di 15° della temperatura della bobina mobile di un altoparlante comporta una variazione di SPL superiore a 0.5 dB (udibile). La temperatura della bobina mobile di un altoparlante può raggiungere allegramente i 100°.

Dove non si misurano differenze oggettive restano le differenze soggettive che vanno ricondotte alle mutate condizioni del soggetto: la differenza (nel suono) non c’è ma il soggetto percepisce un suono diverso perché le “sue” condizioni sono mutate (quindi le variazioni percepite sono la misura delle mutate condizioni del soggetto).

Nel rapporto stimolo-soggetto-percezione la percezione cambia se cambia lo stimolo, se cambia il soggetto o se cambia l’ambiente (influendo sul soggetto).

Si tenga presente che solo il 5% degli impulsi nervosi va dall’orecchio al cervello mentre il 95% degli impulsi nervosi vanno dal cervello all’orecchio e modificano la sensazione su indicazione (inconscia) del cervello. Si dice che il cervello “scarti” oltre il 99% delle informazioni sonore che riceve per concentrarsi solo su quello che “vuole” sentire. In sostanza sentiamo quello che il cervello vuole farci sentire (se vogliamo, anche inconsciamente, sentire una differenza la sentiremo anche se non c’è).

Confronti a distanza di tempo:
La memorizzazione di un fenomeno è un processo dinamico (cambia nel tempo). Prendiamo una conversazione: nell’immediato siamo in grado di ripetere le frasi pronunciate dal nostro interlocutore ma a distanza di tempo potremo ricordare il tono della conversazione, l’argomento, una sintesi del contenuto. Nel tempo i dettagli vengono perduti e rimangono gli “attributi”. Esistono più livelli di memorizzazione: con il tempo i dettagli vanno persi, aumenta il livello di sintesi e alla fine restano solo gli attributi. Questa è una necessità: la capacità di memorizzazione del cervello è limitata quindi i ricordi “meno usati” vengono prima sintetizzati e poi anche cancellati.

Per realizzare “l’economia di pensiero” il cervello tende alla “unità di trattazione” organizzando i ricordi in categorie (o attributi).
(Prof. Villi : Corso di Metodi Matematici per la Fisica – Istituto G. Galilei – Università di Padova)

Trascorso un certo periodo di tempo da quando abbiamo assistito ad un concerto. possiamo aver dimenticato tutto ma ancora ricordare che il concerto era bellissimo. Ad un evento come un concerto resta collegato solo un attributo: “bellissimo”. E’ dimostrato che, quando incontriamo una persona sovrappeso a distanza di tempo, ci sembra più magra: questo avviene perché la sua siluette è stata memorizzata come “sovrappeso” e non con i dettagli delle sue dimensioni reali.

I confronti di “qualità sonora” basati sulla memoria (a distanza di tempo) non sono affidabili perché, come tutti i fenomeni, anche il suono viene memorizzato per attributi: possiamo ricordare che il suono del tal diffusore era magnifico ma in realtà non ricordiamo altro che questo. Quando si fanno dei confronti, specie per valutare la qualità della riproduzione, tutto ciò va tenuto presente. Così come si dovrebbero tenere nella massima considerazione gli “attributi del suono” ovvero quei termini che utilizziamo per descrivere il suono percepito e che corrispondono alle categorie che utilizza il nostro cervello per memorizzare gli eventi. Non si può negare che esista una corrispondenza tra le parole che usiamo e le categorie utilizzate per la memorizzazione.

Confronti in commutazione rapida
Roger Sanders afferma che possiamo ricordare un suono per 2 secondi. Che siano 2 secondi o due minuti ha poca importanza: sicuramente la memoria acustica è molto breve.
Se i confronti a distanza di tempo sono poco affidabili, gli unici che possono funzionare sono quelli che confrontano, in rapida successione, brevi frammenti sonori. Affinché il confronto rapido funzioni, i livelli SPL devono essere equiparati con cura (cosa quasi impossibile con i diffusori acustici a causa delle differenze di risposta in frequenza che producono livelli di loudness soggettiva diversi). Per i cavi e gli amplificatori equiparare i livelli è molto meno complicato. Purtroppo la tendenza “naturale” è quella di giudicare “migliore” il dispositivo che suona più forte. La causa è fisiologica e va ricercata nei sistemi che riducono il guadagno dell’apparato uditivo per i segnali più intensi ma che impiegano un certo tempo per ripristinare la condizione normale (isteresi). L’altro motivo è il Loudness (curve isofoniche): dati due diffusori acustici con la stessa risposta in frequenza , quello che suona più forte sembra avere più bassi e più acuti.

Commutando da un diffusore più sensibile a uno meno sensibile, ci troviamo ad essere temporaneamente “sordi” e con una limitata capacità di percepire le frequenze agli estremi della banda audio.

Per far apparire migliore un diffusore efficiente si fa così: si fa suonare almeno due minuti il diffusore che suona più forte, quindi si commuta per qualche secondo su quello che suona più piano e si torna subito a quello che suona più forte. Il diffusore meno sensibile sembra muto.

Loudness Soggettivo
Quando un amplificatore a valvole o un diffusore acustico viene sollecitato da segnali di ampiezza crescente produce tassi di distorsione crescente. Questo induce nell’ascoltatore l’impressione che il livello SPL prodotto sia maggiore di quello effettivo. Una giustificazione di questo fenomeno chiama in causa la distorsione prodotta dall’ a.u. (aural distortion = distorsione aurale). L’a.u. assocerebbe la maggiore distorsione ad un livello SPL superiore scambiando la distorsione che esso stesso produce con quella presente nel suono ascoltato. Questo avverrebbe quando il pattern di distorsione presente nel suono è simile al pattern della distorsione aurale.
Teoria interessante.
Tuttavia questo incremento di loudness soggettivo si verifica con tutti gli amplificatori a valvole e viene percepito da tutti. Possibile che tutti gli amplificatori producano un pattern di dispersione simile a quello dell’orecchio (che tra l’altro cambia da individuo a individuo)? E che effetto ha la distorsione di intermodulazione (che certamente l’orecchio genera ed è altrettanto presente nella riproduzione)?
Più probabilmente, per percepire un incremento di loudness soggettivo, è sufficiente che la catena di riproduzione generi un tasso di distorsione crescente con il livello del suono riprodotto.
Questo fenomeno va classificato come una illusione acustica.
Si noti che con gli amplificatori fortemente controreazionati, dove la distorsione cresce violentemente superato il limite del clipping, l’incremento del loudness soggettivo non si verifica ma avviene un fenomeno molto diverso: quando l’amplificatore clippa si percepisce la “verticalizzazione” della scena acustica che sembra compattarsi al centro ed espandersi in senso verticale (clipping contemporaneo dei due canali stereo).
Va notato che l’incremento del loudness soggettivo può indurre a giudicare “migliore” un sistema che distorce di più limitatamente alle basse frequenze (per esempio un diffusore a tre vie con primo taglio sotto 200 Hz). Ne segue che anche l’ascolto critico va associato a qualche misura.
Si potrebbe anche dire che, se la distorsione dà delle sensazioni gradevoli, non è il caso di cercare di eliminarla. Pur sempre di distorsione si tratta e, se non c’è, è meglio. Quando si lasciano dei difetti in un sistema di riproduzione inevitabilmente questo si comporta meglio con certi programmi e meno bene con altri. La diversa “interpretazione” che l’a.u. dà della distorsione contribuisce a rendere ancora più diverse le percezioni uditive da soggetto a soggetto.
Un soggetto allenato ed istruito a riconoscere la distorsione avrà percezioni diverse rispetto ad uno non istruito allo stesso modo.

Conclusioni
Si può valutare la qualità sonora di un impianto stereo? Si, è possibile perché le differenze esistono, si sentono e si misurano. Le differenze “vere” sono quelle che superano la soglia differenziale di percezione. Al di sotto di tale soglia può succedere di tutto in particolare sentire quello che non c’è.

Conoscere i limiti ed i difetti del sistema uditivo aiuta a non cadere nelle trappole (leggasi acquisto di dispositivi di utilità nulla se non controproducenti).

Per ottenere una valutazione sicura si devono utilizzare sia l’ascolto che le misure.

Se le misure mostrano delle differenze oggettive di entità superiore alla soglia differenziale di percezione allora le “impressioni di ascolto” riflettono differenze oggettive (altrimenti no). Quindi la ricerca deve concentrarsi, non sulla spasmodica classificazione di differenze soggettive, ma sulla determinazione delle soglie differenziali di percezione. Poi si potrà pensare al resto. Questa missione non è facile: nel caso della distorsione l’ a.u. la tollera a bassa frequenza più che alle frequenze medie e alte e addirittura dà sensazioni “positive” (incremento di loudness soggettivo) o fa apparire la risposta in frequenza più estesa verso il basso (ricostruzione della fondamentale mancante).

Secondo Sanders, quando si esegue un confronto tra dispositivi diversi, si devono tenere sotto controllo le “variabili” coinvolte e modificarne una alla volta (questo contrasta con la concezione olistica della percezione ma è coerente con la filosofia di misura). Le variabili che più spesso sfuggono al controllo (sempre secondo Sanders ma, per una volta, pienamente condivisibile) sono:

Differenze di Livello – Differenze di livello comportano variazioni nel livello di loudness soggettivo e quindi di risposta in frequenza soggettiva.

Clipping – L’ amplificatore, nelle effettive condizioni d’uso, lavora spesso in clipping o prossimo al clipping.

Ritardo – Il suono resta in memoria per poco tempo. Le commutazioni devono essere sufficientemente rapide.

Pregiudizi – Se vi aspettate di udire una differenza la sentirete anche se non c’è. Quindi bisogna ascoltare senza aspettative.

Pensieri presi qui e là…
Tra le mille altre cose la percezione uditiva è determinata dalla forma e dimensione del padiglione auricolare (pinna). E’ stato dimostrato che le riflessioni provenienti dal mixer in una control room sono molto simili a quelle prodotte dal padiglione (pinna). A causa di ciò alcune persone possono percepire il suono dei monitor provenire dall’alto mentre altre lo percepiscono semplicemente al centro dei monitor.
Rodgers, Carolyn Alexander, Ph.D. Thesis, Multidimensional Localization, Northwestern University, Evanston, IL, USA (1981)
Rodgers, Puddie C. A., ‘Pinna Transformations and Sound Reproduction’, Journal of the AES, Vol. 29, No. 4, pp. 226–234 (April 1981)

Sempre a causa delle differenze introdotte dalla pinna la percezione spaziale del campo sonoro varia da persona a persona. Ne segue che la percezione della musica riprodotta è diversa da persona a persona. Ne segue che alcune soluzioni adottate per esaltare o ridurre certi attributi della riproduzione possono essere percepite da alcuni e non da altri.
(Newell, Philip. Studio Monitoring Design, Focal Press, Oxford, UK, and Boston, USA – 1995)

Percepire l'impercettibile

Percepire l’impercettibile

Intervento (rivisto e corretto) al Forum Video HiFi del 1/11/2011:
La sensazione uditiva è il risultato di un processo olistico dove, per definizione, 1+1 può fare 3 o 4. Le misure sono un processo deterministico dove 1+1=2 (se sono fatte a modo). Ne segue che 1+1 fa sempre 2 per gli strumenti, 3 per me, 4 per te e 5 per qualche altro. Domani o tra un’ora i risultati soggettivi cambiano quelli degli strumenti restano costanti. La “realtà”, a parità di condizioni al contorno, è sempre 1+1. Per l’individuo le condizioni al contorno sono sempre diverse anche solo a causa dello scorrere del tempo. Se, cambiando un cavo, la “realtà” strumentale diventa (faccio per dire) 1+1.1=2.1 allora posso giustificare anche una variazione nella percezione soggettiva ma se resta 1+1 devo attribuire la mutata sensazione dell’ascoltatore non alla realtà misurabile ma alle mutate condizioni dell’ascoltatore. Se non concordiamo su questo aspetto c’è poco da discutere. Anche il doppio cieco ABX non garantisce che le condizioni dell’ascoltatore non mutino con il tempo o per il solo fatto di essere coinvolto in un test (e quindi di aspettarsi, consciamente o inconsciamente, una qualche variazione).
Questo non significa che non si possano fare confronti ma che si debba estendere i test ad un elevato numero di persone in modo da poter trattare i risultati statisticamente. Il vero limite dei test è lo scarso numero di soggetti coinvolti.
L’altro problema (aperto e che complica ulteriormente le cose) è la determinazione delle “soglie differenziali di percezione”.

Riferimenti

2011 – Renato Giussani – Audioplay
2001 – Daniel H. Cheever – “A NEW METHODOLOGY FOR AUDIO FREQUENCY POWER AMPLIFIER TESTING BASED ON PSYCHOACOUSTIC DATA THAT BETTER CORRELATES WITH SOUND QUALITY – 1989, Tesi di Laurea, pubblicata nel 2001
1981 – Rodgers, Carolyn Alexander – Ph.D. Thesis, Multidimensional Localization, Northwestern University, Evanston, IL, USA
1981 – Rodgers, Puddie C. A. – ‘Pinna Transformations and Sound Reproduction’, Journal of the AES, Vol. 29, No. 4, pp. 226–234
1995 – Robert Harley – Cary Audio Design CAD-300SEI integrated Amplifier – Stereophile, 25 settembre 1995 – www.stereophile.com
1995 – Newell, Philip – Studio Monitoring Design, Focal Press, Oxford, UK, and Boston, USA
1976 – H.F. Olson – Music, Phisics and Engineering – seconda edizione – Dover Publication Inc.
2011 – G. C Sticazzi – Lavarsi le orecchie come precondizione per l’ascolto critico – non pubblicato.