OMF er definitivt inne på noe her. Jeg utdyper et par momenter nedenfor
OMF skrev:
La oss si at en refleksjon finner seg et mønster ved å treffe 5 av veggene i rommet før den igjen treffer lytteposisjon i samme fase som direktelyden som kommer fra høytaleren - so m idette tilfellet spiller en ren sinus på 100 Hz.
Vi vil da oppleve en betydelig peak ved denne frekvensebn - og romkorreksjon (med parametrisk EQ) vil korrigere for denne ved å dempe output.
Dette er helt korrekt. Og avhengig av varighet på den aktuelle tone og det akustiske spillet i rommet, så kan styrken på denne peaken øke over tid før det blir steady state-nivå. Avhengig av fasegangen i refleksjonene kan det selvfølgelig også resultere i en kansellering.
Derimot vil det hvis vi bare spiller en bølelengde - ikke være noen forsterkning. Så når du spiller denne tonen i vil du i lytteposisjon måle noe helt annet, enn det du gjør hvis du spiller en sinus over et lengre tidsperiode. Selv om vi spiller samme frekvens. MAO - så vil hvor lenge du avspiller målesignalet - påvirke hvor mange ulike refleksjoner du får med i måleresultat.
Selvsagt vil refleksjonen nå frem også for "enkeltbølgen" men denne vil ikke påvirke direktelyden, men komme som en uønsket ekko.
Nå er noe så kort som en periode av en bølgelengde et lite sannsynlig scenario i praksis. Men tidsaspektet er i høyeste grad relevant. Enkelte toner vil bygge seg opp gradvis, og dette kan skje over flere titalls millisekunder. Og andre toner kan bli kansellert. Dette har en tendens til å skje mye raskere. Mange toner blir både utsatt for forsterkninger og kanselleringer og noe midt i mellom og da kan lydnivå vs. tid avtegne et ganske interessant bilde...
Korrigerer du for en utfasing ved å heve nivået - basert på hvordan dette fungerer ved en kontinuerlig sinus - så vil du først få en direktelyd som er mye høyere, og deretter vil du få en mye kraftigere forsinket refleksjon - altså dobbelt galt, selv om dette oppfører seg pent i "steady state".
Spiller man en lang tone med en frekvens som blir "kansellert" av rommet, så er det et rimelig høyt nivå før kanselleringen slår inn - og så inntrer en markant demping. Til slutt så skyter lydnivået tilværs igjen ved avslutningen - når refleksjonene ikke blir kansellert av direktelyden.
Spiller man en lang tone med frekvens som blir forsterket av rommet vil den som regel bygge seg opp i tidlig fase for så å flate ut.
Her er et frekvensplott basert på slike lange toner. Vanlig frekvensplott i bakgrunnen.
Først en liten kommentar til kurven: Den er ikke helt typisk over 10 kHz. Ofte vil den ligge høyere opp mot den vanlige maks frekvensresponsen hele veien opp.
Så en kommentar til: Kurven er ikke glattet på noen måte. Hva vi faktisk får ut av høttaleren er mye glattere enn det en vanlig frekvensmåling viser.
Kurven er framkommet ved å simulere hva som skjer når man spiller stasjonære toner gjennom høyttaleren. (Empiriske forsøk har vist at simuleringen er påligelig
). I prinsippet gjøres det en simulering per punkt i frekvensplottet. Hver simulering gir så et ujevnt forløp der lydtrykket varierer med tiden. Kurven ovenfor gjengir maks lydtrykk innenfor det tidsrommet hver tone spiller. Dette vil fange opp forsterkninger, men nedtone kanselleringer. Det er ikke gjort fryktelig mye forskning på dette området, men det lille jeg har funnet ut tyder på at makslydtrykket for en frekvens er det som samsvarer best med hvordan vi oppfatter lyden. Det henger igjen sammen med at selv kort varighet av en tone vil gi en maskeringseffekt av det som kommer etterpå. Og det man kanskje allermest ønsker å eliminere med å korrigere frekvensresponsen er maskeringseffekter.
Hvis vi hadde laget et plott som viste lydnivået etter en "passe lang stund" så hadde peakene vært de samme som ovenfor, mens dippene hadde vært en del dypere. Men langt fra så dype som kamfilteret skulle indikere.
Det er også på sin plass å understreke at taggene i kamfiltereffekter lyver kraftig. Floyd Toole skal ha sagt at kamfiltereffekten er en måle-artifakt. Når jeg simulerer en sinustone med en frekvens som matcher bunnen av en tagg - og så måler hvordan lydtrykket endrer seg over tid så er det i praksis aldri i nærheten av å være så svakt som kamfilteret indikerer. Og i starten og avslutningen kan det være et rimelig høyt nivå.
Det steady-state nivået som man i praksis oppnår er mao vesentlig høyere enn bunnene i kamfilteret viser. Men peakene - de som samsvarer med toppene i målt frekvensrespons - de skal stemme meget bra med lydnivået på musikken som kommer ut.
Utrukket jeg bruker om "statisk korreksjon" hentyder til at den parametriske EQ som romkorreksjonene baserer seg på - vil måtte ta utgangspunkt i et målevindu - og med mindre "musikksighnalet" og målevinduet er like langt - så vil korreksjonen bli feil....
Det vil bli feil selv om musikksignalet og målevinduet er like langt - fordi rommet vil endre signalstyrken mens signalet pågår. Og det blir feil fordi frekvensresponsen fra vinduet ikke forteller presist hva som faktisk foregår.
Det er mulig at group delay korreksjon gjør lydnivået litt mindre avhengig av hvor lenge tonen har vart, da en group delay korreksjon i noen grad vil nøytralisere en del refleksjoner - men det har jeg ikke funnet ut av enda.
Forskningen tyder på at denne problematikken er mest relevant i forhold til kanselleringer. Som det framgår av kurven ovenfor så er kanselleringene ofte ikke så dype som man kan ledes til å tro gjennom å studere frekvensplott. Jeg har dessverre ikke kurver tilgjengelig for øyeblikket som viser hvor dyp en kansellering reelt går etter noen millisekunder. Men typisk er at disse ligger vesentlig nærmere simuleringen ovenfor enn den takkene i kamfilteret. Men jeg kan bekrefte at kraftig korreksjon av dype dalsøkk i den vanlige frekvensresponsen ofte gir hørbare resonnanser rett fra høyttaleren.
Jeg kommer i den nærmeste tid til å teste ut korreksjonsfiltre basert på slike simuleringer som ovenfor. Om det fungerer like bra i praksis som i teorien så kommer det i Audiolense litt senere utpå våren.