Snickers-is
Bransjeaktør
Enkle kjøreregler for å forstå og utføre kalibrering av manuelt DSP oppsett.
Mange av disuksjonene rundt DSP går ganske dypt, og det blir ofte en liten krig om prinsipper, tilnærminger og metoder. Samtidig sitter et par karer et stykke nord og prøver å få kontroll på et system med DSP og helt kurrant akustikk. Systemet består av høyttalere og subwoofere, noe som krever en eller annen form for delefilter. Det er ikke hovedtema for denne tråden, men derimot ønsker jeg å sette søkelyset på noen enkle regler man kan følge for å komme i mål med godlyden uten at det låter som om musikken er murt inn og lenket fast i veggen, for det er ingen tvil om at DSP gjort feil låter helt forferdelig.
Først noen begreper:
Her kommer det en del informasjon som er dels anekdotisk og derfor ikke noe man trenger å huske, men som kan være til hjelp ift å forstå hva som ligger bak begrepene.
Parametrisk EQ:
Selve verktøyet vi bruker er stort sett parametrisk EQ. Det betyr en EQ der man kan velge 3 verdier, nemlig frekvens, gain og Q.
Frekvens:
Intuitivt nok er dette frekvensen det aktuelle EQ-punktet er aktivt. Mer presist kan man si at det er senterfrekvensen, eller den frekvensen effekten er størst.
Gain:
Dette er hvor mye det ukorrigerte signalet påvirkes av det aktuelle EQ-punktet. Setter vi gain til +1dB betyr det at energien ved den aktuelle frekvensen økes med 1dB. Setter vi det til -1dB dempes energien ved den aktuelle frekvensen med 1dB. Står den på null betyr det at vi ikke påvirker signalet i det heletatt. Øker vi den med 3dB betyr det at det signalet vil ha dobbelt så høy effekt som når gain står til null. Setter vi gain til +6dB går det 4 ganger så mye effekt, og på +10dB går det 10 ganger så mye effekt. +6dB er også det samme som summen av to høyttalere som hver mottar samme effekt. Grunnen til at dette er +6dB og ikke +3dB er at når vi har 2 høyttalere dobler vi effekten, men samtidig øker vi den samlede virkningsgraden med 3dB. Når vi bare dobler effekten øker vi både strøm og spenning med en faktor på 1,41, noe som betyr at kraften som virker på membranen bare øker med 1,41 og ikke 2 slik man umiddelbart kunne tenke seg.
Q:
Dette er en litt komplisert parameter å forstå da den brukes i veldig mange sammenhenger. Men vi kan si at Q alltid brukes i forbindelse med en eller annen resonans. En parametrisk EQ er en resonans, og vi bruker her parameteren Q for å definere hvor bredt frekvensområde det aktuelle EQ-punktet virker over. Kort sagt kan man si at antallet oktaver = 1/Q, og en oktav er en dobling eller halvering av frekvens. Det betyr at om Q = 1 vil bredden være 1 oktav. Da er den nedre grensefrekvensen halvparten av den øvre. Dersom Q = 2 virker det hele over 1/2 oktav, og om Q= 0,5 virker det over 2 oktaver.
I forbindelse med høyttalere brukes Q blant annet om driverens parametre. En driver med høy Q vil typisk ha mindre demping i bassen og dermed levere mye bass, mens en med lav Q vil ha høy demping og dermed levere lite bass. Med andre ord skal Q være riktig, men i og med at mange faktorer påvirker Q kan man ikke si at Q skal være en bestemt verdi. Q brukes også om hvordan et delefilter fungerer. Høy Q betyr typisk en hardere avrulling, ofte assosiert med en viss heving før avrullingen starter. Lav Q i delefiltre gir typisk bedre impulsrespons, men dem samlede impulsresponsen er summen av høypass og lavpass, så her finner man heller ikke noen brukbare forenklinger som gjør at man kan ta enkle snarveier.
Innen akustikk bruker vi Q for å beskrive hvor aktiv en resonans er. En resonans med høy Q vil drøye kraftig i tid før den er i gang, og den henger desto mer igjen i tid før den toner ut. Den vil typisk legge til voldsomt mye energi ved en bestemt frekvens, men virker over et lite område. Man kan også ha utfasing som gjør at den høye energien til tross, i SS forsvinner lyden fullstendig.
Mode:
Vi kan tenke oss at vi har et rom med en viss lengde, og ved 50Hz er det plass til akkurat to hele signalperioder mellom framvegg og bakvegg. Vi vil da få en stående bølge ved 50Hz, og vi sier derfor at 50Hz er en av dette rommets moder.
Node:
I eksempelet over har vi altså plass til 2 signalperioder ved 50Hz. Ved hver endevegg vil trykket svinge mellom trykkmaksimum og trykkminimum. Vi vil i tillegg ha et punkt midt i rommet der det samme skjer. Deler vi lengden på rommet opp i 4 vil vi ha 3 delepunkter, ett midt i rommet, og ett midt mellom det midtre punktet og hver endevegg. Ved alle disse har vi trykkmaksimum. Men midt mellom disse punktene vil trykket fra den stående bølgen være tilnærmet uendret. Det er her partikkelhastigheten er størst i og med at trykket består av luftmasse som beveger seg mellom punktene med trykkmaksimum. Disse punktene med tilnærmet null trykkforskjell, men med maksimal partikkelhastighet, kaller vi for noder. Sitter vi i en node og lytter er vi med andre ord ganske upåvirket av den aktuelle resonansen, men man risikerer at bare en del av kroppen befinner seg i noden.
Frekvensrespons:
De fleste kjenner til begrepet frekvensrespons. Ideen om rett frekvensrespons ligger dypt forankret i folks hifi-overtro som en slags enkel vei til målet, enten som et faktisk mål, eller som en ren villfarelse for de vantro. Men kort sagt kan vi si at frekvensresponsen forteller oss hvor mye energi som finnes ved hver frekvens innenfor et gitt tidsområde. Dette tidsområdet kaller vi for gating.
Det som gjør at man ikke uten videre kan se på frekvensresponsen forklares dels i de neste definisjonene, men kort sagt kan man si at det skyldes at ulike fenomener behøver ulik tid på å komme i gang, det krever ulikt tidsvindu å måle ulike frekvenser. Ørene våre definerer tidsfaktorer ulikt ved ulike frekvenser, og innen musikk har ulike typer lyder ulik varighet og ulik utvikling i tid.
Gating:
Tradisjonelt var gating noe vi brukte for å kunne kutte målingen etter en viss tid for å unngå å få med refleksjoner i målingen. I dag har selve begrepet utviklet seg og metodene er flere. Vi bruker ofte frekvensavhengig gating som gir oss lenger varighet ved lave frekvenser enn ved høye. Dette gjøres for at man skal kunne vise forskjellen på det opplevde energinivået ved ulike frekvnser, og fordi det gir et tydeligere bilde av hvordan lyden oppleves. Gater vi kort i tid vil vi allikevel få med all informasjonen i toppen, mens i bunnen er vi ikke i nærheten av en gang å få med direktelyden fordi en signalperiode er lenger enn tidsvinduet vårt. Skal vi ha med to hele signalperioder ved 20Hz kan vi få noe i nærheten av en pålitelig måling ved 20Hz, men det betyr det at vårt tidsvindu tilsvarer 34 meter, noe som gir oss massevis av refleksjoner ved middels og høye frekvenser.
Ekkofri respons:
Når vi måler med så kort gating at vi ikke får med noen refleksjoner fra vegger, gulv og tak får vi det vi kaller ekkofri respons. Det samme får vi om vi måler en høyttaler i et ekkofritt rom. Den ekkofrie responsen vi kan måle i et vanlig rom er begrenset nedover i frekvens av avstanden til nærmeste reflekterende flate. I et ekkofritt rom er dette området som regel mye større, men begrenset av størrelsen og konstruksjonen av rommet. Kort sagt kan vi si at ekkofri respons er lyden av selve høyttaleren på lytteaksen.
Impulsrespons:
Dette er tidsversjonen av frekvensresponsen. Den inneholder tid og amplitude, og selv om den grafiske fremstillingen kan være uforståelig inneholder også denne all informasjon om frekvens og tid. Ofte bruker folk begrepet feilaktig for å omtale impulsvillighet. Mange hevder for eksempel at en kraftig motor og en lett membran gir bedre impulsrespons fordi akselerasjonen blir høyere. Dette er både feil bruk av begrep og en ren misforståelse også ift impulsvillighet. Kort sagt kan man si at når man tar tidsdomenet av et målesignal (og det kan i prinsippet være hva som helst), og trekker i fra tidsdomenet av det som kommer ut av høyttalerne, så får man et bilde av hva som skjer i høyttalerne, og dette er hva vi kaller impulsrespons.
Transientrespons:
Dette er typisk hva folk egentlig mener når de snakker om impulsrespons. En av tingene man lett ser her er båndbredden til en høyttaler. En høyttaler med høyere båndbredde vil også stige raskere. Enkelte forvrengningsfenomener kan man se tydelig, og etterslepet i tid kan komme ganske tydelig frem. Vi har også noe vi kaller ETC (Energy Time Curve) som er nyttig for å studere etterslepet i tid. MEN HUSK AT ØRENE ER MYE MER FØLSOMME FOR DET SOM SKJER FØR TRANSIENTEN ENN DET SOM HENGER IGJEN ETTER. Ikke dermed sagt at det som kommer etter er uviktig altså.
Tidsdomene:
Når vi studerer hvordan energien enten samlet eller for hver enkelt frekvens utvikler seg over tid snakker vi om tidsdomenet. Mange metoder finnes for å fremstille tidsdomenet grafisk. For eksempel impulsrespons, transientrespons, ETC, som er frekvensuavhengige, og CSD og wavelet, som viser hver enkelt frekvens. Det er imidlertid verdt å merke seg at noen av disse fremstiller amplitude mens andre fremstiller energiinnhold.
Amplitude:
Et signal beveger seg rundt et nullpunkt. Det betyr at en enkelt tone er en sinuskurve som beveger seg mellom to ytterpunkter, symmetrisk om null. Nivået på kurven i et gitt punkt kaller vi amplitude. Amplituden er regelmessig på null, men det er ikke det samme som at signalet er null. Impulsresponsen viser på sett og vis amplituden, men bare over et minimum av tid. Vi ser altså ikke en sinuskurve, men vi ser den responsen vi får av en gitt målepuls som er beregnet ved å regne ut forskjellen på denne referansepulsen og det faktiske målesignalet.
Energi:
Når vi studerer energi, for eksempel i wavelet, ser vi hvor lang tid det tar før energien for en gitt frekvens er oppe på maks, og hvor raskt den dempes etter toppen. I løpet av denne tiden kan man forestille seg at amplituden beveger seg vekselvis mellom + og -, og passerer null i farten. Energien forteller oss hvor kraftig signal som er tilstede, men ikke hvor høy amplituden i et gitt punkt er. Når vi studerer transientrespons og ETC vil amplituden spille en betydelig rolle, selv om fremstillingen ikke dermed sagt er ren amplitude.
Smoothing:
En rekke faktorer gjør at vi på en del målinger kan få for mye informasjon, og dermed gå glipp av det store bildet. Derfor bruker vi smoothing for å hjelpe oss til bedre å se detaljer av betydning. Dette betyr kort og godt at man tar bort detaljer som er mindre enn en gitt grenseverdi. Grenseverdien er gjerne en andel av en oktav, og verdier fra 1/48 til 1/2 oktav er vanlige. Til å studere akustikk vil jeg si verdier fra 1/6 og oppover er interessante, men lavere verdier kan være nyttige for å forstå klangbalanse.
Schröder:
Når vi forsøker å gjøre en ekkofri måling kommer vi til et punkt der bølgelengdene blir for lange til at vi kan klare å skille høyttaler og rom. Vi har nå kommet til det som kalles "Schröder-frekvensen". Når vi ikke kan skille rom og høyttaler med måleinstrumenter kan vi det heller ikke med ørene. Det betyr at fra dette området og nedover vil ørene våre høre rom og høyttaler som ett, mens over dette området vil vi høre rom og høyttaler som adskilte fenomener.
Punktmåling:
Når vi måler med målemikrofon i et gitt punkt i rommet får vi en punktmåling. En slik måling gjør det mulig å ta vare på en fullstendig impulsrespons, men det er også viktig å huske at den bare er gyldig for akkurat dette punktet. Punktmålinger er mest nyttige over Schröder.
Feltmåling:
En feltmåling gjøres typisk med flere målepunkter. For at målingen skal ha noen verdi må man forkaste tidsinformasjonen da det ikke gir særlig mening å beregne et gjennomsnitt av denne. Man kan da også ende med en frekvens og faserespons som i sum ikke gir noen særlig mening. Feltmålinger der man beregner et slags gjennomsnitt mellom de ulike målingene er mest nyttige under Schröder.
Minimum fase:
Dette er et uhyre komplisert fenomen som jeg ikke skal gå altfor mye i dybden på. Kort sagt kan man si at for at et system skal være minimum fase må visse kriterier være oppfylt. De som er interessante for oss når det kommer til romakustikk er de som har med kausalitet og reversibilitet å gjøre. Når disse er oppfylt kan man fullt ut korrigere det som skjer. Når de ikke er oppfylt skal man være litt mer forsiktig med hva man korrigerer.
Kausalitet:
Når noe alltid forårsaker noe annet kan vi kalle et system for kausalt. Man har da et system hvor man har en input (høyttaler) og en output (målemikrofon). Dersom man har flere output, eller output er et felt vil som regel ikke kausalitet være oppfylt. Vi kan se for oss et system der man har en betydelig heving i en frekvens i ørehøyde, men samtidig et underskudd av samme frekvens i magehøyde. Det er samme fenomenet som forårsaker begge, men utfallet er forskjellig. Dersom vi har mulighet til å fjerne årsaken kan vi si at vi har gjort en gyldig korreksjon, men når valget står mellom å heve eller å dempe, og dette er en frekvens som er lav nok til at vi til en stor del oppfatter den ved hjelp av kroppen, kan vi ikke korrigere den effektivt.
Reversibilitet:
Når vi studerer et rom kan vi tenke oss at et signal sendes fra et punkt A, reflekteres via B, og fanges opp i punkt C. I punkt C kommer da først direktelyden, og så den reflekterte lyden litt forsinket. For å kunne reversere dette systemet må vi sende lyd tilbake der mikrofonen står, og med 100% styrt retning. Vi sender da først lyd mot refleksjonspunktet B, også litt senere lyd rett mot A. De to vil da ankomme samtidig i A. Imidlertid er punktet C ikke retningsbestemt, det er bare et teoretisk uendelig lite punkt, så både refleksjonen og direktelyden vil gå mot både A og B og dermed summere til noe enda mer komplisert.
En kanskje enda enklere modell å forstå er der vi har 100% utfasing ved en gitt frekvens. Vi har altså punktet A (høyttaler) og punktet B (output). Vi mater energi inn i punktet A, og det kommer ingen ting ut av B. Vi kan ikke da snu dette rundt, mate ingen ting inn på B og få energi ut i punktet A.
Absolutt og delvis korreksjon:
Hadde vi hatt et system der kausalitet og reversibilitet var fullt intakt kunne vi gått hardt til verks og korrigert alt. Men her bør det manes til forsiktighet. I lytteevalueringer har systemer som korrigerer lite stort sett uten unntak blitt rangert høyere enn systemer som korrigerer mye selv om det på papiret ser langt bedre ut med mer korreksjon. Jeg kommer derfor til å bruke følgende uttrykk videre:
Fullkorreksjon: Her korrigerer man langt på vei 100% med det mål å fjerne fenomenet fra frekvensresponsen.
Delvis korreksjon: Her korrigerer man typisk så man har igjen en betydelig del av den opprinnelige feilen.
Ingen korreksjon: Her kan man prøve seg frem, men man skal ikke være redd for å la være å gjøre noe som helst.
Arbeidsmetodikken:
Destruktiv korreksjon:
Ofte stammer ønsket om DSP fra at man har ting i lydbildet man oppfatter som uønskede, eller direkte plagsomme. Dette er typisk stående bølger som er sjenerende både fordi de skaper dominerende frekvenser og fordi de forsinker hovedtyngden av energien ved den aktuelle frekvensen. Når vi angriper disse frekvensene, som da åpenbart må dempes, korrigerer vi både frekvensresponsen og minimum fase versjonen av faseresponsen. Jo hardere man går til verks med destruktiv korreksjon, jo mer livløst blir også lydbildet.
Når man gjør destruktiv korreksjon bør man i stor grad holde seg til høy Q filtre.
Konstruktiv korreksjon:
Om vi betrakter det hele fra motsatt side kan vi lete etter ting som mangler i lydbildet. Når vi har identifisert og hevet enkelte ting vi har for lite av vil vi som regel oppleve lydbildet som mer livlig, men vi eksponerer også gjerne flere moder og avvik i høyttalerne som krever oppmerksomhet.
Når man gjør konstruktiv korreksjon bør man i stor grad holde seg til medium Q filtre og absolutt ikke overdrive. Husk at det er lyden som skal være bra, ikke målekurvene.
Balansering av lydbildet:
For å få til balansen mellom liv og ro i lydbildet er det derfor viktig å veksle mellom konstruktiv og destruktiv korreksjon.
Korreksjon av klangbalanse:
I tillegg er det viktig å studere den generelle klangbalansen og korrigere denne på en slik måte at man opplever at lydbildet er passe lyst/mørkt. Her bruker man generelt filtre med svært lav Q.
Lokal klangbalanse:
Klangbalanse er ikke bare hvor mye bass og diskant man har. Det handler også om hvordan mer avgrensede toneregistre fremstilles. For eksempel vil balansen i området 5 - 12,5kHz i stor grad gi oss en slags "hvitbalanse" i lyden, mens balansen i området 1 - 5kHz gir oss følelsen av fuktighet/tørrhet i vokaler og akustikk, det gir oss i tillegg høydepersepsjon og grad av "hardhet" i diskantområdet. Videre nedover vil 320 - 1k gi oss størrelse, energi, rytme osv. 80 - 320Hz gir oss også rytme, og i stor grad impact og bestemmer også i veldig stor grad hvor rask og tørr bassen skal oppleves. 40 - 80Hz gir oss bassnivået og hvor "sidrumpa" bassen oppleves, mens under 40Hz vil de fleste oppfatte det meste som dypbass.
Man bør jobbe veldig mye med alle disse områdene, man bør bruke lav-medium Q, og man bør bruke stor grad av konstruktiv korreksjon. Ikke fordi man ikke kan ha behov for å gjøre demping, men fordi vi ofte ikke legger merke til hva som mangler og dermed fort kan overse ting som mangler fordi det ikke påkaller vår oppmerksomhet.
Korreksjon over Schröder:
Dette er et område der ørene våre klarer å skille mellom høyttaler og rom. Dersom vi korrigerer frekvensresponsen i SS i et rom som ikke er spesielt akustisk behandlet vil det i mange tilfeller medføre at lyden oppleves litt rar. Dette skyldes at vi da korrigerer høyttalerne for å ta høyde for rommet, men om vi allerede til en viss grad klarer å skille høyttaler og rom vil vi med andre ord oppfatte det som at høyttalerne låter litt rart.
Jeg vil anbefale at man fullkorrigerer høyttalerne ved hjelp av nærfeltsmåling og gating. Man kan hjelpe seg selv litt med madrasser og slikt for å kunne strekke gatingen litt og måle med litt større tidsvindu.
Delefrekvenser og nærfeltsmåling:
Man må også være oppmerksom på at måling i nærfelt ikke blir nøyaktig rundt delefrekvensene da man typisk får en viss forskyvning av avstandsforskjellen til de involverte driverne. Måler man for eksempel rett foran mellomtonen vil diskanten bli litt "tregere" i målingen enn den faktisk er fra SS. Man kan derfor godt kontrollere overgangsområdene med målinger fra SS.
Korreksjon under Schröder:
Siden vi ikke klarer å skille mellom høyttaler og rom på målinger klarer heller ikke ørene å skille mellom høyttaler og rom. Vi korrigerer derfor greit høyttaler og rom under ett fra SS. Imidlertid er det viktig å ikke gå for hardt til verks. Ikke bare er kausalitetsprinsippet dårlig ivaretatt ved lave frekvenser, men vi lytter som et felt, og ikke som to punkter. Her er noen enkle regler man kan bruke under Schröder:
1: Ikke demp resonanser 100%. Gjør man det vil man som regel ende opp med at korte lyder i musikken, og de er det mange av, ikke rekker å aktivere resonansene, mens EQ-punktene man setter er raske nok til å gjøre betydelig ugang.
2: Ikke hev for mye. Det er mye energi i dette området, og de færreste har 10dB å gå på i forsterkeren. Trenger de 100W i praksis betyr det at man må ha 1000W tilgjengelig om man skal heve 10dB. Som oftest er også disse avvikene svært store og man vil ikke klare å få dem opp på et hørbart nivå nesten uansett hvor hardt man går tilverks. Opplever man at EQ ikke har noen effekt på en gitt frekvens, så la den heller være. Hadde man flyttet favorittbandet/artisten inn i det samme rommet ville den samme frekvensen manglet, men det ville vært 100% autentisk og naturlig.
3: Bruk høy Q for å dempe resonanser.
4: Studer hvordan ting utvikler seg over tid i rommet.
5: Bruk feltmålinger for å forstå hvorvidt et målt avvik vil ha stor betydning for den opplevde lyden.
6: La ørene være sjef. Om noe høres feil ut, men man har ikke klart å finne det på målingene, let mer, mål mer, spør om hjelp.
Hvor er Schröder i mitt rom?:
Schröder er i praksis ikke én frekvens. Når de nærmeste flatene begynner å komme innenfor 1 signalperiode er vi typisk godt inne i det interessante området. Når alle flatene er innenfor mindre enn 0,25 signalperioder er rommet tilnærmet 100% trykksatt av alle frekvenser. Dette skjer over et område på mange oktaver. I praksis vil jeg oppfordre folk til å se på området 150-500 som overgangsområdet. Dette er først og fremst basert på hvordan vi tolker lyd, og ikke på den faktiske definisjonen av Schröder.
Jeg har også fokusert på korreksjon over og under Schröder, men vi kan ikke ignorere området mellom 150 og 500Hz. Her bør man benytte feltmålinger og betrakte hele kroppen som lytteorgan, man bør studere utviklingen i tidsdomenet som om det var under Schröder, men man bør også studere den ekkofrie responsen så langt det lar seg gjøre som om dette var over Schröder. Budskapet er altså at man bør bruke reglene for både over og under Schröder i dette området, og det avgjørende må være hva som låter best i praksis.
Feltmåling og tolkning:
Til slutt vil jeg si litt om kroppen som lytteorgan. Ørene våre er effektive svært høyt i frekvens, men måten vi har lært oss å lytte på stammer fra det virkelige livet. Vi er vant til at når vi snakker med andre mennesker kjenner vi stemmen deres fysisk på kroppen. Når vi legger på 10dB for å korrigere feil i frekvensresponsen er det fort gjort at lydeffekten av en stemme har blitt 10dB høyere hele veien fra brystkassa og ned. Hjernen vår aksepterer ikke at dette er korrekt lyd, og vi vil ikke tro på at en stemme kan ha så mye energi ved en gitt frekvens.
For å bedre forstå hvordan vi opplever lyd bør vi derfor gjøre minst 3, men gjerne flere målinger i ulike høyder som representerer ulike deler av kroppen. Man kan enkelt legge alle målingene inn i samme diagram for å sammenlikne dem. Enkeltmålinger som stikker av i en eller annen retning bør man vurdere å ikke korrigere for. Spesielt gjelder dette der man mangler energi i ørehøyde, men har plenty andre steder på kroppen. Allikevel kan noen resonanser, spesielt oppover i mellomtonen, som bare registreres i ørehøyde, være så påtrengene at noe bør gjøres.
Jeg husker spesielt ett oppsett der eieren hevdet at bassen var helt linjær i SS. Jeg opplevde selv en voldsomt overdreven bass, helt til jeg løftet fotsålene fra parketten.
Mange av disuksjonene rundt DSP går ganske dypt, og det blir ofte en liten krig om prinsipper, tilnærminger og metoder. Samtidig sitter et par karer et stykke nord og prøver å få kontroll på et system med DSP og helt kurrant akustikk. Systemet består av høyttalere og subwoofere, noe som krever en eller annen form for delefilter. Det er ikke hovedtema for denne tråden, men derimot ønsker jeg å sette søkelyset på noen enkle regler man kan følge for å komme i mål med godlyden uten at det låter som om musikken er murt inn og lenket fast i veggen, for det er ingen tvil om at DSP gjort feil låter helt forferdelig.
Først noen begreper:
Her kommer det en del informasjon som er dels anekdotisk og derfor ikke noe man trenger å huske, men som kan være til hjelp ift å forstå hva som ligger bak begrepene.
Parametrisk EQ:
Selve verktøyet vi bruker er stort sett parametrisk EQ. Det betyr en EQ der man kan velge 3 verdier, nemlig frekvens, gain og Q.
Frekvens:
Intuitivt nok er dette frekvensen det aktuelle EQ-punktet er aktivt. Mer presist kan man si at det er senterfrekvensen, eller den frekvensen effekten er størst.
Gain:
Dette er hvor mye det ukorrigerte signalet påvirkes av det aktuelle EQ-punktet. Setter vi gain til +1dB betyr det at energien ved den aktuelle frekvensen økes med 1dB. Setter vi det til -1dB dempes energien ved den aktuelle frekvensen med 1dB. Står den på null betyr det at vi ikke påvirker signalet i det heletatt. Øker vi den med 3dB betyr det at det signalet vil ha dobbelt så høy effekt som når gain står til null. Setter vi gain til +6dB går det 4 ganger så mye effekt, og på +10dB går det 10 ganger så mye effekt. +6dB er også det samme som summen av to høyttalere som hver mottar samme effekt. Grunnen til at dette er +6dB og ikke +3dB er at når vi har 2 høyttalere dobler vi effekten, men samtidig øker vi den samlede virkningsgraden med 3dB. Når vi bare dobler effekten øker vi både strøm og spenning med en faktor på 1,41, noe som betyr at kraften som virker på membranen bare øker med 1,41 og ikke 2 slik man umiddelbart kunne tenke seg.
Q:
Dette er en litt komplisert parameter å forstå da den brukes i veldig mange sammenhenger. Men vi kan si at Q alltid brukes i forbindelse med en eller annen resonans. En parametrisk EQ er en resonans, og vi bruker her parameteren Q for å definere hvor bredt frekvensområde det aktuelle EQ-punktet virker over. Kort sagt kan man si at antallet oktaver = 1/Q, og en oktav er en dobling eller halvering av frekvens. Det betyr at om Q = 1 vil bredden være 1 oktav. Da er den nedre grensefrekvensen halvparten av den øvre. Dersom Q = 2 virker det hele over 1/2 oktav, og om Q= 0,5 virker det over 2 oktaver.
I forbindelse med høyttalere brukes Q blant annet om driverens parametre. En driver med høy Q vil typisk ha mindre demping i bassen og dermed levere mye bass, mens en med lav Q vil ha høy demping og dermed levere lite bass. Med andre ord skal Q være riktig, men i og med at mange faktorer påvirker Q kan man ikke si at Q skal være en bestemt verdi. Q brukes også om hvordan et delefilter fungerer. Høy Q betyr typisk en hardere avrulling, ofte assosiert med en viss heving før avrullingen starter. Lav Q i delefiltre gir typisk bedre impulsrespons, men dem samlede impulsresponsen er summen av høypass og lavpass, så her finner man heller ikke noen brukbare forenklinger som gjør at man kan ta enkle snarveier.
Innen akustikk bruker vi Q for å beskrive hvor aktiv en resonans er. En resonans med høy Q vil drøye kraftig i tid før den er i gang, og den henger desto mer igjen i tid før den toner ut. Den vil typisk legge til voldsomt mye energi ved en bestemt frekvens, men virker over et lite område. Man kan også ha utfasing som gjør at den høye energien til tross, i SS forsvinner lyden fullstendig.
Mode:
Vi kan tenke oss at vi har et rom med en viss lengde, og ved 50Hz er det plass til akkurat to hele signalperioder mellom framvegg og bakvegg. Vi vil da få en stående bølge ved 50Hz, og vi sier derfor at 50Hz er en av dette rommets moder.
Node:
I eksempelet over har vi altså plass til 2 signalperioder ved 50Hz. Ved hver endevegg vil trykket svinge mellom trykkmaksimum og trykkminimum. Vi vil i tillegg ha et punkt midt i rommet der det samme skjer. Deler vi lengden på rommet opp i 4 vil vi ha 3 delepunkter, ett midt i rommet, og ett midt mellom det midtre punktet og hver endevegg. Ved alle disse har vi trykkmaksimum. Men midt mellom disse punktene vil trykket fra den stående bølgen være tilnærmet uendret. Det er her partikkelhastigheten er størst i og med at trykket består av luftmasse som beveger seg mellom punktene med trykkmaksimum. Disse punktene med tilnærmet null trykkforskjell, men med maksimal partikkelhastighet, kaller vi for noder. Sitter vi i en node og lytter er vi med andre ord ganske upåvirket av den aktuelle resonansen, men man risikerer at bare en del av kroppen befinner seg i noden.
Frekvensrespons:
De fleste kjenner til begrepet frekvensrespons. Ideen om rett frekvensrespons ligger dypt forankret i folks hifi-overtro som en slags enkel vei til målet, enten som et faktisk mål, eller som en ren villfarelse for de vantro. Men kort sagt kan vi si at frekvensresponsen forteller oss hvor mye energi som finnes ved hver frekvens innenfor et gitt tidsområde. Dette tidsområdet kaller vi for gating.
Det som gjør at man ikke uten videre kan se på frekvensresponsen forklares dels i de neste definisjonene, men kort sagt kan man si at det skyldes at ulike fenomener behøver ulik tid på å komme i gang, det krever ulikt tidsvindu å måle ulike frekvenser. Ørene våre definerer tidsfaktorer ulikt ved ulike frekvenser, og innen musikk har ulike typer lyder ulik varighet og ulik utvikling i tid.
Gating:
Tradisjonelt var gating noe vi brukte for å kunne kutte målingen etter en viss tid for å unngå å få med refleksjoner i målingen. I dag har selve begrepet utviklet seg og metodene er flere. Vi bruker ofte frekvensavhengig gating som gir oss lenger varighet ved lave frekvenser enn ved høye. Dette gjøres for at man skal kunne vise forskjellen på det opplevde energinivået ved ulike frekvnser, og fordi det gir et tydeligere bilde av hvordan lyden oppleves. Gater vi kort i tid vil vi allikevel få med all informasjonen i toppen, mens i bunnen er vi ikke i nærheten av en gang å få med direktelyden fordi en signalperiode er lenger enn tidsvinduet vårt. Skal vi ha med to hele signalperioder ved 20Hz kan vi få noe i nærheten av en pålitelig måling ved 20Hz, men det betyr det at vårt tidsvindu tilsvarer 34 meter, noe som gir oss massevis av refleksjoner ved middels og høye frekvenser.
Ekkofri respons:
Når vi måler med så kort gating at vi ikke får med noen refleksjoner fra vegger, gulv og tak får vi det vi kaller ekkofri respons. Det samme får vi om vi måler en høyttaler i et ekkofritt rom. Den ekkofrie responsen vi kan måle i et vanlig rom er begrenset nedover i frekvens av avstanden til nærmeste reflekterende flate. I et ekkofritt rom er dette området som regel mye større, men begrenset av størrelsen og konstruksjonen av rommet. Kort sagt kan vi si at ekkofri respons er lyden av selve høyttaleren på lytteaksen.
Impulsrespons:
Dette er tidsversjonen av frekvensresponsen. Den inneholder tid og amplitude, og selv om den grafiske fremstillingen kan være uforståelig inneholder også denne all informasjon om frekvens og tid. Ofte bruker folk begrepet feilaktig for å omtale impulsvillighet. Mange hevder for eksempel at en kraftig motor og en lett membran gir bedre impulsrespons fordi akselerasjonen blir høyere. Dette er både feil bruk av begrep og en ren misforståelse også ift impulsvillighet. Kort sagt kan man si at når man tar tidsdomenet av et målesignal (og det kan i prinsippet være hva som helst), og trekker i fra tidsdomenet av det som kommer ut av høyttalerne, så får man et bilde av hva som skjer i høyttalerne, og dette er hva vi kaller impulsrespons.
Transientrespons:
Dette er typisk hva folk egentlig mener når de snakker om impulsrespons. En av tingene man lett ser her er båndbredden til en høyttaler. En høyttaler med høyere båndbredde vil også stige raskere. Enkelte forvrengningsfenomener kan man se tydelig, og etterslepet i tid kan komme ganske tydelig frem. Vi har også noe vi kaller ETC (Energy Time Curve) som er nyttig for å studere etterslepet i tid. MEN HUSK AT ØRENE ER MYE MER FØLSOMME FOR DET SOM SKJER FØR TRANSIENTEN ENN DET SOM HENGER IGJEN ETTER. Ikke dermed sagt at det som kommer etter er uviktig altså.
Tidsdomene:
Når vi studerer hvordan energien enten samlet eller for hver enkelt frekvens utvikler seg over tid snakker vi om tidsdomenet. Mange metoder finnes for å fremstille tidsdomenet grafisk. For eksempel impulsrespons, transientrespons, ETC, som er frekvensuavhengige, og CSD og wavelet, som viser hver enkelt frekvens. Det er imidlertid verdt å merke seg at noen av disse fremstiller amplitude mens andre fremstiller energiinnhold.
Amplitude:
Et signal beveger seg rundt et nullpunkt. Det betyr at en enkelt tone er en sinuskurve som beveger seg mellom to ytterpunkter, symmetrisk om null. Nivået på kurven i et gitt punkt kaller vi amplitude. Amplituden er regelmessig på null, men det er ikke det samme som at signalet er null. Impulsresponsen viser på sett og vis amplituden, men bare over et minimum av tid. Vi ser altså ikke en sinuskurve, men vi ser den responsen vi får av en gitt målepuls som er beregnet ved å regne ut forskjellen på denne referansepulsen og det faktiske målesignalet.
Energi:
Når vi studerer energi, for eksempel i wavelet, ser vi hvor lang tid det tar før energien for en gitt frekvens er oppe på maks, og hvor raskt den dempes etter toppen. I løpet av denne tiden kan man forestille seg at amplituden beveger seg vekselvis mellom + og -, og passerer null i farten. Energien forteller oss hvor kraftig signal som er tilstede, men ikke hvor høy amplituden i et gitt punkt er. Når vi studerer transientrespons og ETC vil amplituden spille en betydelig rolle, selv om fremstillingen ikke dermed sagt er ren amplitude.
Smoothing:
En rekke faktorer gjør at vi på en del målinger kan få for mye informasjon, og dermed gå glipp av det store bildet. Derfor bruker vi smoothing for å hjelpe oss til bedre å se detaljer av betydning. Dette betyr kort og godt at man tar bort detaljer som er mindre enn en gitt grenseverdi. Grenseverdien er gjerne en andel av en oktav, og verdier fra 1/48 til 1/2 oktav er vanlige. Til å studere akustikk vil jeg si verdier fra 1/6 og oppover er interessante, men lavere verdier kan være nyttige for å forstå klangbalanse.
Schröder:
Når vi forsøker å gjøre en ekkofri måling kommer vi til et punkt der bølgelengdene blir for lange til at vi kan klare å skille høyttaler og rom. Vi har nå kommet til det som kalles "Schröder-frekvensen". Når vi ikke kan skille rom og høyttaler med måleinstrumenter kan vi det heller ikke med ørene. Det betyr at fra dette området og nedover vil ørene våre høre rom og høyttaler som ett, mens over dette området vil vi høre rom og høyttaler som adskilte fenomener.
Punktmåling:
Når vi måler med målemikrofon i et gitt punkt i rommet får vi en punktmåling. En slik måling gjør det mulig å ta vare på en fullstendig impulsrespons, men det er også viktig å huske at den bare er gyldig for akkurat dette punktet. Punktmålinger er mest nyttige over Schröder.
Feltmåling:
En feltmåling gjøres typisk med flere målepunkter. For at målingen skal ha noen verdi må man forkaste tidsinformasjonen da det ikke gir særlig mening å beregne et gjennomsnitt av denne. Man kan da også ende med en frekvens og faserespons som i sum ikke gir noen særlig mening. Feltmålinger der man beregner et slags gjennomsnitt mellom de ulike målingene er mest nyttige under Schröder.
Minimum fase:
Dette er et uhyre komplisert fenomen som jeg ikke skal gå altfor mye i dybden på. Kort sagt kan man si at for at et system skal være minimum fase må visse kriterier være oppfylt. De som er interessante for oss når det kommer til romakustikk er de som har med kausalitet og reversibilitet å gjøre. Når disse er oppfylt kan man fullt ut korrigere det som skjer. Når de ikke er oppfylt skal man være litt mer forsiktig med hva man korrigerer.
Kausalitet:
Når noe alltid forårsaker noe annet kan vi kalle et system for kausalt. Man har da et system hvor man har en input (høyttaler) og en output (målemikrofon). Dersom man har flere output, eller output er et felt vil som regel ikke kausalitet være oppfylt. Vi kan se for oss et system der man har en betydelig heving i en frekvens i ørehøyde, men samtidig et underskudd av samme frekvens i magehøyde. Det er samme fenomenet som forårsaker begge, men utfallet er forskjellig. Dersom vi har mulighet til å fjerne årsaken kan vi si at vi har gjort en gyldig korreksjon, men når valget står mellom å heve eller å dempe, og dette er en frekvens som er lav nok til at vi til en stor del oppfatter den ved hjelp av kroppen, kan vi ikke korrigere den effektivt.
Reversibilitet:
Når vi studerer et rom kan vi tenke oss at et signal sendes fra et punkt A, reflekteres via B, og fanges opp i punkt C. I punkt C kommer da først direktelyden, og så den reflekterte lyden litt forsinket. For å kunne reversere dette systemet må vi sende lyd tilbake der mikrofonen står, og med 100% styrt retning. Vi sender da først lyd mot refleksjonspunktet B, også litt senere lyd rett mot A. De to vil da ankomme samtidig i A. Imidlertid er punktet C ikke retningsbestemt, det er bare et teoretisk uendelig lite punkt, så både refleksjonen og direktelyden vil gå mot både A og B og dermed summere til noe enda mer komplisert.
En kanskje enda enklere modell å forstå er der vi har 100% utfasing ved en gitt frekvens. Vi har altså punktet A (høyttaler) og punktet B (output). Vi mater energi inn i punktet A, og det kommer ingen ting ut av B. Vi kan ikke da snu dette rundt, mate ingen ting inn på B og få energi ut i punktet A.
Absolutt og delvis korreksjon:
Hadde vi hatt et system der kausalitet og reversibilitet var fullt intakt kunne vi gått hardt til verks og korrigert alt. Men her bør det manes til forsiktighet. I lytteevalueringer har systemer som korrigerer lite stort sett uten unntak blitt rangert høyere enn systemer som korrigerer mye selv om det på papiret ser langt bedre ut med mer korreksjon. Jeg kommer derfor til å bruke følgende uttrykk videre:
Fullkorreksjon: Her korrigerer man langt på vei 100% med det mål å fjerne fenomenet fra frekvensresponsen.
Delvis korreksjon: Her korrigerer man typisk så man har igjen en betydelig del av den opprinnelige feilen.
Ingen korreksjon: Her kan man prøve seg frem, men man skal ikke være redd for å la være å gjøre noe som helst.
Arbeidsmetodikken:
Destruktiv korreksjon:
Ofte stammer ønsket om DSP fra at man har ting i lydbildet man oppfatter som uønskede, eller direkte plagsomme. Dette er typisk stående bølger som er sjenerende både fordi de skaper dominerende frekvenser og fordi de forsinker hovedtyngden av energien ved den aktuelle frekvensen. Når vi angriper disse frekvensene, som da åpenbart må dempes, korrigerer vi både frekvensresponsen og minimum fase versjonen av faseresponsen. Jo hardere man går til verks med destruktiv korreksjon, jo mer livløst blir også lydbildet.
Når man gjør destruktiv korreksjon bør man i stor grad holde seg til høy Q filtre.
Konstruktiv korreksjon:
Om vi betrakter det hele fra motsatt side kan vi lete etter ting som mangler i lydbildet. Når vi har identifisert og hevet enkelte ting vi har for lite av vil vi som regel oppleve lydbildet som mer livlig, men vi eksponerer også gjerne flere moder og avvik i høyttalerne som krever oppmerksomhet.
Når man gjør konstruktiv korreksjon bør man i stor grad holde seg til medium Q filtre og absolutt ikke overdrive. Husk at det er lyden som skal være bra, ikke målekurvene.
Balansering av lydbildet:
For å få til balansen mellom liv og ro i lydbildet er det derfor viktig å veksle mellom konstruktiv og destruktiv korreksjon.
Korreksjon av klangbalanse:
I tillegg er det viktig å studere den generelle klangbalansen og korrigere denne på en slik måte at man opplever at lydbildet er passe lyst/mørkt. Her bruker man generelt filtre med svært lav Q.
Lokal klangbalanse:
Klangbalanse er ikke bare hvor mye bass og diskant man har. Det handler også om hvordan mer avgrensede toneregistre fremstilles. For eksempel vil balansen i området 5 - 12,5kHz i stor grad gi oss en slags "hvitbalanse" i lyden, mens balansen i området 1 - 5kHz gir oss følelsen av fuktighet/tørrhet i vokaler og akustikk, det gir oss i tillegg høydepersepsjon og grad av "hardhet" i diskantområdet. Videre nedover vil 320 - 1k gi oss størrelse, energi, rytme osv. 80 - 320Hz gir oss også rytme, og i stor grad impact og bestemmer også i veldig stor grad hvor rask og tørr bassen skal oppleves. 40 - 80Hz gir oss bassnivået og hvor "sidrumpa" bassen oppleves, mens under 40Hz vil de fleste oppfatte det meste som dypbass.
Man bør jobbe veldig mye med alle disse områdene, man bør bruke lav-medium Q, og man bør bruke stor grad av konstruktiv korreksjon. Ikke fordi man ikke kan ha behov for å gjøre demping, men fordi vi ofte ikke legger merke til hva som mangler og dermed fort kan overse ting som mangler fordi det ikke påkaller vår oppmerksomhet.
Korreksjon over Schröder:
Dette er et område der ørene våre klarer å skille mellom høyttaler og rom. Dersom vi korrigerer frekvensresponsen i SS i et rom som ikke er spesielt akustisk behandlet vil det i mange tilfeller medføre at lyden oppleves litt rar. Dette skyldes at vi da korrigerer høyttalerne for å ta høyde for rommet, men om vi allerede til en viss grad klarer å skille høyttaler og rom vil vi med andre ord oppfatte det som at høyttalerne låter litt rart.
Jeg vil anbefale at man fullkorrigerer høyttalerne ved hjelp av nærfeltsmåling og gating. Man kan hjelpe seg selv litt med madrasser og slikt for å kunne strekke gatingen litt og måle med litt større tidsvindu.
Delefrekvenser og nærfeltsmåling:
Man må også være oppmerksom på at måling i nærfelt ikke blir nøyaktig rundt delefrekvensene da man typisk får en viss forskyvning av avstandsforskjellen til de involverte driverne. Måler man for eksempel rett foran mellomtonen vil diskanten bli litt "tregere" i målingen enn den faktisk er fra SS. Man kan derfor godt kontrollere overgangsområdene med målinger fra SS.
Korreksjon under Schröder:
Siden vi ikke klarer å skille mellom høyttaler og rom på målinger klarer heller ikke ørene å skille mellom høyttaler og rom. Vi korrigerer derfor greit høyttaler og rom under ett fra SS. Imidlertid er det viktig å ikke gå for hardt til verks. Ikke bare er kausalitetsprinsippet dårlig ivaretatt ved lave frekvenser, men vi lytter som et felt, og ikke som to punkter. Her er noen enkle regler man kan bruke under Schröder:
1: Ikke demp resonanser 100%. Gjør man det vil man som regel ende opp med at korte lyder i musikken, og de er det mange av, ikke rekker å aktivere resonansene, mens EQ-punktene man setter er raske nok til å gjøre betydelig ugang.
2: Ikke hev for mye. Det er mye energi i dette området, og de færreste har 10dB å gå på i forsterkeren. Trenger de 100W i praksis betyr det at man må ha 1000W tilgjengelig om man skal heve 10dB. Som oftest er også disse avvikene svært store og man vil ikke klare å få dem opp på et hørbart nivå nesten uansett hvor hardt man går tilverks. Opplever man at EQ ikke har noen effekt på en gitt frekvens, så la den heller være. Hadde man flyttet favorittbandet/artisten inn i det samme rommet ville den samme frekvensen manglet, men det ville vært 100% autentisk og naturlig.
3: Bruk høy Q for å dempe resonanser.
4: Studer hvordan ting utvikler seg over tid i rommet.
5: Bruk feltmålinger for å forstå hvorvidt et målt avvik vil ha stor betydning for den opplevde lyden.
6: La ørene være sjef. Om noe høres feil ut, men man har ikke klart å finne det på målingene, let mer, mål mer, spør om hjelp.
Hvor er Schröder i mitt rom?:
Schröder er i praksis ikke én frekvens. Når de nærmeste flatene begynner å komme innenfor 1 signalperiode er vi typisk godt inne i det interessante området. Når alle flatene er innenfor mindre enn 0,25 signalperioder er rommet tilnærmet 100% trykksatt av alle frekvenser. Dette skjer over et område på mange oktaver. I praksis vil jeg oppfordre folk til å se på området 150-500 som overgangsområdet. Dette er først og fremst basert på hvordan vi tolker lyd, og ikke på den faktiske definisjonen av Schröder.
Jeg har også fokusert på korreksjon over og under Schröder, men vi kan ikke ignorere området mellom 150 og 500Hz. Her bør man benytte feltmålinger og betrakte hele kroppen som lytteorgan, man bør studere utviklingen i tidsdomenet som om det var under Schröder, men man bør også studere den ekkofrie responsen så langt det lar seg gjøre som om dette var over Schröder. Budskapet er altså at man bør bruke reglene for både over og under Schröder i dette området, og det avgjørende må være hva som låter best i praksis.
Feltmåling og tolkning:
Til slutt vil jeg si litt om kroppen som lytteorgan. Ørene våre er effektive svært høyt i frekvens, men måten vi har lært oss å lytte på stammer fra det virkelige livet. Vi er vant til at når vi snakker med andre mennesker kjenner vi stemmen deres fysisk på kroppen. Når vi legger på 10dB for å korrigere feil i frekvensresponsen er det fort gjort at lydeffekten av en stemme har blitt 10dB høyere hele veien fra brystkassa og ned. Hjernen vår aksepterer ikke at dette er korrekt lyd, og vi vil ikke tro på at en stemme kan ha så mye energi ved en gitt frekvens.
For å bedre forstå hvordan vi opplever lyd bør vi derfor gjøre minst 3, men gjerne flere målinger i ulike høyder som representerer ulike deler av kroppen. Man kan enkelt legge alle målingene inn i samme diagram for å sammenlikne dem. Enkeltmålinger som stikker av i en eller annen retning bør man vurdere å ikke korrigere for. Spesielt gjelder dette der man mangler energi i ørehøyde, men har plenty andre steder på kroppen. Allikevel kan noen resonanser, spesielt oppover i mellomtonen, som bare registreres i ørehøyde, være så påtrengene at noe bør gjøres.
Jeg husker spesielt ett oppsett der eieren hevdet at bassen var helt linjær i SS. Jeg opplevde selv en voldsomt overdreven bass, helt til jeg løftet fotsålene fra parketten.