Snickers-is
Bransjeaktør
Hvordan høres egentlig forvrengning ut i de tilfellene der forvrengning så høy at den faktisk er klart hørbar?
I lyset av tråden et oppgjør med virkeligheten tenkte jeg det kunne være interessant å forsøke å få til en fruktbar diskusjon rundt dette med harmonisk forvrengning.
Aller først vil jeg gjerne legge noen premisser for denne tråden:
- Det skal ikke være en skyttergravskrig.
- Det skal ikke handler om forsvar for egne valg.
- Det hører ikke hjemme her å lansere seg som "fornærmet" fordi man nevner utstyr som har bestemte typer forvrengning.
- Påstander bør være rimelig godt forankret i vitenskapen.
Hensikten er at man skal kunne stille spørsmål rundt, og få klarhet i emner som har med typer forvrengning man måtte finne i ulike typer utstyr og hvordan dette høres ut. Kvalitative vurderinger er av underordnet interesse i denne tråden.
Jeg prøver meg på en slags introduksjon:
Her er en liten innføring i hvordan harmonisk forvrengning høres ut og kan benyttes for eksempel i en miks:
Harmonisk forvrengning i hifiutstyr:
Det finnes utrolige mengder ulike ideer til hvordan ting skal konstrueres og bygges, og dette medfører ulike typer forvrengning. En av de "skumleste" er de høye odde komponentene man finner i en del dårlige klasse AB-forsterkere med medium motkobling. Det er så stor konsensus rundt at disse bare låter vondt at de ikke er tema for tråden.
Tråden vil derfor først og fremst handler om forsterkere med rør etter SET og PP-prinsippene, samt høyttalere generelt, og i særdeleshet fulltoner.
Single ended triode
En SET-forsterker er asymmetrisk av natur. Det sitter et rør mot bare den ene siden av strømforsyningen. På den andre siden av strømforsyningen har man ingen aktive komponenter. Dette fører som sagt til en asymmetri, og det faller naturlig at dette genererer såkalte partalls harmoniske forvrengningskomponenter, i første rekke 2. harmonisk.
Push-pull rør
En PP-forsterker på sin side er av natur symmetrisk, og ofte er symmetrien finjustert med de aktuelle rørene. En godt utført justering vil klart redusere 2. harmonisk forvrengning. Allikevel har slike forsterkere ofte ganske mye forvrengning. Dette skyldes først og fremst den høye utgangsimpedansen, og rørenes natur. Dette med rørenes natur går ut på at et rør svært tidlig begynner å "runde av" signalet, og gir en svært enkel form for komprimering. Med "enkel" mener jeg det matematiske forholdet til grunntonen. Dette resulterer typisk i 3. harmonisk forvrengning.
Høyttalerelementer:
I typiske høyttalerelementer finner vi gjerne ganske mye 2. og 3. harmonisk forvrengning. Her også er dette knyttet til asymmetri og dynamisk komprimering. Disse typene forvrengning har typisk opphav i selve motoren til driveren. Spesielt drivere med kort slaglengde har ofte voldsomme mengder 3. harmonisk forvrengning. Drivere bygget etter såkalte "vintage" prinsipper har gjerne også svært høy 2. harmonisk forvrengning, men dette kan også skyldes ren slurv på produksjonslinja på nyere drivere, eller rett og slett dårlig ingeniørarbeid.
Kan lyd bli bedre av harmonisk forvrengning?
Det enkle svaret er ja. Setter vi på et godt innspilt pianostykke med dynamisk karakter på et vanlig bilstereoanlegg vil man simpelthen ikke høre de stille partiene. Man vil kun høre lyd i de sterke partiene. Man vil også slite med å høre dynamisk innspilt tale. Løsningen er å komprimere dynamikken slik at det svake i lydbildet blir tydeligere, og det sterke i lydbildet fortsatt lar seg håndtere av anlegget. Her er vi selvsagt langt unna en hver hifi-diskusjon, så eksempelet har begrenset interesse for en hifientusiasts valg av dingser.
Tonal balanse:
En grunntone som forvrenges med harmonisk forvrengning vil følges av andre toner som ligger høyere i frekvens enn grunntonen. Om vi ser for oss gjengivelsen av et komplekst lydbilde som inneholder nok informasjon til at vi kan si en hel del om hvordan vi opplever klangbalansen, så vil et tillegg av harmonisk forvrengning uten videre øke andelen høyfrekvent innhold i lydbildet. Dette skjer allikevel uten at man endrer nivået på en eneste grunntone. Man vil med andre ord oppleve lydbildet som lysere, uten at de nødvendigvis vil være lysere etter alle tenkelige definisjoner.
Synes ikke på frekvenskurver:
En av definisjonene er hvordan vi måler frekvensrespons. Når vi måler frekvensrespons sammenlikner vi det som kommer ut av høyttalerne med det målesignalet vi sender inn i systemet. Når vi henter ut måledataene filtrerer vi bort det som ikke hører direkte sammen med målesignalet. I denne prosessen forsvinner også harmonisk forvrengning. Men denne forvrengningen finnes i impulsresponsen så borte er den ikke, den hører bare ikke hjemme i visningen av frekvensrespons.
Ørene liker at det skjer mye:
Vi har en del bevisste faktorer når det kommer til lytting, og disse er ofte tett knyttet til smak, erfaring osv. Men vi har også en del ubevisste faktorer. En av disse handler om hvor raskt og presist vi identifiserer en lyd. De som er over snittet interessert i vitenskapen på området kjenner kanskje til det som kalles usikkerhetsprinsippet. Dette er knyttet til den såkalte fouriertransformasjonen (matematisk konvertering mellom impulsrespons og frekvensrespons), og kan forklares omtrent som følger:
En enkelt tone spres utover i tidsdommenet. En enkelt impuls spres utover i frekvensdomenet. En såkalt gaussisk funksjon i frekvensdomenet vil være en gaussisk funksjon i tidsdomenet.
Hva betyr dette?
Kort sagt betyr dette at om man begynner å fokusere ting ekstremt i tidsdomenet så blir det rot i frekvensdomenet. Og om man begynner å fokusere ting ekstremt i frekvensdomenet blir det rot i tidsdomenet. Vi snakker her altså ikke om å perfeksjonere frekvens og tidsresponsen til et system, men om hendelser, altså lyder.
Vi kan se for oss en perfekt sinustone som starter og stopper. Dette start og stoppunktet er nærmest matematisk udefinerbart, og konsekvensen er at vi ender opp med en uendelig lang funksjon i tidsdomenet.
Alternativet er at vi ser for oss en frekvens, men kortest mulig hendelse i tidsdomenet. Da vil informasjonsmengden i frekvensdomenet bli uendelig og dekke alle frekvenser.
Fra naturens side:
Den siste varianten av en hendelse er er den vi kjenner typisk fra naturens side. En trussel tråkker på en kvist som knekker, det hele er ikke en ren tone, men en skarp impuls med mye frekvensinnhold. Vi reagerer umiddelbart på slike lyder og store deler av hjernen trigges.
En tone som følger en gaussisk funksjon (myk start, myk stopp både i tids og frekvensdomenet) er noe vi sjelden finner i naturen, og vi reagerer ikke på dette på samme måte.
Rene toner med minimal utstrekning i tidsdomenet er nærmest utopi, så det har vi heller ingen naturlig respons til.
Med andre ord, vi trigges mye lettere av impulser enn av rene toner på grunn av deres utbredelse i frekvensdomenet, og dermed vil vi langt lettere oppfatte hendelser som strekker seg utover i frekvenssdomenet enn hendelser som bare rammer én enkelt frekvens.
Utklingning:
Et hett tema er gjerne utklingning. Det vi da ofte snakker om er hvordan etterklangen i perkussive instrumenter høres ut. Slike instrumenter kjennetegnes gjerne av en svært bredbåndet impuls, og en etterfølgende og langt mer smalbåndet utklingning. I en del tilfeller er det bare én frekvens som klinger ut, mens selve impulsen består av utallige samtidige frekvenser. Dersom man tilfører harmonisk forvrengning til dette vil man øke antallet frekvenser som klinger ut. Dette vil dramatisk øke hørbarheten av utklingningen. Det er som om man har en EQ der man kan justere opp nivået på utklingningen. Det er faktisk ingen grense for hvor høyt dette kan løftes. Man kan tilføre så mye forvrengning at man til slutt ikke kan høre forskjell på impuls, utklingning og noe som helst annet.
Men når noen hevder at de har mer utklingning i et anlegg kan dette skyldes harmonisk forvrengning. Det er ikke bare mulig, det er svært sannsynlig.
Dette er også noe man kan bruke i studio for å tilføre nivå til etterklangen. Man kan kombinere en direct path med en path med kompressor og forvrengning som så mikses sammen. Denne metoden vil i liten grad tilføre forvrengning til impulsen, og i svært stor grad kunne brukes til å modellere etterklangen om man ikke er fornøyd med hvordan instrumentet klinger ut i virkeligheten.
Mikrodetaljer:
Et annet, og minst like hett tema er det mange kaller mikrodetaljer. Om vi studerer et typisk stereoanlegg med normal spredning, og sammenlikner dette med for eksempel dipol elektrostater vil de fleste mene at elektrostatene har langt mer mikrodetaljer. Det samme vil de fleste mene om et svært godt implementert horn som jobber langt ned i mellomtonen. Forklaringen på dette er så enkel som at man med mer ordinær spredning skaper massevis av rot i tidsdomenet. Man får en haug med kopier av viktig impulsinformasjon, og dette ligger tildels tett på direktelyden i tid, og er heller ikke veldig dempet. Dette gjør det vanskelig å skille hendelser i tidsdomenet fra hverandre.
Å begrense spredningen er en ekstremt effektiv medisin mot dette problemet, men utvalget av spredningskontrollerte høyttalere er mildt sagt ikke imponerende, spesielt om man er på budsjett.
Men hva om vi tilfører harmonisk forvrengning? Det er lett å tenke seg at det siste vi trenger er mer av noe som helst når det allerede er rot. Men i dette lydbildet vi forsøker å definere har vi en del lett definerbare hendelser i tidsdomenet, og en del ikke fullt så lett definerbare hendelser. Det som gjerne er typisk for de vanskelig definerbare hendelsene er at de ligger lenger ned i frekvens og har mindre informasjon oppover i frekvens. Vi behøver da større avstand i tid til refleksjoner for å klare å skille dem fra hverandre.
Dersom hver av disse følges av frekvenser som ligger 2 og 3 ganger høyere vil vår evne til å skille dem fra hverandre i tid øke dramatisk, både fordi våre ører (vår hjerne) lettere identifiserer hendelser som består av flere frekvenser, og fordi høyere frekvenser krever mindre plass i tidsdomenet for å gi samme grad av identifikasjon.
Det er med andre ord ikke det minste rart om man skulle oppleve at taletydeligheten øker når man tilfører betydelige mengder harmonisk forvrengning.
Konklusjon (foreløpig):
Dette er interessant, svært interessant!
Men jeg føler ikke det er noen grunn til å konkludere med at harmonisk forvrengning rent faktisk er positivt. Det gir for meg mer mening å forsøke å identifisere problemene vi har med å gjøre og se på hvilke alternativer vi har.
Dessuten vil opplevelsen av et lydbilde som er mer detaljert og har mer taletydelighet svært ofte oppleves positivt. Da føler jeg det er fort gjort å konkludere altfor raskt med at dette er en kvalitet. Har man et topp kalibrert oppsett der harmonisk forvrengning er en vesentlig del av regnestykket vil det å fjerne forvrengning uten å endre noe annet gjerne oppleves som en dramatisk nedgradering.
Andelen forvrengning må, på lik linje med høyttalernes spredning og alt annet, være en del av den totalen man kalibrerer lydbildet etter.
Kanskje man til og med burde inkludere harmonisk forvrengning som en del av beslutningsgrunnlaget for target-respons i romkorreksjonssystemer.
I lyset av tråden et oppgjør med virkeligheten tenkte jeg det kunne være interessant å forsøke å få til en fruktbar diskusjon rundt dette med harmonisk forvrengning.
Aller først vil jeg gjerne legge noen premisser for denne tråden:
- Det skal ikke være en skyttergravskrig.
- Det skal ikke handler om forsvar for egne valg.
- Det hører ikke hjemme her å lansere seg som "fornærmet" fordi man nevner utstyr som har bestemte typer forvrengning.
- Påstander bør være rimelig godt forankret i vitenskapen.
Hensikten er at man skal kunne stille spørsmål rundt, og få klarhet i emner som har med typer forvrengning man måtte finne i ulike typer utstyr og hvordan dette høres ut. Kvalitative vurderinger er av underordnet interesse i denne tråden.
Jeg prøver meg på en slags introduksjon:
Her er en liten innføring i hvordan harmonisk forvrengning høres ut og kan benyttes for eksempel i en miks:
Harmonisk forvrengning i hifiutstyr:
Det finnes utrolige mengder ulike ideer til hvordan ting skal konstrueres og bygges, og dette medfører ulike typer forvrengning. En av de "skumleste" er de høye odde komponentene man finner i en del dårlige klasse AB-forsterkere med medium motkobling. Det er så stor konsensus rundt at disse bare låter vondt at de ikke er tema for tråden.
Tråden vil derfor først og fremst handler om forsterkere med rør etter SET og PP-prinsippene, samt høyttalere generelt, og i særdeleshet fulltoner.
Single ended triode
En SET-forsterker er asymmetrisk av natur. Det sitter et rør mot bare den ene siden av strømforsyningen. På den andre siden av strømforsyningen har man ingen aktive komponenter. Dette fører som sagt til en asymmetri, og det faller naturlig at dette genererer såkalte partalls harmoniske forvrengningskomponenter, i første rekke 2. harmonisk.
Push-pull rør
En PP-forsterker på sin side er av natur symmetrisk, og ofte er symmetrien finjustert med de aktuelle rørene. En godt utført justering vil klart redusere 2. harmonisk forvrengning. Allikevel har slike forsterkere ofte ganske mye forvrengning. Dette skyldes først og fremst den høye utgangsimpedansen, og rørenes natur. Dette med rørenes natur går ut på at et rør svært tidlig begynner å "runde av" signalet, og gir en svært enkel form for komprimering. Med "enkel" mener jeg det matematiske forholdet til grunntonen. Dette resulterer typisk i 3. harmonisk forvrengning.
Høyttalerelementer:
I typiske høyttalerelementer finner vi gjerne ganske mye 2. og 3. harmonisk forvrengning. Her også er dette knyttet til asymmetri og dynamisk komprimering. Disse typene forvrengning har typisk opphav i selve motoren til driveren. Spesielt drivere med kort slaglengde har ofte voldsomme mengder 3. harmonisk forvrengning. Drivere bygget etter såkalte "vintage" prinsipper har gjerne også svært høy 2. harmonisk forvrengning, men dette kan også skyldes ren slurv på produksjonslinja på nyere drivere, eller rett og slett dårlig ingeniørarbeid.
Kan lyd bli bedre av harmonisk forvrengning?
Det enkle svaret er ja. Setter vi på et godt innspilt pianostykke med dynamisk karakter på et vanlig bilstereoanlegg vil man simpelthen ikke høre de stille partiene. Man vil kun høre lyd i de sterke partiene. Man vil også slite med å høre dynamisk innspilt tale. Løsningen er å komprimere dynamikken slik at det svake i lydbildet blir tydeligere, og det sterke i lydbildet fortsatt lar seg håndtere av anlegget. Her er vi selvsagt langt unna en hver hifi-diskusjon, så eksempelet har begrenset interesse for en hifientusiasts valg av dingser.
Tonal balanse:
En grunntone som forvrenges med harmonisk forvrengning vil følges av andre toner som ligger høyere i frekvens enn grunntonen. Om vi ser for oss gjengivelsen av et komplekst lydbilde som inneholder nok informasjon til at vi kan si en hel del om hvordan vi opplever klangbalansen, så vil et tillegg av harmonisk forvrengning uten videre øke andelen høyfrekvent innhold i lydbildet. Dette skjer allikevel uten at man endrer nivået på en eneste grunntone. Man vil med andre ord oppleve lydbildet som lysere, uten at de nødvendigvis vil være lysere etter alle tenkelige definisjoner.
Synes ikke på frekvenskurver:
En av definisjonene er hvordan vi måler frekvensrespons. Når vi måler frekvensrespons sammenlikner vi det som kommer ut av høyttalerne med det målesignalet vi sender inn i systemet. Når vi henter ut måledataene filtrerer vi bort det som ikke hører direkte sammen med målesignalet. I denne prosessen forsvinner også harmonisk forvrengning. Men denne forvrengningen finnes i impulsresponsen så borte er den ikke, den hører bare ikke hjemme i visningen av frekvensrespons.
Ørene liker at det skjer mye:
Vi har en del bevisste faktorer når det kommer til lytting, og disse er ofte tett knyttet til smak, erfaring osv. Men vi har også en del ubevisste faktorer. En av disse handler om hvor raskt og presist vi identifiserer en lyd. De som er over snittet interessert i vitenskapen på området kjenner kanskje til det som kalles usikkerhetsprinsippet. Dette er knyttet til den såkalte fouriertransformasjonen (matematisk konvertering mellom impulsrespons og frekvensrespons), og kan forklares omtrent som følger:
En enkelt tone spres utover i tidsdommenet. En enkelt impuls spres utover i frekvensdomenet. En såkalt gaussisk funksjon i frekvensdomenet vil være en gaussisk funksjon i tidsdomenet.
Hva betyr dette?
Kort sagt betyr dette at om man begynner å fokusere ting ekstremt i tidsdomenet så blir det rot i frekvensdomenet. Og om man begynner å fokusere ting ekstremt i frekvensdomenet blir det rot i tidsdomenet. Vi snakker her altså ikke om å perfeksjonere frekvens og tidsresponsen til et system, men om hendelser, altså lyder.
Vi kan se for oss en perfekt sinustone som starter og stopper. Dette start og stoppunktet er nærmest matematisk udefinerbart, og konsekvensen er at vi ender opp med en uendelig lang funksjon i tidsdomenet.
Alternativet er at vi ser for oss en frekvens, men kortest mulig hendelse i tidsdomenet. Da vil informasjonsmengden i frekvensdomenet bli uendelig og dekke alle frekvenser.
Fra naturens side:
Den siste varianten av en hendelse er er den vi kjenner typisk fra naturens side. En trussel tråkker på en kvist som knekker, det hele er ikke en ren tone, men en skarp impuls med mye frekvensinnhold. Vi reagerer umiddelbart på slike lyder og store deler av hjernen trigges.
En tone som følger en gaussisk funksjon (myk start, myk stopp både i tids og frekvensdomenet) er noe vi sjelden finner i naturen, og vi reagerer ikke på dette på samme måte.
Rene toner med minimal utstrekning i tidsdomenet er nærmest utopi, så det har vi heller ingen naturlig respons til.
Med andre ord, vi trigges mye lettere av impulser enn av rene toner på grunn av deres utbredelse i frekvensdomenet, og dermed vil vi langt lettere oppfatte hendelser som strekker seg utover i frekvenssdomenet enn hendelser som bare rammer én enkelt frekvens.
Utklingning:
Et hett tema er gjerne utklingning. Det vi da ofte snakker om er hvordan etterklangen i perkussive instrumenter høres ut. Slike instrumenter kjennetegnes gjerne av en svært bredbåndet impuls, og en etterfølgende og langt mer smalbåndet utklingning. I en del tilfeller er det bare én frekvens som klinger ut, mens selve impulsen består av utallige samtidige frekvenser. Dersom man tilfører harmonisk forvrengning til dette vil man øke antallet frekvenser som klinger ut. Dette vil dramatisk øke hørbarheten av utklingningen. Det er som om man har en EQ der man kan justere opp nivået på utklingningen. Det er faktisk ingen grense for hvor høyt dette kan løftes. Man kan tilføre så mye forvrengning at man til slutt ikke kan høre forskjell på impuls, utklingning og noe som helst annet.
Men når noen hevder at de har mer utklingning i et anlegg kan dette skyldes harmonisk forvrengning. Det er ikke bare mulig, det er svært sannsynlig.
Dette er også noe man kan bruke i studio for å tilføre nivå til etterklangen. Man kan kombinere en direct path med en path med kompressor og forvrengning som så mikses sammen. Denne metoden vil i liten grad tilføre forvrengning til impulsen, og i svært stor grad kunne brukes til å modellere etterklangen om man ikke er fornøyd med hvordan instrumentet klinger ut i virkeligheten.
Mikrodetaljer:
Et annet, og minst like hett tema er det mange kaller mikrodetaljer. Om vi studerer et typisk stereoanlegg med normal spredning, og sammenlikner dette med for eksempel dipol elektrostater vil de fleste mene at elektrostatene har langt mer mikrodetaljer. Det samme vil de fleste mene om et svært godt implementert horn som jobber langt ned i mellomtonen. Forklaringen på dette er så enkel som at man med mer ordinær spredning skaper massevis av rot i tidsdomenet. Man får en haug med kopier av viktig impulsinformasjon, og dette ligger tildels tett på direktelyden i tid, og er heller ikke veldig dempet. Dette gjør det vanskelig å skille hendelser i tidsdomenet fra hverandre.
Å begrense spredningen er en ekstremt effektiv medisin mot dette problemet, men utvalget av spredningskontrollerte høyttalere er mildt sagt ikke imponerende, spesielt om man er på budsjett.
Men hva om vi tilfører harmonisk forvrengning? Det er lett å tenke seg at det siste vi trenger er mer av noe som helst når det allerede er rot. Men i dette lydbildet vi forsøker å definere har vi en del lett definerbare hendelser i tidsdomenet, og en del ikke fullt så lett definerbare hendelser. Det som gjerne er typisk for de vanskelig definerbare hendelsene er at de ligger lenger ned i frekvens og har mindre informasjon oppover i frekvens. Vi behøver da større avstand i tid til refleksjoner for å klare å skille dem fra hverandre.
Dersom hver av disse følges av frekvenser som ligger 2 og 3 ganger høyere vil vår evne til å skille dem fra hverandre i tid øke dramatisk, både fordi våre ører (vår hjerne) lettere identifiserer hendelser som består av flere frekvenser, og fordi høyere frekvenser krever mindre plass i tidsdomenet for å gi samme grad av identifikasjon.
Det er med andre ord ikke det minste rart om man skulle oppleve at taletydeligheten øker når man tilfører betydelige mengder harmonisk forvrengning.
Konklusjon (foreløpig):
Dette er interessant, svært interessant!
Men jeg føler ikke det er noen grunn til å konkludere med at harmonisk forvrengning rent faktisk er positivt. Det gir for meg mer mening å forsøke å identifisere problemene vi har med å gjøre og se på hvilke alternativer vi har.
Dessuten vil opplevelsen av et lydbilde som er mer detaljert og har mer taletydelighet svært ofte oppleves positivt. Da føler jeg det er fort gjort å konkludere altfor raskt med at dette er en kvalitet. Har man et topp kalibrert oppsett der harmonisk forvrengning er en vesentlig del av regnestykket vil det å fjerne forvrengning uten å endre noe annet gjerne oppleves som en dramatisk nedgradering.
Andelen forvrengning må, på lik linje med høyttalernes spredning og alt annet, være en del av den totalen man kalibrerer lydbildet etter.
Kanskje man til og med burde inkludere harmonisk forvrengning som en del av beslutningsgrunnlaget for target-respons i romkorreksjonssystemer.
Sist redigert: