Mbare,
Litt svar og litt *voksenopplæring* følger
Mbare skrev:
Det jeg bet meg i merke i det intervjuet, blant mye annet, var det de sa om "group-delay corrections":
Dette dreier seg om antialiasing filtrering, så vidt jeg kan se. Det gjøres i hvert fall to steder i lydkjeden; Når mixen blir nedsamplet til 44,1kHz så må det lavpassfiltreres ved 22,05kHz ettersom CD-formatet ikke kan takle høyere frekvenser. Dernest skjer det samme i forbindelse med DA-konverteringen. Om man i forbindelse med DAC gjør en oppsampling så må man fortsatt gjøre en en lavpassfiltrering ved 22,05kHz (eller tilsvarende vha interpollering).
Siden CD-formatet har så begrenset båndbredde og siden det er noen ufravikelige tradeoffs i slike filtre, så blir det fort diskusjoner av hva som er de beste kompromissene.
Et steilt filter - som kan beholde båndbredden intakt - vil introdusere ringing / time smearing. Mens et filter som ikke ringer vil stjele litt futt i den aller øverste oktaven. Så det er en tradeoff mellom steilhet og kjapphet.
Og så kommer det som de diskuterer; Skal denne filtreringen være lineær fase (konstant group delay) eller minimumfase? Her er det også tradeoffs.
KJ: ... It turns out if one works a CD very well, with the proper noise-shaping system that is accurate to about 1 part per million, then the remaining difference between high resolution and the 44.1 is time dispersion. The other factors are really not that important. And the time dispersion can be partially corrected by doing group-delay corrections.
RH: Time dispersion, for the benefit of the readers, is a smearing of transient information that occurs in digital filters. High sampling rates relax the filter requirements so there's less of this spreading out of transient energy over time.
Her er det antialiasing filtreringen de snakker om
KJ: Excactly. That's excactly what happens, and it's very technincal, but it's highly audible.
Her er et steilt og et kjapt filter i frekvensdomenet. Eksemplene er ekstreme:
Det steile filteret beholder frekvensresponsen 99,9999% intakt, scorer og leder 1-0. Så kan vi se på hva som skjer i tidsdomenet med minimumfase varianten:
1-1. Eller kanskje 0-0 ;D
Legg merke til at jeg har zoomet litt inn, for å vise forskjellen. Men impulsen har maksverdi på under 1, så halen med ringing har et betydelig lydnivå. Det er det steile filteret som ringer mest. Steile filtre har alltid mer ringing enn slakke filtre hvis de ellers er like. Sammenhengen mellom tidsdomenet og frekvensdomenet er ganske universell. Knekkpunkter / krappe endringer i frekvensresponsen gir ringing. Slake, jevne, glatte områder i frekvensresponsen gir lite ringing.
Det at man har en slik krøllhale til høyre for impulsen betyr jo også at man totalt sett får en viss tidsforsinkelse av de frekvenser soom ringer. En slik ringing har mye til felles med en vanlig resonnans. Det er gjerne en en eller noen få frekvenser som ringer. Disse frekvensene blir i gjennomsnitt noe forsinket, og man får en fasefeil.
På grunn av fasefeilen med minimumfase anti aliasing så mener noen at det er bedre med et lineærfase filter. I dette tilfellet ser det slik ut:
Dette siste filteret gir konstant group delay. Og halehenget som kommer etter peaken er mindre enn med minimumfase varianten. Det som er negativt er at det nå er et like stort haleheng i forkant. Dette filteret er helt fasekorrekt, men som dere kan se så blir lyden smurt utover i tid her også når filteret blir steilt.
Når man holder på med 44,1kHz så er det gode muligheter for at anti alias filteret blir hørbart. Derfor gjelder det å finne fram til det beste kompromisset. Noen skryter av at de har fasekorrekt filtrering. Da vil det være ringing - eller i hvert fall en viss aktivitet også før spiken. Andre skryter av at de har filtre uten preringing. Da kan dere være sikre på at det er en minimumfase løsning som gir fasedreining og en relativt sett kraftigere ringing bak spiken. Her er det ingen gratis lunch.
Det viktigste er at man ikke tillater for mye ringing (time smearing) i tidsdomenet. Vi er vesentlig mer følsomme for ringing som kommer i forkant av en spike enn det som kommer i etterkant. Så et fasekorrekt antialias filter må ha en fin og rund bue i toppen for å fungere bra i tidsdomenet. Det må forsåvidt et minimumfase filter også.
Jeg har forsket en del i ulike filtertopologier, og det er pussig å se hvor sterkt de klassiske filter aligments står fortsatt (Chebychev, Butterworth etc) Alle delefiltrene i audiolense er optimalisert slik at man får maksimalt kjappe filtre med minimalt ringing i tidsdomenet for en gitt steilhet. Og ved en gitt steilhet er de er svært mye bedre enn konvensjonelle filtre i tidsdomenet. Så det er ikke bare tradeoffs her. Noen filterløsninger er mange klasser bedre enn andre. 8)
Dette med steilhet og ringing har også en mer generell dimensjon. Der det er skarpe kurver i frekvensresponsen - der vil det alltid være ringing. Det er bare å se på en ufiltrert måling av en høyttaler i et rom. Frekvensresponsen er berg- og dalbane. Impulsresponsen har et haleheng på mange 100 millisekunder. De to tingene henger uløselig sammen.
Jeg antar at GDC i AudioLense er det samme som de snakker om her? I så fall, og hvis disse gutta har rett, så kan vel det forklare det Petter Dale beskriver i Fidelity om hvorfor ting falt på plass når han skrudde på dette, samt kanskje også si noe om hva som er problemet med f.eks. andre romkorreksjonssystemer som ikke tar hensyn til dette? Var ikke transienter noe av det RoDa ikke syns var greit når han prøvde den Copland-saken?
Det er en viss sammenheng i den forstand at GDC vil gi en faselineær topp. Men Audiolense med GDC gir en lineærfase impuls helt bort til sofaen din. I hele audiobåndet. Det de diskuterer foregår stort sett over fra 10-15 kHz og opp og begrenser seg til det som går ut av dac'en. GDC vil reelt bidra til å kansellere romeffekter og redusere nivået på romklangen. Man får rett og slett en større dynamikk og en mye renere impulsrespons. Jeg tror nok det var de mer generelle kvaliteter man får med GDC som gjorde susen hos Petter, snarere enn fasegangen i den øverste oktaven. Det de har diskutert i TAS er atomiske lydforskjeller sammenlignet med en god lydkorreksjon, og peanuts i forhold til forskjellen mellom GDC og minimumfase korreksjon. Dessuten så tror jeg herrene hører ringingen bedre enn faseforskjellen.
Alle etablerte konkurrenter tilbyr minimumfase korreksjonsfiltre. De likner på de minimumfasefiltrene jeg viste ovenfor. Slike filtre starter med en peak og så kommer alt det som endrer frekvensresponsen i en hale etterpå. Dette er en mindre ambisiøs korreksjon enn GDC, men gjort riktig så skal det gi entydige forbedringer i lyden.
Det er enormt mange parametere som påvirker hva et minimumfase filter gjør med lyden. Forskjellen mellom to minimumfase korreksjonsløsninger er nok større enn mellom to vilkårlige dac'er som begge er basert på samme Wolfson brikke. Eller to forsterkere som benytter de samme transistorene. Ulike måleprosedyrer gir ulik kvalitet på målingene og korreksjonen. Ulike måter å filtrere og tolke målingene på har direkte effekt på lyden ut. Ulik filterlengde. Bugs. Ulike korreksjonsfilosofier. Viktige DSP-tekniske detaljer. Det er et mylder av detaljer som har betydning. Og man har nok vesentlig flere konstruksjonsmessige frihetsgradder når man lager korreksjonsløsninger enn når man lager hardware. Og så tror jeg det er stor variasjon i forhold til hvor bra de ulike korreksjonsløsningene takler mangfoldet av høyttalere og oppsett. Og her tror jeg de automatiserte løsningene innimellom er ekstra utsatt for overraskelser.
Det er mange som er strålende fornøyd med Audiolense 2.0. Den er etter min vurdering helt transparent. Ingen tvil om at GDC er klart bedre i et klasse-oppsett. Men 75% av det som gir det strålende resultatet med GDC er også i bruk i surroundversjonen og 2.0 versjonen av Audiolense. Så en minimumfasekorreksjon fra Audiolense likner nok vesentlig mer på en GDC fra Audiolense enn en nesten hvilken som helst annen minimumfase korreksjon. The Devil is in the Details.