Det er viktig å ikke glemme hva en firkantpuls består av. Kort sagt, en perfekt 50Hz firkantpuls består av 50, 150, 250, 350, 450 osv oppover (altså alle odde overharmoniske, gradvis synkende i energi).
Vi kan se her hvordan energien i en transient fordeler seg, og hvordan det samtidig avhenger av signalets varighet etc:
Det som er viktig å trekke ut av dette er hvor mye energien faller av i praksis, og dette er rent matematisk, altså uten noen form for naturlig avrulling i luft, mikrofoner og andre deler av kjeden. En tone på 100Hz/80dB har altså energi ved så lavt som 1kHz som er redusert med 70dB.
Når man spiller inn dette avhenger det av opptaksutstyret og hvordan det benyttes hvilken del av spekteret man faktisk tar opp. Første bud er at man tar opp i ekstrem nærfelt, hvis ikke får man med seg fint lite energi over 15kHz uansett, og da hjelper det ikke hvor firkantet pulsene er ut fra instrumentet, de er ikke veldig firkantede når de når frem til mikrofonen.
Dersom vi ser på instrumentmikrofoner som er i det øvre sjiktet, og beregnet for clip on (så man får tatt opp i nærfelt) er de typisk kardioide for å unngå mengder med omgivelsesstøy. Selv om disse kan ha frekvensrespons over 20k er det store mengder interferens i dette området i selve mikrofonen grunnet virkemåten til kardioidemikrofoner. Allerede ved 16kHz begynner for eksempel Neumann KK14 å flate ut, og da kommer lobingen veldig raskt. Forsøker man å spille inn firkantpulser med noe slikt blir det ikke firkant på opptaket.
Dette er altså en av de gromme sakene der ute, og det er også en av de typene med virkelig bredt frekvensspekter, og allikevel er den i seg selv et hinder.
Men allikevel har vi hoppet litt for lett over et annet poeng, for hva slags referanse til virkeligheten har vi når vi lytter til instrumenter som er spilt inn på 10cm avstand? Hvem har hørt et instrument på 10cm avstand og bruker dette som referanse?
Det er riktig, som du skriver
@pedal tilbake i 2011, at når en tone starter fra null så representerer det en overgang med svært høy båndbredde. Allikevel er ikke dette verken det samme som firkantpuls, og det er samtidig begrenset i båndbredde både av instrumentets natur, opptaksutstyret og luften.
Vi kan tenke oss at vi starter i null, også får vi en plutselig sinus. I bildet ovenfor ser man en "window function" som fader sinusbølgen inn og ut igjen. I virkeligheten har den selvsagt forholdsvis høy båndbredde i forhold til sinusbølgen. Allikevel kan vi tenke oss at denne window function er noe som naturlig oppstår i luft, det finnes i selve instrumentet, og det ligger selvsagt i opptaksutstyret i svært betydelig grad.
Ser vi på en firkantpuls gjengitt med ulike typer feil er det lett å se hvor mye galt som faktisk kan skje, i hvertfall om vi vurderer feil ut fra visuelle kvaliteter:
Felles for alle disse er at rene skarpe hjørner ikke egentlig eksisterer i praksis. Det vi egentlig har å kjempe mot er gjerne helt andre ting. Vi ønsker for eksempel ikke at utstyret skal være overfølsomt ved høye frekvenser. Her er en måling av en firkantpuls ved høy frekvens på en forsterker. Støyen på toppene er det som først fanger øyet, men legg merke til at stige og synketiden ikke er uendelig kort. Vi har en skrå opp og en skrå ned igjen. Dette kan selvsagt benyttes som argument for at vi må ha bedre forsterkere, noe jeg selvsagt ikke synes er en dum ting, men samtidig vet vi ikke bare at veien til ringing er kort, men vi vet også at tilgangen på energi over 20kHz bare er stor om du snakker med en som lever av å selge ideen om hi rez.:
Om vi ser hvordan energien fordeler seg i frekvensdomenet ser vi at vi ikke uten videre ønsker å smelle døra vid åpen for alt som skjer oppover:
Det kan være nyttig å gjengi det som skjer opp til 20kHz her, men det som skjer fra 50k og oppover ønsker vi definitivt ikke å ha med oss videre.
Også var det hørselen da. Noen som vil belære oss om de enorme forskjellene på ulike sample rates, for dernest å gjennomgå en kontrollert blindtest?