Det er egentlig ikke så mye mer å gjøre nå med designet for Bifrôst, med mindre Armand finner noen nye overraskelser når han tester den. Hittil har vi lært noe nytt i hver test. (En gang hørte jeg smellet nesten helt hit.) Deretter har vi gjort nye iterasjoner som har forbedret dingsen for hver gang. Versjonen han loddet sammen og testet i fjor sommer var allerede langt bedre enn den første fungerende prototypen tilbake i 2019, men jeg håper jo at denne runden gjør den enda litt mer støy- og forvrengningssvak, og langt mer robust for diverse overbelastning. Time will show.
I mellomtiden funderer jeg på støy, sånn i største almenhet. I de siste innleggene har jeg skrevet en del om støynivå, signal/støynivå, bitdybde og støytetthet. Dette er et område jeg ikke egentlig har gravd meg så mye ned i tidligere, så det var en del å forsøke å forstå om hvordan disse konseptene egentlig henger sammen. Som pauseunderholdning i tråden forsøker jeg å skrive ned noe av det jeg tror jeg har skjønt, og ender kanskje opp med å relatere støynivåene i Bifrôst til noen andre størrelser. (Spoiler alert: De støynivåene er ikke så aller verst, egentlig.) Med det samme maner jeg også frem
@I_L som sikkert vil kunne se med et halvt øye om det jeg skriver her er misforstått og i så fall korrigere meg (og med det andre halve øyet se på loop gain-kurven for Bifrôst i forrige innlegg at den er en delta-sigma-forsterker).
Vi har regnet litt frem og tilbake mellom total støy i uV for 20-20k Hz, signal/støyforholdet mellom en sinus på f eks 4.47 V rms (5 W i 4 ohm) eller 28.3 V rms (100 W i 8 ohm) og den totale støyen, og ekvivalent bitdybde tilsvarende SNR i en "perfekt" ADC med n bits oppløsning. Og vi har vist badekarformede grafer med frekvensavhengig støytetthet i litt mystiske enheter som volt pr kvadratrot av Hertz.
Jeg forstår sånn omtrent hvordan de henger sammen: Total støy er integralet eller summen av støytettheten over et visst frekvensbånd. Den får enheter i volt, og kan sammenlignes med volt rms for signalet. Det vi egentlig vil sammenligne er
effekten av signalet (f eks en 100 W sinus ved 1 kHz) med
effekten av støyen (f eks summert fra 20-20k Hz). Da burde vi regnet P1/P1=(U1^2/Z)/(U2^2/Z), men fordi decibeller er hendige greier kan vi forenkle det ved både å korte bort impedansen over og under brøkstreken, og ved å droppe kvadreringen og regne 10 log(V1^2/V2^"2) = 20 log (V1/V2). Så når vi regner ut et signal-støy-forhold som rms spenning ved klipping for en eller annen frekvens delt på totalt integrert støy over audiobåndet er det en mirakuløs forenkling som skjer.
Grafisk ser SNR gjerne ut som noe slikt, signaleffekten samlet i en enkelt frekvens som stikker opp av "gresset" i støygulvet. Man kan sammenligne effekten i den smale sinusen med effekten i den brede støyen, dvs alt "gresset" summert over båndbredden av interesse:
Vis vedlegget 917426
Støytettheten, høyden på "gresset" når det er nyklippet, er definert som det man får hvis man tar en FFT med binstørrelse 1 Hz for å vise effektspektrumet. Det er fortsatt effekt over båndbredde vi er interessert i, så egentlig er det Volt^2/Ohm Hz, men fordi decibeller fortsatt er hendige greier kan vi vise det som Volt/sqrt(Hz), integrere over frekvens til Volt, og bruke 20 log igjen. Og da kan vi plotte frekvensavhengig støygulv som for Bifrôst, her fra 10 til 100k Hz:
Vis vedlegget 917307
Nanovolt pr kvadratrothertz sier meg likevel ikke veldig mye, ikke engang når de summeres over en båndbredde og sammenlignes med en sinus med en viss spenning rms. Hvordan henger det der sammen med et komplekst musikksignal? Eller med ørets frekvensavhengige følsomhet? Vel å merke når vi sammenligner med høyden på plengresset akkurat der, ikke med totalt antall kubikkmeter gress på hele plenen?
Jeg satte sammen denne grafen mens jeg funderte, og der er det ganske mye informasjon, så spenn fast sikkerhetsbeltene:
Vis vedlegget 917579
X-aksen vist øverst er frekvens, fra 10 Hz til 100 kHz, logaritmisk skala. Y-aksen til venstre følger konvensjonen fra digitalverdenen med 0 dB (FS) øverst og regner nedover fra det. Nullpunktet her tilsvarer 120 dB SPL, lydtrykket 1 m foran en hypotetisk høyttaler med 100 dB effektivitet @ 1 W som får 100 W inn uten å komprimere eller forvrenge. Med 8 ohm impedans er det en +/- 40 V sinus over terminalene, eller 28.3 V rms. For enkelhets skyld har jeg også vist aksen i dB SPL på høyre side.
En enkelt ren sinustone med 100 W effekt, 28.3 V rms i 8 ohm, vil vises som et punkt langs X-aksen ved den aktuelle frekvensen, f eks den røde prikken ved 1 kHz. Derfra kan vi regne oss nedover i decibeller både med lydtrykk og spenning, i sammenlignbare enheter.
Den
røde kurven er ørets følsomhet ihht ISO 226, tidligere kjent som Fletcher-Munson-kurven. Dette viser høreterskelen for en enkelt tone ved en viss frekvens i et stille rom. Siden de 120 dB er smerteterskelen ("full utstyring") kan vi regne nedover derfra og få -120 dB ved 1 kHz, tilsvarende 0 dB SPL. Tone-lignende lyder under denne kurven greier vi ikke høre, selv om de presenteres enkeltvis og uten noen andre maskerende lyder. Lyden av en mygg i den andre enden av et stille soverom, fem meter fra nesetippen, er omtrent 0 dB SPL ved 450-550 Hz.
This blog post compares examples of noise levels. It is broken down by Noise Source, Decibel Level, and Decibel Effect.
www.iacacoustics.com
En enkelt ren sinustone ved 1 kHz på grensen til hørbarhet ved 0 dB SPL 1 m foran nevnte høyttaler er da -120 dB fra full utstyring og -100 dB fra 1 W og 2.83 V rms, dvs 28.3 uV rms og 0.1 nW i 8 ohm. Det er også et punkt på grafen, nærmere bestemt punktet (x=1000, y=-120) på den røde kurven.
De to
blå kurvene representerer frekvensspektrumet av typisk musikksignal. Det er bredspektret med nivå som varierer med frekvens. Litt grovt er det flatt fra ca 50 Hz til 1000 Hz, og faller omtrent som 1/f over det. Her har jeg lagt på et lite ekstra løft mellom 50 og 100 Hz, og en andreordens avrulling under 50 Hz (-40 dB pr dekade). I virkeligheten vil spektrumet av et musikkstykke også ha en mengde mindre topper på tonene og tilsvarende daler mellom dem, som i eksemplet nedenfor, men vi glatter over den fine strukturen her og beholder bare omrisset av toppene.
Vis vedlegget 917546
Den
mørkeblå kurven er gjennomsnittlig lydtrykk. Hvis vi gjør en FFT på dette signalet med bins på 1 Hz bredde, som for støyen, vil hver enkelt bin få nivåene langs kurven. F eks -33 dB ved 1000 Hz. Når vi summerer alle bins langs kurven (root mean squared sum) summerer denne kurven seg til -17 dB, eller 103 dB SPL, 2 W tilført effekt, 4 V rms i 8 ohm i våre hypotetiske 100 dB høyttalere.
I den
lyseblå kurven har jeg også lagt til gjennomsnittlig 17 dB crest factor for noenlunde velprodusert musikk. Dette er nivået i toppene, tutti orkestra
ffff med pauker, kanoner, cymbaler og det hele. Crest factor varierer også med frekvens, mer høyere oppe, så denne kurven tilter litt oppover sammenlignet med den gjennomsnittlige. Igjen viser kurven spektral intensitet for hver frekvens, men hvis vi integrerer denne vil den summere til 120 dB SPL. Det er hva et håndholdt SPL-meter med flat vekting vil vise i toppene her. Det er også 100 W summert, flatt jern med musikksignal på vår like hypotetiske 100 W effektforsterker.
Så har vi de to
gule kurvene. De representerer kvantiseringsstøyen i et digitalt medie med en viss bitdybde og samplingfrekvens. Dette er
ikke det samme som signal/støy-forhold, det typiske 6 dB ganger antall bits, men legger også til måten støyen spres utover i frekvensbåndet på, igjen i 1 Hz brede bins. En ideell ADC med n bits vil fortsatt ha SNR = 6.02 * n + 1.76 dB når det summeres over hele båndbredden, men sampleraten bestemmer hvor bred båndbredden blir, og derfor hvor mange 1 Hz bins støyeffekten fordeles på. Antall bins dobles og støyen pr bin halveres for hver dobling av sampleraten, alt annet likt.
Den
lysegule kurven er støytettheten av 16 bits med 44.1 kHz sample rate. Da er det 22050 bins å fordele støyen på opp til Nyqvist-frekvensen, og støyintensiteten blir -(6.02 * 16 +- 1.76) - 10 log(44100/2) = -98.1 - 43,4 = -141.5 dB. Det er et godt stykke under hørbarhetsgrensen. Optimalt utnyttet er 16/44.1 tilstrekkelig til å gjengi all lyd vi kan høre, både i Hz og dB.
Den
mørkegule kurven er samme for 24/192 hirez. Da er SNR bedre og støyen dessuten fordelt over mange fler bins, så støyintensiteten blir så lav som -196 dB. Altså viser omrisset av det mørkegule rektangelet, nesten hele grafen, alt som kan gjengis med 24/192 hirez når avspillingskjeden er kalibrert slik at digital 0 dBFS tilsvarer 120 dB SPL.
Og de tre
grønne kurvene viser støyintensiteten av tre forskjellige Bifrôst-versjoner. Den mørkeste er den vi "egentlig" holder på å lage, ca 100 W i 8 ohm og med 10 dB gain. Den har 4.0 uV total støy 20 - 20k Hz og er i prinsippet samme som kurven vist i begynnelsen av dette innlegget. Den lysere er versjonen med 20 dB gain, 5.6 uV total støy, og den lyseste stiplede er 50-watteren som til og med slår LA90 i denne disiplinen. Stiplet, fordi den har bare 50 W og vil ikke være i stand til å nå toppen av grafen.
Om jeg har tenkt og regnet rett her, ser det ut til at støygulvet i Bifrôst havner ca 60 dB under hørbarhetsgrensen ved 1 kHz og 40 dB under kvantiseringsstøyen i et ideelt 16/44.1 digitalmedie. Det er ca 180 dB under full utstyring og ca 120-160 dB ned fra tutti orkestra, men fortsatt 16 dB over kvantiseringsstøyen i ideell 24/192 hirez.
Og, hvis vi sier at støyen fra en mygg på 5 m avstand er 0 dB SPL og reduseres med ytterligere 6 dB for hver dobling av avstanden, så er -60 dB SPL 10 doblinger, 2^10 = 1024, og støygulvet i Bifrôst opplevd med ørene 1 m foran en 100 dB høyttaler tilsvarer dunderet av en enkelt mygg på 5.1 km avstand. Det er kanskje godt nok for nå, men hvis vi setter fire Bifrôst i parallell og senker støyen ytterliger 6 dB flytter vi den virtuelle myggen til litt over en mils avstand. Og det bør jo holde for de fleste praktiske formål.