Kan man da si at realistisk støygulv i en vanlig stue ligger rundt 60-80 db?...Hvordan blir lydopplevelsen med tanke på rommets påvirkning, vil det overstyre en hver støy faktor som ligger under i avspillingskjeden typ SINAD ENOB, THD og SNR, SFDR og THD+N?
Jeg vet ikke. Det man kan si er at støygulvet typisk ligger ved 30-35 dB SPL, at det er frekvensavhengig og faller med økende frekvens omtrent som 1/f, og at støygulvet dannes av alt fra trafikkstøy utenfra til surringen av kjøleskap, datadingser, lyspærer og selv kablene i veggen. Musikksignal faller også omtrent som 1/f, med høyest nivå ved 50-100 Hz.
Vi vil nok helst ikke spille høyere enn ca 120 dB i toppene (smerteterskelen), men både smerteterskelen og ørets følsomhet er nokså frekvensavhengig. Vi tåler mye mer i bassen enn ved 2-3 kHz, og det er lettere å få det stille i rommet ved 2 kHz enn ved 50 Hz. Vi kan høre en mygg på 1 m hold (ca 0 dB SPL ved ca 1 kHz) i et stille soverom selv om det er litt fjern trafikkstøy i bakgrunnen og dB-meteret viser ca 25 dB bakgrunnsstøy. Ved 3-4 kHz kan vi høre ned til et sted rundt -7 dB SPL. I tillegg har vi en viss evne til å høre ting som er begravd i støygulvet, spesielt hvis det er en harmonisk serie av overtoner.
Mellom støygulv og smerteterskel går det en sone som kanskje er ca 90 dB bred, alt etter hvor stille man greier å få det i rommet og hvor gal man er med volumrattet. Vi forsøker å tre et musikksignal langs den sonen. Det gir ca 15 bits realistisk oppløsning i et lytterom ved en gitt frekvens, men selve luften har ikke så mye med det å gjøre.
Men det båndet er alt annet enn rektangulært i frekvens x bitdybde, noe som forklarer hvorfor noise shaping og lossy psykoakustiske codecs fungerer. Et rektangel som dekker alt vil kan høre bør dekke alt fra +120 dB SPL til ca -10 dB SPL, et spenn på 130 dB. Det er ca 21 bits oppløsning som lineær PCM, eller 0,00003 % THD+N om man skal garantere at man ikke hører noe annet enn hva som er på opptaket. Vi er ikke helt der ennå, men vi kan være nokså sikre på at 24 bits er mer enn nok, og at 16 bits med noise shaping sannsynligvis også er tilstrekkelig.
I frekvens kan vi oppleve noe som en tone ned til ca 15-20 Hz. Dypeste tone på et stort kirkeorgel ligger ved 16 Hz. Middelaldrende ører gir seg et sted ved 12-15 kHz, mens unge og friske kan registrere 20 kHz. Så vi behøver båndbredde på ca 20 kHz for å kunne gjengi alt mennesker med rimelighet vil være i stand til å høre. Det betyr en samplingfrekvens på minst 40 kHz + litt plass for anti-aliasing filter. CD'ens samplingfrekvens på 44,1 kHz er slett ikke så dum, men 48 kHz ville vært enda bedre og villle gitt litt mer plass for filteret. 88,2 eller 96 kHz sampling er nokså sikkert mer enn nok.
Hvor mye som er nødvendig i en lossy psykoakustisk codec er mye vanskeligere å svare på. MP3 og AAC har 32 bits oppløsning internt og kan fint dekke 130 dB dynamisk spenn, men bortsett fra det er "all bets off" med hensyn til hva det inkluderer og hva den forkaster fra signalet. Kommer an på eksakt codec, og det er mange forskjellige MP3 og AAC-codec'er.