Diverse Why 24/192 Music Downloads Make No Sense

Diskusjonstråd Se tråd i gallerivisning

  • U

    Utgattmedlem 762

    Gjest
    En litt interessant ting som jeg lærte underveis i tråden var hvor mye mer enn de "matematiske" 6*16=96 dB dynamisk spenn man kan formidle med "bare" 16 bits. Linken i åpningsinnlegget demonstrerte at en 1 kHz tone ved -105 dBFS stikker frem som et fyrtårn fra et støygulv nede rundt -137-138 dB med 16-bits audio.
    Det fordrer en presisering av begrepet "støygulv" og hvordan et spektrum leses. Med 16-bit kvantisering er maksimal oppnåelig SNR 98dB (for et sinussignal), og SNR er et mål på forholdet mellom signaleffekten og effekten av all støy som skapes. Når man kvantiserer med høy oppløsning blir støyen i praksis hvit, så denne støyeffekten er fordelt utover hele frekvensbåndet fra DC til Nyquist. Når man måler tar man opp et gitt antall sampler, la oss kalle tallet N, og når man gjør DFT vil man få like mange frekvenspunkter i spektrumet. Det vil si at støyeffekten i hvert frekvenspunkt i målingen er den totale støyeffekten delt på N (eller N^2 for å være presis, siden effekt summerer kvadratisk). Så den blir mindre jo lengre målingen er. Figuren under viser et spektrum av et signal med 0dB SNR, dvs at signaleffekten og støyeffekten er lik. Men støyen er fordelt utover et antall sampler, og i figuren vises støygulvet for ulike målelengder N. Man ser da at "støygulvet" blir lavere fordi det er mindre støyeffekt i hvert frekvenspunkt. Så man kan fint måle toner som er lavere enn støyeffekten på -98dB, eller for den del høre dem om forholdene ligger til rette for det.

    Pop quiz; hvis SNR er 98dB og støygulvet (hvitt) ligger på -138dB, hvor lang er målingen?

    Skjermbilde 2012-10-16 kl. 20.00.06.png
     
    Sist redigert av en moderator:
    U

    Utgattmedlem 762

    Gjest
    Ad spektrum 2: Fouriertransformen er en tapsfri, reversibel transform, så alt man gjør er å se på signalet på en annen måte, selve signalet er akkurat det samme før som etter. Fouriertransformen er egentlig "analog", dvs tidskontinuerlig, men i en datamaskin må det gjøres digitalt og den varianten kalles diskrét fouriertransform eller DFT (regnemetoden de fleste datamaskiner bruker er forøvrig kalt fast fouriertransform eller FFT). Så hvis signalet består at et antall sampler vil følgelig også spektrumet bestå av det samme antallet sampler, man har bare endret aksene. Det vil si at spektrumet egentlig bare er en rekke punkter, som signalet er, men for å øke lesbarheten trekker man som oftest rette linjer mellom punktene, slik som man trekker rette linjer mellom punktene i "trappetrinnfremstillingen" av et digitalt signal i tid.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Pop quiz; hvis SNR er 98dB og støygulvet (hvitt) ligger på -138dB, hvor lang er målingen?
    Mye igjen å lære, ser jeg. Hva med N = 20643? Resonnementet var at vi skal ned 40 dB fra 98 dB, og vi senker det gulvet med 3 dB for hver oktav. 40/3 = 13,333. Men i eksemplet er N=2^6 vist ved -15 dB (altså ikke 3dB*6=18 dB), så her er det bare å legge til Skinner's konstant som i dette tilfellet er 1, altså N=2^14,333=20643.

    Men hva om støygulvet er alt annet enn hvitt, men formet av en delta-sigma-modulator med f eks 128x oversampling, altså 2^7?
     
    U

    Utgattmedlem 762

    Gjest
    Nesten. Støyeffekten er fordelt over hele Nyquistbåndet, altså 32 av de 64 samplene i en 64-punkt DFT, så det er 10*log(1/32)=-15dB i hver sample. 10*log(1/10000) er -40dB, så 10.000 sampler i nyquistbåndet eller 20.000 for hele DFTen er svaret (du fikk avrundingsfeil fordi det er 3,0103dB/okt og ikke 3,0000).

    For en delta-sigma må man multiplisere spektraltettheten til kvantisereren med støytransferfunksjonen til modulatoren. Under antagelsen at kvantisering gir hvit støy er det lett, men det er en tilnærming og virkeligheten er en del mer kompleks med idle-tones og annet dill. Kvantisering er deterministisk og gir ikke reell hvitstøy. For en mange-bit kvantiserer lar det seg løse med dither, men for en få-bit eller 1-bit som delta-sigma typisk bruker vil normal dither kjøre modulatoren i metning så den bryter sammen. Hvis loopfilteret har høy orden er dog hvitstøytilnærmingen ganske bra selv uten dither, men 1-bit er generelt mye mer komplisert enn multibit.

    Edit: Mulig det er en faktor 2 feil i figuren og at det skal være -18dB for 64 sampler og følgelig 10.000 sampler for -40dB, sjekkes i morra.
     
    Sist redigert av en moderator:
    S

    sorgenfri

    Gjest
    Trodde jeg var med en stund, vel nå er jeg ikke det!

    :)

    Men, fortsett å poste- dette er virkelig lærerikt.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Tallet 3,0103 er ihvertfall "rundere" enn det ser ut til. Det er 10 log10(2), om det hjelper.

    Jeg forstår (sånn noenlunde) at med 16 bits, lineær skala og rektangulærfordelte signalnivåer blir kvantiseringsstøyen også rektangulærfordelt over ett kvantiseringsnivå. Altså blir signal/støy-forholdet (dvs oppløsningen) 20 log10(216) = 96,3 dB. Jeg forstår vel også (sånn noenlunde) at for det spesielle tilfellet med en ren sinusbølge ved 0 dBFS blir kvantiseringsstøyen modulert av noe som ligner på en sagtannskurve, og da blir det gjennomsnittlige signal/støy-forholdet de 98 dB som I_L nevnte.

    Dessuten har jeg skjønt at delta-sigma-modulatorer er hårete små skapninger med ikke-trivielle stabilitetsegenskaper, men som kan skyve kvantiseringsstøyen til frekvenser hvor den ikke gjør hørbar skade. En 4-bits delta-sigma vil vel ha et signal/støy-forhold på ca 24 dB, men hvis den tusler avgårde ved 5,644 MHz (128x44,1 kHz) har den ganske stor båndbredde å fordele all den støyen på. Når signalet deretter nedsamples og tilføres dither, kan det bli ganske lite støy igjen i audiobåndet og den tilsynelatende oppløsningen der blir tilsvarende høy. Lipshitz & Vanderkooy demonstrerte allerede i 2001 at en 16-bits 4x oversamplet datastrøm kunne oppnå -123 dB støygulv helt opp til 40 kHz og flat frekvensrespons til 80 kHz, og at både en 16-bits 2x oversamplet datastrøm og en 8-bits 4x oversamplet datastrøm kunne oppnå -120 dB støygulv gjennom audiobåndet og flat frekvensrespons til 80 kHz.

    Men jeg er nok ikke i stand til å regne på dette selv, annet enn å ekstrapolere at støygulvet fra en 4-bits 8x oversamplet datastrøm burde havne på samme -120 dB, og observere at vi nå har DAC'er som oversampler mye mer enn det.

    Hvilket signal/støy-forhold er egentlig teoretisk og praktisk mulig å få til med en 16-bits datastrøm med 20 kHz båndbredde, gitt state-of-the art oversampling, multibit delta-sigma og noise shaping? Da går jeg ut fra at intern bitdybde i ADC og DAC kan være mye høyere og/eller lavere enn "flaskehalsen" 16 bits i distribusjonskanalen. Det virker fortsatt for meg som om den oppløsningen kan være ganske mye mer enn de konvensjonelle 96-98 dB (som allerede er veldig mye mer enn hva en moderne CD faktisk benytter seg av).
     
    Sist redigert:
    N

    nb

    Gjest
    Et lite kuriosa som muligens er kjent for noen, men neppe for alle: Som nevnt ønsker man en samplingfrekvens som minimum er litt over det dobbelte av det som regnes som hørbart, dvs minimum 40kHz (2*20kHz). Så kan man kanskje spørre seg hvorfor man i CD-ens barndom valgte akkurat 44.1kHz og ikke 44kHz, 45kHz eller 50kHz for å ta noen rundere tall. Grunnen er å finne i datidens opptaksmedium - det var ikke harddisker, men utstyr beregnet for videoopptak.

    Forklaringen (fra John Watkinson, The Art of Digital Audio, 2nd edition, pg. 104)
    http://www.cs.columbia.edu/~hgs/audio/44.1.html

    In the early days of digital audio research, the necessary bandwidth of about 1 Mbps per audio channel was difficult to store. Disk drives had the bandwidth but not the capacity for long recording time, so attention turned to video recorders. These were adapted to store audio samples by creating a pseudo-video waveform which would convey binary as black and white levels. The sampling rate of such a system is constrained to relate simply to the field rate and field structure of the television standard used, so that an integer number of samples can be stored on each usable TV line in the field. Such a recording can be made on a monochrome recorder, and these recording are made in two standards, 525 lines at 60 Hz and 625 lines at 50 Hz. Thus it is possible to find a frequency which is a common multiple of the two and is also suitable for use as a sampling rate.
    The allowable sampling rates in a pseudo-video system can be deduced by multiplying the field rate by the number of active lines in a field (blanking lines cannot be used) and again by the number of samples in a line. By careful choice of parameters it is possible to use either 525/60 or 625/50 video with a sampling rate of 44.1KHz.
    In 60 Hz video, there are 35 blanked lines, leaving 490 lines per frame or 245 lines per field, so the sampling rate is given by :
    60 X 245 X 3 = 44.1 KHz
    In 50 Hz video, there are 37 lines of blanking, leaving 588 active lines per frame, or 294 per field, so the same sampling rate is given by
    50 X 294 X3 = 44.1 Khz. The sampling rate of 44.1 KHz came to be that of the Compact Disc. Even though CD has no video circuitry, the equipment used to make CD masters is video based and determines the sampling rate.
     
    U

    Utgattmedlem 762

    Gjest
    Edit: Mulig det er en faktor 2 feil i figuren og at det skal være -18dB for 64 sampler og følgelig 10.000 sampler for -40dB, sjekkes i morra.
    Det er en faktor 2 feil i figuren, så det skal være -18dB og 10.000. Støyeffekten er fordelt fra 0 til fs og ikke fs/2. Litt tricky å forklare uten å bli matematisk, men området fra fs/2 til fs er det komplekskonjugerte til området fra 0 til fs/2. Hvis man gjør kvadraturesampling kan man sample fra 0 til fs, men det er helt irrelevant for audio.
     
    U

    Utgattmedlem 762

    Gjest
    Jeg forstår (sånn noenlunde) at med 16 bits, lineær skala og rektangulærfordelte signalnivåer blir kvantiseringsstøyen også rektangulærfordelt over ett kvantiseringsnivå. Altså blir signal/støy-forholdet (dvs oppløsningen) 20 log10(216) = 96,3 dB.
    Hvis du har B antall bit, vil en fullskala sinusbølge ha peak-to-peak amplitude på 2^B koder. Altså er peakamplituden 2^(B-1) koder, altså er RMS-verdien 2^(B-1)/sqrt(2) koder. Iht til hvitstøyapproksimasjonen er kvantiseringsstøy hvit med RMS-verdi 1/sqrt(12). SNR=20*log(signal_rms/støy_rms), så sett inn det over og du får 6.02*B+1.76. Med B=16 (CD-audio) blir det 98.08dB maksimal oppnåelig SNR. Hvis du antar at signalet er en tilfeldig variabel med flat distribusjon mellom 0 og 2^B får du at SNR=6.02*B dB eller 96.32dB. Musikk er forøvrig hverken enkelt sinus eller en rektangulær sannsynlighetsdistribusjon over hele kodeområdet så ingen av tallene er "riktige" sånn sett, men det som har noe å si er uansett at støyen er konstant. Så får signalet eller musikken være hva den er.

    Som en digresjon baserer lossless komprimering seg på sannsynlighetsdistribusjonen til musikk som en tilfeldig variabel, og man har funnet ut at Laplacedistribusjon gir best tilnærming for de fleste typer musikk og det er den som stort set brukes i entropikodingen, men det blir utenfor tema.

    Dessuten har jeg skjønt at delta-sigma-modulatorer er hårete små skapninger med ikke-trivielle stabilitetsegenskaper, men som kan skyve kvantiseringsstøyen til frekvenser hvor den ikke gjør hørbar skade.
    Stemmer.

    En 4-bits delta-sigma vil vel ha et signal/støy-forhold på ca 24 dB...
    Nei, lavere. Den totale støyen vil alltid øke når du plasserer en kvantiserer i en delta-sigma-loop fordi det er umulig å realisere delayfrie sløyfer, men filteret vil skyve mesteparten til høye frekvenser som er utenfor audiobåndet når du oversampler. Hvor mye som er in-band vil helt avhenge av filterfunksjonen til loopfilteret. Se kap.2 her.

    Når signalet deretter nedsamples og tilføres dither, kan det bli ganske lite støy igjen i audiobåndet og den tilsynelatende oppløsningen der blir tilsvarende høy.
    Riktig bortsett fra at man aldri tilføyer dither annet enn før kvantisering. Hvis du tilføyer dither etterpå gjør du ikke noe annet enn å legge til støy.

    Lipshitz & Vanderkooy demonstrerte allerede i 2001 at en 16-bits 4x oversamplet datastrøm kunne oppnå -123 dB støygulv helt opp til 40 kHz...
    SNR eller integrert støygulv vil jeg anta at du mener, støygulvet som sådan, dvs spektraltettheten til støyen, avhenger som sagt av lengden til målingen. Lipshitz og Vanderkooy er forøvrig veldig flinke folk med god evne til å formidle kompliserte ting på en lettfattelig måte og de har gjort mye bra arbeid på teoretisk delta-sigma, og særlig Lipshitz er en morsom skrue. Men de er utpregede teoretikere med fokus på teoretisk matematikk og ikke så mye på praktiske implikasjoner for konverterdesign.

    Hvilket signal/støy-forhold er egentlig teoretisk og praktisk mulig å få til med en 16-bits datastrøm med 20 kHz båndbredde, gitt state-of-the art oversampling, multibit delta-sigma og noise shaping?
    I prinsippet så høy som helst, men det er primært kvantiseringsstøyen du undertrykker. Kretsstøy i første integrator i loopfilteret vil være den praktiske begrensingen da denne ikke blir undertrykket i modulatoren. Mer som praktisk støy i delta-sigma her (kap. 3).
     
    Sist redigert av en moderator:
    U

    Utgattmedlem 762

    Gjest
    Knoll og Totts "Why 1-bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications" var forøvrig en fornøyelig brannfakkel i sin tid, men de overså den kanskje viktigste grunnen.

    jitter.jpg
     

    coolbiz

    Hi-Fi freak
    Ble medlem
    31.03.2006
    Innlegg
    9.468
    Antall liker
    5.135
    Sted
    Sydvestlandet
    Torget vurderinger
    2
    Hvis du har B antall bit, vil en fullskala sinusbølge ha peak-to-peak amplitude på 2^B koder.
    Såvidt jeg skjønner, finnes det et særtilfelle der amplityden faktisk overstiger dette, ikke-intuitivt nok.

    Jeg hadde en gang et nummer av enten Hi-Fi Choice eller Hi-Fi News der Alvin Gold demonstrerte at det er mulig å tenke seg en 16-bit representasjon av en sinusbølge der peak-to-peak amplityde av den resulterende analogversjonen overstiger $FFFF.FFFF. Litt vanskelig å forklare med ord, men tenk deg at du har en høyfrekvent sinuskurve der sampleverdien $FFFF.FFFF ikke er toppen av kurven og at bølgelengden er kort nok (men likevel lenger enn det som tilsvarer halve samplingsfrekvensen) til at neste sampleverdi er under $FFFF.FFFF igjen. Gold hadde en illustrasjon som viste det på en intuitiv og overbevisende måte. Dessverre kom jeg i skade for å kaste bladet,

    Gold lagde så en test-CD med et slikt signal og fant at det var stor forskjell mellom ulike CD-spillere i hvor korrekt de håndterte dette. Han gikk så på let i CD-samlingen sin og fant at et lite antall av dem hadde dette sære fenomenet. Jeg tror det var 1 av 100 eller noe sånt. De låt visstnok hørbart dårligere i diskantområdet på de avspillerene som ikke håndterte det korrekt.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Knoll og Totts "Why 1-bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications" var forøvrig en fornøyelig brannfakkel i sin tid, men de overså den kanskje viktigste grunnen.

    Vis vedlegget 160505
    Interessant. Jeg fant forklaringen på den grafen etterhvert på side 67.
    The figure compares SJNRmax according to the estimate with simulated SNR in a high order DSM DAC. For low OSR the quantization noise dominates the simulated error while for high OSR the performance is jitter limited. It is seen that with 50ps RMS white jitter the DAC needs quite many bits to maintain hi-res audio performance.
    Altså, hvis man mater en 44,1 kHz datastrøm med 50 ps jitter til en en-bits DSM DAC med 64x oversampling, så vil det jitteret begrense oppløsningen til noen-og-åtti dB signal/støy-forhold. Det er jo ikke spesielt imponerende ved et helt realistisk jitternivå. Hvis den DACen oversampler fortere blir det bare enda mye verre. Derimot vil en 7-bits DSM DAC ikke la seg affisere i det hele tatt av det jitteret, men leverer oppimot 130 dB SNR ved 128x oversampling. Da vil vel i praksis noe annet i signalkjeden begrense oppløsningen først. One-bit DSM Considered Harmful, indeed.

    Jeg forstår deg slik at du heller ikke er noen stor fan av 24/192 PCM eller DSD (SACD) som distribusjonsformater. :)
     
    Sist redigert:

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Såvidt jeg skjønner, finnes det et særtilfelle der amplityden faktisk overstiger dette, ikke-intuitivt nok.

    Jeg hadde en gang et nummer av enten Hi-Fi Choice eller Hi-Fi News der Alvin Gold demonstrerte at det er mulig å tenke seg en 16-bit representasjon av en sinusbølge der peak-to-peak amplityde av den resulterende analogversjonen overstiger $FFFF.FFFF. Litt vanskelig å forklare med ord, men tenk deg at du har en høyfrekvent sinuskurve der sampleverdien $FFFF.FFFF ikke er toppen av kurven og at bølgelengden er kort nok (men likevel lenger enn det som tilsvarer halve samplingsfrekvensen) til at neste sampleverdi er under $FFFF.FFFF igjen. Gold hadde en illustrasjon som viste det på en intuitiv og overbevisende måte. Dessverre kom jeg i skade for å kaste bladet,

    Gold lagde så en test-CD med et slikt signal og fant at det var stor forskjell mellom ulike CD-spillere i hvor korrekt de håndterte dette. Han gikk så på let i CD-samlingen sin og fant at et lite antall av dem hadde dette sære fenomenet. Jeg tror det var 1 av 100 eller noe sånt. De låt visstnok hørbart dårligere i diskantområdet på de avspillerene som ikke håndterte det korrekt.
    Jepp. Det er en av grunnene til at det ikke alltid er noen god ide å peak-normalisere til 0 dBFS, for da kan enkelte målepunkter havne på hver sin side av den egentlige peak-verdien, og den analoge bølgeformen skal rekonstrueres til en verdi som er høyere enn 0 dBFS. Da er det jo trist hvis den som designet analogkretsene antok at 0 dBFS er absolutt max og lar kretsene svinge rail-to-rail ved det signalnivået. Da vil det nok bli en del oddeordens forvrengning på utgangene, ja. Det må vel helst sies å være en konstruksjonsfeil på DAC-siden, for signalet er jo "lovlig" ihht Red Book-standarden.

    MP3-filer er forøvrig enda mer utsatt for sånt, ettersom en del "uhørbare" deler av signalet er fjernet og signalet tilsynelatende får en større crest factor, uten at det nødvendigvis kompenseres med en tilsvarende nivåsenkning. MP3 + loudness war = audio hell.
     
    U

    Utgattmedlem 762

    Gjest
    Det finnes sikkert noen oversamplingsfiltre/sampleratekonvertere som "flipper rundt" i stedet for å saturere når de går over maksverdi, altså at b10+b10 gir b00 i stedet for b11 (tobiteksempel, b=binært). Hvis en digital adderer/multiplikator skal klippe i stedet for å "flippe rundt" må det legges til logikk for å håndtere dette.

    50ps jitterstøy er mye, men det er et høst reelt problem for 1bit-konvertere. De fleste DSD-DACer desimerer DSD-strømmen til en vanlig PCM-strøm før de oversampler og rekvantiserer på nytt, så i praksis er signalkjeden stort sett lengre med DSD. 24/192 ser jeg ingen problemer med, datalagring er uansett nesten gratis så hvorfor ikke?
     

    coolbiz

    Hi-Fi freak
    Ble medlem
    31.03.2006
    Innlegg
    9.468
    Antall liker
    5.135
    Sted
    Sydvestlandet
    Torget vurderinger
    2
    <...>, for da kan enkelte målepunkter havne på hver sin side av den egentlige peak-verdien, og den analoge bølgeformen skal rekonstrueres til en verdi som er høyere enn 0 dBFS.
    Det var en mye bedre forklaring enn min. Takk.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    50 ps RMS jitter er vel omtrent som en Squeezebox SB3 eller Duet. Spec'en sier "< 50 ps (standard deviation)" og hvis jeg forstår grafen riktig ("white" = Gaussian?) så blir vel det omtrent det samme som du brukte. Nå har jeg ikke tall tilgjengelig, men mener å huske at forskjellige CD-transporter havnet mellom 50 og 150 ps RMS i en gruppetest for noen år siden. Min Logitech Transporter har oppgitt jitter 18 ps std.dev., forresten.
     
    Sist redigert:
    U

    Utgattmedlem 762

    Gjest
    ^ På coax-utgangen kanskje, men klokka skal forhåpentligvis gjennom en PLL eller to før det blir samplingsjitter. Uansett bruker den nesten garantert ikke 1-bit konvertere, har ikke sett sånne siden "bitstream" var et in-begrep.
     

    CDWMcInSpots

    Hi-Fi freak
    Ble medlem
    30.09.2010
    Innlegg
    7.551
    Antall liker
    564
    Sted
    Bergensregionen
    Benchmark DAC2 HGC: High Headroom DSP + Orban Loudness Meter

    Såvidt jeg skjønner, finnes det et særtilfelle der amplityden faktisk overstiger dette, ikke-intuitivt nok.

    Jeg hadde en gang et nummer av enten Hi-Fi Choice eller Hi-Fi News der Alvin Gold demonstrerte at det er mulig å tenke seg en 16-bit representasjon av en sinusbølge der peak-to-peak amplityde av den resulterende analogversjonen overstiger $FFFF.FFFF. Litt vanskelig å forklare med ord, men tenk deg at du har en høyfrekvent sinuskurve der sampleverdien $FFFF.FFFF ikke er toppen av kurven og at bølgelengden er kort nok (men likevel lenger enn det som tilsvarer halve samplingsfrekvensen) til at neste sampleverdi er under $FFFF.FFFF igjen. Gold hadde en illustrasjon som viste det på en intuitiv og overbevisende måte. Dessverre kom jeg i skade for å kaste bladet,

    Gold lagde så en test-CD med et slikt signal og fant at det var stor forskjell mellom ulike CD-spillere i hvor korrekt de håndterte dette. Han gikk så på let i CD-samlingen sin og fant at et lite antall av dem hadde dette sære fenomenet. Jeg tror det var 1 av 100 eller noe sånt. De låt visstnok hørbart dårligere i diskantområdet på de avspillerene som ikke håndterte det korrekt.
    Jepp. Det er en av grunnene til at det ikke alltid er noen god ide å peak-normalisere til 0 dBFS, for da kan enkelte målepunkter havne på hver sin side av den egentlige peak-verdien, og den analoge bølgeformen skal rekonstrueres til en verdi som er høyere enn 0 dBFS. Da er det jo trist hvis den som designet analogkretsene antok at 0 dBFS er absolutt max og lar kretsene svinge rail-to-rail ved det signalnivået. Da vil det nok bli en del oddeordens forvrengning på utgangene, ja. Det må vel helst sies å være en konstruksjonsfeil på DAC-siden, for signalet er jo "lovlig" ihht Red Book-standarden.

    MP3-filer er forøvrig enda mer utsatt for sånt, ettersom en del "uhørbare" deler av signalet er fjernet og signalet tilsynelatende får en større crest factor, uten at det nødvendigvis kompenseres med en tilsvarende nivåsenkning. MP3 + loudness war = audio hell.
    High Headroom DSP
    Benchmark Media Systems, Inc. har lansert Benchmark DAC2 HGC som bl.a. har en funksjon de kaller "High Headroom DSP - with 3.5 dB "Excess" Digital Headroom" som så langt jeg har forstått, nettopp skal håndtere dette problemet:

    High Headroom DSP - with 3.5 dB "Excess" Digital Headroom

    All of the digital processing in the DAC2 HGC is designed to handle signals as high as +3.5 dBFS. Most digital systems clip signals that exceed 0 dBFS. The 0 dBFS limitation seems reasonable, as 0 dBFS is the highest sinusoidal signal level that can be represented in a digital system. However, a detailed investigation of the mathematics of PCM digital systems will reveal that inter-sample peaks may reach levels slightly higher than +3 dBFS while individual samples never exceed 0 dBFS. These inter-sample overs are common in commercial releases, and are of no consequence in a PCM system until they reach an interpolation process. But, for a variety of reasons, virtually all audio D/A converters use an interpolation process. The interpolation process is absolutely necessary to achieve 24-bit state-of-the art conversion performance. Unfortunately, inter-sample overs cause clipping in most interpolators. This clipping produces distortion products that are non-harmonic and non-musical . We believe these broadband distortion products often add a harshness or false high-frequency sparkle to digital reproduction. The DAC2 HGC avoids these problems by maintaining at least 3.5 dB of headroom in the entire conversion system. We believe this added headroom is a groundbreaking improvement.
    Orban Loudness Meter: Reconstructed Peak
    Vis vedlegget 158685
    [...]
    Jeg har nå brukt ovennevnte Orban Loudness Meter litt nå og da i noen få (3?) uker. Det ser ut til å være et riktig nyttig verktøy med betydelig potensiale
    [...]
    Legg forøvrig spesielt merke til [...] "Reconstructed Peak". Deres og andre innstillinger kan justeres. Asbjørn har tidligere skrevet om problematikken som "Reconstructed Peak" belyser. Hvis det digitale signalet stadig når 0 dBFS, vil det konverterte (bølge)signalet overstige 0 dBFS og gi forvrengning.
    [...]
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.699
    Antall liker
    7.007
    @I_L: Går det an å si noe om et analogt signal taper seg ved en AD-DA konvertering i forhold til en ren analog signalvei fra mikrofon til høyttaler ideelt sett?
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.699
    Antall liker
    7.007
    Et tenkt ideelt scenario.
    1. Du synger et ubehandlet signal inn i en mikrofon som går gjennom en AD DA konvertering inn forsterker og ut i høyttalere.
    2. Du synger samme ubehadlete signalet inn i en mikrofon som går rett inn i forsterkning og ut i høyttalerene.

    Vil det digitalkonverterte signalet begrenses i forhold til det som går rett i en forsterker eller vil disse to signalene ideelt sett lyde helt likt.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Ideelt sett bør de låte helt likt. Transparent A/D og D/A-konvertering er ikke noe stort problem, definitivt ikke hvis man kan bruke datarater som 24 bit/96 kHz. Et slikt signal kan representere alt vi kan høre og enda mye mer. I praksis kan det tenkes at det blir mindre hørbar "skade" på signalet hvis det overføres digitalt enn om det går i en analog mikrofonkabel med noen meters lengde. Eksempler:
    Shure Americas | Microphones, Wireless Systems, Headphones, Earphones
    AKG Wireless Digital
    Line 6 Digital Wireless Guitar
     
    U

    Utgattmedlem 762

    Gjest
    Idéelt sett? Hvorfor skulle det bli noen forskjell hvis det er idéelt?
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.699
    Antall liker
    7.007
    Takk for svar Asbjørn!

    I_L: Jeg leser deg/dere slik at teknologien AD-DA ideelt sett ikke gjør noe med det originale analogt signalet.

    Da vet vi det. Da er det bare å gjøre konverteringen så ideel som mulig.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Idéelt sett? Hvorfor skulle det bli noen forskjell hvis det er idéelt?
    Nå var jeg ikke helt med?

    Jeg ser ihvertfall ingen grunn til at A/D->24/96->D/A på noen måte skulle begrense signalkvaliteten sammenlignet med en meter eller tre med analog mikrofonkabel. Eventuelle hørbare avvik fra det "ideelle" vil formodentlig skje på den analoge siden. F eks er kapasitansen i gitarkabelen en viktig del av hvordan en elgitar låter, sånn at garasjebandet som står på en stor scene for første gang (med 8x så lange kabler som de har lånt her og der) kanskje ikke vil helt kjenne igjen lyden av seg selv gjennom monitorene. Min sønn gitaristen ønsker seg ihvertfall en sånn trådløs dings til jul. :)

    Edit: Min erfaring er også at en ekstra høykvalitets D/A-A/D-konvertering kan være helt transparent. Jeg greier ikke å høre noen forskjell om jeg tar signalet fra de analoge utgangene på Transporter (fra DAC) og mater det inn på de analoge inngangene på DEQX (til ADC) eller om signalet går direkte digitalt uten de to konverteringstrinnene. Det er sikkert en målbar forskjell, men hørbar? Niks.
     
    Sist redigert:
    U

    Utgattmedlem 762

    Gjest
    I_L: Jeg leser deg/dere slik at teknologien AD-DA ideelt sett ikke gjør noe med det originale analogt signalet.
    Prosessen AD-DA gjør ideelt sett ingen ting med signaler all den tid de overholder Nyquistkriteriet.
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.699
    Antall liker
    7.007
    Takk!

    I teorien vil man kunne sette flere konverteringer etter hverandre uten forringing?

    Siste dumme spørsmål: hvis det ikke skjer en degradering, hvorfor er det forskjell på chippene?
    Presiserer at jeg ikke er kritisk til svarene deres, bare benytter sjansen til å få noen svar.

    Jeg spør fordi jeg synes det er så rart at analogkjeder lyder generelt mer energisk enn signal som har vært innom konvertering.
    Elgitar er et godt eksempel.
    Kan det ha noe med forskjellig støy på hver side av konverteringen å gjøre?
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    40.103
    Antall liker
    42.976
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Hvis vi nå snakker om musikkinstrumenter til miksepult: Se den linken om elgitar, gjentatt her:
    BuildYourGuitar.com :: The Secrets of Electric Guitar Pickups

    Kapasitansen i kabelen påvirker den resonante toppen som karakteriserer elgitar-lyden. Jeg tror heller det kan ha noe med dette å gjøre, ettersom en (digital eller analog) wirelessboks normalt vil velge en eller annen fast verdi av kapasitans og resistiv last for pickupen, og at det vil kan ha en eller annen påvirkning på frekvens og høyde på den resonante toppen som gir "stinget" fra en elgitar.
     
    Sist redigert:
  • Laster inn…

Diskusjonstråd Se tråd i gallerivisning

  • Laster inn…
Topp Bunn