Diverse Why 24/192 Music Downloads Make No Sense

Diskusjonstråd Se tråd i gallerivisning

  • Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    En artikkel her hvor det argumenteres for at 24 bits er en hørbar forbedring:
    Dynamic Range of Home Listening Roomes and Theaters
    En stund siden jeg leste den, men kjenner jo litt til vedkommende som har skrevet den og han roter i alle fall mye når det gjelder akustikk.
    Interessant, men en nokså grunnleggende feil er at han bare postulerer at egenstøyen i DAC (dvs DAC og alle analoge kretser som kommer etter den) er subtraktive 4 bits fra oppløsningen på opptaket. Det er jo ikke sånn. Det analoge støygulvet i avspillingskjeden vet ingen ting om hvor mange bits det er i opptaket. Den støyen består av termisk støy (johnson noise) og strømstøy (shot noise) fra motstander, transistorer og lignende. Det vil gi et fast nivå i mikrovolt og milliwatt. Den delen av støyen som kommer før volumkontrollen vil følge den opp og ned i volum, mens det som kommer etter (dvs i effektforsterkerne) ligger fast. Støyen er også "hvit" i spektrum, slik at den vil ligge som en litt rufsete horisontal strek hvis man plotter den mot frekvens. I tillegg vil det komme noe "excess noise" med et 1/f-spektrum, altså fallende med frekvens. Det resulterende støygulvet havner et visst antall dB under fullt signalnivå, med litt høyere nivå ved DC og deretter nokså flatt gjennom hele audiobåndet. Som vi så med den Mark Levinson-forsterkeren litt lenger oppe i tråden, så vil den støyen begrense oppløsningen. Det skjer gjerne ved 18-20 bits, helt uavhengig av om datastrømmen er 16 eller 24 bits. X3MHC viste nettopp at 16 bits audio med noise shaping gir vesentlig bedre oppløsning enn dette ved de frekvensene hvor øret er mest følsomt, slik at det analoge støygulvet lett havner en god del høyere enn det digitale allerede ved 16 bits.

    dB(A)-vektingen i ethvert håndholdt dB-meter tar allerede hensyn til at øret har ulik følsomhet ved ulike frekvenser. Her jeg sitter er det nå ca 35 dB(A) bakgrunnsstøy og ca 42 dB(C). Det er det A-vektede tallet jeg regner som støygulv i denne typen dynamikkberegninger, men tar for sikkerhets skyld høyde for at vi kan trekke ut viktig informasjon et godt stykke nede i støygulvet, f eks 10-20 dB under. Dermed blir det interessante spennet fra ca 105 dB i rommet og ned til 35-20=15 dB. Det er 105-15 = 90 dB, eller ca 15 bits oppløsning. 16 bits med noise shaping er tilstrekkelig til å gjengi lyden av en mygg som svirrer rundt ved siden av hornmusikken på 17de mai, selv når volumkontrollen står slik at musikken gjengis med samme nivå i stua som når man står midt i korpset.

    Det er også noe som heter Balanced Noise Criterion som tar hensyn til at øret er mer følsomt ved høyere frekvenser. Studioer blir gjerne spesifisert til en slik kurve, f eks NCB-15. Langs den kurven aksepteres 11 dB ved 8 kHz, 17 dB ved 1 kHz, 38 dB ved 250 Hz, og hele 47 dB ved 63 Hz. (Se Master Handbook of Acoustics eller her: http://www.cavtocci.com/pdf/tocci.pdf)
     
    Sist redigert:

    coolbiz

    Hi-Fi freak
    Ble medlem
    31.03.2006
    Innlegg
    9.429
    Antall liker
    5.079
    Sted
    Sydvestlandet
    Torget vurderinger
    2
    Dan Lavry har også noen lesverdige white papers om dette og beslektede emner innen digital audio.

    Bl.a. går han i rette med den utbredte oppfatningen at samplingsrate og bitdybde i hifi på en måte tilsvarer megapixler i fotoverdenen.

    The notion that more is better may appeal to one's common sense. Presented with analogies
    such as more pixels for better video, or faster clock to speed computers, one may be misled to
    believe that faster sampling will yield better resolution and detail. The analogies are wrong.
    The great value offered by Nyquist's theorem is the realization that we have ALL the
    information with 100% of the detail, and no distortions, without the burden of "extra fast"
    sampling.
     

    KW

    Hi-Fi freak
    Ble medlem
    30.11.2002
    Innlegg
    6.388
    Antall liker
    390
    Sted
    Bærum
    Torget vurderinger
    1
    Kan sikkert bruke slakke filtere med 128 x upsampling fra redbook:cool:
    Min ene dac (Dac2) upsampler til 5,6mHz = 2x Sacd.
    Mvh.KW
     
    N

    nb

    Gjest
    Det er vel også de som mener at alt under 32 bits / 384kHz låter piggtråd.
     

    32bit

    Hi-Fi freak
    Ble medlem
    01.09.2003
    Innlegg
    1.239
    Antall liker
    306
    Torget vurderinger
    1
    Litt upassende navn i denne tråden jeg kanskje men.... ;)

    sampling-fallacies.png


    Noen som kan forklare meg litt mere om hvorfor ikke mere sampling skal kunne gi bedre reproduksjon av den analoge kurven ? Skjønte ikke helt det med Nyquist.....
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Da foreslår jeg et lite nettsøk på Nyquist-teoremet. Google is your friend. Wikipedia også.

    Den korte versjonen er at under visse forutsetninger vil sampling med en viss frekvens f gjengi alle frekvenser opp til f/2 perfekt. Siden hørselen er begrenset til et sted rundt 18-20 kHz for mennesker, vil en samplingsfrekvens på det dobbelte, altså 36-40 kHz, være tilstrekkelig til å gjengi alle hørbare frekvenser perfekt. Gjengivelsen blir ikke bedre enn perfekt, så det er ikke noe å vinne på å gå høyere. I praksis vil det være noen avvik fra de ideelle forutsetningene i teorien, pluss at de nødvendige lavpassfiltrene ikke kan gjøres vilkårlig bratte uten å skape andre problemer, så det trengs litt headroom også i samplingfrekvens. Derfor 44.1, 48, 88.2 og 96 kHz som ganske vanlige samplingfrekvenser. Lavry mener at den optimale samplingfrekvensen ligger rundt 60 kHz et sted.

    In essence, the theorem shows that a bandlimited analog signal can be perfectly reconstructed from an infinite sequence of samples if the sampling rate exceeds 2B samples per second, where B is the highest frequency of the original signal.
    Nyquist–Shannon sampling theorem - Wikipedia, the free encyclopedia

    http://lavryengineering.com/pdfs/lavry-digital-audio-introduction.pdf
    http://lavryengineering.com/pdfs/lavry-sampling-theory.pdf
    http://www.lavryengineering.com/pdfs/lavry-white-paper-the_optimal_sample_rate_for_quality_audio.pdf
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.700
    Antall liker
    7.011
    Fin tråd.

    Har de siste ukene for første gang hatt muligheten til å teste hirezfiler med full oppløsning fra fil til høyttaler uten nedsamplinger og slikt. Jeg har siden SACDs fødsel basert på lytting hevdet at mesteparten av forbedringene var på grunn av mastringsforskjeller. Det er i utgangspunktet ikke noe galt i det at de som er opptatt av god lyd får en master som er tilrettelagt god audiokvalitet, det som jeg rynker på nesen over er at man muligens solgte på feil grunnlag.

    MEN, når man sammenligner en høyoppløst fil fra for eksempel 2L i 24bit 96Khz med 16bit 44khz som er lastet ned som to separate filer hører jeg en kvalitativ forskjell i favør 24bit. Virkeligheten en meter unna den levende akustiske kilden opplever jeg som lysere, mørkere, glattere og mer ruglete enn noen stereoanlegg jeg har hørt.
    Når jeg upsampler en 16bits fil til 96 eller 192khz opplever jeg at lyden blir glattere, men fjernere. Når jeg sammenligner 2L sine orginalformater opplever jeg 96khz som glatter OG mer ruglete enn 16bit. Forskjeller er etter min mening ikke natt og dag, men en liten nyanse. Men på mange måter handler jo denne hobbyen om nyanser, så ethvert skritt i riktig retning er en god ting.
    Jeg hører ingen forskjell på støygulv på hverken innspilling eller anlegg, men hirezfilen er kanskje en anelse lavere i volum.

    Det er hva jeg hører. Å forklare hvorfor er vanskeligere. Jeg tror ikke på at økt båndbredde er en avgjørende faktor. En ukomprimert 16bit 44khz kan låte kjempebra, men når man har et opptak som 2L sitt hvor strikken er strukket i alle ender oppleves likevel forskjellen her.
    Når jeg opplever lyd ruglete så opplever jeg det som hurtigere lydgjengivelse i mellomtonen. Glatt kan være det motsatte med filter og slikt, men også et tegn på hurtighet.

    Har lest noen steder at det er forskjeller på stigningstiden på impulser ved forskjellig oppløsning. Det KAN være en teoretisk forklaring og da er det kanskje ikke så betydningsfullt med båndbredden på opptaket?
     

    Gjallarhorn Audio

    Bransjeaktør
    Ble medlem
    26.02.2010
    Innlegg
    1.680
    Antall liker
    1.720
    Sted
    Heggedal, Asker
    Torget vurderinger
    100
    Litt upassende navn i denne tråden jeg kanskje men.... ;)

    Vis vedlegget 160016

    Noen som kan forklare meg litt mere om hvorfor ikke mere sampling skal kunne gi bedre reproduksjon av den analoge kurven ? Skjønte ikke helt det med Nyquist.....
    '32bit' som nick er jo greit det om du driver med mastering :p

    Poenget til artikkelforfatter var at mange tror den digitale representasjonen er som den røde kurven i figuren, men den røde kurven ligger egentlig eksakt opp på den blå (analoge) kurven for frekvenser helt opp til det halve av samplingsfrekvensen.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Har lest noen steder at det er forskjeller på stigningstiden på impulser ved forskjellig oppløsning. Det KAN være en teoretisk forklaring og da er det kanskje ikke så betydningsfullt med båndbredden på opptaket?
    Stigetiden begrenses også av den høyeste frekvensen som kan gjengis. Stigningstiden i sekunder er omtrent 0,35 delt på båndbredden i Hertz. (http://en.wikipedia.org/wiki/Rise_time)

    Jeg opplever forøvrig 2L som dønn seriøse og høyst kompetente. Innspillingene derfra er blant de aller best lydende jeg har. Likevel er det så mange måter en hørbar forskjell kan oppstå på mellom to lydfiler at jeg gjerne vil utelukke alle de kjente faktorene før jeg begynner å tvile på grunnleggende samplingsteori og etablerte sannheter om menneskelig hørsel. Cookie Marenco i Blue Coast Records lager også ekstremt vellydende innspillinger, men hun insisterer på å distribuere lydfiler som WAV-filer i zip-arkiv fordi hun mener det låter bedre enn komprimerte formater. Ikke si det til Cookie, men det første jeg gjør med innspillingene hennes er å pakke dem ut av zip-arkivet og konvertere dem til FLAC.
     

    Gjallarhorn Audio

    Bransjeaktør
    Ble medlem
    26.02.2010
    Innlegg
    1.680
    Antall liker
    1.720
    Sted
    Heggedal, Asker
    Torget vurderinger
    100
    Trompetnerd: Se linken til brukeren Asbjørn over i post #44. Om jeg forstod den riktig (skummet i grunnen bare igjennom), så er det ingen forskjell i tidsdomenet heller.
     

    Gjallarhorn Audio

    Bransjeaktør
    Ble medlem
    26.02.2010
    Innlegg
    1.680
    Antall liker
    1.720
    Sted
    Heggedal, Asker
    Torget vurderinger
    100
    Ikke si det til Cookie, men det første jeg gjør med innspillingene hennes er å pakke dem ut av zip-arkivet og konvertere dem til FLAC.
    Så lenge FLAC-enkoderen gjør alt riktig, så skal det da heller ikke være noen forskjell fra ukomprimert. Om det hadde vært det, så skulle FLAC ikke kunne kvalifiseres som et tapsfri (lossless) format.

    Jeg er oppmerksom på at mange mener å høre en forskjell. Men det finnes god teknisk dokumentasjon på det motsatte.

    ZIP er jo i seg selv en tapsfri komprimering (av data), så om Cookie ikke stoler på slik komprimering, burde WAV-filene vært sendt uten bruk av ZIP :p
     
    Sist redigert:

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.700
    Antall liker
    7.011
    Har lest noen steder at det er forskjeller på stigningstiden på impulser ved forskjellig oppløsning. Det KAN være en teoretisk forklaring og da er det kanskje ikke så betydningsfullt med båndbredden på opptaket?
    Stigetiden begrenses også av den høyeste frekvensen som kan gjengis. Stigningstiden i sekunder er omtrent 0,35 delt på båndbredden i Hertz. (Rise time - Wikipedia, the free encyclopedia)

    Jeg opplever forøvrig 2L som dønn seriøse og høyst kompetente. Innspillingene derfra er blant de aller best lydende jeg har. Likevel er det så mange måter en hørbar forskjell kan oppstå på mellom to lydfiler at jeg gjerne vil utelukke alle de kjente faktorene før jeg begynner å tvile på grunnleggende samplingsteori og etablerte sannheter om menneskelig hørsel. Cookie Marenco i Blue Coast Records lager også ekstremt vellydende innspillinger, men hun insisterer på å distribuere lydfiler som WAV-filer i zip-arkiv fordi hun mener det låter bedre enn komprimerte formater. Ikke si det til Cookie, men det første jeg gjør med innspillingene hennes er å pakke dem ut av zip-arkivet og konvertere dem til FLAC.
    Takk for nok et fint svar! :)

    Når du skriver at stigetiden begrenses til den øverste frekvensen som kan gjengis så er det fra mikrofonen eller øret du mener? Som vil si at en mikrofon som kutter på 16khz ikke vil ha noe å si for stigetiden. Vil stigetiden være begrenset kun av DAC eller helt ut i høyttaleren?

    Spørsmålet mitt om stigetiden har betydning ved bruk av mikrofoner og utstyr som fanger opp lyd over 20Khz i form av overtoner som gir utslag (dog svake) over 20Khz selv om de ikke er hørbare for øret?
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.700
    Antall liker
    7.011
    Trompetnerd: Se linken til brukeren Asbjørn over i post #44. Om jeg forstod den riktig (skummet i grunnen bare igjennom), så er det ingen forskjell i tidsdomenet heller.
    Takk! Artikkelen i det innlegget underbygger faktisk min påstand om at 96khz KAN høres bedre ut enn 44Khz. Lengre opp i samplingsfrekvens har jeg ikke kommet i evalueringen.:)
     

    Gjallarhorn Audio

    Bransjeaktør
    Ble medlem
    26.02.2010
    Innlegg
    1.680
    Antall liker
    1.720
    Sted
    Heggedal, Asker
    Torget vurderinger
    100
    Må visst lese den grundig skjønner jeg :)

    Det er dog arrangert dobbelt blindtest på dette området av flere forskere med seriøse hensikter, og treffprosenten ligger på rundt 50% - m.a.o. samme score som om det var ren gjetning.
     

    Boden9

    Hi-Fi entusiast
    Ble medlem
    13.04.2005
    Innlegg
    462
    Antall liker
    76
    Torget vurderinger
    2
    Hvorfor brukes ordet perfect når teoremet forutsetter:
    • infinite samples
    • (implisitt) infinite bit-depth
    - noe som er umulig?

    imho

    Da foreslår jeg et lite nettsøk på Nyquist-teoremet. Google is your friend. Wikipedia også.

    Den korte versjonen er at under visse forutsetninger vil sampling med en viss frekvens f gjengi alle frekvenser opp til f/2 perfekt. Siden hørselen er begrenset til et sted rundt 18-20 kHz for mennesker, vil en samplingsfrekvens på det dobbelte, altså 36-40 kHz, være tilstrekkelig til å gjengi alle hørbare frekvenser perfekt. Gjengivelsen blir ikke bedre enn perfekt, så det er ikke noe å vinne på å gå høyere. I praksis vil det være noen avvik fra de ideelle forutsetningene i teorien, pluss at de nødvendige lavpassfiltrene ikke kan gjøres vilkårlig bratte uten å skape andre problemer, så det trengs litt headroom også i samplingfrekvens. Derfor 44.1, 48, 88.2 og 96 kHz som ganske vanlige samplingfrekvenser. Lavry mener at den optimale samplingfrekvensen ligger rundt 60 kHz et sted.

    In essence, the theorem shows that a bandlimited analog signal can be perfectly reconstructed from an infinite sequence of samples if the sampling rate exceeds 2B samples per second, where B is the highest frequency of the original signal.
    Nyquist–Shannon sampling theorem - Wikipedia, the free encyclopedia

    http://lavryengineering.com/pdfs/lavry-digital-audio-introduction.pdf
    http://lavryengineering.com/pdfs/lavry-sampling-theory.pdf
    http://www.lavryengineering.com/pdfs/lavry-white-paper-the_optimal_sample_rate_for_quality_audio.pdf
     

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.700
    Antall liker
    7.011
    Må visst lese den grundig skjønner jeg :)

    Det er dog arrangert dobbelt blindtest på dette området av flere forskere med seriøse hensikter, og treffprosenten ligger på rundt 50% - m.a.o. samme score som om det var ren gjetning.
    Tja, kommer kanskje an på hvordan man tolker det også. ;) Som Asbjørn skriver mener forfatteren at den optimale samplingsfrekvensen ligger rundt 60Khz noe som gjør at 96Khz er det naturlige trinnet. Derfra og oppover mener forfatteren av forvrengningen blir betydningsfull.

    At det ikke er detektert forskjeller i blindtester vil jo ikke si at det ikke finnes, men er heller en god indikasjon på hvor store de evtuelle forskjellene er.
     
    Sist redigert:

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Hvorfor brukes ordet perfect når teoremet forutsetter:
    • infinite samples
    • (implisitt) infinite bit-depth
    - noe som er umulig?
    Under de forutsetningene blir det perfekt. Som noen sa i en annen sammenheng, "it is only valid for the special case of spherical cows in a vacuum". Men så viser det seg at de "umulige" forutsetningene likevel gir et resultat som er nyttig i praksis. All digital lydbehandling bygger på det teoremet.

    Det vi diskuterer her er egentlig hvor mye headroom som trengs i samplingfrekvens for å få et tilnærmet perfekt resultat med 20 kHz båndbredde. 2x20=40 kHz er ikke tilstrekkelig i den virkelige verden, 44.1 kHz er litt lite og 48 kHz knapt bedre. Men da er man allerede forbi et "point of diminishing returns" og passerer optimum et sted rundt 60 kHz (ifølge Lavry), før ytterligere økning i samplingfrekvens drar med seg økende grad av uønskede bivirkninger. 88.2 kHz er OK, 96 greit nok, men 192 er too damn much, og 384 kHz skal vi ikke snakke om engang. Alt sammen for 16 eller 24 bits audio, selvsagt, 1-bits DSD er noe annet.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Når du skriver at stigetiden begrenses til den øverste frekvensen som kan gjengis så er det fra mikrofonen eller øret du mener? Som vil si at en mikrofon som kutter på 16khz ikke vil ha noe å si for stigetiden. Vil stigetiden være begrenset kun av DAC eller helt ut i høyttaleren?

    Spørsmålet mitt om stigetiden har betydning ved bruk av mikrofoner og utstyr som fanger opp lyd over 20Khz i form av overtoner som gir utslag (dog svake) over 20Khz selv om de ikke er hørbare for øret?
    Det gjelder vel både mikrofon, øret og alle trinn i mellom. Begrenset båndbredde vil runde av flankene på en firkantbølge og dra ut en impuls i tid. Det leddet i kjeden med minst båndbredde vil bestemme stigetiden på impulser gjennom den signalkjeden. De to størrelsene stigetid og båndbredde er to ender av den samme barten. Her er en forklaring: http://pcdandf.com/cms/images/stories/mag/0412/0412nomyths.pdf
     

    Boden9

    Hi-Fi entusiast
    Ble medlem
    13.04.2005
    Innlegg
    462
    Antall liker
    76
    Torget vurderinger
    2
    Takk for svaret. Det jeg reagerer på er at ordet perfekt avskjærer diskusjonen ganske effektivt, mens det egentlig er en diskusjon på hvor nær (hvor lite avvik) som en kan komme. At 16bit er tilnærmet uendelig / effektivt nok er for meg ganske absurd. Det at det gir et brukbart resultat er jeg derimot enig i, men brukbart er ikke det samme som perfekt :)

    Hva som er nyttig i praksis kan derfor være forskjellige meninger om. En ingeniør vil normalt lete etter en pen løsning (antatt løse oppgaven med minst mulig margin/sløsing), mens andre kan ønske en løsning med minst mulig tvil om den faktisk er løst (ie. overkill).

    imho

    Hvorfor brukes ordet perfect når teoremet forutsetter:
    • infinite samples
    • (implisitt) infinite bit-depth
    - noe som er umulig?
    Under de forutsetningene blir det perfekt. Som noen sa i en annen sammenheng, "it is only valid for the special case of spherical cows in a vacuum". Men så viser det seg at de "umulige" forutsetningene likevel gir et resultat som er nyttig i praksis. All digital lydbehandling bygger på det teoremet.

    Det vi diskuterer her er egentlig hvor mye headroom som trengs i samplingfrekvens for å få et tilnærmet perfekt resultat med 20 kHz båndbredde. 2x20=40 kHz er ikke tilstrekkelig i den virkelige verden, 44.1 kHz er litt lite og 48 kHz knapt bedre. Men da er man allerede forbi et "point of diminishing returns" og passerer optimum et sted rundt 60 kHz (ifølge Lavry), før ytterligere økning i samplingfrekvens drar med seg økende grad av uønskede bivirkninger. 88.2 kHz er OK, 96 greit nok, men 192 er too damn much, og 384 kHz skal vi ikke snakke om engang. Alt sammen for 16 eller 24 bits audio, selvsagt, 1-bits DSD er noe annet.
     

    coolbiz

    Hi-Fi freak
    Ble medlem
    31.03.2006
    Innlegg
    9.429
    Antall liker
    5.079
    Sted
    Sydvestlandet
    Torget vurderinger
    2
    ...
    Når jeg upsampler en 16bits fil til 96 eller 192khz opplever jeg at lyden blir glattere, men fjernere.
    ...
    Det der er et interessant eksperiment som er en sterk indikasjon på at en eller annen andel (og jeg mistenker den for å være stor) av de opplevde, lydmessige fordelene med hi-res overhodet ikke skyldes økning i informasjonsmengde eller oppløsning, men implementasjonstekniske forhold.
     

    Bjørn ("Orso")

    Bransjeaktør
    Ble medlem
    03.11.2008
    Innlegg
    11.296
    Antall liker
    2.903
    Sted
    Bergen
    Torget vurderinger
    2
    Min erfaring med upsampling stemmer godt overens med Trompetnerd sine. Det låter glattere og mykere, men mitt subjektive inntrykk er at det egentlig låter mindre naturtro og man mister litt av "stinget". Ingen upsampling låter mer korrekt og ekte i mine ører på utstyret jeg har prøvd.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Takk for svaret. Det jeg reagerer på er at ordet perfekt avskjærer diskusjonen ganske effektivt, mens det egentlig er en diskusjon på hvor nær (hvor lite avvik) som en kan komme. At 16bit er tilnærmet uendelig / effektivt nok er for meg ganske absurd. Det at det gir et brukbart resultat er jeg derimot enig i, men brukbart er ikke det samme som perfekt.
    Vel, det er nå engang sånn den matematikken er. For å gjøre seg opp en oppfatning om hvorvidt 16 bits er mye eller lite kan det også være nyttig å forstå at mange nyere DAC'er bruker delta-sigma-modulering, sånn at det første de gjør når de ser det digitale 16- eller 24-bits signalet er å konvertere det til et 1-bits signal med mye høyere samplingsrate, f eks 128x oversampling (5,645 MHz - som KW nettopp ga et eksempel på).

    Etter å ha gått gjennom den foodprosessoren ser signalet ut som den blå "kurven" på dette bildet:

    Pulse-density_modulation_2_periods.gif


    Deretter sendes signalet gjennom et lavpassfilter som glatter ut signalet til en rekonstruert analog bølgeform som den røde kurven. Det er ikke "trappetrinnskurven" med diskrete steg som gjengis, men den inneholder nok informasjon til å rekonstruere den analoge bølgeformen med stor grad av presisjon. I prosessen blir også kvantiseringsstøyen redusert i nivå og spredt over et mye større frekvensområde enn bare audiobåndet. Det åpner for noen interessante avveininger mellom oppløsning og støy ved ulike frekvenser. Resultatet er gjerne at oppløsningen i audiobåndet blir riktig god, mens mesteparten av den uunngåelige støyen havner på ultrasoniske frekvenser - som deretter filtreres vekk i lavpassfilteret.
     
    Sist redigert:

    TrompetN

    Hi-Fi freak
    Ble medlem
    04.03.2004
    Innlegg
    8.700
    Antall liker
    7.011
    ...
    Når jeg upsampler en 16bits fil til 96 eller 192khz opplever jeg at lyden blir glattere, men fjernere.
    ...
    Det der er et interessant eksperiment som er en sterk indikasjon på at en eller annen andel (og jeg mistenker den for å være stor) av de opplevde, lydmessige fordelene med hi-res overhodet ikke skyldes økning i informasjonsmengde eller oppløsning, men implementasjonstekniske forhold.
    Tror det kommer veldig an på hvordan det gjøres. Den beste cdspilleren jeg har prøvd spiller 24bit 192hz fastlåst, men da er også alle tenkelige komponenter optimalisert til hverandre. Hvordan det hadde hørtes ut hvis den samme spilleren hadde spilt i 16 bit 44khz er ikke lett å forutse.

    At Bryston som er veldig opptatt av kildetrohet valgte å konstruere en 16bit 44kzh cdspiller når de først lagde avspiller langt utpå 2000 tallet kan være en indikasjon på noe.
     

    I_L

    Hi-Fi freak
    Ble medlem
    27.03.2003
    Innlegg
    3.642
    Antall liker
    6.311
    Litt upassende navn i denne tråden jeg kanskje men.... ;)

    Vis vedlegget 160016

    Noen som kan forklare meg litt mere om hvorfor ikke mere sampling skal kunne gi bedre reproduksjon av den analoge kurven ? Skjønte ikke helt det med Nyquist.....
    Fordi det du har i lydfilen ikke er noen "trapp", men samples, eller med andre ord datapunkter:

    sample.jpg


    Hvis du rekonstruerer dette uten noen form for filtrering, dvs holder spenningen konstant mellom hver sample, får du såklart "trappa" som er skissert i figuren, men det skjer aldri i den virkelige verden. Et lavpassfilter (rekonstruksjonsfilter) som båndbegrenser til under fs/2 vil glatte ut så du får den samme sinuskurven som du opprinnelig samplet.
     

    I_L

    Hi-Fi freak
    Ble medlem
    27.03.2003
    Innlegg
    3.642
    Antall liker
    6.311
    Aliasing er også ganske intuitivt hvis man ser visuelt på det. Her er to sinuskurver med ulik frekvens som gir nøyaktig samme samplesekvens. Den høyfrekvente (stiplede) er over fs/2 og derfor et alias som må filtreres bort før AD-konvertering. Det som lagres er kun datapunktene (ni stykker her) eller verdiene de har, det lagres ingen informasjon om fysiske frekvenser.

    aliasing.jpg
     
    Sist redigert:

    tkr

    Æresmedlem
    Ble medlem
    27.03.2007
    Innlegg
    21.120
    Antall liker
    30.247
    Sted
    Nede i fjæresteinene
    Torget vurderinger
    2
    Aliasing er også ganske intuitivt hvis man ser visuelt på det. Her er to sinuskurver med ulik frekvens som gir nøyaktig samme samplesekvens. Den høyfrekvente (stiplede) er over fs/2 og derfor et alias som må filtreres bort før AD-konvertering. Det som lagres er kun datapunktene (ni stykker her) eller verdiene de har, det lagres ingen informasjon om fysiske frekvenser.

    Vis vedlegget 160175
    ....Og da har endelig jeg også forstått aliasing. Takker.

    mvh
     
    V

    vredensgnag

    Gjest
    Litt upassende navn i denne tråden jeg kanskje men.... ;)

    Vis vedlegget 160016

    Noen som kan forklare meg litt mere om hvorfor ikke mere sampling skal kunne gi bedre reproduksjon av den analoge kurven ? Skjønte ikke helt det med Nyquist.....
    Fordi det du har i lydfilen ikke er noen "trapp", men samples, eller med andre ord datapunkter:

    Vis vedlegget 160174
    Men du må innrømme at når det tegnes opp som en trapp så ser det langt mer dramatisk ut, for den som ønsker å illustrere at noe må være galt med digitallyd?

    :)
     

    Schumacher

    Overivrig entusiast
    Ble medlem
    05.10.2005
    Innlegg
    870
    Antall liker
    97
    Sted
    Sør-Trøndelag
    Hvorfor brukes ordet perfect når teoremet forutsetter:
    • infinite samples
    • (implisitt) infinite bit-depth
    - noe som er umulig?
    Under de forutsetningene blir det perfekt. Som noen sa i en annen sammenheng, "it is only valid for the special case of spherical cows in a vacuum". Men så viser det seg at de "umulige" forutsetningene likevel gir et resultat som er nyttig i praksis. All digital lydbehandling bygger på det teoremet.

    Det vi diskuterer her er egentlig hvor mye headroom som trengs i samplingfrekvens for å få et tilnærmet perfekt resultat med 20 kHz båndbredde. 2x20=40 kHz er ikke tilstrekkelig i den virkelige verden, 44.1 kHz er litt lite og 48 kHz knapt bedre. Men da er man allerede forbi et "point of diminishing returns" og passerer optimum et sted rundt 60 kHz (ifølge Lavry), før ytterligere økning i samplingfrekvens drar med seg økende grad av uønskede bivirkninger. 88.2 kHz er OK, 96 greit nok, men 192 er too damn much, og 384 kHz skal vi ikke snakke om engang. Alt sammen for 16 eller 24 bits audio, selvsagt, 1-bits DSD er noe annet.
    Asbjørn... Din innsikt i dette overgår alt jeg kan forestille meg :)

    Ett spm dog...-Min Bladelius Embla Classic har 32bit 192khz upsampling.Jeg har valget mellom ingen-44,1,48,96 og 192khz upsampling.
    Hvilken innstilling skal i teorien gi best og mest naturtro lyd? Jeg spiller av FLAC og WMA-lossless filer.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Takk, men I_L rett over er den som virkelig kan noe om dette. Jeg er stort sett selvlært amatør på dette området.

    Jeg ville tippet 96 kHz, men det er ikke så veldig mye mer enn tipping. Det er jo bare å prøve seg frem. :)
    Her er Benchmarks argumentasjon for hvorfor de opp- eller nedsampler til 110 kHz før D/A-konvertering: Asynchronous Upsampling to 110 kHz | Benchmark Interaction
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Apropos Billie Jean fra et par sider tilbake: Jeg vifter intenst med paragrafen om "fair use" og legger ut MasVis-analyser av sju forskjellige utgivelser av den samme innspillingen. Det er samme innspilling utgitt på LP, CD og SACD mellom 1982 og 2008, her konvertert til 16-bits WAV-filer for anledningen. SACD-versjonen er en rip av selve SACD'en til .dff filformat og konvertert til WAV med dBpoweramp.

    Mastringen er mildt sagt forskjellig, selv mellom de to LP-versjonene. Det kan godt hende SACD'en låter bedre enn de to-tre nyeste CD-versjonene, men det kan jo også være fordi CD'ene er mastret så vanvittig høyt at de klipper utav ville helsike heller enn på grunn av noen mystiske egenskaper som har med formatene CD og SACD som sådanne å gjøre. SACD-utgaven ligner ganske mye på ur-CD'en fra 1983, men med volumet skrudd opp ca tre dB. Det er også noe rart med dynamikken på den. Kan den være kjørt gjennom en expander for å dra ut toppene litt etter først å ha vært komprimert?

    Billie Jean 1982 - 2008 overview.gif


    Billie Jean 1982 - 2008 details.gif


    Så kan man jo bare gjette på hva som egentlig er grunnen hvis en dyrere "hirez" download låter bedre enn en "CD quality" download til halve prisen. Jeg ville kikket ganske grundig på hvordan de to filene var mastret før jeg sa noe definitivt om hørbare forskjeller mellom 16 og 24 bits eller mellom 44.1 og 96 kHz.
     
    Sist redigert:

    I_L

    Hi-Fi freak
    Ble medlem
    27.03.2003
    Innlegg
    3.642
    Antall liker
    6.311
    Aliasing er også ganske intuitivt hvis man ser visuelt på det. Her er to sinuskurver med ulik frekvens som gir nøyaktig samme samplesekvens. Den høyfrekvente (stiplede) er over fs/2 og derfor et alias som må filtreres bort før AD-konvertering. Det som lagres er kun datapunktene (ni stykker her) eller verdiene de har, det lagres ingen informasjon om fysiske frekvenser.

    Vis vedlegget 160175
    ....Og da har endelig jeg også forstått aliasing. Takker.

    mvh
    For å presisere; hvis du sampler det høyfrekvente signalet (AD) får du de ni datapunktene som er vist og disse lagres som verdier. Når du rekonstruerer (DA) har du ingen annen informasjon enn de ni datapunktene (og klokken som bestemmer når de kommer), og en lavpass rekonstruksjon vil gi den lavfrekvente bølgen. Det er et signal som aldri var der i utgangspunktet og er ikke noe du ønsker å få ut, derfor må du filtrere bort alt utenfor Nyquistbåndet før sampling. Alt utenfor Nyquistbåndet som ikke er filtrert bort gir uønsket forvrenging i Nyquistbåndet når det rekonstrueres (=aliasing). Men innenfor Nyquistbåndet er alle frekvenser unike og sampling derfor en tapsfri prosess.
     

    G-nøkkel

    Hi-Fi entusiast
    Ble medlem
    08.03.2011
    Innlegg
    434
    Antall liker
    203
    Sted
    Mysen
    Torget vurderinger
    3
    "Hvem" upsampler?

    Gjøres dette av chip-ene som kommer fra det begrensede antall produsenter av slike? Eller er upsamplingen gjennomgående noe dac-produsentene ordner selv "utenfor" selve dac-chipen?

    Hilsen G-nøkkel
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    Gjøres dette av chip-ene som kommer fra det begrensede antall produsenter av slike? Eller er upsamplingen gjennomgående noe dac-produsentene ordner selv "utenfor" selve dac-chipen?
    Det gjøres vel gjerne i en separat chip, f eks en sånn: http://www.ti.com/lit/ds/symlink/src4192.pdf

    Ellers er dette en grei innføring i basics om digital lydbehandling: http://www.rs-met.com/documents/tutorials/DigitalSignals.pdf

    Legg merke til at alias-produktene dukker opp ved frekvenser som er bestemt av differansen mellom signalfrekvens og samplingfrekvens, heller enn noe enkelt harmonisk forhold til signalfrekvensen. F eks: Hvis det samples ved 44.1 kHz og det er en tone ved 30 kHz, kanskje en overtone fra ett eller annet instrument, så vil dette generere en falsk tone ved 44.1-30=14.1 kHz. Den tonen har ingen musikalsk eller harmonisk relasjon til den opprinnelige tonen ved 30 kHz (eller til grunntonen og resten av overtonestrukturen fra instrumentet) og vil ikke låte spesielt pent. Jo nærmere samplingfrekvensen det er overtoneinnhold, desto lavere i frekvens kommer aliasene. Ørets følsomhet øker ganske bratt nedover fra 20 kHz, så dette kan bli ganske hørbart.

    De bratte filtrene som brukes for å filtrere vekk innhold over Nyquist-frekvensen kan derimot skape rippel og fasedreining øverst i audiobåndet, noe som også kan være hørbart. Jo skarpere filter, desto mer påvirkning. Pest eller kolera, liksom. Alt det blir enklere ved høyere samplingfrekvens, ettersom Nyquist-frekvensen også øker og man kan være mye mer avslappet med lavpassfiltreringen uten å skape aliaser. Men altfor mye ultrasonisk innhold vil begynne å skape andre forvrengningsformer igjen, som linken i åpningsinnlegget påpekte. Det finnes tydeligvis et optimum for samplingfrekvens, men det er vanskelig å se noen annen skadevirkning av "for høy" bitdybde enn at det kaster bort diskplass og overføringskapasitet på ting som uansett ikke kan høres.
     
    Sist redigert:

    Kalle Klovn

    Hi-Fi freak
    Ble medlem
    15.09.2009
    Innlegg
    3.722
    Antall liker
    3.407
    Sted
    Sandnes
    Torget vurderinger
    7
    Takk til de ( spes Asbjørn) som har brukt tid på å lage denne tråden! Mye forståelig info her.
     

    CDWMcInSpots

    Hi-Fi freak
    Ble medlem
    30.09.2010
    Innlegg
    7.551
    Antall liker
    564
    Sted
    Bergensregionen
    S

    sorgenfri

    Gjest
    Tusen takk til alle i denne svært informative tråden!

    Tusen takk.
     

    Asbjørn

    Rubinmedlem
    Ble medlem
    26.03.2006
    Innlegg
    38.359
    Antall liker
    39.343
    Sted
    Vingulmǫrk
    Torget vurderinger
    2
    URLen "http://www.rs-met.com/documents/tuto...talSignals.pdf" gir nettleserfeilmeldingen "The webpage cannot be found".

    Det kan virke som om HFS/vBulletin har skadet denne URLen. Det hjalp ikke å benytte "Svar med sitat" + "Switch Editor to Source Mode".
    Ja, der hadde noe skjært seg. Dette burde funke: Digital Signals - Sampling and Quantization.
    Eventuelt finner man den og flere "tutorials" her: RS-MET
    Linken i det tidligere innlegget er også fikset.

    En litt interessant ting som jeg lærte underveis i tråden var hvor mye mer enn de "matematiske" 6*16=96 dB dynamisk spenn man kan formidle med "bare" 16 bits. Linken i åpningsinnlegget demonstrerte at en 1 kHz tone ved -105 dBFS stikker frem som et fyrtårn fra et støygulv nede rundt -137-138 dB med 16-bits audio. Hvis volumkontrollen er satt slik at full pinne blir 105 dB i rommet, tilsvarer den tonen ved -105 dBFS (altså 0 dB i rommet) lyden av en mygg et par meter unna deg, og enda er det nesten 30 dB å gå på før mikrodetaljene blir så svake at de forsvinner ned i støygulvet på det digitale mediet. Dynamisk spenn på 120 dB gjennom audiobåndet er definitivt ikke noe problem, og da vil støygulvet i forsterkerne og bakgrunnsstøyen i rommet begrense oppløsningen i anlegget lenge før 16 bits digitale lyddata blir en begrensning. Noise shaping - ikke magisk, men ganske nært.

    Grafen fra artikkelen, også vist av X3MHC på side 2 i denne tråden:
    dynamic-range-16-bits-591x179.png
     
    Sist redigert:
  • Laster inn…

Diskusjonstråd Se tråd i gallerivisning

  • Laster inn…
Topp Bunn