I ren dødsforakt går jeg løs på en udetonert bombe.
Dette pga diskusjonen mellom RS og meg, samt andre som foregår på HFS nå. Det etterfølgende er ikke fasit, det er ikke fullstendig dekkende - men forhåpentligvis er det likevel avklarende:
Psykoakustikk
Det sies at Charlie Chaplin en gang deltok i en "Charlie Chaplin Look-Alike Contest."
Han ble nummer 3.
Og dette er relevant til diskusjonen vi har nå om korrekt gjengivelse av toner, og dermed også av musikkstykkene. På HFS diskuteres det friskt rundt hva som er nøytralt, klinisk, tungt, tilgrodd - dog sjelden med en referanse til det relative i slike begreper: nemlig at det er nøytralt osv i forhold til noe, som bedømt av betrakteren.
Psykoakustikk defineres tradisjonelt som studien av subjektiv oppfatning av lyd, herunder selvsagt musikk.
Det er et stort felt.
Men la oss gå tilbake til Charlie Chaplin, som ble nummer tre i en konkurranse han burde vunnet. Hva var det nummer 1 og 2 gjorde?
Med stor sannsynlighet så overdrev de det som var typisk for Charlie Chaplin, mens han holdt spillet "naturlig" innenfor sin karaktér. Og publikum syns hans spill ble for avmålt, for stille (tør vi si klinisk), sammenlignet med de gøyale karene som tro til.
Vi kan trygt gå ut ifra at de emblematiske detaljene var til stede. Selv i uventet sammenheng er disse nok for å kunne si "Charlie Chaplin."
Og om man ikke har konkret kjennskap til den ekte Charlie Chaplin, kan man lett bli lurt. For eksempel kan man se på en annen rolle som Chaplin spilte, i filmen Diktatoren. Chaplin og Hitler ble født fire dager fra hverandre, i april 1889. Begge gjorde bart og spesielle bevegelser til karakteristiske emblemer for rollene de spilte overfor offentligheten.
En betrakter som skal vurdere om det han ser og hører er "the real thing," vil selvsagt sjelden ha en direkte tilgjengelig referanse til originalen, og må derfor bygge på personlig erfaring når avgjørelsen skal tas. En rekke faktorer spiller inn når det gjelder å ta avgjørelsen, og det er ganske utrolig hvor mange av disse som er subjektive, altså ikke konkrete og objektivt målbare.
RS nevner at vi "kjøper" ikke lydetterligningen fra selv en god synth eller synthtrommer, og mener at dette skyldes tonens kropp. Han skriver at selv en synth kan starte og stoppe en tone.
I Musikministeriet gjorde man en morsom sammenligning mellom musikkinstrumenter - gitar, fiolin, osv. Og det viste seg at et ekspertpanel var usikre på når de lyttet til en Stradivarius og når de lyttet til en billig Kinafele. Slike sammenligninger illustrerer forskjellen på sikker og usikker lytting - og er slik sett et argument for rådyre kabler i hifi-anlegg. Dersom det vi tror om tonen slike kan frembringe hjelper oss å bygge en rikere psykoakustisk opplevelse, så blir kabelvalget et virkemiddel. Men når vi ikke vet hvilken kabel vi lytter til, har vi tydeligvis også vansker med å høre forskjell.
Er det forskjell på en Stradivarius og en Kinafele? Å skulle påstå noe annet virker latterlig - og utdraget i Musikministeriet er valgt fordi det er i et leie der det er vanskeligere å skjelne forskjell. Men man skulle da tro at en fiolin til mange millioner ville briljert uansett hva den spilte, i konkurranse med en til SEK 900.
Programmet varer i ti minutter:
http://svtplay.se/v/1429648/stradivarius_eller_billig_kopia
Psykoakustikk handler om den subjektive dimensjonen - den handler om hva vi ønsker å se og høre og oppleve, i tillegg til det vi faktisk opplever. Psykoakustikken kan være større en opplevelsen - den som kjøpte billett for å høre Pavarotti hoste seg gjennom noen ariaer i Oslo vil ha lyttet forbi at sangeren ikke var i toppform, fordi det var Pavarotti. Den blotte tilstedeværelsen av operastjernen ga det at opplevelsen ikke holdt mål underordnet betydning.
På samme vis kan vi også lure oss selv til å føle og være overbevist om at enkelte musikkopplevelser, gjengitt vha et anlegg, er betydelig bedre pga komponentene som inngår, og merkene som er satt på disse. I mange tilfeller vil forskjellen være berettiget, den eksisterer faktisk; i andre tilfeller vil den være skapt i hodet.
Og hodet er virkelig upålitelig. Når vi f.eks. melder om effekt av lang innspillingstid, så kan det like gjerne være at vi har vennet oss til lyden som initielt virket underlig. Og noe av det aller vanskeligste som finnes er å stille til lytting i nøytralt modus, slik at vi utelukkende lytter til det vi hører, og ikke det vi tror eller har lyst til å høre.
Et berømt eksempel på dette er årsaken til at det nå er mange kvinner i symfoniorkestre. For noen tiår siden var det vurdert som blasfemi å bare foreslå tanken - "kvinner hadde verken intellekt eller stamina til de påkjenninger det medførte å spille i et symfoniorkester."
Og når kvinner stilte til prøvespilling røk de ut -- inntil noen fant på å henge opp en akustisk gardin mellom den som prøvespilte og panelet med dommere.
Nå visste ikke dommerne kjønn eller utseende på den som spilte, de måtte kun forholde seg til lyden de hørte, og til hvordan musikeren produserte denne.
Plutselig ble det en betydelig kvinneandel i symfoniorkestre, og dårligere mannlige musikere røk ut der de før ville blitt valgt.
Jeg fikk lyst til å berøre dette momentet, fordi det er så mange misforståelser innen HiFi, spesielt når det gjelder vurdering av lyd. Det er uomtvistelig bevist at initialtransienten setter musikkopplevelsen; når denne manipuleres, så endres også vår oppfatning av instrumentets karaktér, og i noen tilfeller også type! Det er ganske ekstremt å ikke høre forskjell på kroppstonen til en fiolin og en fløyte - men dette er blitt demonstrert gjentatte ganger, alt som skal til er at initialtransienten fjernes.
RS nevner at det er kroppstonen som er avgjørende for hovedopplevelsen.
Selvsagt har denne verdi. Denne kan best tegnes når anlegget er fullfrekvent, responsivt (et bredere begrep enn hurtig), og har evne til å gjengi korrekte detaljer.
RS innvending om uakseptabel synth handler om oppløsning og reproduksjonsegenskaper -- sett i forhold til subjektiv erfaring! Hvis man ikke har kjennskap til originalinstrumentets faktiske lyd, så kan det godt være at synthlyden blir akseptert, og da behøver man ikke rote rundt med et overdyrt anlegg.
Problemet med tidlige synther var at de hadde mest grunntone, og manglet rike overtoner, i tillegg var de oftest invariante i tonen, selv om man fikk et hjul å pitche med.
Pga begrenset datakraft og lagringskapasitet når synthene først kom, så var det også lite man kunne gjøre for å tilføre detaljer i tonen - den ble simpelthen for enkel. Samplingene ble gjort i dårlige oppløsninger.
I tillegg var man ikke klar over betydningen av initial- og utgangstransientene, så disse var ikke blitt reprodusert så de var organiske, ofte var de bare artefakter av at kroppstonen ble igangsatt, uten detaljene som skapes av artikuleringen til, f.eks. en trompetspiller.
Den siste bølgen i dette diagrammet er hentet fra en Obo, forøvrig et helsikes vanskelig instrument å spille på. Men diagrammet viser oss hvor kompleks virkeligheten er, sammenlignet med den idealiserte, syntetiske gjengivelsen av kun en kroppstone.
Når vi skal vurdere en kroppstones naturlikhet, er det avgjørende at gjengivelsen rommer grunntone og harmonier, at det ikke stanger i topp (selv om det nok er fornuftig å gå ut ifra at vi lytter med hørselen, og ikke med et flaggermusorgan eller benmassen i hodet. Har man lyst på gjengivelse opp til 50kHz eller 100kHz, er det selvsagt helt i orden, om det er dette som skal til for at den subjektive opplevelsen skal kjennes rett. Likevel kan man stusse, gitt at instrumentenes eventuelle overtoner i det høyfrekvente området har energimengder som er hinsides små. I forholdet energi i grunntone/overtone, sammenligner vi ikke en gang luftmomentet til et elefantøre med en myggvinge - det er snarere snakk om molekyler på den myggvingen.)
Det som mangler i følgende diagram er initialtransient og avslutning med påfølgende decay (utklinging.) Men det viser altså hvordan tonen blir mer og mer som en firkantbølge, jo flere overtoner som tillegges.
Og her er en utfordring som jeg ikke har svaret på, men som engasjerer mine små grå: kan det være at påstander om klinisk gjengivelse skyldes at vi hører "for mange" overtoner "korrekt" gjengitt? Og at vi liker (subjektivt) den sammenblandingen som oppstår når det er forvrengning med i signalbanen?
Charlie Chaplin komponerte også musikk, som han plystret og fikk skrevet ned.
Her er en psykoakustisk øvelse - jeg primer deg som lytter med to ord:
BARBRA STREISAND
Så får du høre hva som skjer: