Et enda lengre svar til en alt for lang tekst...
Jeg var ikke forberedt på å få så mye god tilbakemelding, både i form av komplimenter og – kanskje viktigere – konstruktive spørsmål. Så først og fremst: tusen takk for det!
Ut fra det jeg har notert meg av spørsmål og tilbakemeldinger, bunner de fleste spørsmålene ut i spørsmål om forskningsmetode. Med andre ord, hvordan kan vi besvare spørsmålene vi har knyttet til hi-fi, og andre ting for den saks skyld, via observasjoner? Det enkle svaret her, er at vi må systematisere observasjonene våre. En og annen lyttekveld med et par pils og gode låter er – dessverre – ikke et særlig valid mål om vi ønsker å si noe om de objektive effektene av en komponent. Det det derimot er, som kanskje er aller viktigst, er at det er sånn musikk skal nytes. Så la ikke all denne informasjonen komme i veien for lyttegleden og musikken!
Det første jeg kom til å tenke på som er viktig når vi ønsker å gjøre systematisk observasjon av effekten av hi-fi-komponenter, effekter, generell lyd, og forskjeller, er at vi må ha en klar formening om hva det er vi ønsker å svare på. Som jeg allerede påpekte i forrige innlegg, er våre usystematiske observasjoner et sammensurium av faktorer som vi opplever, alt fra anlegg, komponenter, og strømnett, til dagsform, blodsukker, tid på døgnet, og så videre. For å kunne si noe sikkert om en effekt eller forhold må disse tingene utelukkes slik at vi kan isolere en forskjell eller effekt fra all annet støy. Et sted å begynne, er å stille spørsmål som fokuserer på en ting av gangen. Hva vi ønsker å undersøke kommer videre til å bestemme hvilken metode vi skal bruke: Om vi ønsker å avdekke personers opplevelse av å høre på musikk vil dette medføre en metode, i motsetning til det å for eksempel måle den tilførte effekten av en kabel på opplevelsen av en låt.
Tidligere i tråden dukket det opp spørsmål om
kvalitativ versus kvantitativ metode. Kort forklart er kvalitativ metode en metode som undersøker å avdekke personers personlige erfaringer. Denne metoden bruker ofte observasjoner og intervju som metode for å avdekke personlige erfaringer og refleksjoner rundt spesifikke opplevelser. Det er denne metoden du går til om du – for eksempel – vil undersøke hva hi-fi-interesse tilfører de hi-fi-interessertes liv, hvordan de opplever å høre på musikk, hvordan de opplever forskjellig utstyr etc. – Altså en metode som har hensikt i å gi innblikk. Det denne metoden IKKE kan gjøre – som egentlig er den røde tråden fra hele mitt første innlegg – er at den kan ikke disse observasjonene og opplevelsene fra en person til en annen, altså kan disse resultatene ikke generaliseres til andre. Du får et unikt innblikk mot at dette innblikket ikke kan sies å gjelde ander personer, situasjoner, eller anlegg.
På den andre siden har du kvantitative metoder. Kvantitative metoder benytter seg av tall og statistikk for å avdekke forskjeller og tendenser i et utvalg og populasjon. Utvalg beskriver altså personene du undersøker direkte (for eksempel en gruppe mennesker som deltar i en rekke lyttetester), mens populasjonen er de personene du ønsker å generalisere til, for eksempel alle hi-fi-interesserte, Norges befolkning, m.m. Generelt sett kan kvantitative metoder deles inn i to kategorier:
-
Deskriptiv statistikk: denne forklarer tingenes tilstand slik de er nå. Hvor mange husholdninger har stereoanlegg? Hvor mye bruker den gjennomsnittlige hi-fi-entusiast på kabler? Hvor mange desibel kan det menneskelige øre før det går skeis? – Slike spørsmål har som formål å passivt beskrive tingenes tilstand her og nå, og betegnes følgelig som deskriptive.
-
Slutningsstatistikk: denne har som hensikt i å påvise effekter og tendenser og overføre denne kunnskapen fra et utvalg. Her er det vi skal boltre oss videre i denne teksten, med mulige eksempler som effekter av komponenter, en gruppes meninger som antas å representere populasjonen o.l.
Kvantitative metoder gir ikke samme innblikk under huden som kvalitative, men kan til gjengjeld generaliseres til populasjonen. Vi kan med andre ord via kvantitative metoder forsøke å si noe om kabler generelt, i stedet for å gjøre et kvalitativt dypdykk i hva Stian, Henrik, og Tove mener deres Valhalla-kabler gjør på musikkopplevelsen. Dette kan vi f.eks. gjøre via et eksperiment, noe vi kommer til.
Som jeg allerede har nevnt opptil flere ganger, er et problem å skille faktiske effekter fra subjektive illusjoner som placebo eller effort justification (hvis du trodde placebo var gøy, tror jeg denne blir en real home-run: Jo mer innsats [f.eks. penger betalt], jo bedre vurderer du noe som:
https://en.wikipedia.org/wiki/Effort_justification). Disse er vanskelige å eliminere direkte (tidligere, gammel, avdanket forskning forsøkte å omgå problemet ved å trene deltakere i å være objektive… Du kan jo tenke hvordan det gikk). Løsningen er å la de være som de er, men å forsøke å la de være like mye tilstede i alle betingelser og grupper. Om man gjør det, vil en eventuell forskjell mellom gruppene være forårsaket av den eneste forskjellen mellom de, som ideelt sett skal være din manipulasjon. Det er dette som omtales som et eksperiment.
La oss ta et eksempel: Vi ønsker å måle effekten av signalkabler på musikkopplevelse. Vi har to grupper: en gruppe som får høre et album med et sett drittkabler; en annen gruppe som får boltre seg med Valhalla-kabler og samme album. Alt gjennomføres under like betingelser, med samme anlegg, rom, lysnivå, og så videre. Så ber vi deltakere i begge grupper vurdere sine opplevelser på et spørreskjema som vi senere kvantifiserer responsene (hvor godt låt det, rom, luft, skarpe toner, diskant, og så videre som omformes til målbare nivåer, for eksempel en indikasjon på en skala fra 1-7).
Men hva med de subjektive forskjellene? Roar i den ene gruppen er mektig opphengt i kablenes rolle, både politisk og erfaringsmessig, og han mener han tror han har havnet i Valhalla-gruppen. Han gir følgelig skåren 7/7 på alle spørsmålene på spørreskjemaet, og – kanskje enda viktigere – storkoser seg mens han sitter der (det er jo derfor vi alle holder på med dette, ikke antallet faktiske eller fiktive skårer på et skjema
) - Uansett, så medfører jo dette en feil som kan medføre at denne gruppen skårer høyere enn den andre (spesielt om de like tette brødrene til Roar er i samme gruppe og innehar samme meninger og taktikker). Så hvordan kan vi løse dette problemet? Dette gjøres via såkalt
randomisering: vi lar det være helt tilfeldig hvem som havner i hvilken gruppe (og – ideelt sett – hvem som blir invitert til å delta) og følgelig burde det være like mange skeptikere, kabelfrelste, og søsken av Roar i hver gruppe om vi har mange nok deltakere. Siste punkt er også viktig: for å kunne gjøre sikre slutninger trenger vi mange observasjoner og deltakere.
Så, vi utelukker altså de subjektive erfaringene og antakelsene ved å la de fordele seg jevnt mellom gruppene. Om gruppene er – teoretisk – helt like, vil de i teorien oppleve det samme (sett under ett). Eventuelle forskjeller mellom gruppene kan derfor med større sannsynlighet tilskrives manipulasjonen vår (drittkabel vs. Valhalla, eller noe annet dritdyrt om du foretrekker det). Via denne formen for eksperimentell metode (dette blir et
mellomgruppe-design, der forskjellene oppstår mellom gruppene), vil vi kunne tilskrive forskjeller mellom gruppene til vår manipulasjon. Og, for bare å nevne det: vi snakker ikke her om å se på gjennomsnittsskåre for en gruppe og en annen og ut fra det si om en kabel er bedre eller ikke. – Her kjører man statistiske analyser for å avdekke om det er
signifikante forskjeller mellom de to gruppene (for å holde dette under lengden på noe som kunne blitt publisert under Knausgårds navn: signifikans er en statistisk test som estimerer sannsynligheten for at en forskjell vi observerer er en stabil forskjell mellom grupper, eller om denne forskjellen er såpass usystematisk at den kan tilskrives tilfeldig variasjon, som for eksempel Roar og co.).
I tillegg til mellomgruppedesign, som sammenlikner to gruppers oppfatninger, har vi også
innengruppe-design som ser på hvordan samme person opplever forskjeller avhengig av manipulasjon. Her slipper man problemet med at en gruppe kan være forskjellig fra en annen (hver mann sin gruppe, for å forklare det i Sponheim-termer). De nevnte
ABX-designene som jeg ærlig talt ikke har vært borti før i forgårs da mine Bose-hodetelefoner rett i mini-jacken gav meg hele 52% riktig på sammenlikningen mellom Spotify og lossless (der 50% er fullstendig tilfeldig) er eksempler på et innengruppe-design. Manipulasjonen ligger i om X samsvarer med A eller B, og man kan rampe opp ganske mange målinger, noe som er flott for den statistiske styrken. I vårt kabeleksempel ville altså deltakere bli presentert for kabel 1, så kabel 2, og så en av de to (uvisst for deltaker hvilken). Deltaker må så vurdere om det de hørte var kabel 1 eller 2. Igjen er det problemer (hva med rekkefølgen når 1 er X, versus når 2 er x? og andre mulige problemer), men dette antas å jevnes ut med antallet trials: Om du får like mange tilfeller hvor 1 = X og 2 = X, vil dette med andre ord løse seg selv slik at eneste forskjellen mellom de to opplevelsene av musikk skal være kablenes eventuelle effekt. Så noterer man respondentenes svar, kjører alt sammen inn i statistikkprogrammer og ser om det er stabile (signifikante) forskjeller mellom skit og Valhalla. Fordelen her er at du får en og samme deltaker til å gjøre begge vurderinger. Mulige problemer kan være at deltakere går lei ettersom de må gjøre ganske mange tester, at deltakere lærer over tid og svarer konsekvent (feil, for eksempel) basert på andre ting enn musikkopplevelse, etc., men dette kan også antas å skje for begge betingelser.
Sett nå at vi klarer å finne at en av kablene går av med seieren. Hva nå? Vel, en annen viktig ting å notere seg er at
vi kan ikke bevise noe her. Vi kan sannsynliggjøre en effekt av kabel og si at kabel har en effekt på opplevd lydkvalitet e.l., men dette beviser ikke at kabler har noe å si. For å kunne dra denne ekstremt bastante konklusjonen må vi – og andre – gjennomføre en rekke
replikasjoner og vise forskjeller i favør vinnerkabelen flere ganger.
Jeg leste kjapt at noen kommenterte at ABX ikke kan forklare hvordan opplevelse av musikk utvikler seg over tid. Dette stemmer, om vi ser på en ABX-test, som for eksempel den Spotify vs. lossless-testen jeg nevnte i stad (den hadde 15 musikkstykker du skulle vurdere, brukte et par minutter), men dette kan omgås om vi gjør samme test over tid: Inviter deltakere tilbake senere for videre testing, for eksempel.
Men, så har vi store spørsmål, myter, og problemer knyttet til alle disse designene: hva med innbrenningstid? Hva med å oppleve samme kabel over tid som gjør at du blir vant til lydsignaturen den har og dermed blir vant til den? Hva med de øvrige kablene i systemet? Generaliserbarhet til andre, ikke hi-fi-interesserte? Hva med andre komponenter (leste f.eks. at Lyd og Bilde mente strømrensing hadde størst effekt i deres dyreste demo-rigg sammenliknet med deres billigste)? – Listen over mulig metodologisk kritikk er, som ved all annen forskning, uendelig. Her kan man – ideelt sett – over tid implementere disse tingene en etter en og undersøke hvordan disse slår ut på samme type eksperimenter. For eksempel, om vi tar utgangspunkt i billig vs dyrt anlegg og så ser hvordan dette spiller inn på kablenes effekt: gjør samme som over, men i stedet for to grupper (skit vs. Valhalla) har vi fire grupper (1) skit+skit; 2) skit+anlegg som slår deg personlig konkurs; 3) skit+Valhalla; 4) anlegg som slår deg personlig konkurs+Valhalla) og gjør samme prosedyre. Da kan man i tillegg til å se på effekten av kabel (en såkalt hovedeffekt: hvordan en variabel påvirker nivå på en annen) se på mulige
interaksjonseffekter (hvordan tilstedeværelse av en variabel påvirker effekten av en annen variabel på nivå på en tredje).
Det er med andre ord mange teoretiske holdepunkter man kan ta for å sannsynliggjøre at observasjonene man gjør representerer andre, potensielle observasjoner, grupper, og mennesker. Men, vi står her i en unik posisjon der vi ikke trenger å gjøre dette: Vi – jeg – MÅ ikke måle om det er en direkte effekt av komponentene mine, og endringen av de, på min, naboens, og Roars opplevelse av musikk. For i motsetning til forskning i psykologi, fysikk, medisin, eller andre akademiske felt, kan man som hi-fi-entusiast ta seg friheten til å la de subjektive følelsene få være akkurat det, og oppleve gåsehud av Jimmie Pages gitar, Anne-Sofie Mutters fiolin, Garbareks saksofon, Sundførs stemme, eller Deadmau5 sin… Mac.
Nå sier jeg meg, igjen, ferdig for nå, og vil igjen påpeke min hensikt her: Dette er et teoretisk innblikk i noe som på hobbybasis ikke burde være teoribasert. Musikk og nytelse skjer best uten forskningsmetode.
Og helt helt til sist: igjen masse takk for positive tilbakemeldinger! Si gjerne fra om det er andre temaer jeg skal sjekke opp eller – forsøke – å belyse