Noen trakk denne diskusjonen om "kort" ABX-testing vs ublind langtidslytting inn i et annet forum. Jeg fikk lyst til å bidra med dette innlegget som jeg ga der:
Hva er spørsmålet du ønsker besvart gjennom testaktiviteten?
Jeg har liten erfaring med ABX-testing, og grunnen er at det er litt kjedelig å drive med, og tid- og ressurskrevende å sette opp. Men jeg har erfaring med å AB-teste med raske skift (godt under et sekund) mellom ulike komponenter i delefiltre, og har funnet ut at forskjellene ofte er mindre en det man tror... Har også erfaring med ublind langtidslytting på ulike ting (bl.a. kabler), og har ingen problemer med å skjønne at man mener det er forskjell ved langtidslytting når man likevel har problemer med å høre forskjell ved raske skift (jeg har byttet ut kabler på bakgrunn av langtidslytting også, så jeg mener absolutt den har noe for seg). Men i motsetning til mange andre utelukker jeg ikke placebo, varierende ytelse på hørselen, varierende sinnstemning, bakgrunnslyder, romtemperaturvariasjoner, sviktende auditiv hukommelse etc som problemfaktorer som begrenser nøyaktigheten ved langtidslytting. Mange kritikere av ABX-testing mener man skal "stole på at hørselen er nøyaktig". For meg er det det samme som å ignorere ovennevnte usikkerhetsmomenter. Jeg synes heller man skal være åpen for disse usikkerhetsmomentene og forsøke å lære hvordan de påvirker lytteopplevelsen. Da kan man KANSKJE lære å "lytte forbi" eller kontrollere noen av dem også.
Jeg mener at ABX-tester (gitt at de er godt gjennomført) er gode til å svare på spørsmål om det er reelt hørbare forskjeller mellom produkter i et gitt oppsett (og at produktene dermed er bekreftet å ha ulike egenskaper). Et positivt, statistisk godt resultat her vil være objektivt gyldig for at det er reelle forskjeller mellom lydgjengivelsen for produktene, men ikke nødvendigvis i andre oppsett.
Lang tids bruk og lytting til musikk etter samme bruksmønster som vanlig er mer egnet til å svare på spørsmål om hva testeren vil være mest fornøyd med over tid i oppsettet. Dette resultatet vil være subjektivt, men gitt at mange rapporterer den samme opplevelsen av produktet i ulike oppsett, så vil sannsynligvis produktet gi tilnærmelsesvis samme opplevelse i et lignende oppsett. Mange like, subjektive resultater vil således kunne befeste en generell oppfatning av produktet som nærmer seg noe objektivt likevel. Men det er viktig at de som tester på denne måten vet minst mulig om hvilke resultater andre har fått, ellers vil placebo raskt kunne bli en overskyggende feilkilde.
Korte ABX-tester har etter min mening som største svakhet at selv om de er gode på å bekrefte forskjeller hvis de er der, så er de dårlige på å besvare hva som vil oppleves som best over tid ved normalt bruksmønster.
Ublind langtidslytting har etter min mening som sin største svakhet at det er en del usikkerhetsmomenter som gjør at testingen blir mer unøyaktig, spesielt ut fra objektive kriterier.
Etter min mening er altså begge metoder pålitelige, men de gir svar på ulike spørsmål.