Jeg må også si jeg har problemer med å forstå en logikk som tilsier at det høre 0 av 10 rette er ekvivalent med 10 av 10 rette i en ABX test.
I en ABX-test skal du bevise at du hører en reell forskjell, altså at du hører om X er det samme som A eller om X det samme som B. Med andre ord er hypotesen du skal bevise at det
er en forskjell, mens nullhypotesen er at det ikke er noen forskjell og at svarresultatet ditt er slump/tilfeldig.
Hvis det ikke er noen forskjell (nullhypotesen) så betyr det i praksis at du gir et slumpresultat. Hvis du gjetter om X er A eller B på slump, så er det mest sannsynlig at du får rett halvparten av gangene og tar feil halvparten av gangene, eller at du gjetter rett fem av ti ganger. Det er lite sannsynlig at du gjetter riktig ti av ti ganger på slump, men det er like lite sannsynlig at du gjetter feil ti av ti ganger på slump. Sannsynligheten for antall rette av ti på slump er (cirkatall):
0/10: 0.1%
1/10: 1%
2/10: 4%
3/10: 12%
4/10: 20%
5/10: 25%
6/10: 20%
7/10: 12%
8/10: 4%
9/10: 1%
10/10: 0.1%
Hvis du får 10/10 rette er det lite sannsynlig at det er slump og sannsynliggjort at du hørte rett. Hvis du får 0/10 rette er det like lite sannsynlig at det er slump, men mest sannsynlig at du forvekslet A og B. Hvis du gjetter tilfeldig mange ganger vil du score 5/10 cirka én av fire ganger, mens du vil score 8/10 cirka én av tjue ganger. Du vil også score 2/10 cirka én av tjue ganger. Så det er ikke veldig usannsynlig at du får 8/10 på slump. Men hvis du gjentar det flere ganger eller en signifikant majoritet av et lytterpanel får 8/10, er det sannsynliggjort at resultatet ikke er slump og at det faktisk er en forskjell. Og jo flere forsøk eller jo større majoritet, jo sterkere har forsøket sannsynliggjort det.