Det han peker med søvnløshet, hjerteinfarkt og stress heter omitted variable bias.
Hvis vi antar at stress medfører både hjerteinfarkt og søvnløshet, så betyr ikke det at søvnløshet ikke er en god predikator for hjerteinfrakt (selv om stress er den underliggende driveren). Man kan altså predikere hjerteinfarkt ved å undersøke søvnløshet. Det kan være enklere å kvantifisere søvnløshet ift. stress f.eks. ved å ta utgangspunkt i normalbehovet for søvn og normale innsovningstider o.l., for så be observandene loggføre disse. Senere kan man se på frekvensen av hjerteinfarkt.
Selv om man kan predikere hjerteinfarkt ved hjelp av søvnløshet (korrelasjon), så blir det galt å si at søvnløshet forårsaker hjerteinfarkt (kausalitet).
Man kan også tenke seg at søvnløshet forårsaker stress som igjen forårsaker hjerteinfarkt, eller at stress påvirker søvnløshet og at søvnløshet påvirker stress, slik at begge forsterker hverandre og at dette øker sannsynligheten for hjerteinfarkt.
Det er derfor statistikk bør brukes i kombinasjon med god forståelse for det man skal undersøke.
I større statistiske undersøkelser, så bygger de opp større og større forklaringsmodeller der de tar med flere og flere forklaringsvariabler (f.eks. undersøke frekvens av hjerteinfarkt forklart av søvnløshet, stress, kosthold, mosjon, biologiske faktorer, sosioøkonomiske forhold, m.v.) De som leser forskningen og har statistisk innsikt kan da tolke resultatene kritisk. Det er hele poenget.