Tussen feit en gevoel zit het cijfer
Op de (social-)media lijkt sinds het begin van de coronacrisis het openbaar analyseren van data een nieuwe vlucht te hebben genomen. Zo worden we bestookt met dagcijfers van besmettingen, opnames etc. en zijn er veel data nerds die veelal online en openbaar eigen datasets bijhouden. Bij deze honger naar feiten spelen emoties, begrijpelijk, ook een rol.
Ooit volgde ik colleges techniekfilosofie waarin de moraal van voorwerpen ter sprake kwam. Zonder volledig recht te willen doen aan dit onderwerp kun je zeggen dat ook niet-natuurlijke zaken als (gebruiks-)voorwerpen een moraal hebben. Ze dwingen ons immers door hun vorm, uitstraling of gebruiksdoel tot bepaalde handelingen. En sturen en begrenzen ons daar in.
Zoiets is ook aan de hand met cijfers. Om feiten snel en overzichtelijk weer te geven zijn cijfers leuk. Maar het gevoel dat de feiten oproepen kan weldegelijk worden beïnvloed door de keuze in deze cijfers. Zo ontstond een discussie in de vriendengroep van mijn ouders. Daar wilde men een verjaardag vieren maar dat mag (thuis) niet meer met 10-20 personen tegelijk. Een oplossing is om de visite te verdelen over 4 groepen van bijvoorbeeld 5 mensen. Maar... is de kans dat je (intensief) met iedereen praat in een groep van 5 niet gewoon veel groter dan in een groep van 20? En daarmee ook de besmettingskans? En wat als één van de gasten, uiteraard in groep-1, de gastheer/vrouw besmet en deze vervolgens door gaat met nieuwe groepen uitnodigen? Had men dan niet gewoon beter 1 groep kunnen maken in de hoop dat deze persoon 'slechts' 2 of 3 mensen totaal zou besmetten? Wie weet wat nu de veiligste optie is? ("Jij bent toch Data Analist en kun je daar niet iets slims over schrijven?"). Kan dus niet want de bewuste statistieken heb ik niet. Maar terugkerend naar ons feit, cijfer en gevoel driehoekje:
1 x 20 = 4 x 5 ?
Drie manieren om nieuws te brengen
Nog een goed voorbeeld. Veel mensen vragen zich af hoe gevaarlijk COVID-19, in termen van cijfers, nu eigenlijk is. Daar verschijnen vrijwel dagelijks nieuwe studies over. Eén van deze studies (HIER) geeft bijvoorbeeld een Infection Fatality Rate (IFR) van 0.51% over alle leeftijdsgroepen. Laten we voor het rekengemak eens zeggen: een half procent. En laten we daar, wederom voor de vox-populi, even een poll van maken:
Wat maakt u/je banger?
(1) Je hebt 0.5% kans te overlijden aan COVID-19
(2) De kans om te overlijden aan COVID-19 is 1 op 200.
(3) De kans om COVID-19 te overleven is 99.5%
Gebaseerd op de feiten uit het artikel zijn alle drie de statements waar. De eerste 2 zijn negatiever geformuleerd, uitgaande van de IFR/overlijdenskans. De laatste is positiever en geeft, qua cijfer, ook nog eens een lekker hoog percentage! Maar zelfs de eerste twee verschillen van elkaar qua beleving. Dit komt net als bij de derde voornamelijk door de hoogte van het getal. En door het feit dat 'percentage', zelfs als je er goed mee uit de voeten kan, toch nog abstracter klinkt. Het hoofdstuk kansberekening op de middelbare school begon voor velen niet voor niets met 1-op-de-zoveel knikkers in een vaasje experimenten.
Maar verder doorrekenen levert weer nieuwe feiten en daarmee ook gevoelens op. 99,5% klinkt heel positief. Maar uitgezet tegenover een totale bevolking is het nog steeds veel: 85.000 slachtoffers in Nederland en 35 miljoen Wereldwijd. Weer te groot of te abstract? Uitgedrukt in Boeing 737-800 toestellen -een populair type bij onze eigen KLM- zijn dat er ruim 425 in Nederland...
Nog een goed voorbeeld. Veel mensen vragen zich af hoe gevaarlijk COVID-19, in termen van cijfers, nu eigenlijk is. Daar verschijnen vrijwel dagelijks nieuwe studies over. Eén van deze studies (HIER) geeft bijvoorbeeld een Infection Fatality Rate (IFR) van 0.51% over alle leeftijdsgroepen. Laten we voor het rekengemak eens zeggen: een half procent. En laten we daar, wederom voor de vox-populi, even een poll van maken:
Wat maakt u/je banger?
(1) Je hebt 0.5% kans te overlijden aan COVID-19
(2) De kans om te overlijden aan COVID-19 is 1 op 200.
(3) De kans om COVID-19 te overleven is 99.5%
Gebaseerd op de feiten uit het artikel zijn alle drie de statements waar. De eerste 2 zijn negatiever geformuleerd, uitgaande van de IFR/overlijdenskans. De laatste is positiever en geeft, qua cijfer, ook nog eens een lekker hoog percentage! Maar zelfs de eerste twee verschillen van elkaar qua beleving. Dit komt net als bij de derde voornamelijk door de hoogte van het getal. En door het feit dat 'percentage', zelfs als je er goed mee uit de voeten kan, toch nog abstracter klinkt. Het hoofdstuk kansberekening op de middelbare school begon voor velen niet voor niets met 1-op-de-zoveel knikkers in een vaasje experimenten.
Maar verder doorrekenen levert weer nieuwe feiten en daarmee ook gevoelens op. 99,5% klinkt heel positief. Maar uitgezet tegenover een totale bevolking is het nog steeds veel: 85.000 slachtoffers in Nederland en 35 miljoen Wereldwijd. Weer te groot of te abstract? Uitgedrukt in Boeing 737-800 toestellen -een populair type bij onze eigen KLM- zijn dat er ruim 425 in Nederland...
Noot: sinds dat ene onderzoek naar de IFR
hebben we het dus nog steeds over exact
hetzelfde feit. Maar andere cijfers, en dus ook
andere gevoelens.
hebben we het dus nog steeds over exact
hetzelfde feit. Maar andere cijfers, en dus ook
andere gevoelens.
Weglaten is ook een kunst
Uit mijn eigen praktijk als Data Specialist weet ik ook dat hetzelfde feit middels verschillende cijfers ook andere gevoelens oplevert. Zo deed ik ooit een onderzoek naar de relatie tussen vertrouwen, experimenteervaardigheden en persoonlijkheid. Wat bleek: persoonlijkheid was een grotere voorspeller voor vertrouwen in experimenteervaardigheden dan experimenteervaardigheden zelf (1). Maar: dat verschil was niet super spectaculair. Persoonlijkheid voorspelde slechts 4% meer het vertrouwen dan vaardigheden (2). En op het totale model werd het grootste gedeelte van vertrouwen niet verklaart door persoonlijkheid (7%) en vaardigheden (3%) (3). Zeg maar rustig voor 90% niet dus (4). Wederom zien we 4 statements over hetzelfde die én toch allemaal waar zijn én toch allemaal een ander gevoel oproepen.
Zoals een vriend mij met een boosaardige grijns zei: "Ja, je hebt leugens, dan statistiek, en dan heb je nog dat gedoe wat jij doet".
Maar inmiddels durf ik wel te concluderen dat cijfer en gevoel een relatie hebben.
En dat is een feit.
David Otten, oktober 2020
Gerelateerd: Al eerder schreef ik vanuit mijn huidige werkzaamheden een blog over o.a. de data-gedreven maatschappij en dat daarbij -paraoxaal- juist de sociale vaardigheden en het kunnen redeneren over cijfers (data) steeds belangrijker wordt: Vraagt het Data-gedreven werken om meer organisatiegevoel?