Spredeplotets kunst og videnskab

63% af amerikanske voksne kan korrekt læse dette diagramSPOILER ALERT:Hvis du endnu ikke har taget vores Science Knowledge Quiz, skal du gøre det, før du læser dette yderligere, fordi vi giver et af svarene væk.


I en nylig undersøgelse af, hvad amerikanerne ved om videnskab, bad vi folk om at fortolke det diagram, du ser her, og fortælle os, hvad det viste. Seks ud af ti (63%) identificerer den bedste fortolkning af dette diagram som 'jo mere sukker folk spiser, jo mere sandsynligt er det, at de får hulrum.'

Denne form for diagram - kendt som en scatterplot - er meget velkendt for folk, der er vant til at arbejde med tal, såsom økonomer, forskere, forskere og datajournalister. Det er en god måde at vise et forhold mellem to variabler på.


Måske ikke overraskende var de mennesker, vi undersøgte, mest sandsynligt at fortolke vores scatterplot-eksempel korrekt, uddannet på college. Omkring otte ud af ti (79%) af dem med en universitetsgrad og 84% af dem med en kandidatgrad valgte det rigtige svar ud af fire muligheder. I modsætning hertil drog kun halvdelen af ​​dem med en gymnasial uddannelse eller mindre den korrekte konklusion. Uddannelsesgabet på scatterplot-spørgsmålet var kun andet end det spørgsmål, vi stillede om, hvilken egenskab der bestemmer lydens lydstyrke.

Så hvorfor er scatterplot svært at læse for folk med mindre uddannelse? Jeg spurgte Alberto Cairo, der er ridderstol i visuel journalistik ved University of Miami og er forfatter til 'The Functional Art'. (Han har en anden bog, 'Den sandfærdige kunst', der kommer ud næste år.)

'Vi glemmer, at vi ikke kun forstår grafik automatisk', sagde Cairo. ”Søjlediagrammet, linjediagrammet, vi lærer at læse dem i skolen. Vi lærer at forstå grafik '. Og i de fleste tilfælde, inklusive for Kairo selv, udsættes eleverne ikke for spredningsplot i grundskolen. Det er hovedsageligt studerende, der tager et kursus i økonomi, statistik eller et andet videnskabeligt felt, der udsættes for den forholdsanalyse, som scatterplot illustrerer.



Blandt datajournalister, siger Cairo, er der i disse dage en almindelig tanke om, at grafik skal forstås med det samme. Men han er uenig '. Det er helt falsk ', sagde han. 'Visualiseringer skal læses. De er som et stykke tekst. Første gang jeg så en scatterplot for mange år siden, blev jeg forbavset. Tænkte jeg, hvad der erdette?Jeg brugte fem minutter på det '.


Men når du først har læst en, ved du hvordan man læser en anden. Det er et spørgsmål om eksponering, siger han. Det faktum, at omkring seks ud af ti voksne i vores undersøgelse var i stand til at læse en scatterplot, var derforgodtnyheder, sagde han, fordi det er overraskende højere end hvad han ville have troet.

'Grafik har grammatik. De har ordforråd, sagde han. 'Resultaterne betyder, at vi udvider vores uddannelse. Vi udvider vores ordforråd '.


Spredningsdiagrammet er blevet mere populært i de senere år og bevæger sig ud fra bare akademiske lærebøger og papirer til mere almindelig brug i aviser og online medier. Blandt grafiske designere er det et mere sofistikeret diagram - et trin over det typiske bjælke-, linje- eller cirkeldiagram.

Men detgørtage lidt mere tid på at læse. For det første er det ikke en simpel sammenligning af kun to elementer, som du ville finde i et søjlediagram eller tal over tid som i en linjediagram. Spredningsdiagrammet tegner to variabler i forhold til hinanden.

Et vigtigt punkt at forstå er, at scatterplot viser sammenhæng, ikke kausalitet, sagde Pew Research Centers art director, Diana Yoo. Diagrammet, vi brugte, blev tilpasset fra en stikprøve af OECD's Program for International Student Assessment givet til 15-årige i mere end 70 lande. Mens nogle gange mennesker ser et årsagsforhold, viser diagrammet kun en sammenhæng mellem gennemsnitligt sukkerforbrug og gennemsnitligt antal forfaldne tænder.

Ofte inkluderer en scatterplot en linje, kendt som 'line of best fit', der hjælper med at opsummere det underliggende forhold mellem to variabler. Hældningen på denne linje kan hjælpe med at illustrere, om en stigning eller et fald i en variabel er forbundet med en stigning eller et fald i den anden. I vores eksempel viser spredning af tandforfald en positiv sammenhæng. (En negativ ville hælde ned fra venstre mod højre.) Du kan se styrken af ​​forholdet mellem to variabler ved, hvor tæt datapunkterne er grupperet omkring den linje, der passer bedst: jo flere datapunkter på eller nær linjen med den bedste jo stærkere er den samlede sammenhæng.


På Pew Research Center har vi offentliggjort masser af data i scatterplot-diagrammer, og vi har fundet dem især nyttige, når vi har et stort antal datapunkter at vise, såsom andelen af ​​de berettigede spanske vælgere i hvert kongresdistrikt eller lande, såsom rigdom i forhold til madoverkommelighed eller endda at tegne et billede af, hvem der har en 'god' dag.

Det er sikkert at sige, at de fleste datajournalister er scatterplot-fans. Men hvad er det næste? Kairo siger, at landets grafiske ordforråd kan udvides yderligere. Echoing New York Times journalist Amanda Cox, han sagde, at den næste hotte grafik er histogrammet. Hvad er det? Se en af ​​vores og fortæl os, om du også kan læse det.