Gennemsnit, medianer og arbejdsløshed: Analyse af tallene

Hver måned, når Bureau of Labor Statistics offentliggør sin jobrapport, bor folk på en bestemt måling: arbejdsløsheden. Men der er mange andre interessante og potentielt vigtige data i rapporten, selvom det kan være vanskeligt at fortolke dem korrekt.


Tag for eksempel varigheden af ​​arbejdsløsheden. Der er ringe tvivl om, at flere forbliver ledige i længere tid, end historisk har været tilfældet. Sidste måned, ifølge BLS, var den sæsonkorrigerede gennemsnitlige arbejdsløshedsvarighed 35,6 uger, ikke langt under højdepunktet efter krisen på 40,7 uger i slutningen af ​​2011. Før finanskrisen ramte fuld styrke, var den gennemsnitlige varighed omkring 16 eller 17 uger.

Men ergennemsnitvarighed den bedste måling? Som diagrammet til højre viser, er arbejdsløshedsvarigheden stærkt skæv: Mens de fleste mennesker er klynget mod de kortere varigheder, er der nogle mennesker, der har været uden arbejde meget lang tid - 3, 4, 5 år eller mere - og disse tilfælde trækker gennemsnittet højere. Når data distribueres sådan, kan gennemsnit være meget vildledende med hensyn til, hvad den “typiske” værdi er.


I sådanne tilfælde vil de fleste eksperter i stedet bruge medianen - midtpunktet for en distribution, hvor halvdelen af ​​værdierne falder over den og halvdelen under den. Medianen er meget mindre påvirket af skæv fordelinger og outliers (datapunkter, der er usædvanligt store eller små sammenlignet med resten af ​​datasættet). Detmedianvarigheden af ​​arbejdsløsheden i juni, sæsonkorrigeret, var 16,3 uger - stadig langt over den typiske medianvarighed for præ-recession på 8 til 9 uger.

Arbejdsløshedsvarigheden er næppe den eneste datadistribution, der kan blive alt for påvirket af en relativ håndfuld outliers. Rigdoms- og indkomstdata er for eksempel notorisk skæv: Ifølge New York Times-spaltist Floyd Norris var median husstandsformue i 2010 (beregnet ud fra Federal Reserve's treårige undersøgelse af forbrugerfinansieringer) omkring en sjettedel af den gennemsnitlige husstandsformue.

Med hensyn til indkomst, som Stephanie Coontz for nylig argumenterede for i New York Times, ville den gennemsnitlige husstandsindkomst der svæve natten over fra $ 46.341 til $ 75.263, hvis Warren Buffett og Oprah Winfrey tog det i hovedet for at flytte til Steubenville, Ohio. Coontz's stykke giver flere andre eksempler på skæv fordeling og vildledende gennemsnit.



Når man ser på både gennemsnit og medianer, og hvor tæt de er på hinanden, kan det fortælle meget om de underliggende data. (I en helt normal fordeling ville de være identiske.) Den fortsatte brede kløft mellem den gennemsnitlige og medieledighedsløbet (dog ikke helt så bred som for et år siden) indikerer, at mens de fleste arbejdsløse amerikanere finder arbejde om 20 uger eller derunder forbliver en kerne af langtidsledige uden arbejde i længere og længere perioder. Og husk, at for at blive talt som arbejdsløs skal en person for nylig have søgt efter arbejde, inkluderer disse data ikke de anslåede 7,2 millioner amerikanere, der ønsker et job, men ikke har ledt efter et i det forløbne år.