På Twitter er lokale nyheder svære at finde

Da amerikanere i stigende grad bruger sociale medier, er forskere naturligvis interesserede i, hvordan dataene fra det kan bruges til bedre at forstå, hvordan brugerne deler og diskuterer information på disse nye platforme. Massen af ​​tweets, der spænder fra politisk kommentar til den samlede 'stemning' om virksomheder, produkter eller tjenester, har mange marketingfirmaer og akademikere, der klager efter indsigt i Twitters kollektive bevidsthedsstrøm.


Men hvor nøjagtig er Twitter som et mål for den offentlige stemning, og hvordan kan den bruges? På Pew Research Center har vi været specifikt interesserede i at eksperimentere med Twitters rolle i nyhederne siden 2008. Så da vi lancerede et årslangt projekt, der undersøgte lokale nyheder i tre byer sidste år, testede vi flere tilgange ved hjælp af Twitter-data for at forstå, hvordan det tjener som en kilde til nyheder og gør det muligt for lokale beboere at blive deltagere i det.

Vores dom? Mens Twitter-analyser stadig er på et eksperimentelt stadium, og Twitter-data har begrænsninger, kan det være et værdifuldt nyt værktøj til at forstå mediemiljøet. Mere specifikt fandt vi det værdifuldt at forstå, hvordan nyhedsorganisationer bruger Twitter. Lokale nyheder er dog kun et lille emne af mange, der diskuteres på platformen. Det, vi fandt manglende, forsøgte at samle data om Twitter-brugere efter sted.


Her er en oversigt over, hvad der fungerede, og hvad der ikke brugte Twitter til forskning.

Hvad vi gjorde:

Vi ønskede at forstå, hvilken rolle Twitter spiller som kilde til nyheder for lokale beboere i tre casestudiebyer: Denver, Macon, Ga., Og Sioux City, Iowa. Dette omfattede sporing af traditionelle nyhedsorganisationer på Twitter, såsom aviser, tv- og radiostationer samt nyhedsproducenter selv, såsom politikere, samfundsledere og embedsmænd. For at gøre dette brugte vi for det meste tjenesten Gnip til at få adgang til Twitter 'firehose', som refererer til adgang til alle tweets og metadata på Twitter.



I stedet for at tage Twitter-brugere som en proxy for deres større samfund, behandlede vi simpelthen Twitter-brugere i hver by som et samfund i sig selv. Vi foretog en omfattende revision af nyhedsudbydere i hver by og fandt ud af, at de fleste af dem havde Twitter-konti. Selvom en relativt lille del af befolkningen er på Twitter, kan nyhedsorganisationernes brug af Twitter fungere som et nyttigt værktøj til at forstå, hvordan lokal information spreder sig gennem et samfund.


For det andet ville vi vide, om indbyggerne i hver by brugte Twitter til at kommentere, diskutere og endda deltage i nyhedsbegivenheder. Vi eksperimenterede med flere forskellige metoder, inden vi besluttede os for en kombination af tilgange, der bedst kunne besvare de aktuelle spørgsmål.

I denne analyse huskede vi generelle begrænsninger ved at bruge Twitter til at tale om, hvad offentligheden tænker, gør eller værdsætter. I modsætning til de repræsentative telefonundersøgelser, vi foretager, er de på Twitter detikkerepræsentant for befolkningen som helhed. Samlet set viser vores undersøgelser, at omkring 23% af de voksne online er på Twitter, og at de, der får deres nyheder fra webstedet, er yngre, mere uddannede og mere tilbøjelige til at eje en smartphone end befolkningen generelt.


Hvordan vi foretog analysen:

Den første opgave med at oprette en prøve af tweets for hver by var at finde en pålidelig måde at generere geografiske grænser for tweets fra målbyerne.

Det viste sig at være udfordrende, da det at se på geotags eller selvidentificerede placeringer for Twitter-brugere - de tilsyneladende åbenlyse løsninger - ikke var anvendelige svar. På Twitter skal brugerne vælge at få deres tweets automatisk tagget med en placering, og meget få gør det; de fleste skøn er, at kun omkring 2% af tweets har geotags. Dette viste sig også at være tilfældet i denne undersøgelse: I de tre byer, der blev undersøgt over en uges feltperiode, var der næsten ingen geotagede tweets overhovedet.

Vi kiggede derefter på Twitter-brugeres selvidentificerede placering baseret på deres Twitter-profil. Vi undersøgte en prøve af tweets i hver by og fandt ud af, at størstedelen af ​​brugerne enten ikke udfyldte disse oplysninger eller udfyldte dem med oplysninger, der ikke var nyttige. For eksempel var 'månen' og 'det ydre rum' ekstremt populære steder. Selv i tilfælde, hvor der var en anvendelig placering, var der ingen ligetil måde at kontrollere, at brugerne faktisk boede, hvor de sagde, de gjorde.


I stedet vendte vi os til en teknik, der kaldes 'snebold' eller 'kæde' prøveudtagning.

Twitter-høstakkenDa vi allerede havde samlet Twitter-håndtagene fra nyhedsudbydere i hver by, trak vi fra denne oprindelige liste over alle tweets ethvert Twitter-håndtag eller enhver bruger, der @ havde nævnt eller retweetet en nyhedsudbyders håndtag i den undersøgte periode. Vi gjorde dette, fordi det at nævne eller retweeting af nyheder indikerer, at Twitter-brugeren er involveret i det, enten som nyhedsforbruger eller nogen, der ønsker at sprede nyhederne. Mens vi var klar over, kunne vi ikke garantere detalleaf de nye håndtag ville være direkte forbundet med hvert samfund, det gav os et udgangspunkt for yderligere at forfine prøven.

Dette trin øgede det samlede antal Twitter-brugere i prøven fra flere hundrede til mere end 30.000. Endelig trak forskere alle tweets fra hvert håndtag, der enten var identificeret som en nyhedsudbyder eller en nyhedsforbruger i tidsperioden for hver by. Det resulterede i mere end 4,7 millioner tweets.

Derefter indsnævrede vi den prøve på 4,7 millioner yderligere for at finde tweets, der var relevante for undersøgelsens fokus om lokale nyheder på Twitter - et vigtigt skridt, fordi vi fandt ud af, at det overvældende flertal af Twitter-indhold i løbet af den undersøgte uge ikke var lokalt.

Vi forsøgte at forfine prøven ved at studere webadresser, der deles på Twitter i hver by og ved at se på nøgleord. Cirka 40% af tweets inkluderede en URL eller et link til en anden webside. Forskere oprettede et program, der ville gå til hver webside og scanne det for nøgleord, der forbinder siden med hver by. Ved hjælp af Macon som testtilfælde oprettede vi en liste over nøgleord baseret på Macons storbystatistiske område (MSA). De 26 nøgleord inkluderede alle amts- og bynavne inkluderet i Macons MSA. I praksis fungerede disse nøgleord ikke. Selv disse nøgleord, der var specifikke for det geografiske område, var for generelle til at være nyttige.

Selvom denne metode havde fungeret, var der stadig problemet med de 60% af tweets, der ikke indeholdt en URL. Manglen på søgeordsstrategien og spørgsmålet om de yderligere 60% af tweets førte os til den endelige metode, vi brugte til undersøgelsen.

Hvad fungerede:

I sidste ende var løsningen et socialt medieanalyseværktøj kaldet Crimson Hexagon, som analyserede hele vores prøve af tweets for de mest almindelige søgeord og hashtags. Crimson Hexagon er software, der kan bruges til at analysere store mængder tweets og udtrække forskellige stykker information. I dette tilfælde brugte vi værktøjet til at fjerne tweets, der er irrelevante for vores forskning. Disse omfattede tweets sendt fra lande uden for USA og tweets, der ikke var på engelsk.

Efter at have fjernet dem brugte vi Crimson Hexagon til at finde de mest anvendte ord og sætninger i indholdet af tweets. Dette afslørede for os, at lokalt nyhedsindhold på Twitter langt overgås af nationale nyheder og andet indhold. Nøgleord om lokale nyheder var næsten umulige at finde med nogen frekvens.

På trods af nytten af ​​værktøjer som Crimson Hexagon, til sidst fandt vi mest succes med et langt mindre teknisk værktøj: mennesker. Vi læser simpelthen tweets - titusinder af dem - for at finde lokale nyheder. Denne proces tillod os også bedre at forstå, hvor lokale nyheder optrådte, og hvordan de blev delt.

Kombineret med en indholdsanalyse af lokale nyhedskilder viste vores resultater, at selv den lille lokale nyhed, der blev delt på Twitter, ofte var forskellig fra det, der blev dækket af nyhedsudsendelser i hver by. For eksempel i Macon handlede langt den mest delte historie på Twitter om et lokalt band, der havde gjort det til en konkurrence på VH1. Denne historie blev næppe dækket overhovedet i den almindelige presse i løbet af den undersøgte uge.

Der er flere tekniske værktøjer til kortlægning af store tendenser på Twitter, såsom overvågning af et globalt hashtag. Men med henblik på vores undersøgelse af nyheder i mindre samfund var Twitter-dataene så sparsomme, at de ikke var så nyttige, som vi havde håbet.