Exploatarea datelor Twitter geoetichetate pentru a examina fericirea, dieta și activitatea fizică din cartier -

Adăugați la Mendeley

datelor

Repere

Am construit noi caracteristici de cartier din date Twitter geoetichetate.

Am estimat indicatorii tractului recensământului pentru fericire, dietă și activitate fizică.

Tweet-urile etichetate manual și cu algoritm au avut un nivel excelent de acord.

Variabile derivate din Twitter corelate cu caracteristicile sociodemografice ale tractului.

Rețelele sociale sunt o resursă Big Data pentru caracterizarea cartierului eficientă din punct de vedere al costurilor.

Abstract

Obiective

Folosind date Twitter, geotagate, disponibile publicului, am creat indicatori de vecinătate pentru fericire, hrană și activitate fizică pentru trei județe mari: Salt Lake, San Francisco și New York.

Metode

În analiza noastră, utilizăm 2,8 milioane de tweets colectate în perioada februarie - august 2015. Coordonatele geografice ale locului în care au fost trimise tweet-urile ne permit să le alăturăm spațial la locațiile de recensământ din 2010. Am implementat verificări de control al calității și am testat asocieri între variabilele derivate din Twitter și caracteristicile sociodemografice.