Omagiu lui Charles Minard; Grafic flux de lucru

Charles Joseph Minard (1781 - 1870) a fost un inginer civil francez, recunoscut pe scară largă ca fiind unul dintre primii maeștri ai vizualizării datelor.

minard

În opinia mea, Charles Minard este probabil cel mai inovator om de știință pentru vizualizarea datelor, având în vedere tehnologia limitată a timpului său, și a fost foarte prolific în producerea mai multor grafice complicate. Al său este cunoscut în special pentru capacitatea sa de a reduce complexitatea multidimensională a întrebărilor importante la grafice simple, care ar putea fi ușor decodificate chiar și de către publicul larg.

Obiectiv grafic

Charles Minard este cunoscut în special pentru diagrama figurativă a marșului lui Napoleon la Moscova în 1812. Campania de război a fost dezastruoasă, începând cu aproximativ 422.000 de soldați de la granița poloneză către Rusia, ajungând la Moscova cu doar 100.000 și revenind învins cu doar 10.000 de soldați. Graficul arată amploarea devastării și este o capodoperă a simplificării complexității, deoarece codifică șapte dimensiuni: dimensiunea armatei, direcția (înaintare sau retragere), distanța parcursă, latitudinea și longitudinea, locația legată de bătăliile semnificative, temperatura și data . Iată graficul original:

Acest grafic a fost descris de Edward Tufte (1983, The Visual Display of Quantitative Information) ca „probabil cel mai bun grafic statistic desenat vreodată”. Ca un omagiu adus lui Charles Minard, voi încerca să reproduc acest grafic (cât mai aproape posibil) folosind Stata.

Management de date

Datele provin de pe site-ul web al lui Leland Wilkinson pe Gramatica graficii. Datele, deși sunt exacte în înregistrarea latitudinii și longitudinii, nu sunt exacte în reprezentarea figurativă a lui Charles Minard, așa că fac câteva ajustări manuale la latitudine și longitudine. De asemenea, asociez longitudinea temperaturii cu longitudinea locațiilor de marș.

Cel mai important aspect al gestionării datelor este găsirea unei modalități de codificare a lățimilor segmentelor de linie, astfel încât acestea să reprezinte dimensiunea armatei care avansează și se retrage. Acest lucru se realizează prin exprimarea dimensiunii armatei în termeni relativi, ca porțiuni la maximum în orice moment dat.

Codul pentru reproducerea întregii analize este furnizat la sfârșitul acestei pagini.

Implanturi vizuale

Graficul original se bazează pe implantarea liniei de codificare, conectând locațiile cheie din marș la Moscova și numărând mărimea armatei.

Partea de jos a graficului codifică o altă informație folosind o altă implantare de linie cu lățime fixă ​​a liniei. Această linie codifică temperatura în timpul marșului de întoarcere de la Moscou (Moscova) la Kwono (Kaunas).

Implanturi de linie suplimentare sunt utilizate pentru a conecta informațiile de temperatură cu locația căii de retur. Aceste linii verticale acționează și ca legături între datele temporale ale datei la care temperatura a fost înregistrată cu datele spațiale ale locațiilor cheie.