Statistici Putere din date! Varianța și abaterea standard
Publicații
Statistici: Putere din date!
Măsuri de răspândire
- Pagina de bun venit
- Gama și quartile
- Varianța și abaterea standard
- Rezumate cu cinci numere
- Construirea de parcele pentru cutii și mustăți
- Exerciții
- Răspunsuri
Conținut arhivat
Informațiile identificate ca arhivate sunt furnizate în scopuri de referință, cercetare sau evidență. Nu este supus standardelor web ale Guvernului Canadei și nu a fost modificat sau actualizat de când a fost arhivat. Vă rugăm să ne contactați pentru a solicita un alt format decât cele disponibile.
- Proprietățile deviației standard
- Variabile discrete
- Exemplul 1 - Abaterea standard
- Tabel de frecvență (variabile discrete)
- Exemplul 2 - Abaterea standard calculată utilizând un tabel de frecvențe
- Exemplul 3 - Abaterea standard utilizând variabile grupate (continue sau discrete)
- Exemplul 4 - Abaterea standard
- Exemplul 5 - Abaterea standard
Spre deosebire de interval și quartile, varianța combină toate valorile dintr-un set de date pentru a produce o măsură a răspândirii. Varianța (simbolizată prin S 2 ) și deviația standard (rădăcina pătrată a varianței, simbolizată prin ) sunt cele mai utilizate măsuri de răspândire.
Știm că varianța este o măsură a cât de răspândit este un set de date. Se calculează ca deviația pătrată medie a fiecărui număr față de media unui set de date. De exemplu, pentru numerele 1, 2 și 3 media este 2 și varianța este 0,667.
[(1 - 2) 2 + (2 - 2) 2 + (3 - 2) 2] ÷ 3 = 0,667
[deviația pătrată de la medie] ÷ numărul de observații = varianță
Varianța (S 2) = deviația pătrată medie a valorilor față de medie
Calcularea varianței implică deviații la pătrat, deci nu are aceeași unitate de măsură ca observațiile inițiale. De exemplu, lungimile măsurate în metri (m 2) au o varianță măsurată în metri pătrate (m 2).
Luarea rădăcinii pătrate a varianței ne oferă unitățile utilizate în scara originală și aceasta este abaterea standard.
Abaterea standard (S) = rădăcina pătrată a varianței
Abaterea standard este măsura răspândirii cea mai frecvent utilizată în practica statistică atunci când media este utilizată pentru a calcula tendința centrală. Astfel, măsoară răspândirea în jurul valorii medii. Datorită legăturilor sale strânse cu media, deviația standard poate fi foarte mult afectată dacă media dă o măsură slabă a tendinței centrale.
Abaterea standard este, de asemenea, influențată de valori aberante, o valoare ar putea contribui în mare măsură la rezultatele abaterii standard. În acest sens, abaterea standard este un bun indicator al prezenței valorilor aberante. Acest lucru face ca deviația standard să fie o măsură foarte utilă a răspândirii pentru distribuții simetrice fără valori aberante.
Abaterea standard este, de asemenea, utilă atunci când se compară răspândirea a două seturi de date separate care au aproximativ aceeași medie. Setul de date cu deviația standard mai mică are o răspândire mai restrânsă a măsurătorilor în jurul valorii medii și, prin urmare, are de obicei comparativ mai puține valori ridicate sau scăzute. Un element selectat la întâmplare dintr-un set de date a cărui abatere standard este mică are șanse mai mari de a fi aproape de medie decât un articol dintr-un set de date a cărui abatere standard este mai mare.
În general, cu cât valorile sunt mai răspândite, cu atât deviația standard este mai mare. De exemplu, imaginați-vă că trebuie să separăm două seturi diferite de rezultate ale examenului de la o clasă de 30 de studenți, primul examen are note cuprinse între 31% și 98%, celălalt variază de la 82% la 93%. Având în vedere aceste intervale, abaterea standard ar fi mai mare pentru rezultatele primului examen.
Abaterea standard ar putea fi dificil de interpretat în termeni de cât de mare trebuie să fie pentru a lua în considerare datele răspândite pe scară largă. Mărimea valorii medii a setului de date depinde de mărimea abaterii standard. Atunci când măsurați ceva care este în milioane, a avea măsuri care sunt „apropiate” de valoarea medie nu are aceeași semnificație ca atunci când măsurați greutatea a doi indivizi. De exemplu, o măsură de două mari companii cu o diferență de 10.000 USD în venituri anuale este considerată destul de apropiată, în timp ce o măsură de două persoane cu o diferență de greutate de 30 de kilograme este considerată departe. Acesta este motivul pentru care, în majoritatea situațiilor, este util să se evalueze dimensiunea abaterii standard față de media setului de date.
Deși deviația standard este mai puțin susceptibilă la valori extreme decât intervalul, deviația standard este încă mai sensibilă decât intervalul semi-quartile. Dacă se prezintă posibilitatea unor valori ridicate (valori aberante), atunci abaterea standard ar trebui să fie completată de gama semi-quartile.
Proprietățile deviației standard
Când utilizați abaterea standard, țineți cont de următoarele proprietăți.
- Abaterea standard este utilizată numai pentru a măsura răspândirea sau dispersia în jurul mediei unui set de date.
- Abaterea standard nu este niciodată negativă.
- Abaterea standard este sensibilă la valori aberante. O singură valoare anterioară poate crește abaterea standard și, la rândul său, distorsiona imaginea răspândirii.
- Pentru date cu aproximativ aceeași medie, cu cât răspândirea este mai mare, cu atât deviația standard este mai mare.
- Dacă toate valorile unui set de date sunt aceleași, abaterea standard este zero (deoarece fiecare valoare este egală cu media).
Când se analizează datele distribuite în mod normal, abaterea standard poate fi utilizată împreună cu media pentru a calcula intervalele de date.
Dacă = medie, = abaterea standard și X = o valoare din setul de date, apoi
- aproximativ 68% din date se află în intervalul: - S 2).
- Folosiți rădăcina pătrată pozitivă (deviație standard, ).

Exemplul 1 - Abaterea standard
O găină depune opt ouă. Fiecare ou a fost cântărit și înregistrat după cum urmează: