Distribuția F și raportul F Introducere în statistici

Distribuția utilizată pentru testul ipotezei este una nouă. Se numește distribuția F, numită după Sir Ronald Fisher, un statistician englez. Statistica F este un raport (o fracție). Există două seturi de grade de libertate; unul pentru numărător și unul pentru numitor.

frecvent frecvent

De exemplu, dacă F urmărește o distribuție F și numărul de grade de libertate pentru numărător este de patru, iar numărul de grade de libertate pentru numitor este de zece, atunci F

Distribuția F este derivată din distribuția t a Studentului. Valorile distribuției F sunt pătrate ale valorilor corespunzătoare ale distribuției t. One-Way ANOVA extinde testul t pentru compararea mai mult de două grupuri. Scopul acelei derivări depășește nivelul acestui curs.

Pentru a calcula raportul F, se fac două estimări ale varianței.

  1. Varianța între probe: O estimare a lui σ 2 care este varianța eșantionului înseamnă înmulțită cu n (când dimensiunile eșantionului sunt aceleași.). Dacă eșantioanele au dimensiuni diferite, diferența dintre eșantioane este ponderată pentru a ține cont de diferitele dimensiuni ale eșantionului. Varianța se mai numește variație datorată tratamentului sau variație explicată.
  2. Varianța în eșantioane: O estimare a lui σ 2 care este media varianțelor eșantionului (cunoscută și sub numele de varianță cumulată). Atunci când dimensiunile eșantionului sunt diferite, variația în eșantioane este ponderată. Varianța se mai numește variație datorată erorii sau variației inexplicabile.
  • SS între: suma pătratelor care reprezintă variația dintre diferitele eșantioane
  • SSwithin = suma pătratelor care reprezintă variația din eșantioane care se datorează întâmplării.

A găsi o „sumă de pătrate” înseamnă a aduna împreună cantități pătrate care, în unele cazuri, pot fi ponderate.

MS înseamnă „medie pătrată.”MSbetween este varianța dintre grupuri, iar MSwithin este varianța în cadrul grupurilor.

Calculul sumei pătratelor și pătratului mediu

k = numărul diferitelor grupuri

nj = dimensiunea grupului jth

sj = suma valorilor din grupul j

n = numărul total al tuturor valorilor combinate (dimensiunea eșantionului total: ∑n j)

Suma pătratelor din toate valorile din fiecare grup combinat: ∑
x 2

Variația explicată: suma pătratelor care reprezintă variația între diferitele eșantioane:
[latex] \ displaystyle _ >> = \ sum)> ^ >> _ >>]> - \ frac _>)> ^ >>> [/ latex]

Variație inexplicabilă: suma pătratelor care reprezintă variația în eșantioane din cauza întâmplării:
[latex] \ displaystyle _ >> = _ >> -_ >> [/ latex]

df-uri pentru diferite grupuri (df-uri pentru numărător): df = k - 1

Ecuație pentru erori din eșantioane (df pentru numitor):

Pătratul mediu (estimarea varianței) care se datorează întâmplării (inexplicabil):
[latex] \ displaystyle _ >> = \ frac _ >>>> _ >>>> [/ latex]

MSbetween și MSwithin pot fi scrise după cum urmează:

Testul ANOVA unidirecțional depinde de faptul că
MS între ele poate fi influențat de diferențele de populație între mijloacele din mai multe grupuri. Deoarece MSwithin compară valorile fiecărui grup cu media sa de grup, faptul că mijloacele de grup pot fi diferite nu afectează MSwithin.

Ipoteza nulă spune că toate grupurile sunt eșantioane din populații cu aceeași distribuție normală. Ipoteza alternativă spune că cel puțin două dintre grupurile de eșantioane provin din populații cu distribuții normale diferite. Dacă ipoteza nulă este adevărată,
MSbetween și MSwithin ar trebui să estimeze ambele aceeași valoare.

Ipoteza nulă spune că toate mijloacele populației de grup sunt egale. Ipoteza mijloacelor egale implică faptul că populațiile au aceeași distribuție normală, deoarece se presupune că populațiile sunt normale și că au varianțe egale.

F-Ratio sau F Statistic

Dacă
MSbetween și MSwithin estimează aceeași valoare (urmând credința că H0 este adevărat), atunci raportul F ar trebui să fie aproximativ egal cu unul. În cea mai mare parte, doar erorile de eșantionare ar contribui la variații departe de una. După cum se dovedește, MSbetween constă în varianța populației plus o varianță produsă din diferențele dintre eșantioane. MSwithin este o estimare a varianței populației. Deoarece variațiile sunt întotdeauna pozitive, dacă ipoteza nulă este falsă, MSbetween va fi în general mai mare decât MSwithin. Apoi raportul F va fi mai mare decât unul. Cu toate acestea, dacă efectul populației este mic, nu este puțin probabil ca MSwithin să fie mai mare într-un eșantion dat.