O metodă generală și simplă pentru obținerea R2 din modele de efecte mixte liniare generalizate -

Centrul Național pentru Creștere și Dezvoltare, Departamentul de Zoologie, Universitatea din Otago, 340 Great King Street, Dunedin 9054, Noua Zeelandă

pentru

Departamentul de Ecologie Comportamentală și Genetică Evolutivă, Institutul Max Planck pentru Ornitologie, Eberhard - Gwinner - Straße, 82319 Seewiesen, Germania

Departamentul de biologie evolutivă, Universitatea Bielefeld, Morgenbreede 45, 33615, Bielefeld, Germania

Centrul Național pentru Creștere și Dezvoltare, Departamentul de Zoologie, Universitatea din Otago, 340 Great King Street, Dunedin 9054, Noua Zeelandă

Departamentul de Ecologie Comportamentală și Genetică Evolutivă, Institutul de Ornitologie Max Planck, Eberhard - Gwinner - Straße, 82319 Seewiesen, Germania

Departamentul de biologie evolutivă, Universitatea Bielefeld, Morgenbreede 45, 33615, Bielefeld, Germania

rezumat

Utilizarea atât a modelelor liniare, cât și a celor cu efecte mixte liniare generalizate (LMM și GLMM) a devenit populară nu numai în științele sociale și medicale, ci și în științele biologice, în special în domeniul ecologiei și evoluției. Criteriile de informare, cum ar fi Akaike Information Criterion (AIC), sunt de obicei prezentate ca instrumente de comparare a modelelor pentru modele cu efecte mixte.

Prezentarea „varianței explicate” (R 2) ca statistică rezumativă relevantă a modelelor cu efecte mixte, este însă rară, chiar dacă R 2 este raportat în mod obișnuit pentru modelele liniare (LM) și, de asemenea, pentru modelele liniare generalizate (GLM). R 2 are proprietatea extrem de utilă de a oferi o valoare absolută pentru bunătatea potrivirii unui model, care nu poate fi dată de criteriile de informare. Ca o statistică sumară care descrie cantitatea de varianță explicată, R 2 poate fi, de asemenea, o cantitate de interes biologic.

Un motiv pentru subaprecierea R 2 pentru modelele cu efecte mixte constă în faptul că R 2 poate fi definit în mai multe moduri. În plus, cele mai multe definiții ale R 2 pentru efecte mixte au probleme teoretice (de exemplu, scăzute sau negative R 2 valori în modele mai mari) și/sau utilizarea lor este împiedicată de dificultăți practice (de exemplu, implementarea).

Aici, argumentăm importanța raportării R 2 pentru modelele cu efecte mixte. Mai întâi oferim definițiile comune ale R 2 pentru LM și GLM și discutați problemele cheie asociate cu calculul R 2 pentru modelele cu efecte mixte. Recomandăm apoi o metodă generală și simplă pentru calcularea a două tipuri de R 2 (marginal și condițional R 2) atât pentru LMM cât și pentru GLMM, care sunt mai puțin sensibile la probleme comune.

Această metodă este ilustrată prin exemple și poate fi folosită pe scară largă de cercetătorii din orice domeniu de cercetare, indiferent de pachetele software utilizate pentru montarea modelelor cu efecte mixte. Metoda propusă are potențialul de a facilita prezentarea R 2 pentru o gamă largă de circumstanțe.

Introducere

Multe seturi de date biologice au straturi multiple datorită naturii ierarhice a lumii biologice, de exemplu, celule din indivizi, indivizi din populații, populații din specii și specii din comunități. Prin urmare, avem nevoie de metode statistice care modelează în mod explicit structura ierarhică a datelor reale. Modelele cu efecte mixte liniare (LMM; denumite și modele pe mai multe niveluri/ierarhice) și extensia lor, modelele generalizate cu efecte mixte liniare (GLMM) formează o clasă de modele care încorporează ierarhii pe mai multe niveluri în date. Într-adevăr, LMM și GLMM devin o parte a seturilor de instrumente metodologice standard în științele biologice (Bolker și colab. 2009), precum și în științele sociale și medicale (Gelman & Hill 2007; Congdon 2010; Snijders & Bosker 2011). Utilizarea pe scară largă a GLMM-urilor demonstrează că o statistică care să rezume caracterul bun al adaptării modelului cu efecte mixte la date ar avea o mare importanță. În prezent, nu există o astfel de statistică sumară care să fie larg acceptată pentru modelele cu efecte mixte.

Mulți oameni de știință au folosit în mod tradițional coeficientul de determinare, R 2 (variind de la 0 la 1), ca statistică sumară pentru a cuantifica bunătatea potrivirii modelelor cu efecte fixe, cum ar fi regresii liniare multiple, anova, ancova și modele liniare generalizate (GLM). Conceptul de R 2, așa cum „varianța explicată” este intuitivă. pentru că R 2 este fără unități, este extrem de util ca index sumar pentru modelele statistice, deoarece se poate evalua obiectiv potrivirea modelelor și se poate compara R 2 valori între studii într-o manieră similară cu statisticile standardizate privind dimensiunea efectului în anumite circumstanțe (de exemplu, modele cu aceleași răspunsuri și un set similar de predictori sau cu alte cuvinte, poate fi utilizată pentru meta-analiză; Nakagawa și Cuthill 2007).

În Tabelul 1, rezumăm pe scurt 12 proprietăți ale R 2 (bazat pe Kvålseth 1985 și Cameron & Windmeijer 1996; compilație adoptată din Orelien & Edwards 2008) care va oferi cititorului un bun simț al ceea ce este un „tradițional” R Statistica 2 ar trebui să fie și să ofere, de asemenea, un punct de referință pentru generalizare R 2 la modele cu efecte mixte. Generalizând R 2 de la modele liniare (LM) la LMM și GLMM se dovedește a fi o sarcină dificilă. O serie de modalități de obținere R Au fost propuse 2 pentru modele mixte (de exemplu, Snijders & Bosker 1994; Xu 2003; Liu, Zheng & Shen 2008; Orelien & Edwards 2008). Aceste metode propuse, totuși, împărtășesc unele probleme teoretice sau dificultăți practice (discutate în detaliu mai jos) și, în consecință, nu există consens pentru o definiție a R 2 pentru modelele cu efecte mixte a apărut în literatura statistică. Prin urmare, nu este surprinzător că R 2 este raportat rareori ca statistică sumară a modelului atunci când sunt utilizate modele mixte.