4.7 - Evaluarea linearității prin inspecție vizuală

Prima condiție simplă a modelului de regresie liniară se referă la liniaritate: media răspunsului la fiecare valoare predictivă ar trebui să fie o funcție liniară a predictorului. Lucrul îngrijit despre regresia liniară simplă - în care există un răspuns y și un singur predictor x - este că putem avea o senzație bună pentru această afecțiune doar uitându-ne la un grafic de împrăștiere simplu (deci, în acest caz, nu chiar trebuie să te uiți la un complot rezidual). Să începem prin a analiza trei exemple diferite.

Cancer de piele și mortalitate

Datele sugerează că o funcție liniară este adecvată în descrierea relației dintre mortalitatea cancerului de piele și latitudine (set de date despre cancerul de piele)?

inspecție

Raspunsul este da! Se pare că relația dintre latitudine și mortalitatea prin cancer de piele este într-adevăr liniară și, prin urmare, ar fi cel mai bine dacă am rezuma tendința datelor folosind o funcție liniară.

Aligatori

Lungimea unui aligator poate fi estimată destul de precis din fotografii aeriene sau dintr-o barcă. Cu toate acestea, estimarea greutății aligatorului este o provocare mult mai mare. O abordare este utilizarea unui model de regresie care să rezume tendința dintre lungimea și greutatea aligatorilor. Lungimea unui aligator obținută dintr-o fotografie aeriană sau barca poate fi apoi utilizată pentru a prezice greutatea aligatorului. Luând această abordare, unii biologi ai faunei sălbatice au capturat un eșantion aleatoriu de n = 25 aligatori. Au măsurat lungimea (x, în inci) și greutatea (y, în kilograme) a fiecărui aligator. (Set de date aligator)

Datele rezultate sugerează că o funcție liniară este adecvată în descrierea relației dintre lungimea și greutatea unui aligator?

Raspunsul este nu! Nu credeți că o funcție curbată ar descrie mai adecvat tendința? Graficul scatter ne oferă o indicație destul de bună că un model liniar este inadecvat în acest caz.