4.7 - Evaluarea linearității prin inspecție vizuală
Prima condiție simplă a modelului de regresie liniară se referă la liniaritate: media răspunsului la fiecare valoare predictivă ar trebui să fie o funcție liniară a predictorului. Lucrul îngrijit despre regresia liniară simplă - în care există un răspuns y și un singur predictor x - este că putem avea o senzație bună pentru această afecțiune doar uitându-ne la un grafic de împrăștiere simplu (deci, în acest caz, nu chiar trebuie să te uiți la un complot rezidual). Să începem prin a analiza trei exemple diferite.
Cancer de piele și mortalitate
Datele sugerează că o funcție liniară este adecvată în descrierea relației dintre mortalitatea cancerului de piele și latitudine (set de date despre cancerul de piele)?

Raspunsul este da! Se pare că relația dintre latitudine și mortalitatea prin cancer de piele este într-adevăr liniară și, prin urmare, ar fi cel mai bine dacă am rezuma tendința datelor folosind o funcție liniară.
Aligatori
Lungimea unui aligator poate fi estimată destul de precis din fotografii aeriene sau dintr-o barcă. Cu toate acestea, estimarea greutății aligatorului este o provocare mult mai mare. O abordare este utilizarea unui model de regresie care să rezume tendința dintre lungimea și greutatea aligatorilor. Lungimea unui aligator obținută dintr-o fotografie aeriană sau barca poate fi apoi utilizată pentru a prezice greutatea aligatorului. Luând această abordare, unii biologi ai faunei sălbatice au capturat un eșantion aleatoriu de n = 25 aligatori. Au măsurat lungimea (x, în inci) și greutatea (y, în kilograme) a fiecărui aligator. (Set de date aligator)
Datele rezultate sugerează că o funcție liniară este adecvată în descrierea relației dintre lungimea și greutatea unui aligator?
Raspunsul este nu! Nu credeți că o funcție curbată ar descrie mai adecvat tendința? Graficul scatter ne oferă o indicație destul de bună că un model liniar este inadecvat în acest caz.