Kas ir atlikumi?

Skatiet atlikuma diagrammas piemēru, kas atbilst konkrētam izkliedes diagrammai

Izkliedes diagramma ar atbilstošu atlikuma diagrammu zemāk. C.K. Teilore





Lineārā regresija ir statistikas rīks, kas nosaka, cik labi taisna līnija atbilst kopaiAtlikumus iegūst, veicot atņemšanu. Viss, kas mums jādara, ir atņemt paredzēto vērtību Y no novērotās vērtības Y konkrētam x . Rezultātu sauc par atlikumu.

Atlikumu formula

Atlikumu formula ir vienkārša:



Atlikušais = novērots Y – prognozēts Y

Ir svarīgi atzīmēt, ka prognozētā vērtība nāk no mūsu regresijas līnijas. Novērotā vērtība nāk no mūsu datu kopas.



Piemēri

Mēs ilustrēsim šīs formulas izmantošanu, izmantojot piemēru. Pieņemsim, ka mums ir dota šāda pārī savienoto datu kopa:

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Izmantojot programmatūru, mēs varam redzēt, ka mazāko kvadrātu regresijas līnija ir Y = 2 x . Mēs to izmantosim, lai prognozētu vērtības katrai vērtībai x .

Piemēram, kad x = 5 mēs redzam, ka 2(5) = 10. Tas dod mums punktu gar mūsu regresijas līnijakam ir x 5. koordināte.



Lai aprēķinātu atlikumu punktos x = 5, mēs atņemam prognozēto vērtību no mūsu novērotās vērtības. Kopš Y mūsu datu punkta koordināte bija 9, tas dod atlikumu 9 – 10 = -1.

Šajā tabulā ir parādīts, kā aprēķināt visus šīs datu kopas atlikumus:



X Novērots y Paredzēts y Atlikums
1 divi divi 0
divi 3 4 -1
3 7 6 1
3 6 6 0
4 9 8 1
5 9 10 -1

Atlikumu īpašības

Tagad, kad esam redzējuši piemēru, ir jāņem vērā dažas atlikuma pazīmes:

  • Atlikumi ir pozitīvi punktiem, kas nokrīt virs regresijas līnijas.
  • Atlikumi ir negatīvi punktiem, kas ir zem regresijas līnijas.
  • Punktiem, kas krīt tieši pa regresijas līniju, atlikumi ir nulle.
  • Jo lielāka ir atlikuma absolūtā vērtība, jo tālāk punkts atrodas no regresijas taisnes.
  • Visu atlikuma summai jābūt nullei. Praksē dažreiz šī summa nav tieši nulle. Šīs neatbilstības iemesls ir tas, ka var uzkrāties noapaļošanas kļūdas.

Atlikumu lietojumi

Atlikumiem ir vairāki lietojumi. Viens no izmantošanas veidiem ir palīdzēt mums noteikt, vai mums ir datu kopa, kurai ir vispārēja lineāra tendence, vai arī mums vajadzētu apsvērt citu modeli. Iemesls tam ir tāds, ka atlikumi palīdz pastiprināt jebkuru mūsu datu nelineāro modeli. To, ko var būt grūti saskatīt, aplūkojot izkliedes diagrammu, var vieglāk novērot, pārbaudot atlikumus un atbilstošu atlikuma diagrammu.



Vēl viens iemesls, lai ņemtu vērā atlikumus, ir pārbaudīt, vai ir izpildīti lineārās regresijas secinājumu nosacījumi. Pēc lineārās tendences pārbaudes (pārbaudot atlikumus), mēs pārbaudām arī atlikumu sadalījumu. Lai varētu veikt regresijas secinājumus, mēs vēlamies, lai mūsu regresijas līnijas atlikumi būtu aptuveni normāli sadalīti. A histogramma vai balsošanas sižets no atlikumiem palīdzēs pārbaudīt, vai šis nosacījums ir izpildīts.