Quando si osservano due variabile su uno stesso campione, potrebbe essere interessante scoprire se esiste una qualche correlazione tra queste due variabili. La correlazione r, come abbiamo visto nel precedente articolo di questa categoria, viene calcolata come il rapporto tra la covarianza tra le due variabili e il prodotto delle due deviazioni standard. Tale indice varia tra -1 e 1, e ci fornisce un’idea del legame che intercorre tra le due variabili, cioè se una e proporzionale o inversamente proporzionale all’altra e in che misura. Tra le due variabili può esistere una relazione lineare; proprio questo è lo scopo della regressione lineare, uno dei modelli più semplici ma basilari tra tutti quelli usati in statistica. Tale modello è divenuto molto noto, oltre per la sua semplicità, anche per le eleganti proprietà di cui gode.
Il file che segue contiene tutti i passaggi necessari per la determinazione dei parametri della retta di regressione e le principali proprietà di questo modello.
https://drive.google.com/file/d/1HtV1U1ZbrrU76yAnAtuXvw1MsBVDl_i1/view?usp=sharing
