Regressione multipla excel download
Per l’intervallo Y di input, compilare la serie di valori per la variabile di risposta. Per l’intervallo X di input, inserire la serie di valori per le due variabili esplicative. Selezionate la casella accanto a Etichette in modo che Excel sappia che abbiamo incluso i nomi delle variabili negli intervalli di input. Per l’Intervallo di output, selezionare la cella in cui si desidera visualizzare l’output della regressione. Fare quindi clic su OK.
R-quadro: 0.734. È il cosiddetto coefficiente di determinazione. È la percentuale della varianza della variabile di risposta che può essere spiegata dalle variabili esplicative. In questo esempio, il 73,4% della variazione del punteggio dell’esame può essere spiegato dal numero di ore di studio e dal numero di esami di preparazione sostenuti.
Errore standard: 5.366. È la distanza media dei valori osservati dalla retta di regressione. In questo esempio, i valori osservati si discostano in media di 5,366 unità dalla retta di regressione.
Valori P. I singoli valori p ci dicono se ogni variabile esplicativa è statisticamente significativa o meno. Possiamo notare che le ore di studio sono statisticamente significative (p = 0,00), mentre gli esami di preparazione sostenuti (p = 0,52) non sono statisticamente significativi a α = 0,05. Poiché la preparazione agli esami non è statisticamente significativa, potremmo decidere di eliminarla dal modello.
Grafico excel della regressione lineare multipla
La regressione lineare è un tipo di analisi dei dati che considera la relazione lineare tra una variabile dipendente e una o più variabili indipendenti. In genere viene utilizzata per mostrare visivamente la forza della relazione o della correlazione tra vari fattori e la dispersione dei risultati, il tutto allo scopo di spiegare il comportamento della variabile dipendente. L’obiettivo di un modello di regressione lineare è quello di stimare l’entità di una relazione tra variabili e la sua significatività statistica.
Supponiamo di voler verificare la forza della relazione tra la quantità di gelato consumato e l’obesità. Prendiamo la variabile indipendente, la quantità di gelato, e la mettiamo in relazione con la variabile dipendente, l’obesità, per vedere se esiste una relazione. La regressione è una rappresentazione grafica di questa relazione: quanto più bassa è la variabilità dei dati, tanto più forte è la relazione e tanto più stretto è l’adattamento alla retta di regressione.
In finanza, la regressione lineare viene utilizzata per determinare le relazioni tra i prezzi delle attività e i dati economici in una serie di applicazioni. Ad esempio, viene utilizzata per determinare i pesi dei fattori nel Modello di Fama-Francesco ed è la base per determinare il Beta di un’azione nel modello di determinazione del prezzo del capitale (CAPM).
Formula di regressione multipla di Excel
L’esempio seguente illustra il metodo di regressione lineare multipla di XLMiner utilizzando il set di dati Boston Housing per prevedere i prezzi mediani delle case nei quartieri residenziali. Questo set di dati ha 14 variabili. La descrizione di ciascuna variabile è riportata nella tabella seguente. Oltre a queste variabili, il set di dati contiene anche una variabile aggiuntiva, Cat. MEDV, creata classificando il valore mediano (MEDV) in due categorie: alto (MEDV > 30) e basso (MEDV < 30). Questa variabile non verrà utilizzata in questo esempio.
Nella barra multifunzione di XLMiner, dalla scheda Applicare il modello, selezionare Aiuto – Esempi, quindi Previsioni/Esempi di data mining per aprire Boston_Housing.xlsx dalla cartella dei set di dati. Di seguito è riportata una parte del set di dati.
Per suddividere i dati in set di addestramento e di convalida, utilizzare le impostazioni predefinite della partizione standard dei dati con percentuali del 60% dei dati assegnate casualmente al set di addestramento e del 40% dei dati assegnati casualmente al set di convalida. Per ulteriori informazioni sulla suddivisione di un set di dati, consultare la sezione Partizione dell’estrazione dei dati.
Regressione multipla di tendenza in Excel
Per l’intervallo Y di input, compilare la serie di valori per la variabile di risposta. Per l’Intervallo X di input, inserire la serie di valori per le due variabili esplicative. Selezionate la casella accanto a Etichette, in modo che Excel sappia che abbiamo incluso i nomi delle variabili negli intervalli di input. Per l’Intervallo di output, selezionare la cella in cui si desidera visualizzare l’output della regressione. Fare quindi clic su OK.
R-quadro: 0.734. È il cosiddetto coefficiente di determinazione. È la percentuale della varianza della variabile di risposta che può essere spiegata dalle variabili esplicative. In questo esempio, il 73,4% della variazione del punteggio dell’esame può essere spiegato dal numero di ore di studio e dal numero di esami di preparazione sostenuti.
Errore standard: 5.366. È la distanza media dei valori osservati dalla retta di regressione. In questo esempio, i valori osservati si discostano in media di 5,366 unità dalla retta di regressione.
Valori P. I singoli valori p ci dicono se ogni variabile esplicativa è statisticamente significativa o meno. Possiamo notare che le ore di studio sono statisticamente significative (p = 0,00), mentre gli esami di preparazione sostenuti (p = 0,52) non sono statisticamente significativi a α = 0,05. Poiché la preparazione agli esami non è statisticamente significativa, potremmo decidere di eliminarla dal modello.