Regressione lineare

Messaggioda bad.alex » 04/05/2018, 01:36

Ciao ragazzi, avrei una domanda da porvi riguardo un problema sulla regressione lineare.
In particolare, ho un parametro che faccio variare da 0 a 1 di una quantità pari a 0.1. Ho notato che il valore di una variabile (volume) dipende in parte anche dalla variazione di questo parametro e vorrei dimostrarlo. Avevo pensato alla regressione lineare, tuttavia non so come proceder.
Nello specifico, sto effettuando una serie di simulazioni; in ognuna di queste trovo 10 (numero delle simulazioni) valori (volume) per ciascuna variazione del parametro (ciò vuol dire che per 0.1 avrò 10 volumi diversi; per 0.2 ne avrò altri dieci, e così via...).

Codice:
57   0,1
61   0,1
64   0,1
49   0,1
53   0,1
51   0,1
60   0,1
52   0,1
64   0,1
47   0,1

76   0,2
76   0,2
79   0,2
77   0,2
75   0,2
77   0,2
80   0,2
86   0,2
75   0,2
72   0,2


Come andrebbe dimostrata una possibile relazione tra questi due parametri? Come strumento per effettuare la regressione lineare sto utilizzando Excel.

Vi ringrazio sin da ora per l'aiuto e per i vostri preziosi consigli.
bad.alex
Senior Member
Senior Member
 
Messaggio: 1122 di 1283
Iscritto il: 10/01/2007, 19:01

Re: Regressione lineare

Messaggioda Stat_F » 05/05/2018, 10:23

Ciao! Ti consiglio di procedere tramite un modello anova, in cui tieni i volumi come variabile dipendente e tratti i parametri come una variabile categoriale a 9 livelli rendendola la tua variabile indipendente. In questo modo puoi effettuare dei test per vedere se la media dei volumi cambia all'interno dei tuoi gruppi, ed eventualmente, in caso di risposta positiva, avere un evidenza empirica ( non una dimostrazione però ) a sostegno della tua tesi. https://www.excel-easy.com/examples/anova.html qui trovi un applicazione su Excel, http://www.real-statistics.com/one-way- ... pts-anova/ qui invece trovi una breve trattazione teorica del problema. Ti ho postato i link in inglese ma comunque si trovano tranquillamente anche in Italiano.
Stat_F
New Member
New Member
 
Messaggio: 21 di 64
Iscritto il: 20/01/2018, 11:20

Re: Regressione lineare

Messaggioda bad.alex » 06/05/2018, 02:29

Grazie mille, Stat_F! I links e i consigli su come procedere mi sono stati di incredibile aiuto.
Vorrei chiederti un'ultima cosa: su Excel ho notato che alcuni valori di p value sono indicati con NUM!. Ho controllato più volte, ma non riesco a capire il perché mi dia questo messaggio, non essendoci errori.
Può essere dovuto al fatto che non vi sia variazione nei parametri? (ad esempio, avere A con valori tutti uguali a 10 in ogni simulazione; in questo caso avrebbe senso considerare una dipendenza da questo parametro, anche se non varia durante le simulazioni?)


Grazie ancora per l'aiuto.
bad.alex
Senior Member
Senior Member
 
Messaggio: 1123 di 1283
Iscritto il: 10/01/2007, 19:01

Re: Regressione lineare

Messaggioda Stat_F » 08/05/2018, 19:12

bad.alex ha scritto:Vorrei chiederti un'ultima cosa: su Excel ho notato che alcuni valori di p value sono indicati con NUM!. Ho controllato più volte, ma non riesco a capire il perché mi dia questo messaggio, non essendoci errori.
Può essere dovuto al fatto che non vi sia variazione nei parametri? (ad esempio, avere A con valori tutti uguali a 10 in ogni simulazione; in questo caso avrebbe senso considerare una dipendenza da questo parametro, anche se non varia durante le simulazioni?)


Grazie ancora per l'aiuto.

Figurati! Comunque il motivo è proprio quello che hai detto tu. Se il valore assunto dalla variabile al variare del parametro non cambia in ogni simulazione vuol dire che la statistica $F=\frac{\hat{\sigma^{2}}_{bet}}{\hat{\sigma^{2}}_{with}}$ avrà uno 0 a denominatore, in questo caso addirittura sarà uno $\frac{0}{0}$ dunque non ha un valore numerico perché come ben sai tale numero è inesistente e dunque il p-value è incalcolabile. Perciò per risponderti ti dico che non ha senso, la tua variabile non è assolutamente una discriminante, come vedi l'ipotesi nulla che le medie variano nei gruppi viene rifiutata quando la varianza tra gruppi è alta e quando quella entro gruppi è bassa (ovvero con valori elevati di $F$ e $p.value$ basso) perciò se la tua variabile non varia tra gruppi allora non è assolutamente un buon discriminante.
Stat_F
New Member
New Member
 
Messaggio: 23 di 64
Iscritto il: 20/01/2018, 11:20


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite