Econometria: esercizio con variabile Dummy

Messaggioda Al_ge96 » 17/01/2020, 10:39

Ciao a tutti, non riesco a capire questa domanda di econometria:
Si consideri il seguente modello di regressione:
y=Bo+B1x1+B2x2+ε

Mostrate analiticamnete e speigate, come modifichereste la precendente regressione se voleste verificare se l'essere Maschio o Femmina (catturato nella variabile Di) impatta sull'effetto marginale di x1.

Che intende sull'impattare sull'effetto marginale?
Io l'ho risolto cosi:
Di=0 Maschio
Di=1 Femmina
y=Bo+B1x1+Γ0Di+Γ1x1Di+ε
Se Di=0
y=bo+B1x1+ε
Se Di=1
y=Bo+B1x1+Γ0+Γ1x1+ε

Non sono sicuro sia giusto, help me grazie mille
Al_ge96
Starting Member
Starting Member
 
Messaggio: 9 di 17
Iscritto il: 17/05/2019, 11:19

Re: Econometria: esercizio con variabile Dummy

Messaggioda Bokonon » 17/01/2020, 13:11

Non mi convince affatto, inoltre non si mettono dentro due dummy con la medesima informazione (non importa se una ha gli zeri dove sono gli uni dell'altra, contengono la medesima informazione).

Considera tre variabili indipendenti $X_1$, $X_2$ e $S$ e per comodità eliminiamo l'effetto della media (così da avere l'ordinata all'origine pari a zero nel modello).
$S$ è la variabile Sesso e la definiamo con una sola delle due dummy a scelta, ovvero:
$D_M$ M=1 F=0
$D_F$ M=0 F=1
La variabile Sesso già raccoglie tutta l'informazione che vogliamo inserire sia che la si costruisca in un modo che nell'altro. Il modello di regressione sarebbe del tipo $y=theta_1X_1+theta_2X_2+theta_3S+epsilon$
Qui possiamo valutare il contributo di $S$ nello spiegare la $Var(Y)$ e l'eventuale correlazione fra $X_1$ ed $S$

Il testo parla però di effetto marginale su $X_1$ (per esempio un voto di laurea). Immaginiamo la tabella ulteriormente espansa per avere le variabili: $X_1|D_M$ e $X_1|D_F$ dove naturalmente $X_1=X_1|D_M + X_1|D_F$

Il modello originario è $y=beta_1X_1+beta_2X_2+epsilon=beta_1(X_1|D_M+X_1|D_F)+beta_2X_2+epsilon$
Questo sarebbe vero se il sesso non avesse alcuna influenza sul voto.
In caso contrario avremmo $y=gamma_1(X_1|D_M)+gamma_2(X_1|D_F)+gamma_3X_2+epsilon$
Con questo modello possiamo vedere il contributo delle singole variabili condizionate e la relazione fra $gamma_1$ $gamma_2$ e $beta_1$

Ho solo proposto un ragionamento, tu che dici?
Considera che si potrebbe anche confrontare i due modelli (quello con la dummy Sesso e quello con le variabili condizionate)
Avatar utente
Bokonon
Advanced Member
Advanced Member
 
Messaggio: 1941 di 2089
Iscritto il: 25/05/2018, 20:22

Re: Econometria: esercizio con variabile Dummy

Messaggioda Al_ge96 » 17/01/2020, 15:06

sicuramente vedo che ne sai più di me ahah
Scherzi a parte; nella tua proposta y=γ1(X1∣DM)+γ2(X1∣DF)+γ3X2+ε non c'è problema di multicollinearità?
Perchè femmina è l'opposto di maschio, quindi se Di=1 è femmina e allo stesso tempo non maschio (e viceversa ovviamente). Per esempio se ho y=B0+B1esperienza+B2femmina+ε,
se assumiamo D=1 per femmina avrò y=B0+B1esperienza+B2femmina mentre se D=0 (quindi maschio) avrò y=B0+B1esperienza+ε.
Quindi riprendendo il tuo esempio y=γ1(X1∣DM)+γ2(X1∣DF)+γ3X2+ε che mi verrà fuori se D=0 o D=1?
Al_ge96
Starting Member
Starting Member
 
Messaggio: 10 di 17
Iscritto il: 17/05/2019, 11:19

Re: Econometria: esercizio con variabile Dummy

Messaggioda Bokonon » 17/01/2020, 15:33

Forse non mi sono spiegato bene, ma l'idea di ragionare sui possibili modelli è proprio per valutare l'impatto delle marginali.
Supponiamo le distribuzioni marginali del voto di laurea rispetto al sesso abbiano le medesime frequenze (ovvero le due colonne siano perfettamente proporzionali). Utilizzare la variabile somma $X_1$ o utilizzare $(X_1|D_M)$ oppure la variabile $X_1|D_F)$ non fa cambiare nulla! (per questo ho scelto il modello senza media, così diventa persino più lampante). Quindi in questo caso $beta_1=gamma_1=gamma_2$ ergo si ritorna al modello iniziale.
Il modello che ho proposto dovrebbe mettere in luce tutto questo...specie quando $gamma_1!=gamma_2$
Se ad esempio salta fuori che $gamma_1$ è mooooooolto più piccolo di $gamma_2$ ci sarà da attendersi che accada anche nel modello (e accadrà, sara piccolissima) $y=gamma_1(X_1|D_M)+X_2+epsilon$
Supponendo di non disporre delle marginali, allora questo effetto si vedrà anche con la variabile sesso: in questo caso (intuitivamente) mi attenderei che la $S$ spieghi più variabilità di $X_1$

Sto solo proponendo un ragionamento di massima, perchè non so esattamente cosa ti sia stato chiesto di fare ma è il ragionamento che farei io.
Infine, mettere due volte una dummy invertendo gli zeri, non ha senso: il perchè l'ho già esposto prima ma proviamo ad entrarre nel dettaglio. Supponiamo che la variabile $S_F$ abbia una $COV(S_F,Y)=k$
Cosa ti aspetti che sia la $COV(S_M,Y)=?$ ?
Avatar utente
Bokonon
Advanced Member
Advanced Member
 
Messaggio: 1943 di 2089
Iscritto il: 25/05/2018, 20:22

Re: Econometria: esercizio con variabile Dummy

Messaggioda Al_ge96 » 17/01/2020, 15:55

mm si hai ragione, purtroppo ne so davvero poco di econometria e mi sto cervellando non poco per l'esame tra pochi giorni..
Comunque grazie mille, posso farti domande sui dubbi che ho su altri esercizi?
Al_ge96
Starting Member
Starting Member
 
Messaggio: 11 di 17
Iscritto il: 17/05/2019, 11:19

Re: Econometria: esercizio con variabile Dummy

Messaggioda Bokonon » 17/01/2020, 16:02

Non hai risposto alla domanda però :(
$COV=(S_M,Y)=-k$
Non importa la direzione della correlazione lineare, $r^2$ sarà il medesimo sia le due variabili abbiano $r=+-a$
Quindi mettere le due dummy che hai messo, quelle si che sono collineari! Tradotto aggiungono la medesima informazione, quindi ne basta una.

Per il resto spero che tu abbia compreso il ragionamento che ho fatto. Penso sia quello che voglia il prof e che tu possa anche ricavare una relazione formale.

Io ho dato econometria millenni fa quindi dubito ti poterti aiutare se entri in modelli specifici (perchè dovrei guardarmeli e ragionare investendo troppo tempo). Se le domande sono più concettuali come questa, in questo forum di certo troverai sempre qualche spunto (a patto che la domanda che poni sia chiara e ragionata).
Avatar utente
Bokonon
Advanced Member
Advanced Member
 
Messaggio: 1944 di 2089
Iscritto il: 25/05/2018, 20:22

Re: Econometria: esercizio con variabile Dummy

Messaggioda Al_ge96 » 17/01/2020, 16:20

non ti ho risposto perchè non lo sapevo eheh ;(
comunque si gli esercizi sono tutti sul "semplice" tipo questo. Tra poco ne pubblico un altro
Al_ge96
Starting Member
Starting Member
 
Messaggio: 12 di 17
Iscritto il: 17/05/2019, 11:19

Re: Econometria: esercizio con variabile Dummy

Messaggioda Sergio » 17/01/2020, 16:45

Al_ge96 ha scritto:mm si hai ragione, purtroppo ne so davvero poco di econometria e mi sto cervellando non poco per l'esame tra pochi giorni..

Guarda che la faccenda è relativamente semplice e non è dominio esclusivo dell'econometria.
Spero che tu conosca R e ti faccio un esempio "classico" (classico nel senso che si trova in un libro molto conosciuto di Andrew Gelman, uno dei maggiori statistici viventi). Dovrebbe essere comunque facile seguire l'esempio anche non conoscendo R (se conosci Stata, per riprodurlo non devi nemmeno convertire il dataset).
Codice:
library(foreign)   # per caricare file Stata
kids <- read.dta("http://www.stat.columbia.edu/~gelman/arm/examples/child.iq/kidiq.dta")
attach(kids)       # rende accessibili le variabili senza far riferimento al dataset

Carichi così un dataset che contiene i valori di un test attitudinale cui sono stati sottoposti 434 ragazzi, kid_score, e altre informazioni tra cui mom_iq, il quoziente d'intelligenza delle madri, e mom_hs, una variabile che vale 1 se la madre ha almeno un diploma di scuola superiore, altrimenti 0.
Puoi calcolare gli effetti marginali di entrambe le variabili su kid_score:
Codice:
> fit0 <- lm(kid_score ~ mom_iq + mom_hs)
> coef(fit0)
(Intercept)      mom_iq      mom_hs
  25.731538    0.563906    5.950117
Questo è un modello del tipo $y=\beta_0+\beta_1x_1+\beta_2D+\epsilon$, in cui $D$ è una variabile dicotomica (mom_hs, una variabile con due soli valori). La stima ci dice che a un livello base di $25.7$ si devono aggiungere l'effetto marginale di $x_1$ ($0.56$ per ogni punto del QI) e quello di $x_2$ ($5.9$ se la madre ha almeno un diploma di scuola superiore).
Codice:
> fit_1 <- lm(kid_score ~ mom_iq + mom_hs + mom_iq:mom_hs)
> coef(fit_1)
  (Intercept)        mom_iq        mom_hs mom_iq:mom_hs
  -11.4820211     0.9688892    51.2682234    -0.4842747
Questo è invece un modello del tipo $y=\beta_0+\beta_1x_1+\beta_2D+\beta_3Dx_1+\epsilon$, in cui compare anche l'effetto interattivo tra $D$ e $x_1$.
La stima ci dice, in prima istanza, che tenendo conto dell'effetto che può avere il QI insieme al titolo di studio, l'effetto del titolo di studio aumenta parecchio (da $5.9$ a $51.3$) perché l'effetto del QI aumenta in sé ma, essendo l'effetto interattivo negativo, ha minore importanza quando la madre ha almeno un diploma di scuola superiore.
Guardando meglio, si vede che l'intercetta $\beta_0$ è un po' strana (il netto aumento di $\beta_1$ si spiega con la netta diminuzione di $\beta_0$, che diventa $<0$), e il motivo è che non è direttamente interpretabile perché in realtà sono state stimate due rette di regressione:1
1) $y=\beta_0+\beta_1x_1+\epsilon$ per le madri senza un diploma di scuola superiore ($D=0$);
2) $y=(\beta_0+\beta_2)+(\beta_1+\beta_3)x_1+\epsilon$ per le madri che lo hanno ($D=1$).
L'effetto marginale di $x_1$ (il QI della madre) è quindi $\beta_1$ senza diploma, $\beta_1+\beta_3$ col diploma.
Se i coefficienti ottenuti sono significativi, se in particolare è significativo quello dell'effetto interattivo, la differenza tra $\beta_1$ e $\beta_1+\beta_3$ ti dice quanto il titolo di studio impatta sull'effetto marginale di $x_1$.

--------------------------------
PS: A proposito di multicollinearità, distinguerei tra variabili dicotomiche e variabili dummy. Il genere è una variabile dicotomica (M=0, F=1, o viceversa), nell'esempio avere/non avere un diploma è una variabile dicotomica ecc. Una variabile dummy, che viene anche detta "variabile di comodo", è una variabile... che nei dati "non c'è" (va be', quasi).
Ad esempio, se hai una serie storica, potresti voler rilevare l'effetto della "stagionalità". Inserisci allora variabili dummy del tipo: D1=1 se i dati si riferiscono al primo trimestre, D2=1 se si riferiscono al secondo ecc. (se nei dati il trimestre c'era già, trasformi il numero del trimestre in variabili dummy; se non c'era, ad esempio se erano dati giornalieri o mensili, "crei" tu le variabili dummy). È in questi casi che devi badare alla multicollinearità. Se infatti inserisci quattro colonne, per i quattro trimestri, in un qualsiasi modello con intercetta la matrice del modello avrà una colonna con tutti 1 (la colonna dell'intercetta) e quattro colonne (i trimestri) la cui somma è una colonna di tutti 1: la matrice del modello non ha più rango pieno. In questi casi risolvi mettendo solo tre colonne per tre trimestri; questo equivale a considerare un trimestre come "base" e i coefficienti degli altri come effetti differenziali (v. ad es. qui). Con variabili dicotomiche il problema non si pone. È vero che gli econometrici chiamano tutte "dummy", ma la distinzione mi sembra comunque utile.

Note

  1. A rigore anche prima erano due, due rette con intercetta diversa, $\beta_0$ e $\beta_0+\beta_2$, che però avevano la stessa pendenza $\beta_1$. Ora cambia anche la pendenza, cambia cioè l'effetto marginale di $x_1$.
Ultima modifica di Sergio il 19/01/2020, 22:23, modificato 1 volta in totale.
"Se vuoi un anno di prosperità coltiva del riso. Se vuoi dieci anni di prosperità pianta degli alberi. Se vuoi cento anni di prosperità istruisci degli uomini" (proverbio cinese). E invece... viewtopic.php?p=236293#p236293
Avatar utente
Sergio
Cannot live without
Cannot live without
 
Messaggio: 6362 di 6568
Iscritto il: 26/04/2004, 10:56
Località: Roma

Re: Econometria: esercizio con variabile Dummy

Messaggioda Sergio » 19/01/2020, 17:39

Quasi quasi aggiungo un po' di teoria più generale (ne approfitto per ripassare un po' di cose :))
Alla base di tutto c'è l'ipotesi che, osservando una variabile risposta $y$ e un vettore \(\mathbf{x}\) di $K$ variabili esplicative, tutte intese come variabili aleatorie, sia possibile definire una funzione di aspettativa condizionata \(E[y\mid\mathbf{x}]<\infty\).
In teoria si può ottenere \(E[y\mid\mathbf{x}]\) dalla densità condizionata di $y$ dato \(\mathbf{x}\), integrando e/o sommando, in pratica non è così semplice.
Si assume allora spesso che si possa usare una funzione di aspettativa condizionata lineare in \(\mathbf{x}\): \(E[y\mid\mathbf{x}]=\mathbf{x}^T\boldsymbol{\beta}\), ad esempio:
\(E[y\mid x_1,x_2]=\beta_0+\beta_1x_1+\beta_2x_2\)
\(E[y\mid x_1,x_2]=\beta_0+\beta_1x_1+\beta_2x_2+\beta_3x_1x_2\)
In entrambi gli esempi, la derivata parziale \(\partial E[y\mid x_1,x_2]/\partial x_1=\beta_1\) esprime il cambiamento marginale di \(E[y\mid x_1,x_2]\) a seguito di una piccola variazione di $x_1$, tenendo $x_2$ costante.

Se si possono assumere soddisfatte alcune ipotesi (e qui si apre un mondo), si può definire un modello di regressione lineare del tipo: \(y=\beta_0+\beta_1x_1+\beta_2x_2+e\), dove \(e=y-E[y\mid x_1,x_2]\).
A questo punto viene spontaneo dire, e si usa in effetti dire, che $\beta_1$ è il cambiamento marginale di $y$ per una variazione piccola di $x_1$, anche se a rigore è il cambiamento marginale di \(E[y\mid x_1,x_2]\): non della variabile $y$, ma del suo valore atteso.

È questo il ragionamento tipico dell'econometria (ad es. Jeffrey Wooldridge, Econometric Analysis of Cross Section and Panel Data, §2.2, oppure Bruce Hansen, Econometrics, §§2.14-2.15).
"Se vuoi un anno di prosperità coltiva del riso. Se vuoi dieci anni di prosperità pianta degli alberi. Se vuoi cento anni di prosperità istruisci degli uomini" (proverbio cinese). E invece... viewtopic.php?p=236293#p236293
Avatar utente
Sergio
Cannot live without
Cannot live without
 
Messaggio: 6373 di 6568
Iscritto il: 26/04/2004, 10:56
Località: Roma

Re: Econometria: esercizio con variabile Dummy

Messaggioda Al_ge96 » 20/01/2020, 15:25

Grazie mi sei stato davvero utile! Se ti può interessare ho postato un'altra domanda su alcuni dubbi che ho. Mi daresti una grossissima mano se mi aiutassi! Grazie e ciao!
Al_ge96
Starting Member
Starting Member
 
Messaggio: 14 di 17
Iscritto il: 17/05/2019, 11:19


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: ghira e 15 ospiti