Stimatore OLS e distribuzione asintotica
Inviato: 19/11/2019, 19:27
Salve a tutti pongo il mio dubbio in merito alla distribuzione asintotica di uno stimatore OLS, sperando che qualcuno possa aiutarmi:
Dato un modello definito come
$Y_i=\beta_0 + \beta_1X_i + \upsilon_i$
dove
$\beta_0$ è l'intercetta
$\beta_1$ è la pendenza
$\upsilon_i$ è la componente d'errore
date le seguenti assunzioni
1) La distribuzione della componente d'errore condizionata a $X_i$ ha media nulla
2) $(X_i,Y_i), i=1,..,n$ sono i.i.d.
3) Gli outlier sono improbabili
Applicando ora il metodo OLS avremo
$\beta_1\hat$ = $\sum$ $[(X_i-\bar{X})*(Y_i-\bar{Y})]$ $/\sum(X_i-\bar{X})$ = $[S_(xy)]/(S^2)_x$
$\beta_0\hat$= $\bar{Y}-\beta_1\bar{X}$
segue ora la distribuzione campionaria dello stimatore OLS per grandi campioni:
scritto $\beta_1\hat$ = $\beta_1$ $+ 1/n\sum$ $[(X_i-\bar{X})*\upsilon_i]$$/(1/n)\sum$ $[(X_i-\bar{X})^2]$
La dimostrazione in cui mi sono imbattuto: mostra che la componente della seconda parte, la quale si somma al $\beta_1$ , è riconducibile ad una specie di media e quindi per il teorema del limite centrale si distribuisce come una normale; mentre la parte al denominatore è riconducibile asintoticamente alla varianza di X in popolazione.
Il mio problema è che volendo nella scrittura originale del $\beta_1$ anche la componente al denominatore è riconducibile alla covarianza tra X e Y in popolazione, quindi mi sembrerebbe possibile dimostrare un eventuale distribuzione asintotica coincidente con una dirac (data dal rapporto dei due valori in popolazione).
Perchè ciò non avviene ed in base a cosa si decide di trattare la componente al numeratore come tendente ad una normale mentre la parte al denominatore come tendete ad un valore in popolazione?
Dato un modello definito come
$Y_i=\beta_0 + \beta_1X_i + \upsilon_i$
dove
$\beta_0$ è l'intercetta
$\beta_1$ è la pendenza
$\upsilon_i$ è la componente d'errore
date le seguenti assunzioni
1) La distribuzione della componente d'errore condizionata a $X_i$ ha media nulla
2) $(X_i,Y_i), i=1,..,n$ sono i.i.d.
3) Gli outlier sono improbabili
Applicando ora il metodo OLS avremo
$\beta_1\hat$ = $\sum$ $[(X_i-\bar{X})*(Y_i-\bar{Y})]$ $/\sum(X_i-\bar{X})$ = $[S_(xy)]/(S^2)_x$
$\beta_0\hat$= $\bar{Y}-\beta_1\bar{X}$
segue ora la distribuzione campionaria dello stimatore OLS per grandi campioni:
scritto $\beta_1\hat$ = $\beta_1$ $+ 1/n\sum$ $[(X_i-\bar{X})*\upsilon_i]$$/(1/n)\sum$ $[(X_i-\bar{X})^2]$
La dimostrazione in cui mi sono imbattuto: mostra che la componente della seconda parte, la quale si somma al $\beta_1$ , è riconducibile ad una specie di media e quindi per il teorema del limite centrale si distribuisce come una normale; mentre la parte al denominatore è riconducibile asintoticamente alla varianza di X in popolazione.
Il mio problema è che volendo nella scrittura originale del $\beta_1$ anche la componente al denominatore è riconducibile alla covarianza tra X e Y in popolazione, quindi mi sembrerebbe possibile dimostrare un eventuale distribuzione asintotica coincidente con una dirac (data dal rapporto dei due valori in popolazione).
Perchè ciò non avviene ed in base a cosa si decide di trattare la componente al numeratore come tendente ad una normale mentre la parte al denominatore come tendete ad un valore in popolazione?