Salve a tutti pongo il mio dubbio in merito alla distribuzione asintotica di uno stimatore OLS, sperando che qualcuno possa aiutarmi:
Dato un modello definito come
$Y_i=\beta_0 + \beta_1X_i + \upsilon_i$
dove
$\beta_0$ è l'intercetta
$\beta_1$ è la pendenza
$\upsilon_i$ è la componente d'errore
date le seguenti assunzioni
1) La distribuzione della componente d'errore condizionata a $X_i$ ha media nulla
2) $(X_i,Y_i), i=1,..,n$ sono i.i.d.
3) Gli outlier sono improbabili
Applicando ora il metodo OLS avremo
$\beta_1\hat$ = $\sum$ $[(X_i-\bar{X})*(Y_i-\bar{Y})]$ $/\sum(X_i-\bar{X})$ = $[S_(xy)]/(S^2)_x$
$\beta_0\hat$= $\bar{Y}-\beta_1\bar{X}$
segue ora la distribuzione campionaria dello stimatore OLS per grandi campioni:
scritto $\beta_1\hat$ = $\beta_1$ $+ 1/n\sum$ $[(X_i-\bar{X})*\upsilon_i]$$/(1/n)\sum$ $[(X_i-\bar{X})^2]$
La dimostrazione in cui mi sono imbattuto: mostra che la componente della seconda parte, la quale si somma al $\beta_1$ , è riconducibile ad una specie di media e quindi per il teorema del limite centrale si distribuisce come una normale; mentre la parte al denominatore è riconducibile asintoticamente alla varianza di X in popolazione.
Il mio problema è che volendo nella scrittura originale del $\beta_1$ anche la componente al denominatore è riconducibile alla covarianza tra X e Y in popolazione, quindi mi sembrerebbe possibile dimostrare un eventuale distribuzione asintotica coincidente con una dirac (data dal rapporto dei due valori in popolazione).
Perchè ciò non avviene ed in base a cosa si decide di trattare la componente al numeratore come tendente ad una normale mentre la parte al denominatore come tendete ad un valore in popolazione?