Consideriamo una coppia di variabili aleatorie $(X,Y)$. Vogliamo stimare una delle due variabili aleatorie conoscendo solo l'altra. I miei appunti dicono che lo stimatore ottimo (cioè quello che minimizza l'errore quadratico medio) è uno stimatore non lineare dato dalla media condizionale. Purtroppo i passaggi per arrivare a questo risultato non sono chiari... posto quanto leggo ($E$ è la media, $epsilon$ l'errore):
$hat X = g(Y)$
$E[epsilon^2] = E[(hat X - X)^2] = E[(g(Y) - X)^2] = int_(-oo)^(+oo) int_(-oo)^(+oo) (g(y)-x)^2 f_(XY) (x,y) dx dy =$
$= int_(-oo)^(+oo) int_(-oo)^(+oo) (g(y)-x)^2 f_(Y) (y) f_(X|Y) (X|Y=y) dx dy = int_(-oo)^(+oo) [ int_(-oo)^(+oo) (g(y)-x)^2 f_(X|Y) (X|Y=y) dx ] f_(Y) (y) dy$
A questo punto dovrebbe risultare chiaro che per minimizzare l'integrale interno si debba scegliere $g(y)=E[X|Y=y]$...
A me però non risulta chiaro...