stimatore sufficiente

Messaggioda markowitz » 31/08/2019, 10:50

Sto cercando di rivedere la definizione ed il significato di stimatore sufficiente.
In Piccolo 2010 pag 536 trovo che (riarrangiando la notazione come meglio non riesco) uno stimatore $T_n$ è detto sufficiente per $theta$ se vale qualcosa del tipo


$ phi_ul(X) (ul(x) | T_n = t_0) = f(ul(x) , T_n =t_0; theta) / g(T_n = t_0; theta)$

dove $ul(X)$ è il campione casuale, $ul(x)$ è il campione osservato e $t_0$ è il valore osservato per lo stimatore (la stima).
Entrambe le statistiche a destra dipendono da $theta$ e questo è esplicitato dalla notazione.
E' chiaro che a denominatore vi è la distribuzione dello stimatore.
Quello che invece mi stranisce è che $f()$ sembri qualcosa del tipo una distribuzione congiuta del campione casuale e dello stimatore mentre negli esempi di seguito è evidente che luogo di $f()$ sia considerata la distribuzione del campione casuale. Che poi questa sia valutata per un particolare valore dello stimatore ... è esattamente ciò che indica la distribuzione condizionata a sinistra ma non chiarisce il fatto se a nominatore vi sia una congiunta dei due elementi $(ul(X),T_n)$ o la distribuzione (marginale) del campione $ul(X)$.
Da definizione di distribuzione condizionata direi che è una congiunta ma nel seguito è trattata, ed anche chiamata, come distribuzione del campione.
Qual'è l'interpretazione corretta?
Ultima modifica di markowitz il 31/08/2019, 14:16, modificato 1 volta in totale.
markowitz
Senior Member
Senior Member
 
Messaggio: 619 di 1034
Iscritto il: 14/02/2010, 21:50

Re: stimatore sufficiente

Messaggioda tommik » 31/08/2019, 11:40

Lo stimatore $T(ul(X))$, funzione del solo campione (uno stimatore non può dipendere dal parametro che deve stimare, mi sembra evidente) è sufficiente per il parametro $theta$ se e solo se la distribuzione condizionata

$f(ul(x)|T(ul(x)))$ non dipende più da $theta$

Quindi nella definizione del Piccolo, T è sufficiente per $theta$ se la quantità di destra non dipende più da $theta$

Cosa significa in pratica? significa che, noto lo stimatore, la distribuzione condizionata non ha più alcuna informazione utile sul parametro perché tutte le informazioni che ci servono sono contenute già nello stimatore.

Ti faccio un esempio semplice ma molto istruttivo

Supponiamo di avere un'urna con una percentuale di palline bianche non note, diciamo $theta$

Estraiamo un certo numero di palline, non importa se con reimmissione o senza, e vediamo come lo stimatore $T=SigmaX$ ovvero il numero delle palline bianche trovate sul totale di quelle estratte sia uno stimatore sufficiente per stimarne la percentuale....basterà dividere la somma delle palline bianche sul totale di quelle che abbiamo estratto.

Come facciamo a calcolare la distribuzione condizionata alla somma delle bianche?

Se è noto che sono uscite k bianche su n palline, è evidente che, l'unica incognita è come tali palline si siano presentate....prima tutte le k bianche poi le altre...una bianca e una no...ecc ecc...insomma la distribuzione condizionata altro non è che

$1/(((n),(k)))$ che come vedi non dipende più da $theta$

In altri termini, sapendo che sono uscite 4 bianche su 10 estrazioni stimo che le bianche siano il 40% e non mi interessa se la prima pallina estratta è stata bianca o nera.....per il calcolo della distribuzione condizionata nemmeno mi interessa se le estraggo con reimmissione o senza, cambierà la probabilità di aver estratto una determinata sequenza, diciamo $pi(theta)$ mentre la denominatore avremo la probabilità di avere k bianche su n totali, ovvero $((n),(k))pi(theta)$ ma alla fine la distribuzione condizionata è uniforme e dipende solo dalle combinazioni con cui le k bianche possono presentarsi (sappiamo che effettivamente ne sono uscite k)

Ti ho spiegato le cose in modo molto sommario perché so che sei in grado di approfondire in autonomia.

Mi permetto però di consigliarti queste letture "al top", secondo me....(dello stesso autore trovi decine di monografie spettacolari)
tommik
Moderatore
Moderatore
 
Messaggio: 4964 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago

Re: stimatore sufficiente

Messaggioda markowitz » 31/08/2019, 14:11

tommik ha scritto:Lo stimatore $T(ul(X))$, funzione del solo campione (uno stimatore non può dipendere dal parametro che deve stimare, mi sembra evidente) è sufficiente per il parametro $theta$ se e solo se la distribuzione condizionata

$f(ul(x)|T(ul(x)))$ non dipende più da $theta$

Quindi nella definizione del Piccolo, T è sufficiente per $theta$ se la quantità di destra non dipende più da $theta$

Cosa significa in pratica? significa che, noto lo stimatore, la distribuzione condizionata non ha più alcuna informazione utile sul parametro perché tutte le informazioni che ci servono sono contenute già nello stimatore.

Questo mi è abbastanza chiaro.
Anche l'esempio che fai mi torna ed è praticamente uguale proprio a quello di Piccolo.
Il mio dubbio è solo relativo alla notazione ed a un utilizzo adeguato del concetto di distribuzione congiunta e/o marginale in questo contesto.
Quella che ho chiamato $f()$ (Piccolo la chiama $h()$) è proprio la distribuzione del campione casuale $(ul(X))$, nell'esempio in oggetto sarebbe
$f(ul(x);theta) = theta^(sum x_i) (1-theta)^(n-sum x_i) = theta^(t_0) (1-theta)^(n-t_0) = h(ul(x), T_n = t_0; theta)$
nella notazione di sinistra sembra si tratti di una marginale ed in quella di destra di una congiunta. Il dubbio di cui parlo adesso è solo relativo a l'interpretazione di questa grandezza.

Per il resto grazie per il link e per la spiegazione.
markowitz
Senior Member
Senior Member
 
Messaggio: 620 di 1034
Iscritto il: 14/02/2010, 21:50

Re: stimatore sufficiente

Messaggioda tommik » 31/08/2019, 17:25

markowitz ha scritto:ell'esempio in oggetto sarebbe
$f(ul(x);theta) = theta^(sum x_i) (1-theta)^(n-sum x_i) = theta^(t_0) (1-theta)^(n-t_0) = h(ul(x), T_n = t_0; theta)$
nella notazione di sinistra sembra si tratti di una marginale ed in quella di destra di una congiunta. Il dubbio di cui parlo adesso è solo relativo a l'interpretazione di questa grandezza.


Il membro di sinistra non è una marginale perché è funzione di un vettore, quindi è una congiunta.

$f(X_1=x_1,X_2=x_2,...,X_n=x_n,Theta=theta)=f(X_1=x_1,X_2=x_2,...,X_n=x_n, SigmaX=t_0,Theta=theta)$

le due notazioni sono equivalenti perché le due funzioni coincidono quando effettivamente $x_1+x_2+...+x_n=t_0$; in caso contrario il membro di destra è zero e quindi la densità non è nemmeno definita
tommik
Moderatore
Moderatore
 
Messaggio: 4967 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago

Re: stimatore sufficiente

Messaggioda markowitz » 31/08/2019, 17:52

Si mi ero accorto della poca adeguatezza della parola "marginale" perchè $ul(x)$ è una n-pla e non una scalare ma tendevo a consideralo un oggetto singolo. Ora dato che $;theta$ ci sta solo a dire che la distribuzione è definita da quel parametro (scalare/vettore) l'oggetto del contendere era proprio $sum x_i = t_0$.
Sono ormai convinto che la notazione di destra sta solo ad indicare la distribuzione del campione valutata in un particolare valore (appunto $T_n = t_0$) e non segnala invece una distribuzione congiunta $n+1$ dimensionale come, almeno io, non escludevo del tutto.
markowitz
Senior Member
Senior Member
 
Messaggio: 621 di 1034
Iscritto il: 14/02/2010, 21:50


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite