***Interessante***: stimatore UMVUE di P(X>0)

Messaggioda thefurious92 » 18/01/2018, 14:20

In base ad una ricerca condotta in anni precedenti, si può ritenere che il numero di incidenti stradali X per giorno, segua in un certo tratto di autostrada, una distribuzione di Poisson con funzione di probabilità data da

distribuzione di Poisson $p(x, λ) =(lambda^x e^(-lambda))/(x!)$


a) Considerato un campione casuale di numerosità n, si ricavi lo stimatore di massima verosimiglianza per la probabilità che in un giorno si verifichi almeno un incidente;

b) Esiste uno stimatore corretto per la funzione parametrica identificata al punto a) con varianza uguale al limite inferiore di Rao-Cramer? Si giustifichi la risposta.

c) Supponendo che negli ultimi n = 200 giorni si siano verificati 80 incidenti, si ricavi un intervallo di confidenza asintotico al 95% per il numero medio di incidenti stradali per giorno.

d) Supponendo che negli ultimi n = 200 giorni si siano verificati 80 incidenti, si ricavi un intervallo di confidenza asintotico al 95% per la probabilità che in un giorno si verifichi almeno un incidente.

So che è tanto, ma vorrei capire cosa si intende per stimatore di massima verosimiglianza per la probabilità, dato che io so che lo stimatore di massima verosimiglianza per una Poisson è la media campionaria
Ultima modifica di tommik il 19/01/2018, 15:34, modificato 4 volte in totale.
Motivazione: corretta pmf
thefurious92
Starting Member
Starting Member
 
Messaggio: 1 di 8
Iscritto il: 18/01/2018, 14:05

Re: massima verosimiglianza per la probabilità che in un giorno si verifichi almeno un incidente

Messaggioda tommik » 18/01/2018, 14:24

thefurious92 ha scritto:vorrei capire cosa si intende per stimatore di massima verosimiglianza per la probabilità, dato che io so che lo stimatore di massima verosimiglianza per una Poisson è la media campionaria


La media campionaria è lo stimatore di massima verosimiglianza per la media della popolazione cioè, nel caso della poisson, per $lambda$

Qui ti chiede lo stimatore di massima verosimiglianza per la probabilità che si verifichi almeno un incidente, ovvero lo stimatore di una funzione del parametro:

$P(X>=1)=1-P(0)=1-e^(-lambda)$

Fra tutte le richieste dell'esercizio hai chiesto aiuto su quella più semplice....


ciao
tommik
Moderatore
Moderatore
 
Messaggio: 3747 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago

Re: massima verosimiglianza per la probabilità che in un giorno si verifichi almeno un incidente

Messaggioda thefurious92 » 18/01/2018, 15:47

Grazie. Allora ero sulla buona strada.
Ma riguardo il resto?
thefurious92
Starting Member
Starting Member
 
Messaggio: 2 di 8
Iscritto il: 18/01/2018, 14:05

Re: massima verosimiglianza per la probabilità che in un giorno si verifichi almeno un incidente

Messaggioda tommik » 18/01/2018, 15:49

Vediamo il punto b) che è davvero interessante

Se prendiamo la funzione parametrica richiesta $tau(lambda)=1-e^(-lambda)$ la prima cosa da fare è calcolare quanto vale il lower bound di Cramér Rao per uno stimatore non distorto di $tau(lambda)$

Con semplici calcoli trovi che

$V(T)>=(lambdae^(-2lambda))/n$

Ora, giusto per fare un esempio, prendiamo uno stimatore non distorto di $tau(lambda)$ e ce lo scegliamo nel modo più semplice:

Indichiamo con

$I_({X_i>0})(X_i)-={{: ( 1 , 0 ),( 1-e^(-lambda) , e^(-lambda) ) :}$

la funzione che vale 1 quando $X_i>0$ e zero altrimenti

Prendiamo come stimatore di $P{X>0}$ la proporzione delle osservazioni nel campione che sono maggiori di zero.


$T=1/n sum_(i=1)^(n)I_({X_i>0})(X_i)$

tale stimatore è non distorto, dato che

$E[T]=1/n*nE[I_({X_i>0})(X_i)]=1*(1-e^(-lambda))+0*e^(-lambda)=1-e^(-lambda)=tau(lambda)$

e la sua varianza è

$V[T]=1/n e^(-lambda)(1-e^(-lambda))$

si verifica abbastanza semplicemente che, essendo $lambda>0$ per ipotesi:


$1/n e^(-lambda)(1-e^(-lambda))>(lambdae^(-2lambda))/n$


E quindi questo stimatore non distorto NON raggiunge il limite inferiore di CR. Ora bisognerebbe capire cosa accade ad altri stimatori non distorti per $tau(lambda)$...

Il modo più analitico di rispondere alla domanda, anche se non è facilissimo, è quello di trovare l'UMVUE di $tau(lambda)$1 e verificare che la sua varianza non raggiunge il limite inferiore....

ma secondo me si può rispondere alla domanda del testo utilizzando il corollario di un noto teorema riguardante gli UMVUE delle distribzuzioni appartenenti alla famiglia esponenziale.......

Ora vediamo anche come derivare lo stimatore UMVUE per $P(X>0)$

Prendiamo il seguente stimatore

$T=1-I_((0))(X_1)$

dove

$I_((0))(X_1)-={{: ( 1 , 0 ),( e^(-y) , 1-e^(-y) ) :}$

E' facile verificare che

$E[T]=1-e^(-y)$

quindi T è corretto per $P{X>0}$

Applichiamo il teorema di Rao Blackwell e per poterlo applicare ci serve sapere qual è la statistica sufficiente (e completo) del modello

$sum_(i=1)^(n) X_i=s$

Secondo il teorema di Rao Blackwell lo stimatore UMVUE, quindi lo stimatore non distorto a varianza minima (che non è detto abbia varianza pari al lower bound di CR) è

$E[T|S]$

Quindi procediamo innanzitutto a calcolare la distribuzione condizionata $T|S$ con la definizione

$P{T=0|sum_(i=1)^(n)X_i=s}=(P(T=0)P(sum_(i=2)^(n)X_i=s))/(P(sum_(i=1)^(n)X_i=s))=$

$=((e^(-lambda)[(n-1)lambda]^s e^(-(n-1)lambda))/(s!))/(((nlambda)^se^(-nlambda))/(s!))=((n-1)/n)^(Sigmax)$

A questo punto, finalmente, possiamo calcolare il nostro valore atteso condizionato che, per il teorema citato, è l'UMVUE cercato.

$T|S-={{: ( 0 , 1 ),( ((n-1)/n)^(Sigmax) , 1-((n-1)/n)^(Sigmax) ) :}$

e quindi

$E[T|S]=1-((n-1)/n)^(Sigmax)$

A questo punto viene la parte per così dire più semplice, ovvero calcolare media e varianza del nostro stimatore UMVUE

$U=1-((n-1)/n)^(Sigmax)$

e controllare che non raggiunge il limite inferiore di varianza


Intanto sappiamo che $Y=Sigmax~ Po(nlambda)$

e quindi

$E[U]=1-sum_(y=0)^(oo)((n-1)/n)^y((nlambda)^ye^(-nlambda))/(y!)=...=1-e^(-lambda)$

mentre per

$V[U]=V[((n-1)/n)^y]=sum_(y=0)^(oo)[(n-1)^2/n^2]^y((nlambda)^ye^(-nlambda))/(y!)-e^(-2lambda)=...=e^(lambda(1-2n)/n)-e^(-2lambda)$

che è evidentemente sempre maggiore del Lower Bound di Cramér Rao...anzi con l'esempio preliminare che ho fatto si vede bene che l'UMVUE ha varianza minore di un qualunque altro stimatore non distorto ma, in questo caso, pur essendo lo stimatore a varianza minima, tale varianza non raggiunge il limite inferiore teorico.

$1/n lambdae^(-2lambda)<e^(lambda(1-2n)/n)-e^(-2lambda)<1/n e^(-lambda)(1-e^(-lambda))$


Spero che questo topic possa essere di aiuto. Gli altri quesiti sono davvero standard e non hanno bisogno di spiegazioni.

Note

  1. si può fare utlizzando opportunamente il teorema di Rao Blackwell
tommik
Moderatore
Moderatore
 
Messaggio: 3748 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago

Re: interessante: stimatore UMVUE di P(X>0)

Messaggioda thefurious92 » 19/01/2018, 10:40

Purtroppo questo teorema non lo conosco e non era nel programma di studio di questo semestre, ma ne terrò conto quando lo affronterò.
Riguardo i primi due punti, con gli spunti che mi hai dato ieri sono riuscito a risolverli.
Dopodiché, ho risolto con semplicità il terzo punto, ovvero calcolare l'intervallo di confidenza per il numero medio.
Ma sfortunatamente ho riscontrato dei problemi nel calcolo dell'intervallo di confidenza per la probabilità che in un giorno si verifichi almeno un incidente.
Ho iniziato utilizzando la quantità pivotale:

\(\displaystyle (T - τ(λ))/Var(T) \)

ma essendo $τ(λ)=1−e^(−λ) $ mi trovo in punto in cui devo porre l'intervallo sotto logaritmo per risolverlo in \(\displaystyle λ \), ma avendo un valore negativo dato $-z_(0,975) $ non mi è possibile.
Quindi mi conviene utilizzare una quantità pivotale con \(\displaystyle λ \) noto e varianza non nota, in modo che questa quantità abbia distribuzione di una Chi Quadrato con \(\displaystyle n \) gradi di libertà?
thefurious92
Starting Member
Starting Member
 
Messaggio: 3 di 8
Iscritto il: 18/01/2018, 14:05

Re: interessante: stimatore UMVUE di P(X>0)

Messaggioda thefurious92 » 19/01/2018, 10:51

thefurious92 ha scritto:Ma sfortunatamente ho riscontrato dei problemi nel calcolo dell'intervallo di confidenza per la probabilità che in un giorno si verifichi almeno un incidente.
Ho iniziato utilizzando la quantità pivotale:

\(\displaystyle (T - τ(λ))/Var(T) \)

ma essendo $τ(λ)=1−e^(−λ) $ mi trovo in punto in cui devo porre l'intervallo sotto logaritmo per risolverlo in \(\displaystyle λ \), ma avendo un valore negativo dato $-z_(0,975) $ non mi è possibile.
Quindi mi conviene utilizzare una quantità pivotale con \(\displaystyle λ \) noto e varianza non nota, in modo che questa quantità abbia distribuzione di una Chi Quadrato con \(\displaystyle n \) gradi di libertà?



Ho detto una boiata! Con $lambda$ noto e varianza non nota ottengo una quantità pivotale con distribuzione t di student con $n-1$ gradi di libertà, ma anch'essa ha valori negativi e ritorno al mio dilemma iniziale.
thefurious92
Starting Member
Starting Member
 
Messaggio: 4 di 8
Iscritto il: 18/01/2018, 14:05

Re: interessante: stimatore UMVUE di P(X>0)

Messaggioda tommik » 19/01/2018, 14:06

thefurious92 ha scritto:Purtroppo questo teorema ... non era nel programma di studio di questo semestre


stiamo parlando del Teorema di Rao Blackwell e del Teorema di Lehmann Scheffé....cioè dei teoremi principali che sottostanno alla teoria della Stima...e visto il quesito mi permetto di dubitarne....

thefurious92 ha scritto:Dopodiché, ho risolto con semplicità il terzo punto, ovvero calcolare l'intervallo di confidenza per il numero medio.
Ma sfortunatamente ho riscontrato dei problemi nel calcolo dell'intervallo di confidenza per la probabilità che in un giorno si verifichi almeno un incidente.... mi trovo in punto in cui devo porre l'intervallo sotto logaritmo per risolverlo in \(\displaystyle λ \), ma avendo un valore negativo dato $-z_(0,975) $ non mi è possibile.
Quindi mi conviene utilizzare una quantità pivotale con \(\displaystyle λ \) noto e varianza non nota, in modo che questa quantità abbia distribuzione di una Chi Quadrato con \(\displaystyle n \) gradi di libertà?

...

Ho detto una boiata! Con $lambda$ noto e varianza non nota ottengo una quantità pivotale con distribuzione t di student con $n-1$ gradi di libertà, ma anch'essa ha valori negativi e ritorno al mio dilemma iniziale.


cioè fammi riassumere

Hai facilmente calcolato

$P{a<lambda<b}=0.95$

ed il problema ora è capire quali siano gli estremi di

$P{?<1-e^(-lambda)<?}=0.95$

con $(1-e^(-lambda))$ funzione monotona?

HO CAPITO BENE???? :?

L'intervallo iniziale, quello per $lambda$, si calcola semplicemente con la Gaussiana, dato che ti chiede un intervallo asintotico; non fai altro che sostituire alla varianza $bar(x)/n$ e subito trovi che l'intervallo di confidenza cercato è

$bar(x)+-zsqrt(bar(x)/n)$


Se invece vuoi fare "il figo" puoi anche risolvere la seguente doppia disuguaglianza

$-z<(bar(x)-lambda)/sqrt(lambda/n)<z$

rispetto a $lambda$ trovando, in pochi passaggi algebrici, che l'intervallo per $lambda$ è

$bar(x)+z^2/(2n)+-sqrt((z^2/(2n))^2+bar(x) z^2/n)$



... Mentre per l'altro intervallo basta sostituire i valori tramite la funzione....


Immagine
tommik
Moderatore
Moderatore
 
Messaggio: 3755 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite