Goodness of Fit Test

Messaggioda Matteo294 » 09/07/2019, 09:44

Buongiorno,
in un esperienza di laboratorio ci è stato chiesto di generare un campione di dati estratti da distribuzione di Poisson e dimostrare che all'aumentare del parametro della distribuzione \(\displaystyle \alpha \) l'approssimazione a distribuzione Normale con \(\displaystyle \mu = \alpha\) e \(\displaystyle \sigma^2 = \alpha \) migliora. Per tale fine ci è stato chiesto di utilizzare una differenza tra chi-quadrati, uno fatto rispetto alla Poisson teorica e l'altro rispetto alla Normale teorica. Fin qui tutto chiaro: il mio intento era quello di provare a dimostrare (sempre che sia vero) che tale criterio deriva dal rapporto delle massime verosimiglianze. Tuttavia non riesco nel mio intento. Infatti dal rapporto delle due Likelihood
\(\displaystyle \lambda = \frac{L(x | Poisson)}{L(x | Gauss)} \)
prendendo il logaritmo di entrambi i membri ottengo
\(\displaystyle \ln \lambda = \ln(L(x | Poisson)) - ln(L(x | Gauss)) \)
Per quanto riguarda il secondo membro riesco a dimostrare che assume la forma di un chi-quadrato, ma per il primo proprio non riesco a ricondurmi ad una forma che possa ricordarmi un chi-quadrato.
Sapreste aiutarmi?
Ringrazio in anticipo
Ultima modifica di tommik il 10/07/2019, 07:27, modificato 1 volta in totale.
Motivazione: modificato titolo
Matteo294
Starting Member
Starting Member
 
Messaggio: 2 di 8
Iscritto il: 12/01/2019, 09:44

Re: Rapporto massime verosimiglianze

Messaggioda tommik » 09/07/2019, 16:56

Matteo294 ha scritto:in un esperienza di laboratorio ci è stato chiesto di generare un campione ... e dimostrare


generare un campione causale.....e verificare (è una verifica, non una dimostrazione) ecc ecc

Il rapporto delle verosimiglianze non c'entra nulla....occorre generare un campione casuale dalla suddetta distribuzione (di metodi generatori ce ne sono diversi) e verificare quanto richiesto.

Ecco cosa ti devi trovare....che all'aumentare del parametro della poisson la distribuzione tende ad una gaussiana (la curva rossa è la gaussiana di media e varianza $alpha$)...

(click per ingrandire)

Immagine

Come si verifica questa proprietà? Con un classico test non parametrico di Goodness of Fit che sicuramente vi avranno spiegato: il chi-quadro (come richiesto) ma anche con altri test come ad esempio quello di Kolmogorov Smirnov
tommik
Moderatore
Moderatore
 
Messaggio: 4889 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago

Re: Rapporto massime verosimiglianze

Messaggioda Matteo294 » 09/07/2019, 18:59

Ok innanzitutto ti ringrazio per la risposta... La procedura che tu hai descritto (che era quella richiesta) l'ho seguita, ma la mia domanda era se si potesse spiegare quel criterio a partire da quello delle massime verosigmiglianze, ma ok ho capito di no... Ad ogni modo ho provato anche il test di Kolmogorov-Smirnov ma non sono riuscito a ricavare risultati soddisfacenti, non so se sto sbagliando qualcosa ma dubito. Nel primo grafico c'è l'andamento dell'errore relativo dei chi quadri (ovvero \(\displaystyle \frac{\chi^2_{poiss} - \chi^2_{gauss}}{\chi^2_{poiss}} \)), mentre nel secondo il p-value ritornato dalla funzione di test Kolmogorov - Smirnov. E' normale che dia valori di probabilità così bassi?



Immagine


Immagine
Ultima modifica di tommik il 10/07/2019, 07:27, modificato 1 volta in totale.
Motivazione: eliminata citazione ingombrante
Matteo294
Starting Member
Starting Member
 
Messaggio: 3 di 8
Iscritto il: 12/01/2019, 09:44

Re: Goodness of Fit Test

Messaggioda tommik » 10/07/2019, 08:00

Il test chi quadro che hai scritto

Matteo294 ha scritto: \(\displaystyle \frac{\chi^2_{poiss} - \chi^2_{gauss}}{\chi^2_{poiss}} \)


è totalmente sbagliato. Forse prima di affrontare certi importanti temi è necessario uno studio della teoria più approfondito; qui c'è un topic dove spiego l'idea della dimostrazione della nota formula, ma il test in oggetto lo trovi spiegato dovunque.

Come ho già detto, quanto richiesto non è una dimostrazione ma una semplice verifica...anzi è un classico test di verifica di ipotesi non parametrico dove l'ipotesi di lavoro è che la distribuzione segua una normale $N(theta;theta)$ completamente specificata e dove $theta$ è il parametro della poisson.
Tale verifica è del tutto inutile in quanto la proprietà in questione si può facilmente dimostrare in modo analitico sfruttando il Teorema del Limite Centrale.

Infatti, ricordando la proprietà di riproducibilità della Poisson1 sappiamo che la somma di $n$ poisson iid di parametro $theta$ è ancora una poisson di parametro $n theta$ e quindi per la variabile

$Z_n=(Sigma_i X_i-n theta)/sqrt(n theta)$


vale la seguente convergenza

$lim_(n rarr+oo)F_(Z_n)=Phi_((0;1))$



che, detto in altri termini:

${Z_n}\stackrel(" "mathcal(L)" ")rarrZ$


dove $Z~N(0;1)$...che dimostra espressamente quanto qui si chiede solo di verificare.

Se vogliamo trovare qualche cosa di utile nell'esercizio, possiamo cercare il valore di $theta$ per il quale la distribuzione di poisson può già considerarsi gaussiana...già con $theta=10$ il test non è affatto significativo.

Per eseguire il test devi ovviamente ripassare meglio la teoria. Ecco il suddetto test per $theta=10$, generato un campione casuale semplice di ampiezza 100:

IntervalliOE(O-E)^2/E
x<=575.690.30
5<x<=82720.661.94
8<x<=113636.050.00
11<x<=142327.300.68
x>14710.301.05
Totale1001003.97


Un Chi-quadro di 3.97 con 4 gdl significa un Pvalue del 41% ....tieni presente che il chi quadro critico al 5% con 4 gdl viene 9.49

Utilizzando opportunamente il fattore di correzione per distribuzioni discrete, il Pvalue sale al 97% il che significa che con un parametro $theta=10$ abbiamo un'approssimazione gaussiana che coinicide con la distribuzione esatta.

Con un software adeguato ci vuole davvero poco a verificare che, aumentando (diminuendo) il parametro $theta$ della poisson, l'approssimazione con la gaussiana migliora (peggiora)

tieni presente che io non ho alcuno strumento informatico dedicato (faccio il contabile di mestiere) ed ho fatto tutti i conti con carta e penna

[-o< non citare ogni volta TUTTO il messaggio precedente...grazie

:smt039

Note

  1. che si dimostra anch'essa in in paio di semplici passaggi sfruttando le proprietà della Funzione Generatrice dei Momenti
tommik
Moderatore
Moderatore
 
Messaggio: 4890 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite