Ancora fagiuoli marci…

da **Marione** » 13/06/2008, 15:49

Ciao a tutti,
supponete che ho un insieme di fagioli con numerosità nota ed enorme. Ogni fagiolo è di un colore identificabile tramite una scala di grigi che va da 0 (totalmente bianco) a 1000 (totalmente nero).
Ogni fagiolo può essere in due soli stati: fresco o avariato. Inoltre so che la probabilità di essere avariato cresce in maniera proporzionale (ma non so se linearmente, esponenzialmente, etc.) con il suo livello di grigiore; inoltre, un fagiolo nero è sicuramente avariato mentre un fagiolo bianco è sicuramente fresco.
Il mio problema è quello di dover associare ad un dato livello di grigio di un fagiolo l’ammontare della probabilità (e in caso il suo intervallo di confidenza) che questo ha di essere marcio; inoltre devo calcolarmi tale probabilità man mano che analizzo i fagioli e quindi prima che li ho analizzati tutti. :cry:

Leggendo in giro sembrerebbe che io debba utilizzare un approccio frequentista; cioè io mi calcolo la frequenza con cui un fagiolo con una determinato livello di grigio è stato in passato analizzato e determinato come avariato e questa coincide con la probabilità dei fagioli ancora da analizzare, con lo stesso livello di grigio. Questo approccio funziona se il campione su cui si è calcolata la frequenza è “ABBASTANZA” grande da rappresentare l’insieme dei fagioli.
Ma come faccio a giudicare un campione come “abbastanza rappresentativo” di un qualcosa enorme e che inoltre mai analizzerò per intero?

Esempio: supponete che ho analizzato un milionesimo dei fagioli totali, e riguardo questi, per esempio, di quelli con il valore di 500 di grigio solo un terzo erano marci; posso associare al valore 500 di grigio la probabilità 33%? In altre parole, posso dire che il prossimo fagiolo con 500 di grigio ha il 33% di probabilità di essere marcio? In caso affermativo, con quale confidenza? La confidenza coincide con la grandezza del campione? :roll:

Grazie,
Marione

da **EconMax** » 26/06/2008, 08:49

Per fissare la numerosita' campionaria nel caso di stima di una frequenza i metodi sono del tutto standard (li trovi su qualsiasi libro). In breve: $n=z^2*p(1-p)/d^2$, dove $p$ e' la frequenza del fenomeno che pensi sia vera (prudenzialmente puoi prendere $p=0.5$), $d$ e' l'ampiezza desiderata dell'intervallo di confidenza, $z$ e' il livello di confidenza (ad esempio $z=1.96$ per un errore di prima specie del 5%).
Certo il tuo problema e' molto piu' complicato perche' devi stimare una frequenza per ogni tonalita' di grigio. Fissare un campione per ognuna delle 1000 tonalita' mi pare uno spreco. Forse puoi prendere un campione delle 1000 tonalita', per ogni tonalita' campionaria ti stimi la frequenza con il metodo sopra, ma poi non so bene come fare inferenza in modo preciso. E' un bel problema.

Ancora fagiuoli marci…

Ancora fagiuoli marci…

Chi c’è in linea