Ciao a tutti,
supponete che ho un insieme di fagioli con numerosità nota ed enorme. Ogni fagiolo è di un colore identificabile tramite una scala di grigi che va da 0 (totalmente bianco) a 1000 (totalmente nero).
Ogni fagiolo può essere in due soli stati: fresco o avariato. Inoltre so che la probabilità di essere avariato cresce in maniera proporzionale (ma non so se linearmente, esponenzialmente, etc.) con il suo livello di grigiore; inoltre, un fagiolo nero è sicuramente avariato mentre un fagiolo bianco è sicuramente fresco.
Il mio problema è quello di dover associare ad un dato livello di grigio di un fagiolo l’ammontare della probabilità (e in caso il suo intervallo di confidenza) che questo ha di essere marcio; inoltre devo calcolarmi tale probabilità man mano che analizzo i fagioli e quindi prima che li ho analizzati tutti.
Leggendo in giro sembrerebbe che io debba utilizzare un approccio frequentista; cioè io mi calcolo la frequenza con cui un fagiolo con una determinato livello di grigio è stato in passato analizzato e determinato come avariato e questa coincide con la probabilità dei fagioli ancora da analizzare, con lo stesso livello di grigio. Questo approccio funziona se il campione su cui si è calcolata la frequenza è “ABBASTANZA” grande da rappresentare l’insieme dei fagioli.
Ma come faccio a giudicare un campione come “abbastanza rappresentativo” di un qualcosa enorme e che inoltre mai analizzerò per intero?
Esempio: supponete che ho analizzato un milionesimo dei fagioli totali, e riguardo questi, per esempio, di quelli con il valore di 500 di grigio solo un terzo erano marci; posso associare al valore 500 di grigio la probabilità 33%? In altre parole, posso dire che il prossimo fagiolo con 500 di grigio ha il 33% di probabilità di essere marcio? In caso affermativo, con quale confidenza? La confidenza coincide con la grandezza del campione?
Grazie,
Marione