Magnus ha scritto:Ecco l'esercizio:
Negli USA durante gli anni 80, ogni settimana sono morte sul lavoro una media di 121,95 persone. Dai una stima delle seguenti quantità:
a) la frazione di settimane con 130 vittime o più
b) la frazione di settimane con 100 vittime o meno
Vediamo come si risolve:
Banalmente il problema richiede l'uso della distribuzione Poissoniana.
Per vedere questo basta conoscere il significato di questa distribuzione e notare che:
1) il numero di lavoratori n é molto alto (potremmo dire che tende a +∞)
2) mentre la probabilità p che un lavoratore in una settimana cada vittima di un incidente é, si spera, molto bassa (potremmo dire che tende a 0),
3) e tuttavia il rapporto np é finito.
Nel nostro caso si ha λ = 121,95
Pertanto p(x) = (exp(-λ) λ^x)/x! = probabilità che si verifichino x decessi in una data settimana.
Ora é ovvio che facendo la sommatoria con x che varia da 0 a 100 di p(x) si ottiene la risposta b).
Altrettanto banalmente facendo la sommatoria con x che varia da 130 a +∞ si ottiene la risposta a).
Difatti é chiaro che con la terminologia non perfettamente corretta "frazione di settimane che" si intende "probabilità".
Queste sono licenze che spesso taluni statistici si prendono, a differenza dei matematici.
Vediamo di rispondere ai deliri finora visti:
i dati sono tutti ma non ho capito come risolverlo
in effetti basterebbe studiare ...
Direi che é un problema da liceo classico.
Sembra ambiguo anche a me.
Non c'é nessuna ambiguità.
Hai solo la media, ti servirebbe almeno anche una stima della varianza.
No, non serve.
Fra l'altro nella Poissoniana la varianza coincide con la media, quindi é λ.
Ad esempio, se la varianza fosse zero (ossia se ogni settimana muoiono esattamente 121,95 ... vabbe', facciamo 122 persone) , allora quelle due frazioni sarebbero pari a zero.
Fra l'altro, strettamente parlando, si sta parlando di varianza in modo improprio.
Più precisamente, trattandosi di conteggi, sono possibili unicamente valori interi per la variabile aleatoria.
E' per questo perché la Poissoniana é una distribuzione discreta, e non continua.
La distribuzione settimanale del numero di morti sul lavoro è a campana, simmetrica: non vi è motivo di ritenere che la media sia stata calcolata in base a un andamento diverso alla sua sx o alla sua dx.
Ma, no é chiaramente asimmetrica. Fra l'altro la coda sinistra é finita, mentre quella verso destra é infinita (anche se praticamente nulla da subito).
Per la precisione la cosa destra arriva fino ad n, che comunque si é detto tendere a +∞.
Dimostriamo che vi é subito motivo di ritenere che l'andamento sia asimmetrico.
Sia xpic l'ascissa del picco, ovvero la moda della distribuzione (si noti che deve essere un numero intero).
Allora
1) per x = 0 = xpic - xpic si ha p(x) = exp(-λ)
2) per x = 2λ = xpic + xpic si ha p(x) = (exp(-λ) λ^(2xpic))/(2xpic)!
Quindi ad uguale distanza dal valore di moda, si hanno valore diversi (in questo caso uno é λ^(2xpic))/(2xpic)! maggiore dell'altro).
Con Stirling si può facilmente dimostrare che questi due valori hanno anche ordini di grandezza molto diversi in base al valore di λ.
Utilizzando la normale standardizzata che ha media 0 e varianza 1 dovresti essere in grado di calcolare la varianza con media 121,95.
Già usare una distribuzione continua al posto di una discreta é un errore concettuale.
La distribuzione che suggerivo e' simmetrica (infatti e' zero sia a destra sia a sinistra della media). Anche ipotizzando la normalita', comunque, senza sapere la varianza non vedo come calcolare le frequenze richieste. La varianza potrebbe essere 0, 1, 121 o 121.000 e avresti quattro risultati diversi.
In sostanza si chiede di fare una stima, cioè una previsione sul futuro, basandosi sul campione casuale rappresentato dalle rilevazioni storiche di 10 anni, dal 1980 al 1989. La frazione di settimane rappresenta la funzione di ripartizione che nel caso della varibile casuale normale standardizzata è tabulata. Io suggerirei di sostituire al posto di 130 e di 100 i valori calcolati con le proporzioni:
130:x= 121,95: 1
100:x= 121,95: 1.
In sostanza è indifferente conoscere i valori storici effettivamente rilevati perchè sono solo un campione casuale, una delle tante possibilità che si potevano verificare. Per fare un'inferenza statistica, cioè una stima, basta l'ipotesi che il fenomeno collettivo "numero di morti settimanali sul lavoro" sia distribuito secondo una variabile casuale di Gauss.
Restando l'assurdità dell'uso della normale, si noti che quello della varianza é un falso problema.
Difatti nella Poissoniana coincide con la media, quindi é data nell'enunciato del problema.
Basta riconoscere che serve la distribuzione di Poisson.
Confermo, il problema è risolvibile. Il teorema centrale del limite afferma che qualunque sia la distribuzione di ogni singola variabile casuale, rappresentata in questo caso dai possibili modi con cui si distribuisce il numero di morti sul lavoro in una settimana (per comodità possiamo assumere che sia uniforme e in tal caso, scusa la svista del mio secondo post, la varianza NON è zero), la variabile casuale risultante dalla somma delle n=540 settimane studiate negli anni '80 sarà certamente gaussiana (ovvero normale), con media uguale a quella rilevata e varianza uguale a 1/n di quella calcolata ipotizzando che il numero dei morti settimanali vari da 0 a 2 volte la media rilevata (essendo l'andamento simmetrico e non potendo essere il minimo <0, il max dovrà essere 2 volte la media rilevata).
risolvibile -> risolubile
PS: meno male che ti sei reso conto da solo che la varianza non é zero.
Stavo per corregerti prima, ma ho lasciato perdere. Non solo é non nulla, ma é pari a λ.
Per lavorare sul teorema del limite centrale vi servirebbero i dati di n = 540 settimane.
Questi dati ve li state inventando voi, in quanto non vi vengono forniti. Difatti nell'enunciato del problema vi viene fornito soltanto λ.
Questo perché non é necessario scomodare il teorema del limite centrale per risolvere questo problema ottenendo un risultato approssimato.
E' possibile trovare il risultato esatto (senza approssimazioni) semplicemente usando la Poissoniana.
Questa è però la varianza di una sola settimana, quella dei 10 anni si ottiene dividendo il risultato per le 540 settimane del campione utilizzato.
Lo pensi davvero ? Da dove desumi questa assurdità della linearità della varianza nelle trasformazioni?
In realtà come si trasforma la varianza ? Lo sai vero ...
Un modo elegante di risolvere il problema (o forse e' proprio quello che ti chiedono di fare, non so) e' quello di assumere una distribuzione normale (come di fatto suggeriva stepper) e poi di rispondere con una funzione della varianza. Una volta che assumi la normalita', infatti, le due frequenze richieste sono semplicemente due funzioni della varianza (cioe' variano al variare della varianza). Quindi scrivigli direttamente le due funzioni. E' piu' semplice di quello che sembra, davvero.
Non é ne elegante, né probabilisticamente corretto.
OGGETTO: ESERCIZIO CHIARO INGIUSTAMENTE ACCUSATO DI ESSERE AMBIGUO
Cazzo! non ho mai letto una sequela così impressionante di fregnacce dette in varie salse da tanti soggetti!
Possibile che nessuno di voi abbia mai sentito parlare della distribuzione di Poisson?
Tutti i conteggi, per esempio gli incidenti stradali che in una settimana si verificano in un certo tratto autostradale, o il numero di elettroni energetici (raggi beta) emessi da una sorgente radioattiva, o il numero di persone che si presentano nell'arco di un'ora ad un dato sportello, tutte queste variabili aleatorie sono distribuite secondo la distribuzione di Poisson, per scrivere la quale basta solo conoscerne la media, la varianza essendo uguale alla media. La sua espressione è:
Prob( di avere k eventi quando in media se ne hanno m) = exp(-m) m^k / k! __________ k = 0, 1, 2, 3, ......
Se si applica questa distribuzione la soluzione dei quesiti posti da MANGUS viene dopo semplici calcoli.
Ovviamente, l'espressione "la frazione di settimane" va letta semplicemente come "probabilità" nel senso che questa è una buona stima della corrispondente "frequenza" del dato evento, anche se propriamente è più vero il viceversa.
Così ogni cosa va al suo posto e gli esercizi dati sono veramente facili da risolvere.
Altro che ambiguità!
Altro che "distribuzione a campana"! (la Poisson è fortemente asimmetrica per m piccolo e non copre alcun valore negativo)
Altro che "teorema centrale del limite"!
Forse dovreste dedicare un po' più di tempo alla lettura dei libri di testo e un po' meno alla frequentazione dei FORUM.
Sta di fatto che la distribuzione di Poisson viene subito dopo la binomiale e prima della normale in tutti i libri di testo.
Mi sembra impossibile che qui sia stata così elegantemente snobbata!
Penso a Poisson e a come si sta rivoltando nella sua tomba!
Questo intervento piuttosto crudo l'ho fatto soprattutto per fargli giustizia.
I toni sono decisamente inopportuni.
Il contenuto é decisamente corretto.
Finalmente qualcuno che conosce un minimo di teoria della probabilità.
2)Non mi risulta che questo esercizio si riferisca ad un evento raro. Nella distribuzione di Poisson la costante µ (o lambda) è la media, data da np, quindi se la media è 122 circa, p=0,225 perchè l'unità di tempo è la settimana e noi abbiamo usato n=540 settimane.
Dunque:
1) 540 settimane é un valore arbitrario inventato in quanto si trattava solamente di una proposta di stepper per fare un esempio, ma non il dato indicato nel problema (nell'enunciato non é specificato il numero di settimane, ma si parla solo genericamente di anni '80, e cmq quell'excursus non é significativo per la risoluzione del quesito).
2) p = alla probabilità che un operaio rimanga ucciso durante una settimana.
Il valore che hai dato di p é sbagliato, perché non ti viene dato né il numero n di lavoratori, e quindi quello dei casi totali.
Ti viene dato solo il numero dei casi possibili, cioé λ, é ciò non ti basta a fare il rapporto casi possibili/casi totali.
3) l'unità di tempo é indifferente sia alla risoluzione del problema, sia al calcolo di p.
Il tuo punto 2) é tutto un non sequitur.
3) Per n tendente a infinito la distribuzione di Poisson approssima la binomiale, che a sua volta approssima la normale, che è a campana.
E' sbagliato, la Poissoniana approssima la Normale in certi casi (vedi più avanti).
La Binomiale approssima la Poissoniana OPPURE la Normale, ma per limiti DIVERSI.
Nota che l'approssimazione non é una proprietà simmetrica, nel senso che se A approssima B, non implica che B approssima A.
Inoltre é transitiva solo se coincidono o sono compatibili i limiti, cioé se A approssima B e B approssima C, implica che A approssima C, solo se i limiti per cui A approssima B e B approssima C sono lo stesso limite oppure sono entrambi possibili.
Quindi sbagli quandi dici che:
1) la Poissoniana approssima la Binomiale. E' vero il contrario!. Questo perché presumi la riflessività (cosa errata).
2) se la Poissoniana appossima la Binomiale (cosa errata) e la Binomiale approssima la Normale (cosa esatta) allora si deve avere che la Poissoniana approssima la Normale. Ciò non é affatto vero! Questo perche presumi la transitivà (cosa non sempre vera).
La distribuzione poissoniana ha una forma molto asimmetrica, quando la media è piccola: se µ< 1, la classe più frequente (o più probabile) è zero, è ancora asimmetrica per valori di µ< 3 ma già con µ>5 la distribuzione delle probabilità è vicina alla forma simmetrica
Queste sono banalità e discendono banalmente dalla formula della Poissoniana.
Le affermi, ma nessuno le aveva negate.
e può essere bene approssimata dalla distribuzione normale, la quale a sua volta approssima la binomiale per n molto grande, a dimostrazione che, per la proprietà transitiva, la poissoniana è una buona approssimazione della binomiale in quanto entrambe convergono in probabilità verso la normale.
Ancora gli errori di prima!
E cmq quando si dice che la Poissoniana approssima la Normale, é bene ricordare che ciò vale solo per i valori naturali, i soli in cui è definita.
Non si tratta quindi di un approssimazione propriamente detta (anche se spesso si indulge a queste terminologia), in quanto la Gaussiana é continua, mentre la Poissoniana é discreta.
Cheguevilla
Ooops! Un membro dei Blood Beret!
Scommetto che sei al servizio di sua Serenità Imperiale!
PS: attento al Clan Bartholomew.
Davide Malvestuto