scegliere la mediana come valore medio ???

Messaggioda luked » 25/01/2009, 13:25

una domanda di un esame dice:
definire la mediana ed indicare quando dovrebbe essere scelta come valore medio.

questo proprio lo ignoro
luked
New Member
New Member
 
Messaggio: 36 di 58
Iscritto il: 20/12/2008, 10:40

Messaggioda olaxgabry » 25/01/2009, 14:24

Supponi di avere una variabile con delle osservazioni: se si presentano alcuni valori anomali, la media aritmetica può essere non adeguata in quanto risente fortemente degli outliers. Per ovviare a ciò, in questi casi si usa la mediana come indice di posizione.
Io l'ho interpretato in questo modo.
Ciao
olaxgabry
Junior Member
Junior Member
 
Messaggio: 85 di 263
Iscritto il: 14/11/2008, 13:47

Messaggioda Enzo » 25/01/2009, 15:37

MEDIANA E SUO USO
Ci sono due definizioni di mediana, una teorica, valida nel calcolo di probabilità, l'altra "sperimentale", riferita ad un campione di N osservazioni, che si usa in statistica.
Nel seguito l'abbreviazione v.a. significa variabile aleatoria.
CALCOLO DELLE PROBABILITA'
La mediana di una v.a. X è quel valore m di X che bipartisce esattamente il suo peso di probabilità. Dato che il peso totale di probabilità vale 1, la mediana si lascia alla sua sinistra tanto peso quanto alla sua destra, cioè il 50% da ambo i lati.
In particolare, se la v.a. X è continua e F(x)= Prob( X < x ) è la sua funzione di ripartizione allora la mediana è la soluzione m dell'equazione: F(m) = 1/2.
Se invece la v.a. X è discreta, allora X assume uno dei valori distinti x(1) < x(2) < x(3) < ....
con rispettive probabilità: p(1), p(2), p(3) , ....
Dato che la somma di tutte le p(k) è 1, esisterà per forza un k tale che
F(k) = p(1) + p(2) + .... + p(k) < 0,5
e allo stesso tempo
F(k+1) = F(k) + p(k+1) >=0,5
Allora la mediana in genere non é né x(k) né x(k+1) ma un punto intermedio fra essi, ottenuto come loro media pesata.
In particolare si avrà, interpolando,
m = x(k) + [x(k+1) - x(k)]* [1/2 - F(k)] / p(k+1).

----> Continua al prossimo messaggio ...........
Enzo
Starting Member
Starting Member
 
Messaggio: 22 di 47
Iscritto il: 21/01/2009, 20:18

Messaggioda Enzo » 25/01/2009, 15:46

LA MEDIANA IN STATISTICA
Dato un campione di N osservazioni della v.a. X, dicesi mediana di X il valore campionario che si colloca a metà strada fra minimo e massimo. Più precisamente, disposti i valori del campione in ordine non decrescente
x(1) <= x(2) <= x(3) <= .......... <= x(N)
occorre distinguere i due casi:
N dispari
La mediana m = x(k) con k =(N+1)/2 , cioè è il valore campionario che è preceduto da tanti valori campionari quanti sono quelli che lo seguono. Se N è dispari c'é un valore campionario siffatto, che sta cioè "a metà strada in graduatoria" fra il primo e l'ultimo.
N pari
Non essendoci un valore centrale cone nel caso con N dispari, si definisce mediana la media aritmetica dei due valori centrali: m = [x(k) + x(k+1) ]/2 con k = N/2.

-----> continua (e finisce) al prossimo intervento ....
Enzo
Starting Member
Starting Member
 
Messaggio: 23 di 47
Iscritto il: 21/01/2009, 20:18

Messaggioda Enzo » 25/01/2009, 16:16

UN CASO TRAGICO IN CUI LA MEDIANA E' DI GRAN LUNGA PREFERIBILE ALLA MEDIA
Parliamo qui di mediana nel significato statistico , non teorico.
Ammettiamo che una industria farmaceutica voglia sperimentare l'efficacia di un farmaco antitumorale.
Si sceglieranno allora N malati di cancro che iniziano la cura tutti quasi allo stesso tempo.
Poi si vede di ciascuno il tempo di sopravvivenza ...
Per valutare l'efficienza del farmaco serve una stima del tempo "medio" di sopravvivenza. Più è lungo questo tempo, più è efficace il farmaco (ovviamente occorre confrontare coll'analogo tempo calcolato su un campione di "controlli", cioè di altrettanti malati di cancro cui viene dato, a loro insaputa, solo un "placebo", ma ora questo non interessa).
Bene. Ammettiamo che i malati siano 53. Per calcolare la media, propriamente detta, dei 53 tempi di sopravvivenza, occorrerà aspettare che muoiano tutti e 53 i malati (anche quello più recalcitrante a morire). Invece per calcolare la mediana dei tempi di sopravvivenza basterà aspettare che si decidano a morire solo la metà più uno dei malati: infatti in questo caso la mediana coincide col tempo di sopravvivenza del 27.mo malato. Non importa quanto sopravviveranno gli altri 26. Si vede quindi subito il vantaggio (per la casa farmaceutica, che ha una fretta del diavolo di avere finalmente il permesso di lanciare il suo farmaco sul mercato) di usare il tempo di sopravvivenza mediano piuttosto che quello medio. In questi casi infatti, di norma, la mediana è anche piuttosto inferiore alla media aritmetica fra il valore minimo e il valore massimo. Per esempio i primi 27 pazienti muoiono tutti entro 2 anni dall'inizio della cura, mentre l'ultimo a morire potrebbe camparne non altri 2, ma persino altri 10!
Pensate inoltre ai vantaggi pratici immediati. Che bisogno c'è, dopo la morte del 27° paziente, di continuare a seguire gratuitamente i restanti 26 e a somministrare loro gratuitamente il farmaco? Ormai non vi sarebbe più alcun vantaggio nè per l'industria farmaceutica nè per l'equipe di ricercatori, medici e biologi che, appena morto il 27° paziente, si sono affrettati a pubblicare il loro bravo articolo su una rivista medica importante cercando di battere sui tempi altre equipe di ricercatori finanziati dalle industrie farmaceutiche concorrenti.
Voi che ne dite? Sono troppo pessimista?
Enzo
Starting Member
Starting Member
 
Messaggio: 24 di 47
Iscritto il: 21/01/2009, 20:18

Messaggioda luked » 25/01/2009, 17:11

ok grazie per la spiegazione... fa se al prof gli scrivo aspettiamo che ne muoiano 27 ? :P

comunque per concludere: la mediana va scelta come media quando non ha senso aspettare la rilevazione dei dati di tutte le unita statistiche ?
luked
New Member
New Member
 
Messaggio: 37 di 58
Iscritto il: 20/12/2008, 10:40


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Google Adsense [Bot] e 1 ospite