QUESITO (risolto) VARIANZA MEDIA CAMPIONARIA

Messaggioda condor » 25/04/2010, 14:45

risulta positiva quando n=N (ovvero il campione corrisponde alla popolazione)?


Salve a tutti,

ho un quesito semplice... calcolando la varianza della media campionaria risulta che:

Var(media campionaria)=sigma^2/n

fin qui tutto bene.... mi chiedevo pero' perche' se n=N (ovvero se il campione ipoteticamente coincide con la popolazione), e quindi:

media campionaria = media popolazione

la varianza risulta ancora positiva?

Faccio un esempio

POPOLAZIONE= 7, 14, 21, 37
MEDIA=19,75
VARIANZA=123,68

Mettiamo di non sapere da quanti elementi e' formata la popolazione e decidiamo di estrarre un campione di 4 elementi, n=4, quindi ovviamente:
Campione=7,14,21,37
Media campionaria=19,75
Varianza della media campionaria=123,68/4=30.92 --> che senso ha? questa dovrebbe essere zero dato che la media campionaria e' esattamente la media della popolazione......

Grazie dell'eventuale chiarimento
Ultima modifica di condor il 26/04/2010, 12:02, modificato 3 volte in totale.
condor
New Member
New Member
 
Messaggio: 1 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda condor » 25/04/2010, 16:27

Sergio certo! Ma non e' quello che intendo... la media campionaria e' una stima della media della popolazione. La varianza della media campionaria dovrebbe essere l'errore di questa stima (se non ho capito male...), ma se tu (magari senza saperlo) estrai tutti gli elementi della popolazione, la varianza dovrebbe essere zero perche' non c'e' errore! Infatti hai trovato esattamente la media della popolazione!

Non a caso, considerando una popolazione di 4 elementi (N=4) e campioni di 4 elementi (n=4 il campione estratto e' sempre uguale alla popolazione), calcolando le medie campionarie dei campioni estratti (che coincidono con la media della popolazione), le medie sarebbero tutte uguali e quindi la loro varianza sarebbe correttamente ZERO, perche' infatti significa che abbiamo trovato la media esatta della popolazione.

Tuttavia, da quanto ne so, la formula della varianza della media campionaria e':

Var(media campionaria)=sigma^2/n

Significa che se estraggo un campione qualsiasi, di ampiezza n, da una popolazione (distribuita normalmente), allora anche lo stimatore "media campionaria" sara' distribuito normalmente con media "mu" e varianza sigma^2. Ma se n=N (dimensione popolazione e campione coincidono, magari senza saperlo...) allora in quel caso la varianza della media campionaria dovrebbe essere ZERO....in realta' guardando la formula non capisco (anche guardando all'esempio sopra) come cio' possa accadere.
condor
New Member
New Member
 
Messaggio: 2 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda condor » 25/04/2010, 18:36

Scusami Sergio ma credo sia sbagliato cio' che dici..... Io non sto parlando della varianza del campione MA della varianza delle medie campionarie.

La varianza delle medie campionarie si calcola cosi`:

Var(medie campionarie)=sigma^2/n

Dove sigma^2 = varianza della popolazione e n = dimensione del campione

se il campione e' molto molto molto grande => n e' molto molto molto grande e per la definizione data la varianza tende a zero! E quindi non vero cio' che dici.... o sbaglio?



PS scusate se non scrivo bene le formule imparero' quanto prima...
Ultima modifica di condor il 25/04/2010, 19:04, modificato 1 volta in totale.
condor
New Member
New Member
 
Messaggio: 3 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda condor » 25/04/2010, 19:12

Sergio non ti preoccupare, gia' ti ringrazio che mi stai rispondendo.....

Quello che dici e' vero. Il mio voleva essere un caso "assurdo" in cui non conosci la popolazione (non sai da quanti elementi e' formata) e volendo estrarre un campione, in realta' hai estratto tutta la popolazione, ma tu non lo sai.
Mettiamo che hai un urna con 4 palline numerate (non sai quante sono le palline in realta'...) e decidi di estrarre un campione formato proprio da 4 palline. Ora chiaramente la media dei numeri non e' una stima, ma proprio la media della popolazione. Mettiamo pero' di non saperlo...e calcoliamo la varianza secondo la formula

Var(media campionaria) = sigma^2/n

Questa varianza risulta positiva e non uguale a zero. In realta' pero' non avendo una stima, ma proprio la media della popolazione, questa dovrebbe essere zero!
Mi/Ti/Vi chiedo quale pezzo mi manca?????

Ho qualche idea ma vorrei delle conferme...
condor
New Member
New Member
 
Messaggio: 5 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda condor » 25/04/2010, 20:42

sono d'accordo, ad ogni modo, anche se fosse la distribuzione di Cauchy ma il campione e' n>30 allora la distribuzione delle medie campionarie e' comunque normale.

Detto questo allora, la formula della varianza delle medie campionarie dovrebbe essere cosi` riscritta:

1. Var(media campionaria)=sigma^2/n per n<N
2. Var(media campionaria)=0 per n=N

dove N e' l'ampiezza della popolazione

Perche' altrimenti mi si dovrebbe ancora spiegare come mai quando n=N (e credo potrebbe esserci un caso in cui si estrae inconsciamente tutta la popolazione) la varianza calcolata con la formula 1. risulta comunque positiva.

Cosa dici/dite?

PS Sergio ma tu sei un professore?
condor
New Member
New Member
 
Messaggio: 7 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda markowitz » 25/04/2010, 20:51

Il quesito è interessante, mi ero già posto un problema simile e credo che si possa dire questo:
abbiamo un campione con $n$ variabili casuali ognuna con media $mu$ e varianza $sigma^2$ che sono ignote e devono essere stimate. Come fare?
Bisogna prestare la massima attenzione al fatto che noi ipotizziamo un campionamento casuale semplice e quindi i valori estratti sono v.a. $iid$ su cui non è necessario conoscere la specifica distribuzione.
Adesso dobbiamo trovare gli stimatori, e per definizione lo stimatore sarà una v.a. perchè frutto di un campionamento casuale semplice, ne consegue che sia lo stimatore della media vera $mu$ che quello della varianza vera $sigma^2$ avranno a loro volta una distribuzione di prob. e quindi una media ed una varianza. Per intenderci esiste la varianza della media stimata, che è quella che hai scritto, ma anche la varianza della varianza stimata!!! (anche se spesso non la considera nessuno).
Dopodiché le proprietà che vengono richieste agli stimatori sono: non distorsione, consistenza ed efficenza (quest'ultima rispetto ad altri stimatori); dove se si lavora con campioni grandi sulla non distorsione si può soprassedere ciò che conta, e qui attenzione, è la consistenza. Bene quella $n$ al denominatore della formula che hai scritto dimosta la consistenza dello stimatore della media campionaria rispetto al parametro di popolazione $mu$. Quella ottenuta è una stima quindi DEVE avere varianza>0 se n<infinito.
Dopodiché se non conosci neppure $sigma^2$ ti devi stimare anche quella, altra variabile casuale.....
Penso proprio che tutta questa roba perda di significato se perdiamo di vista l'ottica del campionamento casuale da una popolazione con parametri veri finiti ed ignoti. Se esistono quattro dati e basta non ha senso applicare quanto sopra, se esistono quattro possibili risultati ma in una popolazione numerosa e campionabile in senso proprio tutto torna ad avere senso :-D
markowitz
Senior Member
Senior Member
 
Messaggio: 72 di 1034
Iscritto il: 14/02/2010, 21:50

Messaggioda condor » 25/04/2010, 22:48

1) Cauchy non l'ho mai studiata ad essere sincero...pero' so che anche con distribuzioni molto "non normali" la distribuzione delle medie campionarie dovrebbe essere comunque una normale...leggo che il valor medio della distribuzione di Cauchy non e' definito, pero' credo (magari mi sbaglio) che presi comunque un certo numero di campioni, la distribuzione delle medie campionarie dovrebbe comunque essere distribuita in modo normale....o no? Come sarebbe distribuita altrimenti? (comunque non era questa la mia domanda iniziale)
2) Il fatto dell'acqua calda...chiaro, e' una cosa molto ovvia!
3) Ecco sull'ultimo punto n<N per definizione...ok! Tuttavia mi suona "strana" la cosa, ovvero che il risultato della varianza della media campionaria venga totalmente sbagliato....mi sembra strana questa cosa! Rimango convinto che ci sia una spiegazione migliore, "piu' formale".
condor
New Member
New Member
 
Messaggio: 8 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda condor » 25/04/2010, 23:26

1) Sergio, non sono laureato in statistica, ma in economia (anche se sto valutando di prendere una laurea anche in matematica), quindi mi limito a riportarti cio' che scrive il mio libro di statistica: "Se la popolazione ha distribuzione ARBITRARIA (quella che vuoi....se non capisco male), ma considerando un grande campione (operativamente n > 30) allora la media campionaria ha distribuzione asintotica Normale e con un leggero abuso della notazione scriveremo ancora che la media campionaria e' distribuita seconda una normale con media "mu" e varianza sigma^2/n"

ad ogni modo quello che mi interessa e' il seguente:

2) Se quello che dici e' vero, significa che e' obbligatorio conoscere sempre il numero di elementi della popolazione => non e' possibile calcolare la media campionaria se non sai quanto e' grande la popolazione. Inoltre potrei aver bisogno di fare inferenza anche con popolazioni "piccole" dove il costo delle misurazioni e' molto elevato... in questo caso potrei avere un N relativamente piccolo. Tu mi stai dicendo (dimmi se ho capito male) che per calcolare la media campionaria devo conoscere obbligatoriamente N....mi sembra strano....
condor
New Member
New Member
 
Messaggio: 9 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda condor » 25/04/2010, 23:44

Il libro e' "Lezioni di inferenza statistica - Raffaella Piccarreta e Pietro Veronese", la stessa cosa e' scritta anche sul libro del CFA noto "master" di finanza americano.

Il secondo punto continua a non convincermi...l'esempio e':

-popolazione finita
-non conosci N

come la mettiamo? Secondo quanto hai detto non puoi calcolare la varianza della media campionaria...cosa non da poco!
condor
New Member
New Member
 
Messaggio: 10 di 50
Iscritto il: 25/04/2010, 14:21

Messaggioda condor » 26/04/2010, 00:07

1) Direi che riguardo al punto 1 e' meglio lasciare perdere....mi dici che non sei professore e vuoi buttare i libri (sono i libri di statistica della Bocconi e gli altri i libri del CFA)...mah
2) Il secondo punto comunque non sta in piedi, perche' non puoi assumere per definizione una cosa che potrebbe essere non vera! Se tu non conosci N non puoi sapere se n<N e nel caso in cui n=N, appunto la varianza sarebbe sbagliata! Un problema di questo tipo, se fosse come dici, sarebbe stato affrontato in modo molto piu' approfondito! Sono sicuro c'e' una spiegazione piu' semplice....domani che e' lunedi' avremo forse una risposta!
condor
New Member
New Member
 
Messaggio: 11 di 50
Iscritto il: 25/04/2010, 14:21

Prossimo

Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite