significato di covarianza e correlazione

Messaggioda tomobiki » 26/09/2012, 17:19

ciao a tutti. Seguo un corso di statistica II e ho incominciato a trovare qualche difficoltà. Allora, come esercitazione il nostro docente ci ha assegnato alcuni esercizi su R. Ora, si tratta di semplici esercizi, 3 per l'esattezza.
Primo esercizio:
> x = rnorm(1000,5,1) fornisce 1000 numeri casuali aventi media 5 e deviazione 1
> y = rnorm(1000,8,1) fornisce 1000 numeri casuali aventi media 8 e deviazione 1
> cov(x,y)
[1] -0.01030805
> cor(x,y)
[1] -0.01044141

Si nota che ho una covarianza molto bassa, così come ho una bassa correlazione. E' giusto asserire che se ho una covarianza bassa allora significa che non c'è dpendenza tra le due variabili? E' giusto dire che se ho una correlazione così bassa allora non c'è una relazione tra le due variabili?

Secondo esercizio

> x = rnorm(1000,5,1)
> y = x
> cor(x,y)
[1] 1
> cov(x,y)
[1] 1.044262

covarianza e correlazione hanno valori molto elevati (correlazione siamo al limite), significa che esiste una correlazione perfetta diretta ed una forte dipendenza?


Terzo esercizio

> x = rnorm(1000,5,1)
> y = x*0.1 + 0.1*rnorm(1000,0,1)
> cov(x,y)
[1] 0.1048109
> cor(x,y)
[1] 0.7242878

La covarianza assume un valore basso (è corretto dire "basso"?) quindi sono poco "dipendenti" l'una dall'altra, mentre una correlazione di 0.75 indica che la funzione y ha una buona tendenza a variare in modo positivo (corretto dire positivo?) rispetto ad x.



Ora da questi esempi non mi è ben chiaro la differenza in termine di significato tra covarianza e correlazione, se per esempio esistono casi in cui la covarianza sia elevata (fno a che valore si può dire "elevata"?) e :D la correlazione sia quasi nulla e viceversa.

Grazie a tutti
tomobiki
Starting Member
Starting Member
 
Messaggio: 3 di 18
Iscritto il: 12/05/2012, 11:49

Re: significato di covarianza e correlazione

Messaggioda hamming_burst » 29/09/2012, 13:31

tomobiki ha scritto:ciao a tutti. Seguo un corso di statistica II e ho incominciato a trovare qualche difficoltà. Allora, come esercitazione il nostro docente ci ha assegnato alcuni esercizi su R. Ora, si tratta di semplici esercizi, 3 per l'esattezza.
Primo esercizio:
> x = rnorm(1000,5,1) fornisce 1000 numeri casuali aventi media 5 e deviazione 1
> y = rnorm(1000,8,1) fornisce 1000 numeri casuali aventi media 8 e deviazione 1
> cov(x,y)
[1] -0.01030805
> cor(x,y)
[1] -0.01044141

Si nota che ho una covarianza molto bassa, così come ho una bassa correlazione.

entrambi i concetti vengon utilizzati come misura dell'indpendenza

E' giusto asserire che se ho una covarianza bassa allora significa che non c'è dpendenza tra le due variabili?

No. E' condizione necessaria di indipendenza, non però sufficiente per esserlo. Se zero si parla di variabili non correlate non che sono indipendenti, spero sia chiara la differenza.
Covarianza vicina a zero si dice che sono "quasi indipendenti" al contrario (valori grandi) c'è un forte sospetto di dipendenza.

E' giusto dire che se ho una correlazione così bassa allora non c'è una relazione tra le due variabili?

non fissarti troppo sui valori. Sono degli indici statistici non è una scelta netta sono correlati e non correlati. Non c'è relazione/c'è relazione, ma meglio c'è il forte sospetto che non ci sia relazione, perciò meglio utilizzare qualche strumento di indagine migliore per capire che accade.

Secondo esercizio

> x = rnorm(1000,5,1)
> y = x
> cor(x,y)
[1] 1
> cov(x,y)
[1] 1.044262

covarianza e correlazione hanno valori molto elevati (correlazione siamo al limite), significa che esiste una correlazione perfetta diretta ed una forte dipendenza?

ok

Terzo esercizio

> x = rnorm(1000,5,1)
> y = x*0.1 + 0.1*rnorm(1000,0,1)
> cov(x,y)
[1] 0.1048109
> cor(x,y)
[1] 0.7242878

La covarianza assume un valore basso (è corretto dire "basso"?) quindi sono poco "dipendenti" l'una dall'altra, mentre una correlazione di 0.75 indica che la funzione y ha una buona tendenza a variare in modo positivo (corretto dire positivo?) rispetto ad x.

ok

Ora da questi esempi non mi è ben chiaro la differenza in termine di significato tra covarianza e correlazione, se per esempio esistono casi in cui la covarianza sia elevata (fno a che valore si può dire "elevata"?) e :D la correlazione sia quasi nulla e viceversa.

Grazie a tutti

Domanda: secondo te che accade al coefficiente di correlazione (e rispettivamente alla covarianza) se es. il tuo campione sono delle misure espresse in centimetri e ricalcoli il tutto in metri?
hamming_burst
Cannot live without
Cannot live without
 
Messaggio: 2854 di 8058
Iscritto il: 04/07/2009, 10:53

Re: significato di covarianza e correlazione

Messaggioda DajeForte » 29/09/2012, 14:04

hamming_burst ha scritto:
E' giusto asserire che se ho una covarianza bassa allora significa che non c'è dpendenza tra le due variabili?

No. E' condizione necessaria di indipendenza, non però sufficiente per esserlo. Se zero si parla di variabili non correlate non che sono indipendenti, spero sia chiara la differenza.
Covarianza vicina a zero si dice che sono "quasi indipendenti" al contrario (valori grandi) c'è un forte sospetto di dipendenza.

In realta' molto si potrebbe dire su questo.
Vale il seguente risultato: Se $(X,Y)$ e' una normale bivariata, $Cov(X,Y)=0$ implica X ed Y indipendenti.
E' pero' importante che il vettore sia gaussiano, e' falso se si assume l'ipotesi piu' leggera che X ed Y siano normali.
Al contrario se la covarianza non e' nulla allora le variabili sono dipendenti.

Questa era solo una precisazione; per gli scopi del post originale non penso siano necessarie queste specificazioni.
DajeForte
Advanced Member
Advanced Member
 
Messaggio: 1219 di 2489
Iscritto il: 27/05/2010, 01:12

Re: significato di covarianza e correlazione

Messaggioda hamming_burst » 29/09/2012, 14:19

grazie Daje.
Direi allora meglio impostare la definizione come: condizione necessaria ma, in generale, non sufficiente.
hamming_burst
Cannot live without
Cannot live without
 
Messaggio: 2857 di 8058
Iscritto il: 04/07/2009, 10:53

Re: significato di covarianza e correlazione

Messaggioda tomobiki » 01/10/2012, 19:05

grazie a tutti per l'esaustiva risposta :) ora mi sono molto più chiare certe cose :)
tomobiki
Starting Member
Starting Member
 
Messaggio: 5 di 18
Iscritto il: 12/05/2012, 11:49

Re: significato di covarianza e correlazione

Messaggioda hamming_burst » 01/10/2012, 21:31

In effetti l'esposizione di Sergio è molto più corretta, se non si vuole cadere in errori di interpretazione dei dati.

Anzi, già che ci sono.
@Sergio: in casi non lineari cosa utilizzeresti come misura con le stesse caratteristiche di semplicità di calcolo, adimensionalità, ..., se l'indice di correlazione non è più adatto allo scopo?
hamming_burst
Cannot live without
Cannot live without
 
Messaggio: 2865 di 8058
Iscritto il: 04/07/2009, 10:53


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite