ciao a tutti. Seguo un corso di statistica II e ho incominciato a trovare qualche difficoltà. Allora, come esercitazione il nostro docente ci ha assegnato alcuni esercizi su R. Ora, si tratta di semplici esercizi, 3 per l'esattezza.
Primo esercizio:
> x = rnorm(1000,5,1) fornisce 1000 numeri casuali aventi media 5 e deviazione 1
> y = rnorm(1000,8,1) fornisce 1000 numeri casuali aventi media 8 e deviazione 1
> cov(x,y)
[1] -0.01030805
> cor(x,y)
[1] -0.01044141
Si nota che ho una covarianza molto bassa, così come ho una bassa correlazione. E' giusto asserire che se ho una covarianza bassa allora significa che non c'è dpendenza tra le due variabili? E' giusto dire che se ho una correlazione così bassa allora non c'è una relazione tra le due variabili?
Secondo esercizio
> x = rnorm(1000,5,1)
> y = x
> cor(x,y)
[1] 1
> cov(x,y)
[1] 1.044262
covarianza e correlazione hanno valori molto elevati (correlazione siamo al limite), significa che esiste una correlazione perfetta diretta ed una forte dipendenza?
Terzo esercizio
> x = rnorm(1000,5,1)
> y = x*0.1 + 0.1*rnorm(1000,0,1)
> cov(x,y)
[1] 0.1048109
> cor(x,y)
[1] 0.7242878
La covarianza assume un valore basso (è corretto dire "basso"?) quindi sono poco "dipendenti" l'una dall'altra, mentre una correlazione di 0.75 indica che la funzione y ha una buona tendenza a variare in modo positivo (corretto dire positivo?) rispetto ad x.
Ora da questi esempi non mi è ben chiaro la differenza in termine di significato tra covarianza e correlazione, se per esempio esistono casi in cui la covarianza sia elevata (fno a che valore si può dire "elevata"?) e la correlazione sia quasi nulla e viceversa.
Grazie a tutti