distribuzione congiunta

Messaggioda markowitz » 01/04/2020, 20:19

Vorrei porre una domanda che forse sarà banale ma forse no.
Partiamo dalla definizione di distribuzione congiunta di v.a.,
vedere ad esempio qui: https://it.wikipedia.org/wiki/Distribuzione_congiunta

Adesso, date due v.a. qualsiasi è sempre possibile ricondursi ad una distribuzione congiunta che le caratterizza simultaneamente? O non è sempre vero?

Notare che sicuramente è vero il contrario, se definiamo una v.a. multivariata è sempre possibile arrivare alle marginali. A me interessa la strada inversa.

Ragionando di funzione copula: https://it.wikipedia.org/wiki/Copula_(statistica)
che nel caso di v.a. continue è in corrispondenza biunivoca con la funzione di distribuzione congiunta, direi di si, almeno limitatamente alle continue, ma non sono sicuro.

Per semplificare possiamo anche evitare di considerare accoppiamenti "misti" tra v.a. discrete e continue.
Possiamo anche evitare casi patologici che sempre si possono trovare. Ad esempio, se ricordo bene, una Normale bivariata diventa mal definita se le due v.a. marginali sono perfettamente correlate.
Diciamo che mi accontenterei di trovare una risposta abbastanza generale.

In particolare è possibile considerare una distribuzione congiunta con marginali di diversa tipologia e magari con diverso supporto?
Ad esempio, nel caso bivariato, con marginali:
esponenziale e normale
pareto ed esponenziale
uniforme e normale
logistica e t-student
uniforme(0,1) ed uniforme(10,12)

binomiale e geometrica
ipergeometrica e binomiale negativa
geometrica ed uniforme discreta

ecc
markowitz
Senior Member
Senior Member
 
Messaggio: 643 di 1034
Iscritto il: 14/02/2010, 21:50

Re: distribuzione congiunta

Messaggioda markowitz » 10/04/2020, 15:45

Provo ad aggiungere qualcosa, magari è di stimolo per il ragionamento.
La domanda che ho fatto in realtà ha origine da quelli che forse sono gli strumenti statistici più utilizzati empiricamente, la regressione e l'indice di correlazione (lineari).
Adesso, il calcolo degli indici di correlazione è molto diffuso ma spesso non è preceduto da premesse. L'indice di correlazione è calcolabile su dati qualsiasi, basta che si tratti di vettori di pari lunghezza, ma spesso è inteso, a volte implicitamente, come calcolato su coppie di variabili che sono da intendere come realizzazioni di una v.a. bivariata.
In effetti, d'ora in poi restiamo nel campo delle v.a., l'indice di correlazione spesso è considerato come qualcosa di "totalmente libero". Nelle presentazioni più accorte si fa notare che i momenti secondi devono essere finiti, ed infatti sarebbe da precisare, ma non vengono poste molte altre condizioni; spesso nessuna.
In particolare spesso i manuali introducono i concetti di somma di v.a. quindi di varianza della somma e quindi di correlazzioni e magari di trasformazioni di variabili senza parlare di distribuzioni congiunte e, quindi, senza premetterne il concetto o almeno non con chiarezza. Insomma è lasciata l'impressione che gli operatori lineari prescindano dal concetto di distribuzione congiunta.

Il discorso della regressione è subito seguente. Infatti la regressione è interpretabile come un valore atteso condizionato. Solo che i due concetti non sono sempre presentati insieme ed in particolare la regressione lineare è a volte introdotta senza premettere il concetto di distribuzione multivariata ed anzi, forse, col "desiderio" di poter prescindere dalle complicazioni analitiche che riguardano le distribuzioni multivariate.

Al lato pratico le distribuzioni multivariate sono tra gli strumenti più difficili da usare mentre la regressione multivariata ormai viene utilizzata anche da chi, pur avendo imparato a fare un po di conti al PC, ha basi molto confuse di probabilità e statistica.

Il problema è che tutta questa "libertà" nell'utilizzo delle correlazioni e della regressione lineare è giustificata solo se una collezione di dati raccolti in vettori della stessa lunghezza, diciamo $n$, è sempre, o quasi, interpretabille come una raccolta di $n$ realizzazioni di una v.a. multidimensionale.
Infatti se l'intepretazione sopra non è lecita, allora, non dovrebbe essere lecito neppure parlare di correlazioni e di regressioni.

Da qui la domanda sopra.

N.B: notare che i parametri di una regressione lineare non sono altro che trasformate di indici di correlazione lineare, totali e/o parziali. Ovvero questi ultimi sono una standardizzazione dei primi.
markowitz
Senior Member
Senior Member
 
Messaggio: 644 di 1034
Iscritto il: 14/02/2010, 21:50


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite