problema modello predittivo

Messaggioda data_miner » 23/06/2009, 11:09

ciao, sono nuovo del forum, studio Economia e avrei bisogno di un vostro aiuto per il problema che vi spiego subito.

Ho un dataset di record così composti:
7 variabili, x1,...,x7 tutte numeriche intere positive, due variabili x8=f(x1,...,x7) e x9=g(x3,...,x7) e una dicotomica x10.

Le funzioni f e g non sono note a priori, quello che serve a me è un modello che mi permetta di prevedere x10 nei due casi:
in relazione a {x1,...,x8} e in relazione a {x3,...,x9}.

Avevo pensato per le funzioni f e g di utilizzare una regressione lineare multipla e poi predire x10 in base alla differenza tra il valore predetto di x8 (x9) e il valore effettivo. Questo però mi porterebbe a non tenere in conto per le previsioni i valori del training set della x10...

Avevo pensato anche alla regressione logistica, ma come applicarla?? Altre idee?

Spero di essere stato sufficientemente chiaro, grazie mille a chi mi aiuterà (o cercherà di farlo :D )

P.S. Dimenticavo: che software utilizzare per le analisi?? Il dataset è disponibile sia in csv,xls,mdb...
data_miner
Starting Member
Starting Member
 
Messaggio: 1 di 1
Iscritto il: 23/06/2009, 10:51

Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite