ciao, sono nuovo del forum, studio Economia e avrei bisogno di un vostro aiuto per il problema che vi spiego subito.
Ho un dataset di record così composti:
7 variabili, x1,...,x7 tutte numeriche intere positive, due variabili x8=f(x1,...,x7) e x9=g(x3,...,x7) e una dicotomica x10.
Le funzioni f e g non sono note a priori, quello che serve a me è un modello che mi permetta di prevedere x10 nei due casi:
in relazione a {x1,...,x8} e in relazione a {x3,...,x9}.
Avevo pensato per le funzioni f e g di utilizzare una regressione lineare multipla e poi predire x10 in base alla differenza tra il valore predetto di x8 (x9) e il valore effettivo. Questo però mi porterebbe a non tenere in conto per le previsioni i valori del training set della x10...
Avevo pensato anche alla regressione logistica, ma come applicarla?? Altre idee?
Spero di essere stato sufficientemente chiaro, grazie mille a chi mi aiuterà (o cercherà di farlo )
P.S. Dimenticavo: che software utilizzare per le analisi?? Il dataset è disponibile sia in csv,xls,mdb...