Analisi dati - Parametro più influente sul risultato

Messaggioda Gil_88 » 09/11/2022, 19:36

Buonasera a tutti, sono alla ricerca di consigli su come analizzare dei dati con cui sto avendo a che fare in questo momento. Vi racconto in breve la situazione cercando di essere il più esaustivo e chiaro possibile.

Ho simulato un sistema, caratterizzato da 3 parametri variabili, misurandone le prestazioni tramite 5 indici che ho scelto io. I 3 parametri hanno un certo range di variabilità: ho effettuato 50 simulazioni facendo variare ogni volta questi parametri entro il loro range, cercando di coprire nella maniera migliore possibile tutto lo spazio di variabilità (ho usato l'algoritmo di Sobol per determinare il valore di ciascun parametro ad ogni prova).

Ho ottenuto perciò di volta in volta dei risultati diversi per i 5 indici prestazionali che ho scelto.

Quello che vorrei fare adesso è determinare l'influenza della variazione di ciascun parametro sul risultato totale. Credo che questa operazione si chiami Sensitivity Analysis, ma non ho la minima idea di come farla e tutti i software che permettono di eseguirla hanno licenze abbastanza costose.

Le mie domande perciò sono:

- La Sensitivity Analysis è la maniera corretta per raggiungere il mio obiettivo?
- In che modo si esegue una Sensitivity Analysis senza ricorrere a software specifici (i miei dati sono su xls)
- Ci sono procedure di analisi dati che potrei eseguire in alternativa per capire qual è il peso del singolo parametro sul risultato finale? Quali sono?

Grazie in anticipo a chiunque sarà disponibile a darmi una mano, resto a disposizione per ulteriori chiarimenti.
Gil_88
Starting Member
Starting Member
 
Messaggio: 1 di 1
Iscritto il: 09/11/2022, 19:21

Re: Analisi dati - Parametro più influente sul risultato

Messaggioda ingres » 17/11/2022, 21:11

Ci sono diversi metodi per comprendere quali dati sono più significativi. Ad esempio si può utlizzare la PCA (Principal Component Analysis).
Ma comunque sono tecniche che richiedono SW specifici. Un metodo semplice per ottenere il risultato con Excel potrebbe essere il seguente:

1) supponendo che i 3 parametri, che ho capito essere i tuoi ingressi all'analisi, siano tra loro indipendenti conviene normalizzarne i valori ad es. tramite la formula:
$X_n = X/(X_max- X_min)$
In questo modo sterilizziamo eventuali fattori di scala fuorvianti.

2) Si prendono le colonne con i dati di ingresso normalizzati e il valore di uscita (il singolo indice oppure il risultato totale) e si effettua con Excel una Regressione multivariata. A tale scopo devi avere attiva sotto Dati l'opzione Analisi Dati (se no aggiungi dai tools disponibili). Ti comparirà una finestra con diversi algoritmi. Seleziona Regressione e ti comparirà una finestra in cui sotto Ingresso Y devi inserire la colonna con i valori di uscita e sotto Ingresso X le 3 colonne con i valori di ingresso (meglio se le colonne sono adiacenti).

3) Dato OK, comparirà un foglio aggiuntivo con i risultati. In particolare sono importanti i coefficienti X Variabile 1, 2,3 che rappresentano i "guadagni" associati alle variabili X1, X2, X3. Ovviamente quanto maggiore è il guadagno (in modulo) tanto maggiore è l'influenza sul risultato. ATTENZIONE: controlla che l'errore sul coefficiente (colonna accanto al valore del coefficiente) sia comunque ragionevole. Se tale errore è molto alto, superiore allo stesso coefficiente, può essere che il parametro non abbia influenza oppure che tale influenza sia fortemente non lineare.
Chi non vorrà attingere ad altra intelligenza che alla sua, si troverà ben presto ridotto alla più miserabile di tutte le imitazioni: a quella delle sue stesse opere (Ingres)
ingres
Senior Member
Senior Member
 
Messaggio: 37 di 1718
Iscritto il: 30/10/2022, 11:45


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite