Come da titolo, come posso verificare se il mio algoritmo di machine learning approssima bene verso ε-Nash?
Esiste un qualche tipo di simulazione che posso fare?
Farlo giocare contro se stesso mi sembra un pò sick in quanto, giocando allo stesso modo, anche se sono scarsi potrebbero comunque pareggiare.
Ho pensato a queste soluzioni:
1) Riprogrammare il tutto con altri algoritmi di machine learning quali (ne scrivo un pò così nel caso manchi qualcuno potete consigliarmelo voi): MTCS (vers. Smooth IS-UCT), Ficititous Self-Play, qualcosa con Bayes;
2) Farlo giocare contro un algoritmo genetico e vedere se l'algoritmo genetico riesce a sviluppare una rete neurale che sia migliore del risultato ottenuto dall'algoritmo;
3) Giocarci contro;
La terza è l'ultima spiaggia...
Grazie
p.s. io uso il Counterfactual Regret Minimization ed è un gioco sequenziale a frequenze (perciò formule come il q learning non vanno)