Sono perfettamente d'accordo con quanto dici, in particolare faccio mio quello che dici qui.
markowitz ha scritto:Ma la domanda che veramente ti interessa alla fine qual'è? E' prima di tutto questa la domanda a cui rispondere in modo non equivoco.
Diciamo che la la domanda/obbiettivo è capire se l'estrazione del Lotto è "regolare" oppure no. Quindi è domanda molto generale/ambiziosa.
Lo si può valutare partendo dai dati sull'ambo $ 17,56 $ ? Sicuramente è un punto di partenza valido, e la risposta sarebbe:
- se avevamo osservato che l'ambo $ 17,56 $ è stato assente per 6000 estrazioni sulla ruota di Bari senza sapere nient'altro potevamo concludere che come si suol dire, oltre ogni ragionevole dubbio, l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?
- se avevamo osservato che l'ambo $ 17,56 $ è stato assente per 6000 estrazioni sulla ruota di Bari ed è anche quello più ritardatario su detta ruota senza sapere nient'altro potevamo concludere, con qualche dubbio in più ma comunque quasi con sicurezza, che l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?
- se avevamo osservato che l'ambo $ 17,56 $ è stato assente per 6000 estrazioni sulla ruota di Bari ed è anche quello più ritardatario su ogni ruota senza sapere nient'altro potevamo concludere, con non troppa sicurezza, che l'estrazione non è regolare.
Ma è vero che non sapevamo nient'altro ?
Però quando scrivi questo:
markowitz ha scritto:Focalizzarsi sull'ambo è un'ottica coerente ma troppo miope, si deve trattare in qualche modo di tutta la distribuzione è in effetti è questa la base informativa più ampia che abbiamo, e se conosciamo le estrazioni l'abbiamo, a cui possiamo e dovremmo fare in qualche modo riferimento ... ed appunto qualche perchè il modo non è uno solo ... anche se forse uno migliore esiste. In passato avevo fatto qualche prova in questo senso ed il risultato era che le estrazioni erano verosimili.
non capisco in pratica come si potrebbe procedere.
Anzi forse qualcosa intuisco, ma mi sorgono molte domande....
Se per un attimo ci spostiamo dal lotto al lancio di una moneta (che è un ambito un po' più ristretto) per verificare analogamente se, data una sequenza di N lanci, la moneta sia truccata o no, mi vengono per ora in mente due strade.
La prima è simile a quella che stavo seguendo per i lotto: conto il numero di T e C della sequenza e vedo che probabilità avrei in una sequenza di N lanci di ottenere un numero di T (appurato per esempio che nella sequenza abbia T > C) maggiori o uguali di quelle ottenute nella sequenza in oggetto, se ottengo una probabilità molto bassa dico che l'evento è sospetto.
Un secondo diverso modo di procedere potrebbe essere dividere la sequenza in tante sotto-sequenze di stessa lunghezza, ora data la lunghezza della sotto-sequenza so come è fatta la distribuzione discreta teorica della frequenza di teste e di croci, a questo punto la mia ipotesi nulla è che le diverse frequenze misurate nelle sotto-sequenze possano appartenere alla distribuzione discreta di T e C di lunghezza pari a quella delle sotto-sequenze, faccio un test (non so quale ma sicuramente ce ne è uno adatto per questo) e vedo la significatività per decidere se rigettare o no l'ipotesi nulla e dire quindi se la sequenza è sospetta o meno.
Non mi viene in mente niente altro infatti per fare un confronto con una distribuzione discreta nota.
Cosa altro potrei fare in questo caso? Ha senso il modo di procedere che ho scelto? Se sì, in base a cosa scelgo la lunghezza delle sotto-sequenze?
Come estendo poi questo all'esempio del lotto? Controllo usando le ultime 6000 estrazioni solo le frequenze di tutti i 90 numeri?
In qualche modo non dovrei controllare le frequenze di uscita di tutti i vari ambi e confrontare pure quelli con la relativa distribuzione teorica nota. Come?
Spero di esser riuscito a chiarire cosa intendo e di non aver usato un linguaggio improprio (ho detto tante volte che sono un dilettante riguardo a questi argomenti).