Dilemma probabilistico

Messaggioda SnakePlinsky » 28/06/2007, 16:01

Un saluto a tutti.

Quello che ora propongo non è propriamente un gioco matematico, ma piuttosto un dilemma teorico.

Supponiamo di giocare con una moneta non truccata, quindi con p_testa = 1/2 e p_croce = 1/2.
Se esce croce vinco 1, se esce testa perdo 1.
La mia vincita totale al tempo t è data dalla somma di vincite e perdite.

Il valore atteso ad ogni lancio è pari a 1/2*1 + 1/2*(-1) = 0. Siccome sono eventi indipendenti il valore atteso in epoca zero della vincita dopo t lanci è pari alla somma dei valori attesi ed è quindi pari a 0. Più precisamente, poiché questa successione gode della proprietà di martingala, il valore condizionato della vincita in i conosciuto il valore in j , j<i, è pari al valore in j (proprietà di martingala).
La successione delle mie vincite è una cosiddetta catena di Markov, "quindi" una Random Walk (…)

Se faccio infinite prove e t tende ad infinito il valore medio delle mie vincite in t tende a zero (per il teorema centrale del limite).

Fin qui nessun problema.

ORA SUPONIAMO CHE SE VINCO, AL PROSSIMO LANCIO PUNTO 1, MENTRE SE PERDO RADDOPPIO, AD OGNI LANCIO, FINO A CHE NON VINCO: QUANDO QUESTO ACCADE, PUNTO DI NUOVO 1. (è definita progressione con raddoppio). Nota: ho a disposizione un capitale infinito per giocare quindi NON CI SONO PUNTATE MASSIME.

Ora io mi attendo, in epoca zero, che il valore atteso della vincita in t sia zero, poichè è dato dalla somma di valori attesi paria zero (infatti ad ogni puntata il mio valore atteso è: 1/2*puntata - 1/2*puntata =0: il valore della puntata non può incidere sul valore della vincita attesa).
L’entità della puntata non dovrebbe incidere sul valore atteso della vincita in un qualunque tempo t.

Ma probabilmente mi sfugge qualcosa, poiché se utilizzata nella pratica, questa strategia (conosciuta come “progressione con raddoppio”) mi da una vincita positiva e crescente nel tempo: come è possibile ciò?

Una somma di valori attesi tutti pari a zero mi dovrebbe dare un valore atteso pari a zero, eppure non è così.

Ecco il codice matlab se qualcuno volesse fare una simulazione:

%%%%%%%%MArtingala con raddoppio%%%%%%%
%%%%%%%%si punta su Croce (--> se la realizzazione
%%%%%%%%di un White Noise risulta >0)
%%%%%%%%Se vinco intasco la puntata e ripunto 1,
%%%%%%%%se viene Testa raddoppio la puntata successiva fino
%%%%%%%%a che non vinco.
puntata=zeros(1000,1);
puntata(1,1)=1;
vincita(1,1)=0;
base=randn(1000,1);
for a=2:1000;
if base(a,1)>0;
vincita(a,1)=[(vincita(a-1,1) + puntata(a,1))];
puntata((a+1),1)=1;
else;
vincita(a,1)=[(vincita(a-1,1) - puntata(a,1))];
puntata((a+1),1)=[puntata(a,1)*2];
end;
end;

Un saluto
Avatar utente
SnakePlinsky
Junior Member
Junior Member
 
Messaggio: 4 di 470
Iscritto il: 22/06/2007, 13:15
Località: New York 1997 AD

Messaggioda SnakePlinsky » 28/06/2007, 21:47

Bene, siccome mediamente c'è una risposta al post per 47 visite, non mi rimane che attendere altre 23 visite.
Avatar utente
SnakePlinsky
Junior Member
Junior Member
 
Messaggio: 5 di 470
Iscritto il: 22/06/2007, 13:15
Località: New York 1997 AD

Messaggioda kinder » 29/06/2007, 13:56

considera una successione infinita di lanci della moneta, che possiamo rappresentare con una successione di 0 e 1, per esempio associando a 0 l'insuccesso ed a 1 il successo.
Ipotizziamo che la successione non contenga infiniti zeri consecutivi, e prendiamo in considerazione una qualunque successione finita di zeri consecutivi della successione data (includendo anche il caso un cui la successione consista di un solo zero avente uno ai suoi lati), più l'uno immediatamente alla sua destra, che ricordiamo essere una vincita. Questa serie di lanci, secondo la strategia del raddoppio, avrà sempre come risultato netto 1.
Possiamo allora immaginare di costruire una nuova successione partendo dalla prima, nella quale sostituiamo tutti gli zeri e l'uno immediatamente successivo con un semplice uno.
Avremo così una successione di infiniti 1.
kinder
Senior Member
Senior Member
 
Messaggio: 385 di 1122
Iscritto il: 28/10/2006, 18:28
Località: Firenze, ma meridionale per origine e natura

Messaggioda Piera » 29/06/2007, 16:14

Piera
Average Member
Average Member
 
Messaggio: 792 di 923
Iscritto il: 17/06/2005, 21:43

Messaggioda SnakePlinsky » 30/06/2007, 01:13

Un grazie a Kinder e Piera per le risposte.

Il paradosso di San Pietroburgo non lo conoscevo. Comunque non riesco a risolvere il mio dilemma: per quale motivo una somma di valori attesi non condizionati tutti uguali a zero mi da un numero positivo nella pratica (e crescente tendenzialmente in ragione 1/2)?

X Kinder: ti seguo, intuitivamente si capisce perchè la strategia è vantaggiosa. Il problema è che non riesco a spiegarmelo teoricamente, probabilmente commetto un errore di definizione del problema riguardo al valore atteso, ma non riesco a capire quale.

Ecco le immagini:

[img=http://img504.imageshack.us/img504/6707/unoraddoppioyl3.th.jpg]

e senza 50 simulazioni senza raddoppio:

[img=http://img528.imageshack.us/img528/8707/50senzaraddoppioqf8.th.jpg]
Avatar utente
SnakePlinsky
Junior Member
Junior Member
 
Messaggio: 6 di 470
Iscritto il: 22/06/2007, 13:15
Località: New York 1997 AD

Messaggioda kinder » 01/07/2007, 12:15

per dire con certezza qual'è l'errore ci dovrei pensare. Preliminarmente credo che l'errore potrebbe risiedere nel fatto che tu consideri il valore atteso come se ti trovassi di fronte ad eventi completamente indipendenti. In realtà, mentre ciò può essere vero per quanto riguarda l'esito del lancio della moneta (testa o croce), ciò sicuramente non è vero per quanto riguarda la definizione della puntata, la quale dipende proprio dall'esito dei lanci precedenti.

Secondo me il calcolo che fai tu presuppone una definizione a priori della progressione della puntata, indipendente dall'esito dei lanci precedenti.
kinder
Senior Member
Senior Member
 
Messaggio: 386 di 1122
Iscritto il: 28/10/2006, 18:28
Località: Firenze, ma meridionale per origine e natura

Messaggioda SnakePlinsky » 12/07/2007, 13:51

Più di 300 visite, è statisticamente ora che qualcuno risponda...

Ora vi mostro questa dimostrazione che dice sostanzialmente che non si può guadagnare con una progressione (ovvero il mio dilemma), quando si ha una probabilità di vincita minore di 0.5. Ora dalle mie simulazioni con Matlab risulte il contrario, la strategia del raddoppio ha vincita positiva anche con p di vincita < 0.5 (ma non troppo minore), avendo a disposizione un capitale infinito.

Mathematical Proof that Progressions cannot overcome Expectation.
by Richard Reid
--------------------------------------------------------------------------------


In "The Casino Gambler's Guide," Allan Wilson provided a mathematical proof of the fallacy that a progression can overcome a negative expectation in a game with even payoffs. This article expands on Wilson's Proof and provides the proof that progression systems cannot overcome a negative expectation even if the game provides uneven payoffs.
Let bk = the size of the kth bet.
Mk = the size of the payoff on the kth bet.
pk = the probability that the series terminates with a win on the kth bet, having been preceeded by k-1 losses in a row.
n-1 = the greatest number of losses in a row that a player can handle, given the size of the player's bankroll. In other words, the nth bet must be won, otherwise the player's entire bankroll will be lost.

Let's now define Bn = bn * Mn

The expected value for any series is:

Eseries = p1B1 + p2(B2-b1) + p3(B3-b2-b1) + . . . + pn(Bn-bn-1-bn-2- . . . -b2-b1) + (1-p1-p2- . . . -pn) * (-bn-bn-1-bn-2- . . . -b2-b1)

If we let

Eseries = A + B where,

A = p1B1 + p2(B2-b1) + p3(B3-b2-b1) + . . . + pn(Bn-bn-1-bn-2- . . . -b2-b1)

and

B = (1-p1-p2- . . . -pn) * (-bn-bn-1-bn-2- . . . -b2-b1)

then it is easier to see that "A" represents the probability that the series will end with a win multiplied by the bet size at the nth term in the series and "B" is the probability that the series ends in a loss multiplied by the net loss.

Now let's rearrange the terms in "A."

A = p1B1 + p2B2 - p2b1 + p3B3 - p3b2 - p3b1 + . . . + pnBn - pnbn-1 - pnbn-2 - . . . - pnb2 - pnb1
A = p1B1 + p2B2 + . . . + pnBn + b1(- p2 - p3 - . . . - pn) + b2(- p3 - . . . - pn) + bn-2(- pn-1 - pn) + bn-1(- pn)

And for "B" we get

B = -bn(1 - p1 - p2 - . . . - pn) - bn-1(1 - p1 - p2 - . . . - pn) - . . . - b2(1 - p1 - p2 - . . . - pn) - b1(1 - p1 - p2 - . . . - pn)

Now if we combine A and B again, we get,

Eseries = A + B
Eseries = p1B1 + p2B2 + . . . + pnBn - b1(1 - p1) - b2(1 - p1 - p2) - . . . - bn-1(1 - p1 - p2 - . . . - pn-1) - bn(1 - p1 - p2 - . . . - pn)
Eseries = p1B1 + p2B2 + . . . + pnBn + p1b1 + (p2 + p1)b2 + (p3 + p2 + p1)b3 + . . . + (pn + pn-1 + . . . + p2 + p1)bn - (b1 + b2 + . . . + bn)

Wilson points out that to get rid of the subscripts, all we have to do is realize that pk = (1-p)k-1p, where p is the probability of a win on an individual play and 1-p is the probability of a loss. If we think about it, it makes sense that the probability of a series terminating in a win at the kth level is the product of the probability of k-1 losses in a row multiplied by the probability of win on the kth trial.

So how do we use this information? Well, let's try substituting this expression for each pk and see what we get.

Eseries = (1-p)1-1pB1 + (1-p)2-1pB2 + . . . + (1-p)n-1pBn + (1-p)1-1pb1 + ((1-p)2-1p + (1-p)1-1p)b2 + ((1-p)3-1p + (1-p)2-1p + (1-p)1-1p)b3 + . . . + ((1-p)n-1p + (1-p)n-1-1p + . . . + (1-p)2-1p + (1-p)1-1p)bn - (b1 + b2 + . . . + bn)

Simplifying, we get

Eseries = (p(1-p)0B1 + (1-p)1pB2 + . . . + (1-p)n-1pBn + p(1-p)0b1 + ((1-p)1p + (1-p)0p)b2 + ((1-p)2p + (1-p)1p + (1-p)0p)b3 + . . . + ((1-p)n-1p + (1-p)n-2p + . . . + (1-p)1p + (1-p)0p)bn - (b1 + b2 + . . . + bn)

If we factor p out of the first parts of the equation and look closely, we can see that the kth term T can be written as:

T = p[(1-p)k-1]Bk + p[(1-p)k-1 + (1-p)k-2 + . . . + (1-p)2 + (1-p)1 + (1-p)0]bk

or rephrased for Bk = bk * Mk we get

T = p[(1-p)k-1Mk + (1-p)k-1 + (1-p)k-2 + . . . + (1-p)2 + (1-p)1 + (1-p)0]bk

If we substitute

C = (1-p)k-1 + (1-p)k-2 + . . . + (1-p)2 + (1-p)1 + (1-p)0

and if we multiply C by (1-p) and call this D

D = (1-p)C = (1-p)k + (1-p)k-1 + . . . + (1-p)3 + (1-p)2 + (1-p)1

Now, if we subtract C from D, we get

D - C = (1-p)C - C = (1-p)k - (1-p)0
[(1-p) - 1]C = (1-p)k - (1-p)0
C = [(1-p)k - 1]/[(1-p) - 1] or
C = [(1-p)k - 1]/-p]


Now if we substitute C back into T, we get

T = p[(1-p)k-1Mk + [(1-p)k - 1]/-p]bk
T = p(1-p)k-1Mk + 1 - (1-p)k]bk
T = p(1-p)k-1Mk + 1 - (1-p)(1-p)k-1]bk
T = [[pMk - (1-p)](1-p)k-1 + 1]bk This now allows us to write the equations in terms of summations. We therefore get

Eseries = sum {[[pMk - (1-p)](1-p)k-1]bk} + sum {bk} - sum {bk}, for k = 1 to n

The last two terms cancel, so we are left with:

Eseries = sum {[pMk - (1-p)](1-p)k-1]bk}, for k = 1 to n
Eseries = sum {[(1+Mk)p - 1](1-p)k-1]]bk}, for k = 1 to n

If we now look closely at this equation, we can make several observations. First, the sign of Eseries depends solely on the resulting sign of [(1+Mk)p - 1]. To make things a little easier to follow, let's say we're dealing with a game that has even payoffs. This means that Mk = 1 and therefore
Eseries = sum {[2p - 1](1-p)k-1]]bk}, for k = 1 to n
Eseries = [2p - 1]sum {(1-p)k-1]]bk}, for k = 1 to n

Now it is a little easier to see what is going on. For example, if we are in an unfair game, then p < 0.5 and we can easily see that 2p-1 will be a negative value. For example, if our chance of winning is only 49%, then p = 0.49 and 2p-1 = -0.02. In an even game, p = 0.5 and we see that 2*0.5-1 = 0. In this case, the equation is telling us that in an even game the expected value is zero just as we would expect it should. If we are playing a game with an advantage, then p > 0.5 and 2p-1 will be positive.

The general formula for uneven payoffs work just as well, but is more complicated to understand. Suffice to say that if [(1+Mk)p - 1] is negative, then regardless of the progression, the game will eventually result in a loss for the player.

Hopefully, this post will provide definitive proof of the fallacy of trying to overcome a negative expectation by using any type of progression whether it be the martingale or some other modern progression.
Avatar utente
SnakePlinsky
Junior Member
Junior Member
 
Messaggio: 29 di 470
Iscritto il: 22/06/2007, 13:15
Località: New York 1997 AD

Re: Dilemma probabilistico

Messaggioda Fioravante Patrone » 21/08/2007, 16:18

SnakePlinsky ha scritto:Supponiamo di giocare con una moneta non truccata, quindi con p_testa = 1/2 e p_croce = 1/2.
Se esce croce vinco 1, se esce testa perdo 1.
La mia vincita totale al tempo t è data dalla somma di vincite e perdite.

Il valore atteso ad ogni lancio è pari a 1/2*1 + 1/2*(-1) = 0. Siccome sono eventi indipendenti il valore atteso in epoca zero della vincita dopo t lanci è pari alla somma dei valori attesi ed è quindi pari a 0. Più precisamente, poiché questa successione gode della proprietà di martingala, il valore condizionato della vincita in i conosciuto il valore in j , j<i, è pari al valore in j (proprietà di martingala).
La successione delle mie vincite è una cosiddetta catena di Markov, "quindi" una Random Walk (…)

Se faccio infinite prove e t tende ad infinito il valore medio delle mie vincite in t tende a zero (per il teorema centrale del limite).

Fin qui nessun problema.

ORA SUPONIAMO CHE SE VINCO, AL PROSSIMO LANCIO PUNTO 1, MENTRE SE PERDO RADDOPPIO, AD OGNI LANCIO, FINO A CHE NON VINCO: QUANDO QUESTO ACCADE, PUNTO DI NUOVO 1. (è definita progressione con raddoppio). Nota: ho a disposizione un capitale infinito per giocare quindi NON CI SONO PUNTATE MASSIME.

Ora io mi attendo, in epoca zero, che il valore atteso della vincita in t sia zero, poichè è dato dalla somma di valori attesi paria zero (infatti ad ogni puntata il mio valore atteso è: 1/2*puntata - 1/2*puntata =0: il valore della puntata non può incidere sul valore della vincita attesa).
L’entità della puntata non dovrebbe incidere sul valore atteso della vincita in un qualunque tempo t.

Ma probabilmente mi sfugge qualcosa, poiché se utilizzata nella pratica, questa strategia (conosciuta come “progressione con raddoppio”) mi da una vincita positiva e crescente nel tempo: come è possibile ciò?

visto che vuoi essere pagato in natura...

lo sbaglio sta qui: "poiché se utilizzata nella pratica, questa strategia (conosciuta come “progressione con raddoppio”) mi da una vincita positiva e crescente nel tempo"

Non è vero. E' una illusione cognitiva, dovuta al fatto di trascurare eventi con probabilità piccola.
E per dirlo io, che non so niente di probabilità, devo avere solidi argomenti.

I miei argomenti sono solidi in quanto molto semplici.
Costruiamo l'albero degli eventi. O, per meglio dire, vediamo quali tutte le possibili vincite/perdite avvenute nei vari istanti con le loro probabilità
tempo 1: 2 storie possibili, con prob 1/2 cadauno: T o C. Vincite: -1 e 1. Risultato atteso: pareggio...
tempo 2: 4 storie possibili, con prob 1/4 cadauno: TT TC CT CC. Vincite (cumulate) rispettivamente: -3 1 0 2. Risultato atteso: pareggio...
tempo 3: 8 storie possibili, con prob 1/8 cadauno: TTT TTC TCT TCC CTT CTC CCT CCC. Vincite (cumulate) rispettivamente: -7 1 0 2 -2 2 1 3. Risultato atteso: pareggio...

Ti convince?
Magari non ho capito la domanda... :-D
Avatar utente
Fioravante Patrone
Cannot live without
Cannot live without
 
Messaggio: 1701 di 10811
Iscritto il: 09/06/2006, 19:18
Località: Temporaneamente a Novi Ligure ;-)

Messaggioda SnakePlinsky » 22/08/2007, 14:13

visto che vuoi essere pagato in natura...


:-D

o sbaglio sta qui: "poiché se utilizzata nella pratica, questa strategia (conosciuta come “progressione con raddoppio”) mi da una vincita positiva e crescente nel tempo"

Non è vero. E' una illusione cognitiva, dovuta al fatto di trascurare eventi con probabilità piccola.
E per dirlo io, che non so niente di probabilità, devo avere solidi argomenti.


è quello che ho pensato subito anch'io.

Il valore atteso ad ogni lancio è zero, qualsiasi sia la puntata: 1/2*puntata_qualsiasi -1/2*puntata_qualsiasi=0.

E dicevo: somma di valori attesi pari a zero = 0.

Poi ho fatto le simulazioni in matlab, con numeri grandi.

Poi ho discusso un pò: avendo a disposizione un capitale infinito, l'unica possibilità che la strategia fallisca è una serie infinita di croci, se punto testa.

C'era un contrasto, presunto, tra teoria e pratica.

Ma finalmente (forse) sono venuto a capo del problema ieri, parlando con una persona "qualificata": lo sbaglio è nella somma dei valori attesi, tutti zero, assumendo che siano eventi indipendenti. Invece non lo sono, poichè la puntata al tempo successivo è dipendente dal risultato al tempo precedente. La formalizzazione non so darla , ma questa spiegazione mi ha convinto... abbastanza
Avatar utente
SnakePlinsky
Junior Member
Junior Member
 
Messaggio: 51 di 470
Iscritto il: 22/06/2007, 13:15
Località: New York 1997 AD

Messaggioda Fioravante Patrone » 22/08/2007, 18:26

SnakePlinsky ha scritto:Poi ho discusso un pò: avendo a disposizione un capitale infinito, l'unica possibilità che la strategia fallisca è una serie infinita di croci, se punto testa.

C'era un contrasto, presunto, tra teoria e pratica.

Ma finalmente (forse) sono venuto a capo del problema ieri, parlando con una persona "qualificata": lo sbaglio è nella somma dei valori attesi, tutti zero, assumendo che siano eventi indipendenti. Invece non lo sono, poichè la puntata al tempo successivo è dipendente dal risultato al tempo precedente. La formalizzazione non so darla , ma questa spiegazione mi ha convinto... abbastanza


Io sono certo che la somma dei valori attesi è sempre zero, ad ogni "istante". Proprio perché ignorante in materia, ho adottato il punto di vista più semplice. Cioè ho riprodotto pedissequamente il tuo schema di gioco. Non ho usato assunzioni particolari di indipendenza (tranne quelle ovvie, ma tu non mi sembri il tipo che punta sui numeri in ritardo :-D ). Sì, è vero, lo fatto solo per 3 istanti, ma ho abbastanza abitudine alla mate da capire senza noiose prove per induzione che il discorso regge per ogni istante.

Notare che, nei mie due calcoletti, ho assunto che, dopo aver vinto, tu riprendessi a giocare. Se invece, dopo aver vinto 1, ti fermi, i numeri cambiano. Diventano, ad esempio:

tempo 1: 2 storie possibili, con prob 1/2 cadauno: T o C. Vincite: -1 e 1. Risultato atteso: pareggio...
tempo 2: 3 storie possibili, con prob 1/2 la prima e 1/4 le altre due: C TC TT. Vincite (cumulate) rispettivamente: 1 1 -3. Risultato atteso: pareggio... ($1/2 \cdot 1 + 1/4 \cdot 1 - 1/4 \cdot 3 = 0$)
tempo 3: 4 storie possibili, con prob ... Risultato atteso: $1/2 \cdot 1 + 1/4 \cdot 1 + 1/8 \cdot 1 - 1/8 \cdot 7 = 0$. Pareggio...

Mi piacerebbe conoscere la persona "qualificata". O, per lo meno, il dettaglio del suo argomento xhe ti ha convinto "abbastanza..."
Avatar utente
Fioravante Patrone
Cannot live without
Cannot live without
 
Messaggio: 1707 di 10811
Iscritto il: 09/06/2006, 19:18
Località: Temporaneamente a Novi Ligure ;-)

Prossimo

Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite