mah...
Primo punto: il numero esatto della fila non si può sapere perché i dati sono parzialmente accorpati....dalla tabella riassuntiva dei dati non sappiamo cosa in realtà significhi $>=4$.
Ti faccio un esempio: Una delle possibili realizzazioni campionarie potrebbe essere questa
Sani fra due malati | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|
Freq | 50 | 23 | 14 | 8 | 2 | 1 | 1 | 1 |
| | | | | | | | |
Come spesso accade in Statistica (dovresti saperlo visto che fai già la magistrale) frequenze molto ridotte vengono accorpate (vedi ad esempio il test chi-quadro
1)
Però si nota subito come le frequenze siano molto molto decrescenti al crescere di S ed è alquanto improbabile che si vada oltre 6/7 alberi sani consecutivi. Quindi qui dobbiamo fare per forza una scelta: scegliamo
2 di porre il $>=4$ come $S=5$ e la cosa non ci disturba più di tanto....
Ora la tua tabella diventa
A questo punto ragioni:
Per avere zero sani fra due malati devi avere una sequenza così $"MMMMMM$
Per avere 2 sani fra due malati consecutivi devi avere una sequenza così $"SSM"-"SSM"$
Quindi il totale degli alberi è questo
$50xx1+23xx2+14xx3+8xx4+5xx6=200$ più 1 perchè la fila deve iniziare e finire con un malato.
I totali dei sani sono $1xx23+2xx14+3xx8+5xx5=100$
In definitiva la tua verosimiglianza è
$L(theta) prop theta^100(1-theta)^101$
^^^^^^^^^^^^^^^
Se si fatica a fare questi semplici ragionamenti, è opportuno iniziare con degli insiemi più ridotti, ad esempio
1) proviamo a mettere giù un esempio (uno qualunque, ma ne puoi provare quanti ne vuoi) che rispetti i vincoli del testo
$"M-M-M-M-M-S-M-S-M-S-M-S-S-M-S-S-M-S-S-S-M"$
ci sono 21 alberi in totale con 10 sani
2) Verifichiamo che il precalcolo del numero totale di alberi sia corretto:
$4xx1+3xx2+2xx3+1xx4+1=21$ alberi totali, di cui sani
$1xx3+2xx2+3xx1=10$
le formule che abbiamo costruito sono corrette.
Fine del problema