Il problema è questo. Abbiamo di fronte a noi $n$ domande a crocette, ognuna delle quali propone $r$possibili risposte, ma una sola è quella corretta. Non so assolutamente di cosa parlino (o quasi), l’unica è tirare ad indovinare, per cui avremo:
$P(\text{risposta corretta})= 1/r$
$P(\text{risposta sbagliata})= 1- 1/r $
N.B.: ho parlato di un test formato da $n$ domande da sparare a caso. Con $n$ ci si può riferire indifferentemente a tutte le domande che ci sono in un test o, se siamo stati abbastanza bravi da rispondere già a qualche quesito del compito, solamente ai quesiti residui.
Il problema che mi pongo è: come massimizzare la probabilità di eguagliare (o superare) una soglia di punteggio, tipicamente la sufficienza.
Tipicamente i punteggi delle risposte che daremo seguono uno schema del genere:
- risposta corretta -> 1 punto (si potrebbe anche generalizzare, ma è irrilevante)
- Risposta non data -> 0
- Risposta sbagliata -> $\pi_s$
Il minore o uguale indica che ad ogni risposta sbagliata può essere associato o un punteggio nullo (nei casi migliori), o un punteggio negativo che contribuirà ad abbassare il voto. La somma algebrica dei punteggi di ogni domanda determina il voto finale.
La relazione che lega i punteggi è: $\pi_s \leq 0<1$ e, se il test è ben costruito, è fatto in maniera tale che il valore atteso del punteggio di ogni domanda sia $0$, questo per cercare di bilanciare l'effetto tirare ad indovinare.
Il problema è questo, se io ho $n$ domande a cui non so rispondere dalle quali devo ricavare almeno $\sigma$ punti quante delle $n$ domande mi converrebbe sparare a caso?
Il nostro test a crocette è una serie di prove indipendenti che possono avere solo due esiti: successo (con $p=1/r$) fallimento. Si tratta quindi di un processo di Bernoulli.
Ho fatto qualche simulazione (facendo anche variare il peso della penalità si risposta sbagliata). Ho notato che spesso si devono tirare a caso tutte o quasi le $n$ domande per massimizzare la probabilità di raggiungere i $\sigma$ punti. Non ho trovato tuttavia una generalizzazione di tale formula che definisse una "best practice" in forma chiusa.
Secondo voi c'è modo di generalizzare un risultato?
Ciao