Ciao a tutti!
[Perdonatemi per il post chilometrico che segue, mi sono reso conto solo dopo di aver scritto così tanto.
Spero almeno possa nascerne una discussione che sia utile a quelli che investiranno un pò del loro tempo nel leggerla.
Vi anticipo che il post riguarda la modellizzazione e lo studio di un problema reale di calcolo delle probabilità; mi son reso conto infatti che ciò non è mai così semplice come potrebbe sembrare e si finisce spesso o per iper semplificare o (come ne mio caso) per cadere vittima della cosidetta "paralysis by analysis" ]
Per facilitarvi la comprensione del problema sul quale mi sto scervellando da qualche giorno devo farvi un breve incipit dato che proviene dalla realtà e non sono ancora pervenuto ad una sua formulazione chiara e precisa in termini matematici.
Nell'ultimo mese ho iniziato a lavorare part-time in una azienda che produce componenti per l'elettronica, e tra le altre cose si producono contatori di energia elettrica, quelli che tutti abbiamo in casa per intenderci.
Prima di essere terminati e imballati, questi contatori devono superare una fase di "calibrazione" in cui vengono tarati e testati per essere sicuri che effettuino delle misurazioni corrette.
Nel reparto di calibrazione dove lavoro sono presenti 4 macchine diverse gestite da noi operai che ci occupiamo di caricare su di esse dei contatori da calibrare, dare l'avvio e poi scaricarli al termine del processo. Ogni macchina lavora indipendentemente dalle altre e ha un suo tempo di lavorazione che può variare sensibilmente nel caso ci fossero dei contatori che non superano qualche test. Al termine di ogni calibrazione i risultati vengono registrati su un database e viene salvata anche la data esatta in cui la calibrazione è terminata nel formato yyyy-mm-dd time24.
Questa data viene poi utilizzata dai sistemi informatici per assegnare una sigla "univoca" alla run di calibrazione, ovvero all'insieme dei contatori che l'hanno effettuata nello stesso momento sulla stessa macchina.
Come potrete intuire, dato che può succedere che due calibrazioni di due macchine diverse terminino nello stesso identico momento (ora, minuti e secondi), può succedere che due run di calibrazione di macchine diverse finiscano per avere la stessa sigla. Conseguenza: l'unicità va farsi benedire e ciò manda in crisi alcune schermate dei sistemi informatici che non considerano questa evenienza.
E ciò è quello che è effettivamente successo qualche giorno fa
Adesso, al di là del fatto che per ovviare a ciò basterebbe considerare anche la macchina sulla quale è stata effettuata la calibrazione oltre alla data, ho iniziato a pensare a quale poteva essere la probabilità che si verificasse un evento del genere.
Quindi, qual'è la probabilità che un evento del genere accada in un arco temporale di che so, n ore, un giorno, m giorni? E se invece volessi sapere quanti giorni devono passare prima di avere una probabilità del x% che si verifichi?
La prima cosa che mi è venuta in mente è stata il paradosso del compleanno, per cui ho pensato "si, effettivamente in un periodo temporale di qualche giorno al massimo è un evento abbastanza probabile".
Poi però cercando di fare qualche calcolo ho realizzato che non si trattava di un semplice problema di calcolo combinatorio: le calibrazioni di una stessa macchina non possono avere "slot temporali" a caso ma devono essere quanto meno distanziati del tempo di lavorazione di quella macchina, questi tempi di lavorazione nella realtà non sono ben precisi ma variabili entro un certo range, le persone che gestiscono le macchine non avviano la calibrazione successiva esattamente al termine di quella precedente...
Insomma per poter fare qualche calcolo ed essere più fedeli alla realtà bisogna aggiungere altre ipotesi e informazioni, e così mi ritrovo travolto dalla sola formalizzazione di un problema che all'apparenza mi sembrava così semplice.
Ma quindi, in sostanza, come procedo? Ipotizzo che i tempi di avvio delle macchine da parte degli operai al termine di una calibrazione abbiano una distribuzione di probabilità uniforme in un range di tempo determinato? Stessa cosa per i tempi di lavorazione delle macchine?
E dopo, se anche ipotizzassi ciò, come farei effettivamente a calcolare la probabilità che mi interessa?
Aspetta, aspetta, e se invece così facendo stessi solo esagerando e complicando inutilmente il problema?
Insomma, come si procede quando si ha a che fare con problemi del genere?
Mi piacerebbe sentire il parere di qualcuno con più esperienza di me
Per i moderatori: ho ritenuto che la domanda andasse oltre un semplice quesito di probabilità e statistica per cui ho voluto postarlo in questa sezione, nel caso in cui fosse sbagliato mi scuso in anticipo!