Ciao a tutti,
so che la risposta più immediata e sintetica a quanto chiederò è "studia bene statistica", in realtà, come ho avuto modo di dire qui varie volte, sono un dilettante della materia e mi sta bene rimanere tale (vedere queste cose ogni tanto per diletto e poco più), e quindi non saprei neanche cosa andare a cercare di preciso, pertanto anche un aiuto solo in tale senso mi basterebbe.
Il punto è questo.
L'altra sera stavo seguendo uno dei tanti dibattiti sull'opportunità di eseguire test sierologici per verificare la presenza di anticorpi al covid19. Una delle frasi dello scienzato di turno è stata più o meno "attenzione che allo stato attuale, considerando la soglia di incertezza dei test, una risposta positiva non dà grandi certezze e informazioni al singolo sul suo stato reale".
Cosa che io interpreto col fatto che data l'incidenza della malattia attuale (stimata tra il 10% e il 20% mi pare) e la sensibilità $s$ e specificità $k$ del test, la risposta non dà un valore predittivo positivo sufficientemente alto.
In effetti questo è vero, facendo due conti si trova che $s$ e $k$ dovrebbero essere ben superiori al 95% per avere valori accettabili di predittività (almeno per il valore predittivo positivo, per il negativo ovviamente il discorso è diverso, quindi qualche informazione e certezza al singolo in base al risutato c'è).
Poi lo stesso ha aggiunto: "quei test possono essere utili più per determinare con più precisione l'incidenza della malattia".
Da questo è venuto da chiedermi come si fa a fare un calcolo accurato della incidenza della malattia nella popolazione, usando quei test con quel dato $s$ e $k$?
La mia domanda in pratica è: supponiamo di sottoporre a test un certo numero di individui e di trovare un certo valore di incidenza, come si fa a determinare l'incertezza di tale valore di incidenza nota la qualità del test?
Mi viene da pensare che per rispondere a questa domanda ci si può aspettare che il risultato trovato di incidenza sia un sample di una variabile che segue una distribuzione gaussiana(?) con media sul valore vero di incidenza e con una certa deviazione standard, ma non saprei come trovare questa deviazione standard a partire dalla $s$ e $t$ del test, ammesso che quanto ho appena scritto, spero in termini non troppo sgangherati, sia corretto intanto....
Servirebbero altre informazioni?