tommik ha scritto:@markovitz
intanto bentornato...è un po' che non bazzichi da queste parti e non ti nascondo che i tuoi interventi sono sempre di alto valore aggiunto....quindi spero di risentirti presto.
Ti ringrazio.
E' vero negli ultimi tempi non ho frequentato molto il forum ...
però di recente ho postato:
viewtopic.php?f=34&t=172343Tu, che sei diventato anche moderatore, sei utente estremamente competente. Forse hai qualche suggerimento.
tommik ha scritto:Per quanto riguarda la discussione in oggetto non penso di aver detto sciocchezze. Cerco di spiegarmi meglio:
Penso non esista una relazione univoca tra il valore del pvalue e l'ampiezza del campione. Se il campione è piccolo, il pvalue può essere alto anche se la distribuzione del campione è consistente con l'ipotesi alternativa e viceversa, può essere basso anche se la distribuzione del campione è consistente con l'ipotesi di lavoro. Se invece il campione è grande il pvalue sarà alto o basso a seconda che il campionesia consistente con l'ipotesi di lavoro o con quella alternativa, rispettivamente.
infatti non ho mai affermato che tu abbia detto sciocchezze
e condivido ciò che hai affermato qui. Infatti ciò che dicevo non contraddice queste affermazioni.
Semplicemente affermavo che forse login aveva avuto un'intuizione giusta perché in effetti, sotto certe condizioni che mi sembrano abbastanza generali, all'aumentatre della numerosità il p-valore tende a diminuire. Tu invece dici che non c'è relazione univoca tra ampiezza del campione e p-valore.
Non intendo contraddire quello che hai affermato prima di tutto perché ... non è sbagliato. Tuttavia, a mio parere, non agevola la comprensione dello strumento
p-valore.
In altri termini tra le due posizioni non vi è vera contraddizzione ... ma mi costringi a chiarire meglio cosa io intenda con "sotto certe condizioni che mi sembrano abbastanza generali".
In breve:
per prima cosa mi limitavo a problemi posti nella forma, abbastanza usuale, del test a due code su un singolo parametro come quello impostato nell'esempio. Limitiamoci a questo.
Come seconda cosa, io considero come caso normale quello in cui l'ipotesi nulla è falsa. Nella logica del test le ipotesi andrebbero poste
a priori ovvero prima di vedere le stime ... capisci allora che ci vuole una bella fortuna a ipotizzare subito il valore "vero". Quello che dico riguarda la realtà non la didattica, l'esempio che fai tu riguarda proprio il caso speciale di ipotesi nulla vera ed allora avrai che, al contrario di quello che dicevo, il p-valore
tende a crescere con la dimensione del campione. Infatti dai dati che mostri si vede.
Da ultimo è chiaro che sono costretto ad usare la parola "tende" ... siamo sempre nel campo delle probabilità ... e peraltro a questo tende voglio dare solo l'intuizione non intendo attribuire alcuno speficico significato tecnico.
E' proprio per evitare questi problemi che avevo usato l'ipotesi semplificatrice di "distanza d'interesse costante". La distanza è chiaramente quella tra valore stimato e valore sotto la nulla $|mu - mu_0|$ e purtroppo nei casi concreti non resta costante. Al limite può anche valere che, nonostante la nulla sia falsa, la distanza sia nulla ... e quindi il p-valore unitario.
Nell'esempio che hai fatto non ho verificato i conti ma penso che il p-valore passando da 5 a 10 dati diminuisca perché la distanza aumenta ... cosa che, siccome la nulla è vera, non ci si attendeva ... ma chiaramente era comunque possibile.
Ancora possibile, ma decisamente più improbabile, è un aumento della varianza della media campionaria ... ma io proprio al diminuire di questa stavo facendo affidamento per parlare di p-valore che diminuisce con $n$ (ricordo che sottintendevo la nulla come falsa anche perché altrimenti era priva di senso la richiesta di distanza costante).