Salve a tutti!
Mi sto approcciando solo ora alla statistica (me ne vergogno) e mi era sorto un dubbio: io so che per fare degli esperimenti su dei dati reali sarebbe opportuno scegliere un sottoinsieme di questi dati (che si suppone essere enorme) in maniera tale che ogni campione risulti essere rappresentativo della popolazione, ovvero si scelgono gli elementi del campione in maniera casuale. Ora, se io volessi avere più di un campione sul quale effettuo diversi esperimenti (che sono comunque correlati, come ad esempio il comportamento di sistemi sotto uno stesso stimolo ma in ambienti diversi), avrei anche bisogno che tali campioni siano ANCHE di uguale grandezza (per lo meno in misura approssimativa) poiché statistiche descrittive come media e varianza (campionaria, ovviamente) hanno maggior senso solo su insiemi con quanto più simile cardinalità.
Qual è la scelta migliore che posso fare per avere rappresentatività e ugual cardinalità dei campioni (estendendosi anche a più di due campioni)? Partizionare un campione grande in più insiemi va bene oppure è meglio prendere elementi a caso e assegnarli ad una partizione a caso finché non ottengo degli insiemi di uguale cardinalità (con la consapevolezza di poter arrivare ad avere tutti gli elementi in una sola partizione, teoricamente)?