Calcolo media, mediana e differenza con media delle medie

Messaggioda LadyBaby03 » 05/10/2023, 17:59

Ciao a tutti,



Vorrei chiedere un chiarimento in merito al calcolo della media.



Facciamo un esempio: calcolare il nr medio di grammi di biscotti necessari per realizzare ricette dolci.



Ho i seguenti dati:



Con il biscotto tipo a) realizzo 10 ricette impiegando in totale 200 grammi;
Con il biscotto tipo b) realizzo 20 ricette impiegando in totale 150 grammi;
Con il biscotto tipo c) realizzo 10 ricette impiegando in totale 100 grammi;


Ho calcolato la media dei grammi per ricette dolci nel seguente modo: (200+150+100)/(10+20+19)=450/40= 11,25 grammi medi di biscotti necessari a ricetta.



Mentre la media delle medie avrebbe dato: (20+7,5+10)/3=12,5 che differisce da 11,25. Quale è il dato corretto? Io ho letto che la media delle medie è un calcolo errato.



Ma se volessi a questo punto calcolare la deviazione std? Per esempio su Excel come faccio dato che la media l’ho calcolata manualmente? Inoltre andremo a utilizzare la formula di deviazione standard o deviazione standard campionaria?



Secondo me, ma confermatemi, a rigor di logica dovrebbe essere usata la seguente formula di deviazione standard: $sqrt(sum{x i - m}^2/n$ (dove xi sono i valori, m la media (11,5 se è giusta la mia ipotesi) e n il numero di valori che andrei a utilizzare).
Gli xi dovrebbero essere se non sbaglio i rapporti tra i grammi e nr ricette per tipo di biscotto.. quindi 20, 7.5, 10… giusto?



Sto ragionando bene o andando in confusione?

Mi dite quali formule devo utilizzare o se sono giuste le mie appunto per calcolare: 1) media di grammi di biscotti utilizzati per ricetta e la deviazione standard delle varie tipologie di biscotto rispetto a questa media?

Grazie mille
LadyBaby03
Starting Member
Starting Member
 
Messaggio: 1 di 9
Iscritto il: 05/10/2023, 17:44

Re: CALCOLO MEDIA, MEDIANA E DIFFERENZA CON MEDIA DELLE MEDIE

Messaggioda ingres » 06/10/2023, 08:37

Ciao LadyBaby03, benvenuta nel Forum

Puoi vedere il problema considerando che le varie classi (ricette) hanno un numero di elementi diversi ovvero

x1=20 g per ognuno dei n1=10 elementi
x2=7.5 g per ognuno dei n2=20 elementi
x3= 10 g per ognuno dei n3=10 elementi

La media (ponderata) sarà quindi:

$m = (x_1*n_1 + x_2*n_2+x_3*n_3)/(n_1+n_2+n_3) = (200+150+100)/(10+20+10) = 11.25$

La media delle medie è scorretta proprio perchè non considera di quanti elementi è composta la classe.

A questo punto per la deviazione standard varrà la formula:

$sigma = sqrt((n_1*(x_1-m)^2+n_2*(x_2-m)^2+n_3*(x_3-m)^2)/(n_1+n_2+n_3))$

Tutte le formule si ricavano dalle definizioni generali osservando banalmente che avrai per ogni classe tanti elementi tutti uguali.
Chi non vorrà attingere ad altra intelligenza che alla sua, si troverà ben presto ridotto alla più miserabile di tutte le imitazioni: a quella delle sue stesse opere (Ingres)
ingres
Senior Member
Senior Member
 
Messaggio: 1414 di 1718
Iscritto il: 30/10/2022, 11:45

Re: CALCOLO MEDIA, MEDIANA E DIFFERENZA CON MEDIA DELLE MEDIE

Messaggioda LadyBaby03 » 06/10/2023, 18:25

Ok grazie mille intanto davvero. Meno male avevo fatto le considerazioni giuste..
Nel senso che la formula della media totale: (200+150+100)/(10+20+10)=450/40= 11,25 e’ uguale alla media ponderata (infatti in entrambi casi torna 11,25).. giusto?

E per la deviazione standard non c’è una formula più semplice? Nel senso che io vorrei calcolarla in Excel dove in una colonna ho tutti le quantità ovvero 200, 150, 100 e in una gli n ovvero 10, 20, 10.. posso banalmente tenermi anche una colonna per gli x con tutti i rapporti tra quantità e numerosità così .. però volevo capire se va calcolata per forza pesata.. e sopratutto che formula impostereste su Excel ipotizzando di avere appunto in A le quantità (200,150,100) in B gli n (10,20,10) e se servisse in c gli x (20,7.5,10)

Grazie mille
LadyBaby03
Starting Member
Starting Member
 
Messaggio: 2 di 9
Iscritto il: 05/10/2023, 17:44

Re: CALCOLO MEDIA, MEDIANA E DIFFERENZA CON MEDIA DELLE MEDIE

Messaggioda ingres » 06/10/2023, 23:01

LadyBaby03 ha scritto:Nel senso che la formula della media totale: (200+150+100)/(10+20+10)=450/40= 11,25 e’ uguale alla media ponderata (infatti in entrambi casi torna 11,25).. giusto?

Giusto

LadyBaby03 ha scritto:E per la deviazione standard non c’è una formula più semplice? Nel senso che io vorrei calcolarla in Excel ...

Ci sono parecchi modi di calcolare la deviazione standard ponderata.
Ad esempio nella colonna D si possono mettere i valori di $B*(C-m)^2$, ovvero

$10*(20-11.25)^2 = 765.625$
$20*(7.5-11.25)^2 = 281.25$
$10*(10-11.25)^2 = 15.625$

Quindi in una cella calcolare il rapporto tra la SOMMA di tutti i valori in D e la SOMMA di tutti i valori in B ovvero:

$(765.625+281.25+15.625)/(10+20+10)=26.5625$

e infine farne la radice

$sigma = sqrt(26.5625) = 5.15$

In alternativa puoi calcolare solo le differenze al quadrato e quindi osservare che la varianza $sigma^2$ non è altro che la media ponderata di tali differenze quadratiche che può essere calcolata facendo uso della funzione MATR.SOMMA.PRODOTTO (vedi ad es. https://masterexcel.it/media-ponderata-excel/)

Infine nulla vieta di replicare 20 per 10 righe, 7.5 per 20 righe e 10 per 10 righe e quindi usare brutalmente la funzione MEDIA per la media e la funzione DEV.ST.P (quella per intera popolazione) per la deviazione standard, sulla colonna contenente i 40 numeri.
Chi non vorrà attingere ad altra intelligenza che alla sua, si troverà ben presto ridotto alla più miserabile di tutte le imitazioni: a quella delle sue stesse opere (Ingres)
ingres
Senior Member
Senior Member
 
Messaggio: 1415 di 1718
Iscritto il: 30/10/2022, 11:45

Re: Calcolo media, mediana e differenza con media delle medie

Messaggioda LadyBaby03 » 08/10/2023, 06:30

Ok e per vedere se la distribuzione è’ normale devo vedere se il 68% degli ci cade nell’intervallo media +- deviazione standard.. giusto?

Ovvero numericamente il 68% dei rapporti grammi/ricette ovvero nel nostro esempio 20, 7,5, 10 deve ricadere bell’intervallo 6,1-16,4 .

Se così accade posso dire che la distribuzione e’ più o meno normale e che la maggior parte dei valori si avvicina alla media e che quindi la media e’ attendibile giusto?

Grazie
LadyBaby03
Starting Member
Starting Member
 
Messaggio: 3 di 9
Iscritto il: 05/10/2023, 17:44

Re: Calcolo media, mediana e differenza con media delle medie

Messaggioda ingres » 08/10/2023, 13:04

Circa.
E' vero che il 75% dei campioni cade in tale intervallo, ma è anche vero che la distribuzione non è simmetrica, con i valori fuori dall'intervallo considerato tutti posizionati per valori maggiori.
Infatti se si calcolasse l'indice di asimmetria (skewness), questo non sarebbe nullo ma positivo ($gamma approx 1$), a riprova che la distribuzione è asimmetrica.
Chi non vorrà attingere ad altra intelligenza che alla sua, si troverà ben presto ridotto alla più miserabile di tutte le imitazioni: a quella delle sue stesse opere (Ingres)
ingres
Senior Member
Senior Member
 
Messaggio: 1418 di 1718
Iscritto il: 30/10/2022, 11:45

Re: Calcolo media, mediana e differenza con media delle medie

Messaggioda LadyBaby03 » 08/10/2023, 14:36

Ciao grazie intanto..

Come mai il 75%? Dato che sono 7.5 e 10 interni all’intervallo e 20 esterno?
Io avrei detto 2 su 3 quindi il 67% e basta di valori interni all’intervallo no?

Se la deviazione standard fosse più alta della media cosa significherebbe? Che la distribuzione è’ asimmetrica giusto?
In quel caso conviene calcolare la mediana? Può essere un indicatore più attendibile insieme alla media?


Ps: l’indice simmetria cosa significa e come si calcola?


Grazie mille
LadyBaby03
Starting Member
Starting Member
 
Messaggio: 4 di 9
Iscritto il: 05/10/2023, 17:44

Re: Calcolo media, mediana e differenza con media delle medie

Messaggioda ingres » 08/10/2023, 15:57

LadyBaby03 ha scritto:Come mai il 75%? Dato che sono 7.5 e 10 interni all’intervallo e 20 esterno?
Io avrei detto 2 su 3 quindi il 67% e basta di valori interni all’intervallo no?

Vi sono 30 elementi su 40 interni all'intervallo (ovvero i 10 da 10 e i 20 da 7.5).

LadyBaby03 ha scritto:Se la deviazione standard fosse più alta della media cosa significherebbe? Che la distribuzione è’ asimmetrica giusto?

Se intendi in generale, la media può benissimo essere nulla (quando si rinormalizzano i dati rispetto alla media stessa) e la deviazione standard no, per cui il fatto che sia minore della deviazione standard non vuole dire molto. Comunque capisco quello che intendi, e la risposta è negativa. Una deviazione standard elevata significa un'elevata dispersione dei dati (immagina ad esempio una distribuzione equiprobabile ovvero costante invece che gaussiana), mentre l'asimmetria indica che i dati sono più spostati da una parte (come ad esempio nella distribuzione di Poisson).

LadyBaby03 ha scritto:Ps: l’indice simmetria cosa significa e come si calcola?

Una distribuzione simmetrica è come speculare rispetto al valore medio (la gaussiana della distribuzione normale è l'esempio più semplice). Quando si vede che questa condizione non è rispettata e i campioni si accalcano più da una parte, la curva diventa dissimmetrica e sono stati creati degli indici per valutarne il grado di dissimetria. In particolare l'indice di Fisher (skewness) è uno dei più utilizzati.

$gamma = ((\sum_{k=1}^N (x_k-mu)^3)/N)/(sigma^3)$

E' da osservare che il fatto che l'indice sia nullo è solo condizione necessaria perchè la distribuzione sia simmetrica. Comunque per ulteriori dettagli puoi ad es. guardare qui.
https://paolapozzolo.it/asimmetria-statistica/

LadyBaby03 ha scritto:In quel caso conviene calcolare la mediana? Può essere un indicatore più attendibile insieme alla media?

In realtà ci sono casi in cui media e mediana coincidono e la distribuzione è asimmetrica. E in questo caso comunque la risposta è negativa, perchè la mediana è minore della media (Me=8.75) per cui ti dice solo che i campioni si accalcano un pò per valori più bassi della media ma poco di più. Il fatto è che dal punto di vista dei campioni la descrizione con la normale ne comprende la maggior parte, solo che hai un discreto numero di campioni posti a valori molto alti (esempio estremo: in un'altalena ci sono da una parte 5 bimbi da 20 kg ciascuno e dall'altra un uomo da 100 kg. L'altalena è in equilibrio, ma certo come situazione è molto diversa da quella in cui ci sono 3 ragazzini da 33.3 kg (valore medio di peso) per parte).
In prima approssimazione comunque mi terrei tutto sommato la media e la distribuzione normale.
Chi non vorrà attingere ad altra intelligenza che alla sua, si troverà ben presto ridotto alla più miserabile di tutte le imitazioni: a quella delle sue stesse opere (Ingres)
ingres
Senior Member
Senior Member
 
Messaggio: 1420 di 1718
Iscritto il: 30/10/2022, 11:45

Re: Calcolo media, mediana e differenza con media delle medie

Messaggioda LadyBaby03 » 08/10/2023, 19:10

A ok quindi per vedere che percentuale di elementi cade in media più o meno deviazione standard (ovvero 6,1-16,4) devo considerare i valori xi che ci cadono (7,5 e 10) e prendere però i relativi pesi ovvero le ricette e quindi 30 su 40 ricette totali ovvero il 75% giusto?

La mediana 8.75 da che calcolo viene fuori? Ma essa dice che sulle 40 ricette totali 20 richiedono meno di 8,75 grammi e 20 di più di 8,75 grammi giusto? E’ il valore rispetto al quale metà dati stanno a sinistra e metà a destra giusto?

Pre i casi invece in cui deviazione standard > media il calcolo della distribuzione normale e’ rappresentativo?
Avevo letto che non era consigliato ma era consigliata la mediana però bo ditemi voi :)
Anche perché in quel caso se media < mediana il limite inferiore del grafico ovvero (media - deviazione standard) viene negativo.. e che senso ha se tutti i valori dell’intervallo sono positivi?

Lo chiedo perché ci sono esempi con numeri maggiori di dati con valori molto diverso in cui viene deviazione standard > media


Grazie mille


Grazie mille
LadyBaby03
Starting Member
Starting Member
 
Messaggio: 5 di 9
Iscritto il: 05/10/2023, 17:44

Re: Calcolo media, mediana e differenza con media delle medie

Messaggioda ingres » 08/10/2023, 20:53

LadyBaby03 ha scritto:A ok quindi per vedere che percentuale di elementi cade in media più o meno deviazione standard (ovvero 6,1-16,4) devo considerare i valori xi che ci cadono (7,5 e 10) e prendere però i relativi pesi ovvero le ricette e quindi 30 su 40 ricette totali ovvero il 75% giusto?

Giusto

LadyBaby03 ha scritto:La mediana 8.75 da che calcolo viene fuori?

La definizione di mediana è un pò complicata quando si hanno delle classi di elementi (vedi per un sunto di teoria ad es. https://www.edutecnica.it/calcolo/mediana/mediana.htm ). Senza fare tutti i conti, semplificando un pò le cose, se supponiamo di aver diviso in 20 dati a 7.5 e 20 dati a 10 o più la mediana sarà proprio a 8.75 (media tra 7.5 e 10).

LadyBaby03 ha scritto:Ma essa dice che sulle 40 ricette totali 20 richiedono meno di 8,75 grammi e 20 di più di 8,75 grammi giusto? E’ il valore rispetto al quale metà dati stanno a sinistra e metà a destra giusto?

Giusto

LadyBaby03 ha scritto:Pre i casi invece in cui deviazione standard > media il calcolo della distribuzione normale e’ rappresentativo?

Intanto dipende da cosa rappresenta la variabile. Se parliamo per es. di misura di una lunghezza di 1 m, possiamo considerare l' errore di misura che assume valori positivi e negativi e tendenzialmente come media sarà nullo e la deviazione standard ad es. 1 cm. Il confronto 1>0 in questo caso non è corretto. Invece ha senso ed è molto significativo rispetto al dato assoluto (la misura è grosso modo tra 0.99 e 1.01 m).
Stando attenti a quanto sopra è abbastanza vero che in questi casi la mediana è preferibile alla media e il quartile alla deviazione standard. Per ulteriori dettagli puoi ad es. vedere qui https://paolapozzolo.it/deviazione-standard/ )
Chi non vorrà attingere ad altra intelligenza che alla sua, si troverà ben presto ridotto alla più miserabile di tutte le imitazioni: a quella delle sue stesse opere (Ingres)
ingres
Senior Member
Senior Member
 
Messaggio: 1421 di 1718
Iscritto il: 30/10/2022, 11:45

Prossimo

Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite