_stan
(320 punti)
4' di lettura
La statistica descrittiva si occupa dello studio di un fenomeno mediante l'osservazione dell'intera popolazione, cioè la collettività di individui di cui si sono raccolti i dati. Questo studio viene svolto attraverso strumenti di sintesi, quali tabelle, rappresentazioni grafiche e indici sintetici.

Le tabelle

Le tabelle sono costituite dalle modalità della variabile e dalle frequenze associate a ciascuna variabile.

In particolare, possiamo distinguere tre tipi di frequenza:

  • La frequenza assoluta, che misura quante volte una certa modalità, cioè un determinato valore, è stato osservato nella popolazione studiata;
  • La frequenza relativa, che rappresenta la proporzione, o la percentuale, di osservazioni che presentano una determinata modalità della variabile in questione. La frequenza relativa può essere espressa come:
    [math] p_i = \frac{n_i}{n} \times 100 [/math]
    dove
    [math]n_i[/math]
    rappresenta la frequenza assoluta;
  • La frequenza cumulata associata ad una modalità della variabile, che indica il numero di osservazioni che presentano un valore minore o uguale rispetto a quello della modalità in questione. La frequenza cumulata può essere assoluta
    [math]n_i[/math]
    o relativa
    [math]p_i[/math]
    .

Le classi

Possiamo costruire la distribuzione di frequenza anche nel caso di variabili continue, cioè di variabili che possono assumere un qualsiasi valore all'interno di un determinato intervallo (continuo) di numeri reali.

In questo caso, si suddivide l'intervallo in questione in sottointervalli, detti classi; poi, si determina il numero di osservazioni che si trovano in ogni classe.

Per costruire le classi, non vi sono delle regole precise; ma è bene formare classi che non abbiamo frequenze troppo basse, e che abbiamo ampiezze simili tra loro.

Rappresentazioni grafiche

Le rappresentazioni grafiche permettono di visualizzare le caratteristiche di una variabile, e in alcuni casi possono contenere informazioni maggiori delle tabelle.

Le rappresentazioni grafiche possono essere scelte in base al tipo di dato, e alla scala di valori utilizzata.

In particolare, per dati quantitativi è solito utilizzare istogrammi, o poligoni, mentre per dati qualitativi si utilizzano diagrammi, areogrammi.

Nel caso in cui le classi si presentano di ampiezze diverse, le frequenze non sono facilmente confrontabili, quindi occorre introdurre un nuovo parametro che ci permetta di eliminare l'effetto dell'ampiezza di classe. Tale parametro si dice densità di frequenza, ed è il rapporto tra la frequenza e l'ampiezza di classe:

[math] d_i = \frac{p_i}{\Delta_i} [/math]

Le densità di frequenza possono, ora, essere confrontate.

Statistica: istogramma frequenza assoluta e frequenza relativa

Possiamo rappresentare la nostra indagine mediante un istogramma, in cui ogni rettangolo rappresenta una classe, e nell'ordinata si pone la frequenza assoluta, la frequenza relativa, o la densità di frequenza.

Grazie a questo tipo di rappresentazione, è possibile studiare l'andamento del fenomeno, per esempio l'indice di dispersione (cioè, la misura con la quale i valori sono distanti dal valore centrale), se vi è una tendenza centrale, e possiamo individuare il grado di simmetria della distribuzione.

Indici statistici

Le caratteristiche di un fenomeno, che si possono osservare in un grafico di distribuzione, possono essere descritti tramite dei numeri, definiti indici statistici.

Gli indici possono essere di tre tipi:

  • Gli indici di tendenza centrale (o indici di posizione) della distribuzione, che indicano una modalità attorno alla quale si addensano le altre; tali indici sono la media, la, mediana, la moda;
  • Gli indici di distribuzione o dispersione, che indicano come le modalità, nel campione, si dispongano le une rispetto all'indice di tendenza centrale, cioè danno informazioni sulla dispersione dei dati rispetto al valore centrale. Tali indici comprendono la varianza, la deviazione standard;
  • Gli indici di forma, che forniscono dei valori che descrivono una misura della distribuzione di una determinata serie di dati, e in particolare riguardano la asimmetria e la curtosi, cioè l'allontanamento dalla normalità distributiva.

Potrebbero interessarti