La deviazione standard è il concetto più frainteso della statistica introduttiva. Le persone sanno che "misura la dispersione" ma si bloccano quando viene chiesto cosa significhi davvero quel numero. Questa guida lo spiega in tre modi — geometrico, computazionale e intuitivo — così che la prossima volta che vedi in un articolo o in un report, tu capisca davvero cosa c'è.
Definizione in parole semplici
La deviazione standard risponde a: in media, quanto dista ogni dato dalla media?
In simboli, per una popolazione di valori con media :
Letta ad alta voce: "deviazione quadratica media, poi radice quadrata."
Perché elevare al quadrato e poi estrarre la radice?
Un primo tentativo ragionevole di "distanza media dalla media" potrebbe essere — la deviazione media assoluta. Funziona, e i statistici a volte la usano (è più robusta rispetto agli outlier).
Ma il valore assoluto è matematicamente scomodo — non è derivabile in zero, le derivate esplodono e non puoi farci calcolo differenziale in modo pulito. Elevare al quadrato aggira tutto questo, e la radice quadrata finale riporta le unità alla scala originale (così è in euro se è in euro, non in euro²).
È lo stesso motivo per cui il machine learning usa la perdita quadratica (errore quadratico medio) — elevare al quadrato è derivabile, si comporta bene con il calcolo differenziale e gli stimatori risultanti sono spesso ottimali.
Popolazione vs campione — la questione contro
Esistono due formule, e la differenza conta:
- Popolazione (hai tutti i dati): dividi per . Simbolo .
- Campione (hai un campione, vuoi stimare la popolazione): dividi per . Simbolo .
L' della formula campionaria è la correzione di Bessel. Perché? Usare porterebbe a sottostimare sistematicamente la deviazione standard della popolazione, perché hai usato la media campionaria (che per costruzione è il miglior adattamento al campione), comprimendo le deviazioni più di quanto sarebbero rispetto alla vera media della popolazione. Dividere per invece che per compensa esattamente.
La maggior parte delle calcolatrici e dei software usa per impostazione predefinita la formula campionaria. Fai attenzione.
Esempio svolto 1: piccolo dataset simmetrico
Dati: . (8 valori; classico esempio da manuale.)
- Media: .
- Deviazioni dalla media: .
- Deviazioni al quadrato: .
- Somma: .
- Popolazione (): varianza , .
- Campione (): varianza , .
La regola 68-95-99,7 (solo per distribuzioni normali)
Se i tuoi dati sono approssimativamente normali (a forma di campana):
- dei valori cade entro dalla media.
- entro .
- entro .
È per questo che "" o "due sigma" è la definizione informale predefinita di "statisticamente insolito."
⚠️ Attenzione: questa regola si applica solo alle distribuzioni normali. Per dati asimmetrici o a code pesanti (reddito, tempo di risposta), potrebbe coprire l'80% dei dati — oppure il 50%. Verifica sempre la forma della distribuzione (istogramma, QQ plot) prima di citare i numeri 68-95-99,7.
Deviazione standard vs varianza
La varianza è semplicemente . Contengono informazioni identiche, quindi perché averle entrambe?
- La deviazione standard ha le stesse unità dei dati — interpretabile.
- La varianza si decompone in modo additivo per variabili indipendenti ( quando indipendenti), il che la rende la quantità algebricamente conveniente per dimostrazioni, valori attesi e ANOVA.
Usa quando comunichi i risultati; usa quando fai i calcoli.
Errori comuni
- Citare senza contesto. "" non significa nulla se non conosci la media. Abbina sempre: "media , ."
- Mescolare le formule di popolazione e campione. Con campioni piccoli fa una differenza reale. Con campioni grandi () la differenza è trascurabile.
- Dimenticare la sensibilità agli outlier. Un singolo valore estremo può gonfiare . Per dati a code pesanti, riporta anche la deviazione assoluta mediana (MAD) per maggiore robustezza.
- Applicare 68-95-99,7 a dati non normali. Vedi sopra.
Provalo tu stesso
Inserisci qualsiasi dataset nella nostra Calcolatrice della deviazione standard gratuita — scegli popolazione o campione, vedi il calcolo passo dopo passo e verifica rispetto a questa guida.
Materiale correlato: