statistics

Distribuzione t di Student

La distribuzione t ha forma a campana come la normale, ma con code più pesanti. Si usa per l'inferenza sulle medie quando la dimensione campionaria è piccola o σ è ignota.

La distribuzione t di Student è una distribuzione di probabilità continua che assomiglia alla normale — a campana, simmetrica — ma con code più pesanti. Dipende da un parametro chiamato gradi di libertà (gl).

Quando usarla: inferenza su una media di popolazione quando (1) la deviazione standard della popolazione σ\sigma è ignota (stimata dal campione come ss), E (2) la dimensione campionaria nn è piccola.

La statistica t: t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} segue una distribuzione t con n1n - 1 gradi di libertà.

Proprietà: quando dfdf \to \infty, la distribuzione t converge alla normale standard N(0,1)N(0, 1). Per df<30df < 30, le code pesanti allargano sensibilmente gli intervalli di confidenza — si "paga" il fatto di non conoscere σ\sigma.

Storia: sviluppata da William Gosset presso la birreria Guinness (pubblicò sotto lo pseudonimo "Student" perché la Guinness vietava le pubblicazioni dei dipendenti). È alla base dei test t (a un campione, a due campioni, appaiato) e degli intervalli di confidenza per le medie con varianza ignota.