statistics

Varians

Varians mengukur sebaran suatu kumpulan data di sekitar reratanya. Varians adalah rata-rata dari kuadrat simpangan. Simpangan baku adalah akar kuadrat dari varians.

Varians mengukur seberapa jauh nilai-nilai suatu kumpulan data tersebar dari rerata. Untuk populasi berisi NN nilai x1,,xNx_1, \ldots, x_N dengan rerata μ\mu:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Untuk sampel berisi nn nilai dengan rerata sampel xˉ\bar{x}, bagilah dengan n1n - 1 alih-alih nn (koreksi Bessel, sebuah penaksir takbias).

Varians yang kecil berarti nilai-nilai mengelompok di dekat rerata; varians yang besar berarti nilai-nilai tersebar. Varians dinyatakan dalam satuan kuadrat dari data asli (kg² jika data dalam kg) — itulah sebabnya kita biasanya melaporkan simpangan baku σ=σ2\sigma = \sqrt{\sigma^2}, yang memiliki satuan yang sama dengan data.

Varians mendasari seluruh statistika inferensial: selang kepercayaan, uji hipotesis, dan regresi semuanya bergantung pada penaksiran varians. Pertukaran bias-varians dalam pembelajaran mesin dinamai berdasarkan varians.