O desvio padrão é o conceito mais mal compreendido da estatística introdutória. As pessoas sabem que ele "mede a dispersão", mas travam quando perguntam o que o número realmente significa. Este guia o explica de três maneiras — geométrica, computacional e intuitiva — para que, na próxima vez que você vir em um artigo ou relatório, você de fato entenda o que está ali.
Definição em linguagem clara
O desvio padrão responde: em média, a que distância cada ponto de dados fica da média?
Simbolicamente, para uma população de valores com média :
Lendo em voz alta: "desvio quadrático médio, depois a raiz quadrada".
Por que elevar ao quadrado e depois extrair a raiz?
Uma primeira tentativa razoável de "distância média até a média" seria — o desvio absoluto médio. Ele funciona, e os estatísticos às vezes o usam (é mais robusto a valores discrepantes).
Mas o valor absoluto é matematicamente inconveniente — não é derivável em zero, as derivadas explodem e você não consegue fazer cálculo com ele de forma limpa. Elevar ao quadrado contorna tudo isso, e a raiz quadrada no final traz as unidades de volta à escala original (assim fica em dólares se está em dólares, e não em dólares²).
Essa é a mesma razão pela qual o aprendizado de máquina usa a perda quadrática (erro quadrático médio) — elevar ao quadrado é derivável, combina bem com o cálculo e os estimadores resultantes costumam ser ótimos.
População vs amostra — a questão do vs
Existem duas fórmulas, e a diferença importa:
- População (você tem todos os dados): divida por . Símbolo .
- Amostra (você tem uma amostra e quer estimar a população): divida por . Símbolo .
O da fórmula amostral é a correção de Bessel. Por quê? Usar subestimaria sistematicamente o desvio padrão populacional porque você usou a média amostral (que, por construção, é o melhor ajuste para a amostra), comprimindo os desvios para menos do que seriam em relação à verdadeira média populacional. Dividir por em vez de compensa isso exatamente.
A maioria das calculadoras e softwares usa por padrão a fórmula amostral. Preste atenção.
Exemplo resolvido 1: conjunto de dados pequeno e simétrico
Dados: . (8 valores; exemplo clássico de livro-texto.)
- Média: .
- Desvios em relação à média: .
- Desvios ao quadrado: .
- Soma: .
- População (): variância , .
- Amostra (): variância , .
A regra 68-95-99,7 (apenas para distribuições normais)
Se seus dados forem aproximadamente normais (em forma de sino):
- dos valores caem dentro de da média.
- dentro de .
- dentro de .
É por isso que "" ou "dois sigma" é a definição informal padrão de "estatisticamente incomum".
⚠️ Aviso: esta regra se aplica somente a distribuições normais. Para dados assimétricos ou de caudas pesadas (renda, tempo de resposta), pode cobrir 80% dos dados — ou 50%. Sempre verifique o formato da distribuição (histograma, gráfico QQ) antes de citar os números 68-95-99,7.
Desvio padrão vs variância
A variância é simplesmente . Eles contêm informação idêntica, então por que ter os dois?
- O desvio padrão tem as mesmas unidades dos dados — interpretável.
- A variância se decompõe de forma aditiva para variáveis independentes ( quando independentes), tornando-a a quantidade algebricamente conveniente para demonstrações, esperanças e ANOVA.
Use ao reportar; use ao fazer cálculos.
Erros comuns
- Citar sem contexto. "" não significa nada se você não souber a média. Sempre apresente em par: "média , ".
- Misturar as fórmulas de população e amostra. Com amostras pequenas faz uma diferença real. Com amostras grandes () a diferença é desprezível.
- Esquecer a sensibilidade a valores discrepantes. Um único valor extremo pode inflar . Para dados de caudas pesadas, reporte também o desvio absoluto mediano (MAD) por robustez.
- Aplicar 68-95-99,7 a dados não normais. Veja acima.
Tente você mesmo
Coloque qualquer conjunto de dados em nossa Calculadora de Desvio Padrão gratuita — escolha população ou amostra, veja o cálculo passo a passo e verifique em relação a este guia.
Material relacionado: