statistics

آنسوؤں کے بغیر معیاری انحراف کو سمجھنا

سادہ زبان میں معیاری انحراف: یہ حقیقت میں کیا ناپتا ہے، آبادی اور نمونے کے درمیان فرق، 68-95-99.7 کا اصول، اور تین حل شدہ مثالیں جنہیں آپ خود جانچ سکتے ہیں۔
AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

معیاری انحراف تعارفی شماریات کا سب سے زیادہ غلط سمجھا جانے والا تصور ہے۔ لوگ جانتے ہیں کہ یہ "پھیلاؤ ناپتا ہے" مگر جب پوچھا جائے کہ یہ عدد دراصل کیا معنی رکھتا ہے تو جم جاتے ہیں۔ یہ رہنما اسے تین طریقوں سے سمجھاتا ہے — ہندسی، حسابی اور بدیہی — تاکہ اگلی بار جب آپ کسی مقالے یا رپورٹ میں sigmasigma دیکھیں تو واقعی سمجھ پائیں کہ وہاں کیا ہے۔

سادہ زبان میں تعریف

معیاری انحراف اس سوال کا جواب دیتا ہے: اوسطاً، ہر ڈیٹا نقطہ اوسط سے کتنا دور بیٹھتا ہے؟

علامتی طور پر، NN قدروں x1,ldots,xNx_1, ldots, x_N کی ایک آبادی کے لیے جس کا اوسط mumu ہے:

sigma = sqrt{ rac{1}{N}sum_{i=1}^N (x_i - mu)^2}

بآوازِ بلند پڑھیں: "اوسط مربع انحراف، پھر مربع جذر۔"

مربع کیوں، پھر مربع جذر کیوں؟

"اوسط سے فاصلے کی اوسط" کے لیے ایک معقول پہلی کوشش rac{1}{N}sum |x_i - mu| ہو سکتی ہے — یعنی اوسط مطلق انحراف۔ یہ کام کرتا ہے، اور شماریات دان کبھی کبھار اسے استعمال کرتے ہیں (یہ بیرونی قدروں کے خلاف زیادہ مضبوط ہے)۔

مگر مطلق قدر ریاضیاتی طور پر بے ڈھنگی ہے — یہ صفر پر قابلِ تفاضل نہیں، تفاضل پھٹ جاتے ہیں، اور آپ اس کے ساتھ صفائی سے کیلکولس نہیں کر سکتے۔ مربع کرنا یہ سب مسئلے ٹال دیتا ہے، اور آخر میں مربع جذر اکائیوں کو اصل پیمانے پر واپس لے آتا ہے (تو اگر xx ڈالر میں ہو تو sigmasigma ڈالر میں ہوتا ہے، ڈالر² میں نہیں)۔

یہی وجہ ہے کہ مشین لرننگ مربع نقصان (mean squared error) استعمال کرتی ہے — مربع کرنا قابلِ تفاضل ہے، کیلکولس کے ساتھ اچھی طرح چلتا ہے، اور نتیجے میں ملنے والے تخمین اکثر بہترین ہوتے ہیں۔

آبادی بمقابلہ نمونہ — n1n-1 بمقابلہ nn والا معاملہ

دو فارمولے موجود ہیں، اور فرق اہم ہے:

  • آبادی (آپ کے پاس تمام ڈیٹا ہے): NN سے تقسیم کریں۔ علامت sigmasigma۔
  • نمونہ (آپ کے پاس ایک نمونہ ہے، آبادی کا تخمین لگانا چاہتے ہیں): n1n - 1 سے تقسیم کریں۔ علامت ss۔

نمونے کے فارمولے کا n1n - 1 بیسل کی اصلاح ہے۔ کیوں؟ nn استعمال کرنے سے آبادی کا معیاری انحراف منظم طور پر کم تخمین ہوتا کیونکہ آپ نے نمونے کا اوسط استعمال کیا (جو ساخت کے لحاظ سے نمونے کے لیے بہترین فٹ ہے)، جس سے انحرافات اس سے چھوٹے دب جاتے ہیں جتنے وہ حقیقی آبادی کے اوسط کے مقابلے میں ہوتے۔ nn کے بجائے n1n - 1 سے تقسیم کرنا بالکل اسی کا تدارک کرتا ہے۔

زیادہ تر کیلکولیٹر اور سافٹ ویئر بطورِ پہلے سے طے شدہ نمونے کا فارمولا استعمال کرتے ہیں۔ دھیان رکھیں۔

حل شدہ مثال ۱: چھوٹا متناظر ڈیٹا سیٹ

ڈیٹا: 2,4,4,4,5,5,7,9{2, 4, 4, 4, 5, 5, 7, 9}۔ (۸ قدریں؛ کلاسک نصابی مثال۔)

  1. اوسط: ar{x} = rac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5۔
  2. اوسط سے انحرافات: 3,1,1,1,0,0,2,4-3, -1, -1, -1, 0, 0, 2, 4۔
  3. مربع انحرافات: 9,1,1,1,0,0,4,169, 1, 1, 1, 0, 0, 4, 16۔
  4. مجموعہ: 3232۔
  5. آبادی (N=8N = 8): تغیر =32/8=4= 32/8 = 4، sigma=2sigma = 2۔
  6. نمونہ (n1=7n - 1 = 7): تغیر =32/7approx4.57= 32/7 approx 4.57، sapprox2.14s approx 2.14۔

68-95-99.7 کا اصول (صرف معمول تقسیموں کے لیے)

اگر آپ کا ڈیٹا تقریباً معمول (گھنٹی نما) ہے:

  • اوسط کے 1sigma1sigma کے اندر تقریباً approx68approx 68% قدریں آتی ہیں۔
  • 2sigma2sigma کے اندر approx95approx 95%۔
  • 3sigma3sigma کے اندر approx99.7approx 99.7%۔

یہی وجہ ہے کہ "pm2sigmapm 2sigma" یا "دو سگما" "شماریاتی طور پر غیر معمولی" کی پہلے سے طے شدہ غیر رسمی تعریف ہے۔

معیاری انحراف بمقابلہ تغیر

تغیر محض sigma2sigma^2 ہے۔ ان میں یکساں معلومات ہوتی ہیں، تو دونوں کیوں رکھیں؟

  • معیاری انحراف کی اکائیاں ڈیٹا جیسی ہی ہوتی ہیں — قابلِ تعبیر۔
  • تغیر آزاد متغیرات کے لیے جمعی طور پر تجزیہ ہوتا ہے (extVar(X+Y)=extVar(X)+extVar(Y) ext{Var}(X+Y) = ext{Var}(X) + ext{Var}(Y) جب آزاد ہوں)، جو اسے ثبوتوں، توقعات اور ANOVA کے لیے الجبری طور پر سہل مقدار بناتا ہے۔

رپورٹ کرتے وقت sigmasigma استعمال کریں؛ حساب کرتے وقت sigma2sigma^2 استعمال کریں۔

عام غلطیاں

  1. سیاق کے بغیر sigmasigma بتانا۔ "sigma=5sigma = 5" کا کوئی مطلب نہیں اگر آپ کو اوسط نہ معلوم ہو۔ ہمیشہ جوڑیں: "اوسط =100= 100، sigma=5sigma = 5
  2. آبادی اور نمونے کے فارمولوں کو ملا دینا۔ چھوٹے نمونوں کے ساتھ یہ حقیقی فرق ڈالتا ہے۔ بڑے نمونوں (n>100n > 100) کے ساتھ فرق نہ ہونے کے برابر ہے۔
  3. بیرونی قدر کی حساسیت بھول جانا۔ ایک انتہائی قدر sigmasigma کو پھلا سکتی ہے۔ بھاری دُم والے ڈیٹا کے لیے مضبوطی کے لیے میڈین مطلق انحراف (MAD) بھی رپورٹ کریں۔
  4. غیر معمول ڈیٹا پر 68-95-99.7 لاگو کرنا۔ اوپر دیکھیں۔

خود آزمائیں

کوئی بھی ڈیٹا سیٹ ہمارے مفت معیاری انحراف کیلکولیٹر میں ڈالیں — آبادی یا نمونہ منتخب کریں، قدم بہ قدم حساب دیکھیں، اور اس رہنما کے خلاف جانچیں۔

متعلقہ مواد:

AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.