เครื่องคำนวณค่า P
คำนวณและตีความค่า p สำหรับการทดสอบสมมติฐานพร้อมเฉลยทีละขั้นตอนด้วยพลัง AI
ลากแล้ววางหรือ คลิก เพื่อเพิ่มรูปภาพหรือ PDF
ค่า P คืออะไร?
ค่า p คือความน่าจะเป็นที่จะสังเกตผลการทดสอบ ที่สุดขั้วเท่ากับหรือสุดขั้วกว่าผลจริง — โดยสมมติว่าสมมติฐานว่าง เป็นจริง
อย่างเป็นทางการ สำหรับสถิติทดสอบ ที่มีค่าสังเกต :
- หางขวา:
- หางซ้าย:
- สองหาง:
การตีความ: ค่า p เล็กหมายความว่าข้อมูลที่สังเกตจะน่าประหลาดใจถ้า เป็นจริง ดังนั้นเรามีหลักฐานต่อต้าน ค่า p ใหญ่หมายความว่าข้อมูลสอดคล้องกับ — แต่ ไม่ ได้พิสูจน์ว่า เป็นจริง
กฎการตัดสินใจ: เปรียบเทียบ กับระดับนัยสำคัญที่เลือกไว้ล่วงหน้า (โดยทั่วไป 0.05):
- → ปฏิเสธ ('มีนัยสำคัญทางสถิติ')
- → ไม่สามารถปฏิเสธ (หลักฐานไม่เพียงพอ)
สิ่งที่ค่า p ไม่ใช่:
- ไม่ใช่ ความน่าจะเป็นที่ เป็นจริง
- ไม่ใช่ ความน่าจะเป็นที่สมมติฐานทางเลือก เป็นจริง
- ไม่ใช่ มาตรวัดขนาดผล
- ไม่ แยก 'นัยสำคัญในทางปฏิบัติ' จาก 'นัยสำคัญทางสถิติ'
วิธีคำนวณและใช้ค่า P
ทีละขั้นตอน
- ระบุสมมติฐาน และ
- เลือกการทดสอบ ที่เหมาะสมกับข้อมูล (การทดสอบ z, การทดสอบ t, ไคสแควร์, การทดสอบ F, ...)
- คำนวณสถิติทดสอบ จากข้อมูล
- หาจำนวนหาง ตาม : หางขวา (), หางซ้าย () หรือสองหาง ()
- หาค่า p จากการแจกแจงของการทดสอบ
- เปรียบเทียบกับ และสรุป
ค่า P จากสถิติ Z
สำหรับ ปกติมาตรฐาน:
- หางขวา:
- หางซ้าย:
- สองหาง:
อ้างอิงด่วน: → สองหาง → สองหาง
ค่า P จากสถิติ T
ใช้การแจกแจง t ที่มีองศาเสรี (หรือตามที่การทดสอบกำหนด) ตรรกะหางเดียวกับ z แต่การแจกแจงมีหางหนักกว่าเล็กน้อยสำหรับ df เล็ก
ค่า P จากสถิติไคสแควร์
การทดสอบไคสแควร์เป็น หางขวา โดยธรรมชาติเพราะ และค่าที่ใหญ่กว่าบ่งชี้ความเข้ากันที่แย่กว่ากับ :
หางเดียวกับสองหาง: ควรใช้อันไหน?
- สองหาง: เมื่อคุณสนใจการเบี่ยงเบนจาก ในทิศทางใดทิศทางหนึ่ง ค่าเริ่มต้นในบริบทวิชาการส่วนใหญ่
- หางเดียว: เมื่อสมมติฐานทางเลือกเป็นแบบมีทิศทางและระบุไว้ล่วงหน้า ( ไม่ใช่ ) ลดค่า p ลงครึ่งหนึ่งถ้าทิศทางตรงกัน
อย่าเลือกหางหลังเห็นข้อมูล — นั่นคือ p-hacking
เกณฑ์นัยสำคัญที่พบบ่อย
| ป้ายที่พบบ่อย | |
|---|---|
| 0.10 | บ่งชี้ |
| 0.05 | มาตรฐาน |
| 0.01 | แรง |
| 0.001 | แรงมาก |
สมาคมสถิติอเมริกันได้เตือนไม่ให้ถือ เป็นเส้นแบ่งชัดเจน — บริบทและขนาดผลสำคัญกว่าการข้ามเกณฑ์
ข้อผิดพลาดที่พบบ่อยและควรหลีกเลี่ยง
- 'ค่า p คือความน่าจะเป็นที่ เป็นจริง': ผิด ค่า p คำนวณ โดยสมมติ ว่า เป็นจริง มันไม่ได้วัดว่า น่าจะเป็นแค่ไหน
- มอง กับ ต่างกันโดยพื้นฐาน: ไม่ต่างกัน เกณฑ์ 0.05 เป็นธรรมเนียม ไม่ใช่การเปลี่ยนเฟส
- เลือกหางหลังเห็นข้อมูล: ถ้าคุณเห็น และเปลี่ยนไปทดสอบหางซ้าย คุณได้เพิ่มอัตราผลบวกลวงเป็นสองเท่า ระบุล่วงหน้า
- สับสนนัยสำคัญกับขนาดผล: ผลเล็กจิ๋วกับตัวอย่างขนาดใหญ่อาจ 'มีนัยสำคัญสูง' แต่ไม่เกี่ยวข้องในทางปฏิบัติ รายงานขนาดผลควบคู่กับค่า p เสมอ
- การพองตัวจากการเปรียบเทียบหลายครั้ง: รันการทดสอบ 20 ครั้งที่ ผลบวกลวงหนึ่งครั้งคาดได้โดยบังเอิญ ใช้การแก้ไขบอนเฟอร์โรนีหรือ FDR
- ' พิสูจน์ ': ไม่ การไม่สามารถปฏิเสธไม่เหมือนการยอมรับ มันแค่หมายความว่าข้อมูลไม่มีหลักฐานเพียงพอต่อต้าน ที่ขนาดตัวอย่างนี้
Examples
Frequently Asked Questions
หมายความว่าข้อมูลที่สังเกต (หรือข้อมูลที่สุดขั้วกว่า) จะเกิดในน้อยกว่า 5% ของตัวอย่างซ้ำถ้าสมมติฐานว่างเป็นจริง โดยธรรมเนียมถือเป็น 'มีนัยสำคัญทางสถิติ' — แต่ไม่ได้หมายความว่าสมมติฐานว่างเป็นเท็จเสมอ และไม่ได้วัดขนาดของผล
ค่า p คำนวณ *โดยสมมติ* ว่า H₀ เป็นจริง — มันมีเงื่อนไขบน H₀ การคำนวณ P(H₀ จริง | ข้อมูล) ต้องใช้วิธีเบส์ที่มีความน่าจะเป็นก่อนสำหรับ H₀ ซึ่งค่า p แบบความถี่นิยมไม่ใช้
เฉพาะเมื่อคำถามวิจัยเป็นแบบมีทิศทางจริง ๆ และระบุไว้ล่วงหน้าก่อนเห็นข้อมูล — เช่น ยาตัวใหม่ต้องทำงาน *ดีกว่า* ยาหลอกจึงจะมีประโยชน์ โดยทำงานแย่กว่าเทียบเท่ากับไม่มีผล การเลือกหางภายหลังคือ p-hacking
p-hacking คือการรันการวิเคราะห์หลายครั้ง (เซตย่อยต่าง ๆ การแปลง การคัดออก) และรายงานเฉพาะที่มีนัยสำคัญ หรือเปลี่ยนทิศทางการทดสอบหลังเห็นข้อมูล มันพองอัตราผลบวกลวงและเป็นปัจจัยสำคัญต่อวิกฤตการทำซ้ำ
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving