Kalkulator Nilai-p
Hitung dan tafsirkan nilai-p untuk uji hipotesis dengan solusi langkah demi langkah bertenaga AI
Seret & lepas atau klik untuk menambahkan gambar atau PDF
Apa itu Nilai-p?
Sebuah nilai-p adalah probabilitas mengamati hasil uji seekstrem, atau lebih ekstrem dari, hasil sebenarnya — dengan asumsi hipotesis nol benar.
Secara formal, untuk statistik uji dengan nilai teramati :
- Sisi kanan:
- Sisi kiri:
- Dua sisi:
Penafsiran: nilai-p kecil berarti data teramati akan mengejutkan jika benar, sehingga kita memiliki bukti yang melawan . Nilai-p besar berarti data konsisten dengan — tetapi tidak membuktikan benar.
Aturan keputusan: bandingkan dengan tingkat signifikansi yang dipilih sebelumnya (biasanya 0,05):
- → tolak ('signifikan secara statistik')
- → gagal menolak (bukti tidak cukup)
Apa yang BUKAN nilai-p:
- Ini bukan probabilitas bahwa benar.
- Ini bukan probabilitas bahwa alternatif benar.
- Ini bukan ukuran ukuran efek.
- Ini tidak membedakan 'signifikansi praktis' dari 'signifikansi statistik'.
Cara Menghitung dan Menggunakan Nilai-p
Langkah demi Langkah
- Nyatakan hipotesis dan .
- Pilih uji yang sesuai untuk data (uji-z, uji-t, khi-kuadrat, uji-F, ...).
- Hitung statistik uji dari data.
- Tentukan sisi berdasarkan : sisi kanan (), sisi kiri (), atau dua sisi ().
- Cari nilai-p dari distribusi uji.
- Bandingkan dengan dan simpulkan.
Nilai-p dari Statistik-Z
Untuk normal baku :
- Sisi kanan:
- Sisi kiri:
- Dua sisi:
Rujukan cepat: → dua sisi . → dua sisi .
Nilai-p dari Statistik-T
Gunakan distribusi-t dengan derajat kebebasan (atau seperti ditentukan oleh uji). Logika sisi sama dengan z, tetapi distribusi memiliki ekor sedikit lebih berat untuk df kecil.
Nilai-p dari Statistik Khi-Kuadrat
Uji khi-kuadrat secara inheren sisi kanan karena dan nilai lebih besar menunjukkan kecocokan yang lebih buruk dengan :
Satu Sisi vs Dua Sisi: Mana yang Digunakan?
- Dua sisi: ketika Anda peduli dengan penyimpangan dari di kedua arah. Baku dalam sebagian besar lingkungan akademik.
- Satu sisi: ketika hipotesis alternatif berarah dan ditentukan sebelumnya (, bukan ). Memangkas nilai-p menjadi setengah jika arahnya cocok.
Jangan pernah memilih sisi setelah melihat data — itu p-hacking.
Ambang Signifikansi Umum
| Label umum | |
|---|---|
| 0.10 | sugestif |
| 0.05 | baku |
| 0.01 | kuat |
| 0.001 | sangat kuat |
The American Statistical Association telah memperingatkan agar tidak memperlakukan sebagai garis tegas — konteks dan ukuran efek lebih penting daripada melewati ambang.
Kesalahan Umum yang Harus Dihindari
- 'Nilai-p adalah probabilitas benar': SALAH. Nilai-p dihitung dengan asumsi benar; ia tidak mengukur seberapa mungkin .
- Memperlakukan dan sebagai sangat berbeda: tidak. Ambang 0,05 adalah konvensi, bukan transisi fase.
- Memilih sisi setelah melihat data: jika Anda melihat dan beralih ke uji sisi kiri, Anda telah melipatduakan laju positif palsu Anda. Tentukan sebelumnya.
- Mengacaukan signifikansi dengan ukuran efek: efek kecil dengan sampel besar bisa 'sangat signifikan' namun praktis tidak relevan. Selalu laporkan ukuran efek bersama nilai-p.
- Inflasi perbandingan ganda: menjalankan 20 uji pada , satu positif palsu diharapkan secara kebetulan. Gunakan koreksi Bonferroni atau FDR.
- ' membuktikan ': TIDAK. Gagal menolak tidak sama dengan menerima. Itu hanya berarti data tidak memiliki cukup bukti yang melawan pada ukuran sampel ini.
Examples
Frequently Asked Questions
Artinya data teramati (atau data yang lebih ekstrem) akan terjadi pada kurang dari 5% sampel berulang jika hipotesis nol benar. Menurut konvensi, ini diperlakukan sebagai 'signifikan secara statistik' — tetapi itu tidak berarti hipotesis nol pasti salah, dan itu tidak mengukur besarnya efek.
Nilai-p dihitung dengan *asumsi* H₀ benar — ia bersyarat pada H₀. Menghitung P(H₀ benar | data) memerlukan metode Bayesian dengan probabilitas prior untuk H₀, yang tidak digunakan oleh nilai-p frekuentis.
Hanya ketika pertanyaan penelitian benar-benar berarah dan ditentukan sebelumnya sebelum melihat data — mis., obat baru harus berkinerja *lebih baik* daripada plasebo agar berguna, dengan kinerja lebih buruk setara dengan tidak ada efek. Memilih sisi secara post-hoc adalah p-hacking.
P-hacking adalah praktik menjalankan banyak analisis (subset, transformasi, eksklusi berbeda) dan hanya melaporkan yang signifikan, atau mengganti arah uji setelah melihat data. Ini menggelembungkan laju positif palsu dan merupakan kontributor utama krisis replikasi.
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving