Pertemuan 8
Menebak rata-rata populasi dari sampel
Konsep rentang kepercayaan
Konsep student distribution (distribusi t)
Pendahuluan uji hipotesis
Sampling bisa jadi memberikan kita nilai rata-rata yang tidak sama dengan populasi.
\(\mu \neq \bar{X}\)
Tapi kita bisa menebak rata-rata populasi \(\mu\) dengan menggunakan rentang kepercayaan.
Rentang kepercayaan adalah rentang di mana kita yakin dengan tingkat keyakinan \(1-\alpha\)
Gambar biru = \(\alpha\)
Gambar diambil dari UCLA
Kita menentukan dulu level kepercayaan.
Standardnya adalah 95%, atau \(\alpha=5%\)
kalau two-tailed, berarti kiri kanan masing-masing \(\frac{5}{2}\%\)
Makin tinggi tingkat kepercayaan, makin besar rentangnya.
Makin besar rentangnya, makin ga guna tebakannya (inefisien),
\[ \bar{X} \pm Z_{\frac{\alpha}{2}} \frac{S}{\sqrt{n}} \]
atau
\[ \mu=\left[ \bar{X}-Z_{\frac{\alpha}{2}} \frac{S}{\sqrt{n}}, \bar{X}+Z_{\frac{\alpha}{2}}\frac{S}{\sqrt{n}}\right] \]
Diambil sebuah sampel berisikan 100 mahasiswa, didapatkan memiliki rata-rata nilai tes TOEFL sebesar 500 dengan simbangan baku 50. Dengan rentang kepercayaan 95%, tentukan rentang nilai TOEFL keseluruhan mahasiswa tersebut!
Gunakan tabel Z untuk mendapatkan \(Z_{0.025}\)
Rentang rata-rata = \(500 \pm 1,96\times\frac{50}{\sqrt{100}}\)
Rentang rata-rata = \(\left[490,2;509,8\right]\)
Distribusi normal (atau distribusi z) merupakan sebaran kontinyu dari \(-\infty\) sampai \(\infty\)
Meski demikian, hanya dari 3 standar deviasi kiri dan kanan aja udah lebih dari 99,99%.
Sampel dari populasi tersebut belum tentu terdistribusi normal, meski mirip:
= sampel cenderung lebih mungkin dapat di sekitar rata-rata.
Semakin banyak sampel yang kita ambil, semakin mirip distribusinya dengan distribusi normal
Karena itu kita butuh distribusi baru di mana:
karakteristiknya mirip distribusi normal
Seiring sampel meningkat, bentuknya semakin mendekati distribusi normal
Distribusi tersebut adalah distribusi t.
Download t-table di sini
\(df=n-1\)
Diambil sebuah sampel berisikan 10 mahasiswa, didapatkan memiliki rata-rata nilai tes TOEFL sebesar 500 dengan simbangan baku 50. Dengan rentang kepercayaan 90%, tentukan rentang nilai TOEFL keseluruhan mahasiswa tersebut!
Gunakan tabel Z untuk mendapatkan \(t_{0.05}\)
Rentang rata-rata = \(500 \pm 1,833\times\frac{50}{\sqrt{10}}\)
Rentang rata-rata = \(\left[471,02;528,98\right]\)
Student distribution umumnya digunakan untuk sampel yang sedikit.
Beberapa buku menyarankan menggunakan distribusi t selama sampel anda di bawah 30.
Saya akan menyarankan hal yang sama di sini.
Di dunia nyata, sampling adalah hal yang ribet, terutama jika anda memiliki banyak karakteristik yang harus diseimbangkan.
Secara umum, semakin banyak semakin baik. Batasnya? Budget. Yang penting Representatif.
Kita telah belajar menebak nilai pusat (dengan rata-rata) dan menghitung standar deviasi / simpangan baku.
Berikutnya kita akan belajar uji hipotesis dengan jumlah data yang lebih dari 1 jenis.
Kita masih menggunakan asumsi distribusi normal.
Hipotesis adalah pernyataan tentatif mengenai parameter acak.
Parameter acak dimaksud adalah parameter yang menunjukkan karakteristik data yang sedang kita uji.
Misalnya kelas A punya rata-rata nilai 80 dan simpangan baku 10, kelas B 76 dan 8. Manakah yang lebih tinggi?
Supplier A dan supplier B, manakah yang produknya lebih baik?
-Misalnya, rata-rata kelas A lebih tinggi daripada rata-rata kelas B, kita tuliskan sebagai:
\[ H_0: \mu_A > \mu_B \]
\[ H_1: \mu_A \leq \mu_B \] - \(H_0\) disebut juga hipotesis nol, sementara \(H_1\) disebut juga hipotesis alternatif.
Pada prosedur uji hipotesis, kita gunakan prinsip bahwa \(H_0\) dianggap benar, kecuali kita punya cukup bukti statistik untuk menolak \(H_0\).
Mirip prinsip praduga tak bersalah: seseorang dinyatakan tidak bersalah kecuali terbukti sebaliknya.
Kita menggunakan nilai tengah (\(\mu\)) untuk menguji \(H_0\).
Uji hipotesis dapat dibagi dua: uji hipotesis 2 arah (two-tailed) dan uji hipotesis 1 arah (1-tailed).
Uji hipotesis 2 arah kita gunakan bila \(H_0: \mu=\mu_0\) dan \(H_1: \mu\neq\mu_0\)
Uji hipotesis 1 arah kita ginakan bila yang kita uji adalah lebih besar atau lebih kecil.
Kenyataan | Menerima \(H_0\) | Menolak \(H_0\) |
---|---|---|
Benar | tidak salah | Type I error |
Salah | Type II error | tidak salah |
Type I error (\(\alpha\)): aslinya benar tapi kita tolak.
Type II error (\(\beta\)): aslinya salah tapi kita terima.