Menebak populasi dengan sampel

Pertemuan 8

Matematika & Statistika

Hari ini

  • Menebak rata-rata populasi dari sampel

  • Konsep rentang kepercayaan

  • Konsep student distribution (distribusi t)

  • Pendahuluan uji hipotesis

Konsep rentang kepercayaan

  • Sampling bisa jadi memberikan kita nilai rata-rata yang tidak sama dengan populasi.

  • \(\mu \neq \bar{X}\)

  • Tapi kita bisa menebak rata-rata populasi \(\mu\) dengan menggunakan rentang kepercayaan.

  • Rentang kepercayaan adalah rentang di mana kita yakin dengan tingkat keyakinan \(1-\alpha\)

Rentang kepercayaan

Two-tailed

One-tailed

Gambar biru = \(\alpha\)

Gambar diambil dari UCLA

Tingkat kepercayaan

  • Kita menentukan dulu level kepercayaan.

    • Standardnya adalah 95%, atau \(\alpha=5%\)

    • kalau two-tailed, berarti kiri kanan masing-masing \(\frac{5}{2}\%\)

  • Makin tinggi tingkat kepercayaan, makin besar rentangnya.

  • Makin besar rentangnya, makin ga guna tebakannya (inefisien),

Rentang kepercayaan

  • Rumus menghitung rentang kepercayaan:

\[ \bar{X} \pm Z_{\frac{\alpha}{2}} \frac{S}{\sqrt{n}} \]

atau

\[ \mu=\left[ \bar{X}-Z_{\frac{\alpha}{2}} \frac{S}{\sqrt{n}}, \bar{X}+Z_{\frac{\alpha}{2}}\frac{S}{\sqrt{n}}\right] \]

  • Z adalah nilai baku / standardized score yang memberikan kita rentang kepercayaan \(1-\alpha\)

Contoh soal 1

  • Diambil sebuah sampel berisikan 100 mahasiswa, didapatkan memiliki rata-rata nilai tes TOEFL sebesar 500 dengan simbangan baku 50. Dengan rentang kepercayaan 95%, tentukan rentang nilai TOEFL keseluruhan mahasiswa tersebut!

  • Gunakan tabel Z untuk mendapatkan \(Z_{0.025}\)

  • Rentang rata-rata = \(500 \pm 1,96\times\frac{50}{\sqrt{100}}\)

  • Rentang rata-rata = \(\left[490,2;509,8\right]\)

Tabel Z

Bisa Google atau download di sini

distrubusi t

  • Distribusi normal (atau distribusi z) merupakan sebaran kontinyu dari \(-\infty\) sampai \(\infty\)

  • Meski demikian, hanya dari 3 standar deviasi kiri dan kanan aja udah lebih dari 99,99%.

  • Sampel dari populasi tersebut belum tentu terdistribusi normal, meski mirip:

    = sampel cenderung lebih mungkin dapat di sekitar rata-rata.

distribusi t

  • Semakin banyak sampel yang kita ambil, semakin mirip distribusinya dengan distribusi normal

  • Karena itu kita butuh distribusi baru di mana:

    • karakteristiknya mirip distribusi normal

    • Seiring sampel meningkat, bentuknya semakin mendekati distribusi normal

  • Distribusi tersebut adalah distribusi t.

t-table

Download t-table di sini

\(df=n-1\)

Contoh 2

  • Diambil sebuah sampel berisikan 10 mahasiswa, didapatkan memiliki rata-rata nilai tes TOEFL sebesar 500 dengan simbangan baku 50. Dengan rentang kepercayaan 90%, tentukan rentang nilai TOEFL keseluruhan mahasiswa tersebut!

  • Gunakan tabel Z untuk mendapatkan \(t_{0.05}\)

  • Rentang rata-rata = \(500 \pm 1,833\times\frac{50}{\sqrt{10}}\)

  • Rentang rata-rata = \(\left[471,02;528,98\right]\)

Student t

  • Student distribution umumnya digunakan untuk sampel yang sedikit.

  • Beberapa buku menyarankan menggunakan distribusi t selama sampel anda di bawah 30.

  • Saya akan menyarankan hal yang sama di sini.

  • Di dunia nyata, sampling adalah hal yang ribet, terutama jika anda memiliki banyak karakteristik yang harus diseimbangkan.

  • Secara umum, semakin banyak semakin baik. Batasnya? Budget. Yang penting Representatif.

Uji Hipotesis

  • Kita telah belajar menebak nilai pusat (dengan rata-rata) dan menghitung standar deviasi / simpangan baku.

  • Berikutnya kita akan belajar uji hipotesis dengan jumlah data yang lebih dari 1 jenis.

  • Kita masih menggunakan asumsi distribusi normal.

Hipotesis

  • Hipotesis adalah pernyataan tentatif mengenai parameter acak.

  • Parameter acak dimaksud adalah parameter yang menunjukkan karakteristik data yang sedang kita uji.

  • Misalnya kelas A punya rata-rata nilai 80 dan simpangan baku 10, kelas B 76 dan 8. Manakah yang lebih tinggi?

  • Supplier A dan supplier B, manakah yang produknya lebih baik?

Uji hipotesis

  • Uji hipotesis umumnya dilakukan dengan membandingkan nilai rata-rata dengan suatu parameter.

-Misalnya, rata-rata kelas A lebih tinggi daripada rata-rata kelas B, kita tuliskan sebagai:

\[ H_0: \mu_A > \mu_B \]

\[ H_1: \mu_A \leq \mu_B \] - \(H_0\) disebut juga hipotesis nol, sementara \(H_1\) disebut juga hipotesis alternatif.

Uji Hipotesis

  • Pada prosedur uji hipotesis, kita gunakan prinsip bahwa \(H_0\) dianggap benar, kecuali kita punya cukup bukti statistik untuk menolak \(H_0\).

  • Mirip prinsip praduga tak bersalah: seseorang dinyatakan tidak bersalah kecuali terbukti sebaliknya.

  • Kita menggunakan nilai tengah (\(\mu\)) untuk menguji \(H_0\).

Arah uji

  • Uji hipotesis dapat dibagi dua: uji hipotesis 2 arah (two-tailed) dan uji hipotesis 1 arah (1-tailed).

  • Uji hipotesis 2 arah kita gunakan bila \(H_0: \mu=\mu_0\) dan \(H_1: \mu\neq\mu_0\)

    • artinya, kita tolah \(H_0\) jika mendapati bahwa nilai rata-rata lebih besar ATAU lebih kecil dari nilai referensi.
  • Uji hipotesis 1 arah kita ginakan bila yang kita uji adalah lebih besar atau lebih kecil.

    • misalnya kita uji lebih besar dari, maka selama nilai rata-rata lebih kecil atau sama dengan, maka kita tolah \(H_0\)

Dua jenis eror

Kenyataan Menerima \(H_0\) Menolak \(H_0\)
Benar tidak salah Type I error
Salah Type II error tidak salah
  • Type I error (\(\alpha\)): aslinya benar tapi kita tolak.

  • Type II error (\(\beta\)): aslinya salah tapi kita terima.

Prosedur Uji hipotesis

  1. Menetapkan hipotesis: Tulis apa \(H_0\) dan \(H_1\) nya
  2. Menetapkan \(\alpha\), atau level kepercayaan untuk menolak \(h_0\)
  3. Menghitung parameter uji
  4. Memutuskan penolakan atau penerimaan \(H_0\)
  5. Membuat kesimpulan.