Pertemuan 6
Review PDF dan distribusi normal
Z-score
Menebak probabilitas
\[ f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \]
\(\mu\) adalah nilai rata-rata dari total populasi.
\(\sigma\) adalah simpangan baku.
Keduanya adalah nilai dari central tendency / ukuran gejala pusat dan sebaran.
Z-score disebut juga dengan standardized values / scores.
Z-score adalah transformasi yang kita lakukan untuk mengubah angka pada data kita menjadi sebuah nilai standar dalam menggunakan PDF distribusi normal.
PDF distribusi normal yang standar adalah di mana:
\(\mu=0\)
\(\sigma=1\)
\[ z=\frac{x-\mu}{\sigma} \]
Di mana x adalah data point yang mau kita transformasi.
Jajan | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
BPP | 500 | 450 | 350 | 600 | 550 | 550 | 600 | 450 | 500 | 450 |
\(\mu=500 \ ; \ \sigma=74,16\)
Jajan | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
BPP | 500 | 450 | 350 | 600 | 550 | 550 | 600 | 450 | 500 | 450 |
\(z_b\) | 0 | -0.67 | -2.02 | 1.35 | 0.67 | 0.674 | 1.35 | -0.67 | 0 | -0.67 |
Posisi angka-angka pada data tentunya tidak sama: semua bergeser jika rata-rata dan standar deviasinya berbeda.
Kita menjadikan data biasa ke dalam Z-score karena Z-score membuat angkanya menjadi standar.
Dengan angka yang standar, kita jadi dapat menggunakan tabel yang standar
Dengan tabel yang standar kita jadi tidak harus membuat tabel baru untuk setiap data poin.
Berapa banyak kira-kira di BPP dengan uang jajan di bawah 700 ribu?
Cari Z-score dulu \(Z_{700}=\frac{700-500}{74,16}=2,7\)
\(P(X<700) \approx P(Z_X<2,7)\)
Lihat di tabel, \(P(Z<2,7)=0,9965\)
Berapa banyak mahasiswa di BPP dengan uang jajan di atas 400 ribu?
\(Z_{700}=\frac{400-500}{74,16}=-1,348\)
\(P(X<600) \approx P(Z_X<-1,348) \approx 0,0885\)
\(P(Z_X>-1,348)=1-0,0885=0.9115\)
Negara Wokondo memiliki pendapatan bulanan bersih per kapita rata-rata 6 juta rupiah, dengan standar deviasi 8 juta rupiah. Di Wokondo, orang berpendapatan di bawah 2 juta rupiah sudah dianggap miskin. Jika penduduk Wokondo ada 200 juta orang, berapa jumlah penduduk miskin di Wokondo?
Intinya ini pertanyaan \(P(X<2)\). Bisa jawabnya?
Di Wokondo, anda dianggap kelas menengah jika pendapatannya ada di kisaran 5 juta sampai 8 juta rupiah. Berapakah jumlah penduduk Wokondo yang dianggap sebagai kelas menengah?
Intinya ini pertanyaan \(P(5<X<8)\). Bisa jawabnya?
Di Wokondo ada sekitar 2 juta orang yang dianggap sebagai orang ultra kaya. Bisakah anda menebak berapa pendapatan paling minimal untuk masuk golongan ultra kaya?
\(P(Z_X > Y) = \frac{2}{200}=0,01\)
\(P(Z_X < Y) = 1-0,01=0,99 \rightarrow Y=2,33\)
\(2,33=\frac{X-6}{8} \rightarrow X=(2,33 \times 8 ) + 6 = 24,64\) Juta
Teknik ini dapat kita lakukan karena PDF = probabilitas!
Penggunaan distribusi normal seperti ini sangat praktis bagi kita yang tidak mungkin melakukan survey karena keterbatasan dana.
Dengan mengasumsikan distribusi normal, anda dapat melihat satu angka saja, lalu cari rata-rata dan standar deviasi dari lembaga yang kredibel, lalu bisa menebak posisi seseorang dalam distribusi keseluruhan.
Tapi ingat selalu bahwa Statistika = tebak-tebakan!
Untuk latihan, anda dapat mencoba dengan variasi P(X), bisa lebih kecil, lebih besar, antara, silakan dicoba-coba. ada banyak kemungkinannya.
Anda juga bisa mencoba dengan menggunakan nilai \(\mu\) dan \(\sigma\) yang berbeda-beda.
Misalnya, dengan rata-rata yang sama, bagaimanakah bedanya P(Z) antara data dengan \(\sigma\) kecil vs \(\sigma\) besar?
jangan lupa bahwa teknik ini kita gunakan dengan sebuah ASUMSI bahwa populasi yang ingin kita tebak memiliki distribusi normal.
Distribusi normal belum tentu benar untuk beberapa karakteristik.
Meski demikian, distribusi normal dianggap paling mungkin menjelaskan suatu populasi.
Pada kenyataannya, tidak ada manusia yang tau dan yakin 100% bahwa distribusi normal pasti benar.
Pastikan anda paham hal ini.