Pengantar Statistika - Konsep Teori Estimasi

ilustrasi penyajian data
Sumber: Unsplash

Statistika adalah cabang matematika yang mempelajari cara merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika merupakan ilmu yang berkenaan dengan data. Istilah “statistika” berbeda dengan “statistik”. Statistika merupakan ilmu yang berkenaan dengan data, sedangkan statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Statistika banyak diterapkan dalam berbagai disiplin ilmu, seperti ilmu-ilmu alam (misalnya astronomi dan biologi), ilmu-ilmu sosial (misalnya sosiologi dan psikologi), ekonomi, dan industri.

Baca juga: Definisi, Cabang-Cabang, dan Prinsip Belajar Matematika

Statistika dapat dibedakan ke dalam 2 jenis, antara lain:

  • Statistika deskriptif merupakan statistika yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku untuk umum atau generalisasi. Contohnya, menghitung rata-rata dan varians dari data mentah dan mendeskripsikannya dengan tabel-tabel atau grafik, sehingga data mentah lebih mudah “dibaca” dan bermakna.
  • Statistika inferensial merupakan statistika yang digunakan untuk menganalisis data sampel dan hasilnya diberlakukan untuk populasi. Inferensial berkenaan dengan permodelan data dan melakukan pengambilan keputusan berdasarkan analisis data. Contohnya, melakukan pengujian hipotesis, melakukan estimasi pengamatan masa mendatang, dan membuat permodelan hubungan (korelasi, regresi, ANOVA, deret waktu).

Salah satu aspek penting dalam statistika inferensial adalah estimasi parameter populasi. Estimasi parameter populasi (penaksiran parameter populasi) adalah pendugaan karakteristik populasi dengan menggunakan karakteristik sampel. Populasi biasanya memiliki ukuran yang sangat banyak, sehingga sangat sulit untuk mengetahui karakteristiknya melalui sensus. Sensus sangat tidak ekonomis dari segi waktu, tenaga, dan biaya. Oleh karena itu, dapat digunakan pengestimasian dengan melakukan survei terhadap sampel yang diambil secara acak dari populasi tersebut yang selanjutnya hasil karakteristik sampelnya digunakan untuk mengestimasi karakteristik populasi. Sampel yang digunakan adalah sampel yang benar-benar mewakili populasi.

Harga sebuah parameter populasi hanya diestimasikan berdasarkan harga statistik sampel. Teknik statistika yang digunakan untuk mengetahui parameter populasi (rata-rata $\mu$, simpangan baku $\sigma$, proporsi $\pi$, dan sebagainya) adalah dengan menggunakan statistik pada sampel acak yang sesuai. Parameter populasi disebut sebagai nilai sebenarnya (true value) dan dilambangkan dengan $\theta$ (baca: theta), sedangkan statistik sampel disebut sebagai nilai estimasi (estimate value) yang dilambangkan dengan $\hat{\theta}$ (baca: theta topi).

Secara umum, parameter populasi akan diberi simbol $\theta$. Jadi, $\theta$ bisa merupakan rata-rata $\mu$, simpangan baku $\sigma$, proporsi $\pi$, dan sebagainya. Jika $\theta$ yang tidak diketahui harganya ditaksir oleh harga $\hat{\theta}$, maka $\hat{\theta}$ dinamakan estimator atau penaksir. Jelas bahwa sangat dikehendaki $\hat{\theta}=\theta$, yaitu $\hat{\theta}$ bisa mengestimasi harga $\theta$ yang sebenarnya. Namun, ini merupakan keinginan yang sifatnya ideal. Kenyataan yang biasa terjadi adalah:

  • Mengestimasi $\theta$ oleh $\hat{\theta}$ terlalu tinggi
  • Mengestimasi $\theta$ oleh $\hat{\theta}$ terlalu rendah

Namun, kedua kenyataan tersebut tidaklah dikehendaki karena pada dasarnya yang diinginkan adalah estimator yang baik. Terdapat beberapa kriteria untuk mendapatkan estimator yang baik, yakni tak bias, mempunyai varians minimum, dan konsisten.

  • Estimator $\hat{\theta}$ dikatakan estimator tak bias jika rata-rata semua harga $\hat{\theta}$ yang mungkin akan sama dengan $\theta$.
  • Estimator bervarians minimum adalah estimator dengan varians terkecil di antara semua estimator untuk parameter populasi yang sama. Jika $\hat{\theta}_1$ dan $\hat{\theta}_2$ adalah dua estimator untuk $\theta$ di mana varians untuk $\hat{\theta}_1$ lebih kecil dari varians untuk $\hat{\theta}_2$, maka $\hat{\theta}_1$ merupakan estimator bervarians minimum. Artinya, sampelnya relatif homogen atau seragam.
  • Misalkan $\hat{\theta}$ estimator untuk $\theta$ yang dihitung berdasarkan sebuah sampel acak berukuran n. Jika ukuran sampel $n$ makin besar mendekati ukuran populasinya yang menyebabkan $\hat{\theta}$ mendekati $\theta$, maka $\hat{\theta}$ disebut estimator konsisten.

Terdapat beberapa jenis estimasi, yakni di antaranya:

  • Estimasi titik adalah estimasi yang hanya mempunyai atau menyebutkan satu nilai. Dalam estimasi titik, digunakan data sampel untuk menghitung suatu nilai statistik sebagai estimasi parameter populasi.
  • Estimasi interval adalah sebuah interval kepercayaan (confidence interval) yang berisi pernyataan kepercayaan bahwa interval tersebut berisi nilai parameter populasi. Besarnya estimasi interval dipengaruhi oleh 3 faktor, yakni besarnya sampel ($n$), tingkat atau koefisien kepercayaan yang dipilih (level of confidence), variabilitas dari populasi yang diukur dengan simpangan baku

Dari ketiga faktor tersebut, bisa ditentukan jenis distribusi mana yang akan digunakan dalam menghitung estimasi interval.

Comments

Popular posts from this blog

Luasan Putaran Berderajat Dua - Elipsoida dengan Titik Pusat O dan Sumbu-Sumbunya Berimpit dengan Sumbu-Sumbu Koordinat

4 Situs Terbaik dan Gratis untuk Memecahkan Soal Matematika

Definisi dan Rumus Putaran atau Rotasi