Register Now

Login

Lost Password

Lost your password? Please enter your email address. You will receive a link and will create a new password via email.

Add post

Add question

Mean vs Median

Kawan2 dari Sabang s/d Merauke,

Misal kepada kita diberikan dataset berikut: {81, 92, 89, 77, 84, 38, 78}.

Murid sekolah menengah pun tahu bagaimana menghitung mean dan median data tsb. Dengan mudah mereka menghitung mean = 77 dan median 81. Namun, jangan tanyakan kepada mereka; apa itu mean dan apa itu median. Dapat dipastikan mereka tidak tahu. Mereka pandai berhitung namun miskin interpretasi. Keadaan ini jelas menunjukkan kelemahan system pendidikan kita. Ini tidak boleh dibiarkan.

Teringat tahun 1975 (45 tahun yang lalu), di Perancis, konsep2 sederhana tentang probability sudah diberikan di tingkat taman kanak2.

Baik mean maupun median dua2 nya hendak menunjukkan benda yang sama. Apakah benda itu? Ini dia: PUSAT GRAVITASI dataset! Orang yang berada di pusat gravitasi akan melihat dataset dalam keadaan equilibrium.

Mean dan median adalah parameter yang dalam statistika disebut “measure of central tendency”. Awas jangan keliru dengan centrality measure!

Parameter itu mempunyai sifat sbb. Ia yang paling dekat dengan semua data. Pengertian “dekat” hanya mungkin ada kalau ada ukuran “jarak”. Nah, parameter mean berkaitan dengan jarak Euclid, sedangkan median dengan jarak geodesic.

Anda suka yang mana? Mean atau median?

Kesukaan Anda menunjukkan siapa Anda. Yang lebih menyukai mean dapat dipastikan ia adalah pengguna statistic. Sedangkan yang lebih menyukai median dapat dipastikan ia adalah ilmuwan statistic. Dari mana dalil ini? Begini. Mean mempunyai sifat:

1. Jumlah kuadrat jarak Euclid terhadap semua data adalah minimum. Sifat inilah yang menurunkan istilah variance
2. Mudah dikendalikan karena prilaku distribusinya mudah diterka
3. Tidak robust

Di lain pihak, median memiliki sifat:
1. Jumlah jarak geodesic terhadap semua data adalah minimum
2. Sukar dikendalikan karena prilaku distribusinya sukar dikelola
3. Robust (outlier/pencilan tidak berpengaruh)

Karena sifat-sifat itulah, maka para pengguna statistika lebih menyukai mean ketimbang median, walaupun mereka tahu bahwa mean TIDAK robust. Kesukaan tsb timbul karena kepentingan praktis belaka. Sebailknya, para teoritisi dan statistical scientists lebih menyukai median mengingat parameter ini merupakan “measure of central tendency” yang paling robust dan sangat menantang.

Menantang? YA! Median jauh lebih menantang ketimbang mean. Dimana letak tantangannya? Tantangan pertama terletak pada prilaku distribusinya. Kedua, apabila kita bekerja dengan data bivariate atau secara umum data multivariate, lantas yang mana median data tsb? Dan, bagaimana pula distribusinya? Wow….masalah yang amat sangat berat!

Kalau Anda berniat mengikuti PhD program dan berminat menjawab tantangan ini, sila gunakan masalah tsb sebagai topik risetnya.

Jangan lupa, statistika fokusnya adalah inferensi. Sisanya adalah pemodelan. Sedangkan “all models are wrong but some are useful” – kata GEP Box dalam Journal of Quality Technology, tahun 1972. Box betul!

Selamat berkarya,

Penulis,

Maman A. Djauhari (Pensiun dari ITB tahun 2009)

Baca Lagi Biar Pinter

  • 54
    Belajar Konsep Dasar Machine LearningTulisan ini diterjemahkan dan diedit dari sumber introduction machine learning mit opencourseware. Manfaat : Membuat Mesin Yang Bisa Belajar dan…
    Tags: yang, dan, itu, ini, anda
  • 44
    Manfaat : rumus variansi digunakan untuk mengukur keragaman (variasi) data. Rumus : $\displaystyle \frac{\sum_i^N (x_i-\mu)^2}{N}$ $\mu$ : rata-rata (mean) $x_i$…
    Tags: data, adalah
  • 40
    Karena data harga emas merupakan data deret waktu, maka alat atau model yang digunakan untuk memprediksi yang sampai saat ini…
    Tags: yang, adalah, data, dengan, karena
  • 40
    Nilai rata-rata dari data numerik  tanpa diragukan merupakan ukuran statistik yang paling umum digunakan. Siapa pun yang memiliki latar belakang…
    Tags: yang, median, data, dan, adalah, ini
  • 36
    Analyze Descriptive Statistics Frequencies Input variabel dengan cara pilih variabel lalu klik panah ke kanan Pilih ukuran pemusatan (central tendency)…
    Tags: data, dengan, yang, dan

About Riad Taufik LazwardiSweet

Lecturer of Mathematics at 1. Bina Tunas Bangsa (now) 2. Fitrah Islamic World Academic School (2019-2020) 3. Kalbis Institute | Managed by Binus (2018-2019) 4. Telkom University (2017-2018) 5. UIN Bandung (2015-2018)

Follow Me

Leave a reply