Nilai rata-rata dari data numerik tanpa diragukan merupakan ukuran statistik yang paling umum digunakan.
Siapa pun yang memiliki latar belakang statistika dasar tahu cara menghitung rata-rata (aritmatika) – hanya menjumlahkan nilai-nilai individu kemudian membagi hasilnya dengan banyaknya nilai.
Jika, mis., Kita berbicara tentang usia rata-rata sekelompok orang, kita selalu merujuk pada nilai rata-rata usia individu. Jadi ada juga pengertian umum tentang ukuran ini. Usia rata-rata dapat diartikan sebagai nilai “representatif” tunggal yang menggambarkan usia orang-orang dalam kelompok ini. Oleh karena itu, dalam bahasa statistika rata-rata disebut “parameter lokasi”.
Terkadang median digunakan sebagai alternatif dari rata-rata. Sama seperti nilai rata-rata, median juga merepresentasikan lokasi sekumpulan data numerik dengan menggunakan angka tunggal. Secara kasar, median adalah nilai yang membagi data individual menjadi dua bagian: (sekitar) 50% terbesar dan 50% data terendah dalam kolektif.
Contoh
Sebagai contoh, mari kita perhatikan lima pengukuran tekanan darah sistolik (mmHg) berikut:
142, 124, 121, 151, 132.
Nilai rata-rata adalah
(142 + 124 + 121 + 151 + 132) / 5 = 134
Untuk menghitung median, kita harus menyusun dari mulai dengan yang terkecil:
121, 124, 132, 142, 151.
Median didefinisikan sebagai nilai yang terletak di tengah, yaitu 132.
Pertama-tama kita perhatikan bahwa dalam contoh ini mean dan median tidak berbeda jauh, dan bahwa keduanya dapat dilihat sebagai nilai representatif yang masuk akal dari lima pengukuran individu.
Kedua, kita melihat mengapa kata “kira-kira” digunakan untuk deskripsi median pada bagian di atas: Kita tidak dapat membagi 5 angka dalam dua kelompok tepat 50% dari data.
Namun, untuk jumlah nilai genap, kita dapat melakukan hal berikut: Setelah mengurutkan berdasarkan ukuran, median dihitung sebagai rata-rata dari dua nilai yang berdiri di tengah.
Untuk
121, 124, 132, 142
mediannya adalah
(124 + 132) / 2 = 128
Berbeda dengan situasi dari jumlah nilai data yang genap, median tidak harus berupa nilai data itu sendiri.
PRO dan Kontra
Sekarang jika kedua ukuran statistik, rata-rata dan median, digunakan untuk menggambarkan “lokasi” satu set data, bagaimana dengan kelebihan dan kekurangan?
Seperti disebutkan di atas, rata-rata adalah ukuran yang lebih umum digunakan dari keduanya. Selain itu, ini adalah dasar dari banyak metode statistik canggih.
Misalnya, rata-rata diperlukan untuk menghitung standar deviasi, yang merupakan ukuran paling menonjol untuk menilai variasi/keragaman dalam satu set data. Dan itu juga diperlukan untuk banyak prosedur pengujian statistik, misal untuk uji-t.
Namun, apa kelebihan median?
Untuk menggambarkan hal ini, kita kembali ke hasil dari tekanan darah sistolik yang digunakan sebelumnya:
142, 124, 121, 151, 132.
Misalkan ketika melakukan uji tekanan darah yg ke empat hasil uji mengarah/menghasilkan ke pengukuran salah, yaitu 171.
Mari kita lihat apa yang terjadi dengan makna dan median jika hal di atas terjadi?
Rata-rata dari lima nilai yang dihasilkan dari data yh memuat 171 adalah 138 sedangkan yang memuat 151 134, sehingga menunjukkan efek yang cukup besar dari pengukuran yang salah.
Untuk mendapatkan median, kami mengurutkan data lagi berdasarkan ukuran:
121, 124, 132, 142, 171.
Seperti sebelumnya, nilai 132 berada di tengah-tengah baris data, sehingga median sebenarnya tidak berubah oleh pengukuran yang salah.
Itulah sebabnya median disebut “kuat terhadap outlier”, sedangkan rata-rata sebenarnya “sensitif terhadap outlier”.
Distribusi “Skewed”
Keuntungan lain dari median, yang terkait dengan ketahanan semacam ini, dapat dilihat pada distribusi “miring”.
Contoh untuk distribusi seperti itu dalam konteks studi observasional adalah waktu sejak timbulnya penyakit tertentu.
Dalam banyak kasus, tanggal diagnosis mendekati waktu pelaporan, yaitu pada atau hanya beberapa hari sebelum kunjungan awal. Namun, kelompok studi sering juga mencakup pasien yang telah menderita penyakit ini selama bertahun-tahun.
Jika kita menghitung rata-rata rentang waktu individu sejak permulaan penyakit, nilai-nilai besar tersebut memiliki dampak yang sangat besar, menjadikan rata-rata lebih besar daripada yang disarankan oleh distribusi data aktual.
Berita baiknya adalah bahwa outlier tidak memiliki efek seperti itu pada median. Oleh karena itu, di sini median memberikan gambaran data yang lebih realistis.
Jadi yang mana yang harus kita gunakan?
Strategi terbaik adalah menghitung kedua langkah tersebut.
Jika mereka tidak terlalu berbeda, gunakan mean untuk diskusi data, karena hampir semua orang sudah mengenalnya.
Jika kedua ukuran sangat berbeda, ini menunjukkan bahwa data miring (mis. Mereka masih jauh dari yang terdistribusi normal) dan median umumnya memberikan ide yang lebih tepat tentang distribusi data.
Penulis
Dr. Dieter Schremmer (head of biostatistics @GKM)
disadur dari clinfo.eu
(under review)
0Bimbinglah kami kepada jalan yang lurus
Baca Lagi Biar Pinter
- 68Sampel adalah bagian dari populasi. Dalam menentukan besaran sampel yang harus diambil harus dipertimbangkan Ukuran populasi Keragaman populasi
- 66Bagaimana jika kamu menyebarkan kuesioner tetapi yang mengisi kuesioner mengisi dengan acak? Untuk menghindari hal tersebut kita bisa mengeceknya dengan…
- 61Orang zaman dahulu mengamati langit, awan, angin dan rasi bintang. Hasil dari pengamatan dipakai untuk kehidupan sehari-hari. Kini, orang mengamati…
- 58[latexpage] Dapatkah suatu matriks sama dengan suatu nilai? Tentu mustahil sama. Matriks mempunyai dimensi m x n ( m baris…
- 55Binomial terdiri dari suku kata bi yang berarti dua dan nomial yang berarti kondisi. Distribusi binomial adalah distribusi peluang kejadian…
Leave a reply