| Telaah Statistik : Penyebaran Data |
| Ditulis Oleh: Dr. Brodjol Sutijo Suprih Ulama MS | |
| Tuesday, 02 September 2008 | |
|
Nilai pemusatan data dapat dicari dengan menghitung nilai rata-rata, median dan modus. Nilai penyebaran data adalah nilai range atau jangkauan, jangkauan inter kuartil dan varian. Nilai varian lebih sering digunakan dibandingkan nilai yang lain. Telah diketahui bahwa nilai median merupakan nilai pemusatan data yang “robust” terhadap nilai outlier. Dengan menggunakan nilai median berarti kita mempunyai dua kelompok data yang sama banyak, yaitu kelompok data yang nilainya kurang atau sama dengan median dan kelompok data yang nilainya lebih atau sama dengan median. Bila data dikelompokkan menjadi empat kelompok yang berjumlah sama berarti yang sedang dicari adalah nilai kuartil sebagai batas kelompok tersebut. Salah satu cara dapatkan sebaran data yang paling sederhana, adalah dengan tentukan nilai minimum dan nilai maksimum. Nilai minimum dan maksimum tersebut memberikan informasi bahwa data berada dalam range atau jangkauan tersebut; dengan kalimat lain, semua nilai data berada diantara nilai minimum dan nilai maksimum, tidak ada satu pun nilai diluar kedua nilai tersebut. Lokasi dari data sudah tentu tidak merata pada range tersebut akan tetapi ada kelompok-kelompok data pada range tersebut. Kelompok-kelompok data dapat berada di tengah, dikiri maupun di kanan. Pola dari kelompok data inilah yang memberikan gambaran pemahaman tentang sebaran data. Bila perhatian pada data sejumlah 50% data yang berada ditengah, berarti focus kita adalah data pada interval antara kuartil satu dan kuarti tiga interval ini biasa disebut dengan jangkauan antar kuartil. Kondisi sebaran 50% data yang berada di tengah ini dapat diketahui dengan meletakkan nilai kuartile satu, kuartil dua (median) dan kuartile tiga pada garis bilangan. Secara umum, bila nilai median berada di tengah, antara kuartil satu dan kuartil tiga memberi informasi bahwa data kita simetri. Sedangkan untuk nilai median yang berada dekat dengan kuartil satu memberi informasi bahwa pola data adalah menjulur ke kanan atau ke atas, yang dengan ungkapan lain; data menggerombol pada nilai kecil (banyak observasi yang nilainya kecil). Begitu juga sebaliknya, yaitu nilai median dekat dengan kuartil tiga, pola data menjulur ke kiri atau kebawah dengan kata lain data menggerombol pada nilai besar (berarti, banyak observasi yang nilainya besar). Penanganan 50% data yang tersisa (25% dikiri kuartil satu dan 25% di kanan kuartil tiga) adalah menentukan nilai ambang batas yang disebut dengan batas bawah dan batas atas. Bila nilai Jangkauan Antar Kuartil (JAK) dianggap sebagai nilai simpangan baku, maka dengan tingkat keyakinan 95%, data terletak pada : Batas Bawah(BB) = Median - 2 JAK Batas Atas (BA) = Median + 2 JAK Dengan menggunakan Batas Bawah, kuartil satu, Median, kuartil tiga, dan batas atas kita dapat membuat suatu pola sebaran dari data yang sebut diagram yang disebut diagram kotak garis.
Pada grafik ditunjukkan bahwa garis yang ada ditengah suatu kotak adalah nilai median dari setiap kelompok data (ada empat kelompok). Batas kotak adalah nilai kuartil satu (bawah) dan kuartil tiga (atas), sedangkan ujung dari garis merupakan nilai batas bawah (ujung bawah) atau batas atas (ujung atas). Pada kelompok data ketiga pola sebaran data adalah simetri, sedangkan pada kelompok data kesatu dan kedua pola data menjulur ke atas dan kelompok keempat menjulur ke bawah. Ada kalanya data yang kita kumpulkan tidak berada pada interval yang tertera pada diagram kotak garis. Data yang berada diluar interval tersebut disebut data outlier, biasanya dinyatakan dengan tanda ‘*’. Pada kenyataan, cara-cara yang sederhana di atas kurang populer walaupun banyak informasi begitu mudah diperoleh dibandingkan dengan mendapatkan nilai varian. Bisa jadi karena harus mengurutkan data terlebih dahulu, mulai data data terkecil sampai terbesar untuk mendapatkan nilai kuartil satu, median dan kuartil tiga. Pada saat sekarang ini kendala tersebut dapat diatasi dengan keberadaan komputer. Adapun nilai varian secara umum adalah ukuran penyebaran data dari nilai rata-rata. Salah satu kelebihan dari nilai varian adalah menggunakan semua data untuk mendapatkan nilai varian tersebut, sedangkan kekurangannya adalah tidak menarik dari segi eksplorasi data dan tidak robust tertadap outlier. |
| < Sebelum | Berikut > |
|---|





