1. Pengertian
Reliabilitas
berasal dari kata reliability berarti kepercayaan, keterandalan,
keajegan, kestabilan, dan konsistensi. Miller(2008) mengatakan “reliability is an estimate of test
consistency”. Reliabilitas instrumen berarti kepercayaan, keterandalan,
keajegan, kestabilan, dan konsistensi suatu instrumen. Reliabilitas instrumen
pada umumnya, dianggap sama dengan reliabilitas hasil ukur. Artinya, berapa
kali pun instrumen tersebut dipakai untuk melakukan pengukuran terhadap kelompok
subyek yang sama dan aspek-aspeknya tak diubah diasumsikan akan diperoleh hasil
yang relatif sama.
Menurut Brennan (2001:
295) reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun
bentuk tes.Menurut Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan
sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil
pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan
kemantapan.
Reliabilitas
dapat juga berarti indeks yang menunjukan sejauh mana suatu alat ukur dapat
dipercaya atau diandalkan. Reliabilitas menunjukan kemantapan dan konsistensi
hasil pengukuran. Suatu instrumen dikatakan memiliki angka reliabilitas yang
tinggi apabila instrumen tersebut digunakan untuk mengukur sesuatu secara
berulang-ulang, mrnunjukan hasil yang sama dan dalam kondisi yang sama.
Kerlinger
(1996) memberikan beberapa batasan tentang reliabilitas, yaitu: 1) reliabilitas
dicapai apabila kita mengukur himpunan objek yang sama berulang-ulang dengan
istrumen yang sama atau serupa akan memberikan hasil yang sama atau serupa, 2)
reliabilitas dicapai apabila ukuran yang diperoleh dari suatu instrumen
pengukuran adalah ukuran “yang sebenarnya” untuk sifat yang diukur, dan 3)
keandalan dicapai dengan meminimalkan galat pengukuran yang terdapat dalam
suatu instrumen pengukuran. Berdasarkan uraian diatas, instrumen dikatakan
reliabel jika instrumen tersebut memiliki sifat konstan, stabil atau ajeg.
Jadi, alat ukur dinyatakan reliabel apabila diujicobakan terhadap sekelompok
subyek akan tetap sama hasilnya, walaupun dalam waktu yang berbeda, dan/atau
jika dikenakan pada subyek lain yang sama karakteristiknya dan hasilnya akan
sama juga.
2. Jenis-jenis reliabilitas
Walizer (1987) menyebutkan bahwa
ada dua cara umum untuk mengukur reliabilitas, yaitu:
1. Relibilitas
stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk
setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya.
Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi
operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada
waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali
unit diukur skornya haruslah sama atau hampir sama.
2. Reliabilitas ekivalen. Menyangkut usaha
memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu
yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih
indicator yang berbeda, batasan-batasan operasional, paeralatan pengumpulan
data, dan / atau pengamat-pengamat.
Menguji
reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias
menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah.
Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang
mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan
tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau
pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing
bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian
tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian
tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah
reliabilitas belah tengah.
Reliabilitas
ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda.
Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari
satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila
seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah
menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang
diukur.
Miller (2008)
mengklarifikasikan reliabilitas instrumen kedalam tiga kategori, yaitu stability, equivalece, dan internal consistency. Ketiga kategori
tersebut meiliki teknik dan prosedur pengukurannya masing-masing sebagaimana
dipaparkan dalam tabel berikut.
Reliabilitas
|
Metode
|
Prosedur
|
Stabilitas
|
Tes
ulang (test-retest)
|
Tes
yang sama tetapi dilakukan pengulangan dalam waktu yang berbeda.
|
Ekuivalensi
|
Tes
paralel
|
Dua
alat ukur yang relatidf sama diberikan kepada peserta didik yang sama dalam
waktu yang relatif sama.
|
Konsistensi
internal
|
Tes
belah dua
|
Alat
ukur diujicobakan ke peserta didik, kemudian butir soal dianalisis atas dasar
belah dua, misal butir ganjil dibandingkan dengan butir genap.
|
Kuder-Richardson
|
Butir-butir
alat ukur dianalisis dengan teknik analisis Kuder-Richarson.
|
3. Teknik-teknik yang digunakan
a. Teknik
Paralel (Paralel Form atau Alternate Form)
Teknik
paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti
harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu
dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir
soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari
instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji
coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan
menggunakan rumus product moment (korelasi Pearson).
b.Teknik
Ulang (Test Re-test)
Disebut
juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun
dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk
mengetahui besarnya indeks reliabilitas.Teknik perhitungan yang digunakan sama
dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson.
Menurut
Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes
konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan
antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu
yang berbeda.
Metode
pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode
pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau
“test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang
lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas,
bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua
bagian yang berbeda dari kuesioner atau wawancara. Misalnya the Minnesota
Multiphasic Personality Inventory (MPPI) mengecek reliabilitas test-retest
dalam satu kuesionernya dengan mengulang pertanyaan tertentu di bagian-bagian
yang berbeda dari kuesioner yang panjang.
Kesulitan
terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa
sifat/ variable yang akan diukur memang benar-benar bersifat stabil sepanjang
waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang
tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah
pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini
selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar
pijakan yang obyektif.
c.Teknik
Belah Dua (Split Halve Method)
Disebut
juga tenik “single test single trial”. Peneliti boleh hanya memiliki
seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya
dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama
besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar
nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian.
Menurut
Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor
dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada
suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh
tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi
koefisien yang didapat.
4. Pengujian Reabilitas
4.1.Reliabilitas
Merupakan Koefisien Stabilitas Eksternal
Menurut
Retnawati (2015) Reliabilitas eksternal diperoleh dengan cara mengolah hasil
pengetesan yang berbeda, baik dari instrument yang berbeda maupun yang sama.
Ada dua cara untuk estimasi reliabilitas eksternal suatu instrument yaitu
dengan teknik ulang dan teknik paralel.
a. Metode
Test Ulang (Test-Retest-Method)
Metode
tes ulang adalah metode estimasi reliabilitas yang dilakukan dengan
mengestimasi sebuah perangkat instrumen kepada kelompok peserta uji coba yang
sama sebanyak dua kali. Hasil estimasi kedua pengujian selanjutnya
dikorelasikan (Purwanto, 2007: 156).
b. Metode Bentuk Paralel
(Equivalent/alternate form)
Metode
paralel adalah estimasi reliabilitas yang dilakukan dengan cara membuat dua
perngkat instrumen yang paralel dan
mengestimasikan sekaligus (Purwanto, 2007: 157). Salah satu indikator
terpenuhinya asumsi paralel adalah setaranya korelasi antara skor kedua
instrumen tersebut dengan skor suatu ukuran lain. (Azwar, 2007: 182).
4.2.Reliabilitas Merupakan Koefisien
Stabilitas Internal
Estimasi reliabilitas
dengan pendekatan konsistensi internal didasarkan pada data dari sekali
pengenaan satu bentuk alat ukur pada sekelompok subjek (single trial
administration) (Azwar, 2007: 182). Menurut Purwanto (2007: 159), jika dalam
suatu instrumen terdapat butir soal dengan jumlah genap maka dapat menggunakan
metode Belah Dua, Flanagan, atau Rulon. Sedangkan pada kasus lain jika butir
soal berjumlah ganjil maka estimasi realibilitas dapat menggunakan
Kuder-Richardson, Hoyt, dan Alpha Cronbach.
a. Jumlah
Butir Genap
Metode pengujian
reliabilitas atas instrumen ini
dilakukan jika suatu instrumen dapat dibelah menjadi dua bagaian sama besar.
Metode yang dapat digunakan untuk mengestimasi reliabilitas butir soal genap
antara lain: Reliabilitas dengan Rumus Spearman-Brown, Flanagan, dan Rulon.
untuk lebih memperjelas
perhitungan koefisien reliailitas pada kelompok metode belah dua, ikuti contoh
berikut. Data dalam Tabel 3 adalah hasil tes pada mata pelajaran Matematika
dengan 10 butir soal pilihan ganda pada 5 orang anak.
1. Reliabilitas dengan Metode Belah Dua
Metode ini dilakukan
apabila guru atau pengembang instrumen tidak ingin mengujicobakan dua kali dan
membuat dua perangkat yang paralel. Instrumen dibuat satu perangkat dan hanya
diujikan sekali, tetapi selanjutnya butir dibelah menjadi dua. Metode belah dua
(split half method) adalah metode pengujian reliabilitas yang dilakukan dengan
cara membagi butir perangkat instrumen menjadi dua belahan, selanjutnya
mengkorelasikan skor total kedua belahan. Setiap butir dalam instrumen harus
mengukur hal yang sama, sehingga korelasi antara kedua belahan harus tinggi.
Menurut cara
membelahnya, pembelahan dapat dilakukan dengan membelah butir dalam butir
ganjil dan genap atau awal dan akhir. Misalkan pada instrumen yang terdiri dari
10 butir, pembelahan ganjil-genap dilakukan dengan mengelompokan butir
1,3,5,7,9 dalam belahan pertama dan butir 2,4,6,8,10 dalam belahan kedua. Pada
cara lain, pembelahan atas dasar awal-akhir dilakukan dengan mengelompokan
butir 1,2,3,4,5 dalam belahan pertama dan butir 6,7,8,9,10 dalam belahan kedua.
2. Reliabilitas
dengan Rumus Flanagan
Dalam teknik ini
dilakukan pembelahan data menjadi dua belahan. Pembelahan dapat dilakukan atas
dasar belahan ganjil-genap atau awal-akhir. Selanjutnya mengestimasi
reliabilitas dengan menggunakan rumus:
rxy = 2(1-((s₁²-s₂²)/st²))
Keterangan:
rxy:
koefisien reliabilitas
3. Reliabilitas dengan Rumus Rulon
Rulon (1939) merumuskan
suatu formula untuk mengestimasi reliabilitas belah dua tanpa perlu berasumsi
bahwa kedua belahan mempunyai varians yang sama. Menurut Rulon (dalam
Retnawati, 2015), perbedaan skor subjek pada kedua belahan tes akan membentuk
distribusi perbedaan skor dengan varians yang besarnya ditentukan oleh varians
eror masing-masing belahan menentukan varians eror keseluruhan tes, maka
varians eror tes ini dapat diestimasi lewat besarnya varians perbedaan skor
diantara kedua belahan. Formula Rulon dirumuskan sebagai:
rxy = 1-(sd²/st²)
Keterangan:
b.Jumlah Butir Ganjil
Mengestimasi
reliabilitas sebagai koefisien konsistensi internal dimana butir soal genap
dapat menggunakan metode Kuder-Richardson , Hoyt, dan Alpha Cronbach.
1.Kuder-Richardson
Kuder dan Richardson
merumuskan banyak formula reliabilitas. Metode iniditemukan oleh dua orang yang
diabadikan menjadi nama rumusnya, yaitu Kuder dan Richardson. Keduanya membuat
sejumlah rumus pengujian reliabilitas dan diberi nomor, adapun yang paling
terkenal adalah formula KR-20 dan KR-21. Menurut Retnawati (2015), apabila
peneliti memiliki instrument dengan jumlah butir pertanyaan ganjil, maka
peneliti tersebut tidak mungkin menggunakan teknik belah dua untuk pengujian
reliabilitasnya. Untuk itu maka peneliti dapat menggunakan rumus KR-20. Formula
KR-20 adalah:
Keterangan:
n : jumlah butir
st² :
varians total
p : proporsi skor yang diperoleh
q : proporsi skor maksimum dikurangi skor
yang diperoleh
Selain rumus KR-20
terdapat KR-21 yang dapat digunakan untuk menghitung koefisien reliabilitas.
Rumus KR-21 adalah sebagai berikut.
Keterangan:
n : jumlah butir
M : rata-rata skor total
st² :
varians total
2. Alpha
Cronbach
Menurut
Retnawari (2015), Rumus Alpha Cronbach digunakan untuk mengestimasi
reliabilitas instrument yang skornya bukan 1 dan 0, misalnya angket atau soal
bentuk uraian. Rumus Alpha Cronbach yaitu:
Keterangan:
n : jumlah butir
si² : varians butir
st² : varians total
3.Hoyt
Perhitungan
koefesien reliabilitas menggunakan metode Hoyt dilakukan dengan rumus:
keterangan:
V(s) : Varians Responden
V(t) : Varians Total
c.Batas
Keputusan Reliabilitas
Pembuatan keputusan
apakah suatu instrumen dapat dinyatakan reliabel atau tidak didasarkan pada
batas untuk membuat keputusan reliabilitas. Angka koefesien reliabilitas yang
dihitung melalui berbagai metode pengujian reliabilitas masih harus
dikonfirmasikan dengan batas tertentu untuk dapat ditafsirkan reliabel atau
tidak. Instrumen dapat dinyatakan reliabel apabila koefisien yang diperoleh
melalui perhitungan menggunakan metode pengujian reliabilitas tertentu lebih
besar dibandingkan dengan batas keputusan reliabilitas.
Tidak ada anggka
koefisien batas yang pasti yang dapat digunakan sebagai dasar untuk menentukan
apakah suatu koefesien reliabilitas hasil perhitungan menunjukan reliabel atau
tidak. Batas reliabilitas bersifat sangat relatif akan sangat tergantung pada
kepentingan penilai atau pengumpul data. Menurut Azwar (1995:186), koefisien
reliabilita harus diusahakan setinggi mungkin, namun koefisien yang tidk tinggi
dapat dianggap cukup dalam pengukuran tertentu yang tidak digunakan sebagai
dasar pengambilan keputusan yang bersifat individual.
Gronlund dan Linn
(1990:100-101) memberikan argumentasi yang lebih ekstentif. Menurutnya, derajat
reliabilitas dalam pengukuran pendidikan sangat tergantung kepada keputusan
yang akan dibuat. Beberapa pertimbangan dalam menentukan seberapa tinggi
seharusnya sebuah reliabiliatas, disampaikan berikut.
Pertama, tingkat
pentingnya keputusan. Apabila keputusan yang diambil berdasarkan skor yang
dikumpulkan dari instrumen mempunyai konsekuensi yang sangat penting bagi
responden maka menuntun instrumen dengan reliabilitas yang sangat tinggi.
Sebaliknya, bila keputusan dari hasil instrumen tidak menimbulkan konsekuensi
yang serius maka instrumen dengan reliabilitas yang lebih rendah dapat
digunakan.
Kedua, dapat tidaknya
keputusan diperbaiki dalam waktu yang cepat. Dalam tahap awal pengambilan
keputusan pendidikan/reliabilitas yang rendah mungkin cukup karena kesalahan
pengambilan keputusan dapat diperbaiki segera. Misalnya tes untuk pengelompokan
siswa di mana siswa yang salah dikelompokan dapat dengan mudah dipindahkan jika
terdapat bukti baru untuk memindahkan. Sebaliknya, bila keputusan membutuhkan
waktu yang lama untuk memperbaiki maka intrumen untuk pengumpulan data harus
mempunyai reliabilitas yang tinggi.
Ketiga,jaminan yang
dibutuhkan sehubungan dengan keputusan yang dibuat. Jaminan yang lebih besar
mempersyaratkan reliabilitas yang lebih tinggi.
Kerlinger (1996:722-723)
memberikan petunjuk tentang batas untuk menafsirkan reliabilitas instrumen.
Menurutnya, reliabilitas adalah koefisien determinasi, proporsi varians bersama
antara skor yang diperoleh (observed score) dengan skor murni (true score).
Oleh karenanya, penafsiran koefisien reliabilitas dapat dilakukan dengan
menggunakan tabel product moment setelah mengubah koefisien determinasi menjadi
korelasi dengan mengakarkannya.
Aiken (1995:82)
mengutarakan seberapa tinggi seharunnya koefisien reliabilitas yang diperoleh
dari skor instrumen sangat tergantung pada apa yang akan dilakukan atas skor. Namun,
dia memberikan beberapa petunjuk. Jika skor digunakan untuk menentukan apakah
dua kelompok berbeda signifikan maka koefisien reliabilitas 0,65 sudah
memberikan kontribusi dalam keputusan. Tetapi jika skor digunakan untuk
membandingkan penampilan individu yang berbeda maka koefisien reliabilitas
paling tidak 0,85.
Gronlun dan Linn
(1990:80) menyatakan bahwa koefisien korelasi yang digunakan untuk menentukan
reliabilitas dihitung dan ditafsirkan sebagai indeks korelasi sehingga batas
koefisien reliabilitas adalah korelasi berdasarkan hasil konfirmasi dengan
tabel korelasi product moment dengan jumlah sampel dan tingkat kesalahan
tertentu. Pada hakikatnya indeks reliabilitas merupakan korelasi instrumen
dengan instrumen itu sendiri (rn) untuk melihat apakah instrumen
memberikan hasil pengukuran yang stabil dan konsisten. Oleh karena indeks reliabilitas
merupakan korelasi hitung, maka batas kriteria reliabilitas adalah tabel
korelasi. Bila rhitung > rtabel maka kedua skor hasil
pengukuran berkorelasi signifikan.
Signifikan korelasi menunjukan adanya konsistensi, sehingga instrumen talah
dapat dikatakan reliabel.
d.Kesalahan
Standar Pengukuran.
Kalau
validitas berhubungan dengan ketepatan instrumen dalam mengukur hasil yang
diinginkan, reliabilitas lebih berhubungan dengan akurasi instrumen dalam
melakukan pengukuran. Instrumen yang mampu mengukur hasil dengan akurasi dan
presisi yang tinggi akan meminimalkan kesalahan instrumen dalam melakukan
pengukuran. Instrumen yang mampu melakukan pengukuran secara akurat dengan
tingkat kesalahan pengukuran yang rendah akan memberikan hasil pengukuran yang
relatif konsisten dan stabil (reliabel).
Kesalahan
standar pengukuran (standad eror of measurement atau SEM) adalah ukuran yang
mencerminkan tidak akuratnya skor dari instrument yang digunakan untuk mengukur
(Purwanto, 2007: 180). Semakin tinggi koefisien reliabilitas, maka instrumen
semakin akurat dan makin rendah kesalahan standar pengukuran. Sebaliknya,
semakin rendah koefisien reliabilitas maka makin tinggi kesalahan standar
pengukuran dan makin tinggi cermatnya pengukuran. Dalam pengumpulan data hasil
belajar dimana skor-skor akan dibandingkan secara individual sangat penting
untuk memperhitungkan kesalahan standar pengukuran.
SEM dapat dihitung dengan menggunakan rumus
sebagai berikut:
Referensi
Timtoni, Ayu Arfiana.
2015. Mengestimasi Reliabilitas Instrumen. http://aynatimtoni.blogspot.co.id/2015/11/mengestimasi-reliabilitas-instrumen.html.
diakses pada tangga 10 Oktober 2016
Zahrudin, H. Ma’mun.
2015. Validitas dan Reliabilitas http://evaluasipembelajaranelghazy.blogspot.co.id/2015/09/validitas-dan-reliabilitas.html.
diakses pada tanggal 10 Oktober 2016
Sutama, Anik
Ghufron.2011.Evaluasi Pembelajaran Matematika.Jakarta. Universitas Terbuka
Tidak ada komentar:
Posting Komentar