RELIABILITAS, KEPRAKTISAN,
DAN EFEK POTENSIAL SUATU INSTRUMEN
Kata reliabilitas dalam bahasa Indonesia yang digunakan saat ini, sebenarnya diambil dari kata reliability dalam bahasa Inggris dan berasal dari kata reliable yang artinya dapat dipercaya,keajegan, konsisten, keandalan, kestabilan. Suatu tes dapat dikatakan reliabel jika tes tersebut
menunjukkan hasil yang dapat dipercaya dan tidak bertentangan.
Menurut Sugiono (2005) Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda. Sedangkan Sukadji (2000) mengatakan bahwa reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi.
Menurut Nursalam (2003) Reliabilitas
adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau
kenyataan hidup tadi diukur atau diamati berkali–kali dalam waktu yang
berlainan. Alat dan cara mengukur atau mengamati sama–sama memegang
peranan penting dalam waktu yang bersamaan.
Menurut Arifin (1991), suatu tes dapat dikatakan andal (reliable)
jika tes tersebut mempunyai hasil yang taat asas (konsisten). Sedangkan
Sudjana (2004) mengatakan bahwa reliabilitas suatu tes adalah ketepatan
atau kejegan tes tersebut dalam menilai apa adanya, artinya kapan pun
tes tersebut digunakanakan memberikan hasil yang sama atau relatif sama.
Berdasarkan beberapa pendapat tentang
reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas
adalah suatu pengukuran terhadap suatu tes yang melihat apakah tes
tersebut dapat mengukur apa yang seharusnya di ukur.
B. Jenis- Jenis Reliabilitas
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut harus mempunyai reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji (2008) membedakan reliabilitas menjadi 2 macam, yaitu :
- Reliabilitas Konsistensi tanggapan, dan
- Reliabilitas konsistensi gabungan item
Reliabilitas ini selalu mempersoalkan
mengenai tanggapa responden atau objek terhadap tes tersebut apakah
sudah baik atau konsisten. Dalam artian apabila tes yang telah di
cobakan tersebut dilakukan pengukuran kembali terhadap obyek yang sama,
apakah hasilnya masih tetap sama dengan pengukuran sebelumnya. Jika
hasil pengukuran kedua menunjukkan ketidakonsistenan, maka hasil
pengukuran tersebut tidak mengambarkan keadaan obyek yang sesungguhnya.
Untuk mengetahui apakah suatu tes atau instrument tersebut sudah mantap
atau konsisten, maka tes/instrument tersebut harus diuji kepada obyek
ukur yang sama secara berulang-ulang.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden terhadap tes (Jaali ; 2008) yaitu :
- Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu tes yang sama pada waktu yang berbeda.
- Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan dua kelompok item yang setara pada saat yang sama.
- Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan menggunakan dua tes yang dibuat setara kemudian diberikan kepada responden atau obyek tes dalam waktu yang bersamaan.
Reabilitas ini terkait dengan konsistensi
antara item-item suatu tes atau instrument.. Apabila terhadap bagian
obyek ukur yang sama, hasil pengukuran melalui item yang satu
kontradiksi atau tidak konsisten dengan hasil ukur melalui item yang
lain maka pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu
tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka kita
tidak bisa menyalahkan obyek ukur, melainkan alat ukur (tes) yang
dipersalahkan, dengan mengatakan bahwa tes tersebut tidak reliable atau
memiliki reliabilitas yang rendah.
Koefisien reliabilitas konsistensi gabungan item dapat dihitung dengan menggunakan 3 rumus (Jaali 2008), yakni :
- Rumus Kuder-Richardson, yang dikenal dengan nama KR-20 dan KR-21.
- Rumus koefisien Alpha atau Alpha Cronbach.
- Rumus reliabilitas Hoyt, yang menggunakan analisis varian.
C. Contoh perhitungan Reliabilitas Instrumen .
1. Bentuk Urayan
Jika skor butir instrumen atau soal tes
kontinum (misalnya skala sikap atau soal bentuk uraian dengan skor butir
1-5 atau skor soal 0-10) dan diberi simbol Xi dan skor total instrumen atau tes diberi simbol Xt,
maka rumus yang digunakan untuk menghitung koefesien korelasi antara
skor butir instrumen atau soal dengan skor total instrumen atau skor
total tes adalah sebagai berikut:
Keterangan:
rit = koefisien korelasi antara skor butir soal dengan skor total.
xi = jumlah kuadrat deviasi skor dari Xi
xt = jumlah kuadrat deviasi skor dari Xt
Data hasil uji coba adalah sebagai berikut:
Nomor Responden
|
Nomor Butir Pertanyaan
|
Jumlah
|
||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | ||
1
|
5
|
4
|
3
|
5
|
3
|
5
|
3
|
28
|
2
|
5
|
4
|
3
|
4
|
3
|
4
|
3
|
26
|
3
|
4
|
4
|
2
|
4
|
3
|
4
|
3
|
24
|
4
|
4
|
3
|
3
|
3
|
4
|
3
|
4
|
24
|
5
|
5
|
5
|
3
|
4
|
5
|
5
|
4
|
31
|
6
|
3
|
3
|
2
|
3
|
2
|
3
|
1
|
17
|
7
|
3
|
3
|
2
|
3
|
2
|
2
|
2
|
17
|
8
|
3
|
2
|
2
|
3
|
2
|
2
|
2
|
16
|
9
|
2
|
2
|
1
|
2
|
1
|
2
|
1
|
11
|
10
|
2
|
1
|
1
|
1
|
1
|
1
|
1
|
8
|
Jumlah
|
36
|
31
|
22
|
32
|
26
|
31
|
24
|
202
|
Penyelesaian:
Untuk n=10 dengan alpha sebesar 0,05
didapat nilai table r=0,631. Karena nilai koefesien korelasi antara skor
butir dengan skor total untuk semua butir lebih besar dari 0,631, maka
semua butir mempunyai korelasi signifikan dengan skor total tes. Dengan
demikian maka semua butir tes dianggap valid atau dapat digunakan untuk
mengukur hasil belajar.
Uji reliabilitas
Dari soal diatas, selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan rumus koefesien Alpha, yaitu:
Keterangan:
rii = koefisien reliabilitas tes
k = cacah butir
= varian skor butir
= varian skor total
Koefisien reliabilitas dari contoh diatas dapat dihitung dengan cara pertama-tama dihitung varian butir sebagai berikut:
Nomor butir
|
Varian Butir
|
1
2
3
4
5
6
7
|
1,24
1,29
0,56
1,16
1,44
1,69
1,24
|
Jumlah
|
8,62
|
Jadi koefesien reliabilitas tes (dengan 7 butir) pada contoh diatas adalah 0,97
2. Bentuk Objektif
Jika skor butir soal diskontinum
(misalnya soal bentuk objektif dengan skor butir soal 0 atau 1) maka
kita menggunakan koefesien korelasi biserial dan rumus yang digunakan
untuk menghitung koefesien korelasi biserial antara skor butir soal
dengan skor total tes adalah:
Keterangan:
rbis(i) = koefesien korelasi beserial antara skor butir soal nomor i dengan skor total
X1 = rata-rata skor total responden yang menjawab benar butir soal nomor i
Xt = rata-rata skor total semua responden
st = standar deviasi skor total semua responden
pi = proporsi jawaban yang benar untuk butir soal nomor i
qi = proporsi jawaban yang salah untuk butir soal nomor i
Contoh hasil uji coba adalah sebagai berikut:
Nomor Responden
|
Nomor Butir Pertanyaan
|
Jumlah
|
||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
||
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
4
|
2
|
1
|
1
|
0
|
1
|
1
|
1
|
0
|
5
|
3
|
0
|
1
|
1
|
1
|
0
|
0
|
0
|
3
|
4
|
1
|
1
|
0
|
0
|
0
|
0
|
0
|
2
|
5
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
6
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
7
|
7
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
6
|
8
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
9
|
1
|
1
|
0
|
0
|
1
|
0
|
0
|
3
|
10
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
5
|
Jumlah |
7
|
9
|
5
|
6
|
5
|
3
|
1
|
36
|
Xt = 3,60
St = 2,107
Nomor Butir
|
r-butir
|
r-tabel
|
Status
|
1
2
3
4
5
6
7
|
0,70
0,57
0,66
0,81
0,76
0,75
0,54
|
0,63
0,63
0,63
0,63
0,63
0,63
0,63
|
Valid
Tidak valid
Valid
Valid
Valid
Valid
Tidak valid
|
Ternyata dari tujuh butir soal tes ada 5 butir yang valid dan dua butir tidak valid. Oleh karena itu perlu dilakukan perhitungan untuk menghitung koefesien antara skor butir dengan skor total baru (5 butir), sebagai berikut:
Nomor Responden
|
Nomor Butir Pertanyaan
|
Jumlah
|
||||
1
|
3
|
4
|
5
|
6
|
||
1
|
1
|
1
|
1
|
0
|
0
|
3
|
2
|
1
|
0
|
1
|
1
|
1
|
4
|
3
|
0
|
1
|
1
|
0
|
0
|
2
|
4
|
1
|
0
|
0
|
0
|
0
|
1
|
5
|
0
|
0
|
0
|
0
|
0
|
0
|
6
|
1
|
1
|
1
|
1
|
1
|
5
|
7
|
1
|
1
|
1
|
1
|
1
|
5
|
8
|
0
|
0
|
0
|
0
|
0
|
0
|
9
|
1
|
0
|
0
|
1
|
0
|
2
|
10
|
1
|
1
|
1
|
1
|
0
|
4
|
Jumlah
|
7
|
5
|
6
|
5
|
3
|
26
|
Xt = 2,6
St = 1,8
Untuk n = 10 dengan alpha sebesar 0,05
didapat nilai table r = 0,631. Karena niai koefesien korelasi biserial
antara skor butir dengan skor total untuk semua butir lebih besar dari
0,631, maka semua butir mempunyai korelasi biserial yang signifikan
dengan skor total tes. Dengan demikian maka semua butir tes (5 butir)
dianggap valid atau dapat digunakan untuk mengukur hasil belajar.
Uji Reliabilitas
Selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan rumus KR-20, sebagai berikut:
Keterangan:
rii = koefesien reliabilitas tes
k = cacah butir
piqi = varian skor butir
pi = proporsi jawaban yang benar untuk butir nomor i
qi = proporsi jawaban yang salah untuk butir nomor i
= varian skor total
Koefesien reliabitas dari contoh diatas adalah:
Pertama-tama dihitung varian butir (piqi) sebagai berikut:
Nomor butir
|
pi
|
qi
|
piqi
|
1
3
4
5
6
|
0,7
0,5
0,6
0,5
0,3
|
0,3
0,5
0,4
0,5
0,7
|
0,21
0,25
0,24
0,25
0,21
|
Jumlah
|
1,16
|
= 1,16
St = 3,24
Jadi koefesien reliabilitas tes (dengan 5 butir) pada contoh diatas adalah 0,80.
D. Kepraktisan Suatu Instrumen
Dalam kamus besar bahasa Indonesia kepraktisan diartikan sebagai suatu yang bersifat praktis atau efisien. Arikunto (2010) mengartikan kepraktisan dalam evaluasi pendidikan merupakan kemudahan-kemudahan yang ada pada instrument evaluasi baik dalam mempersiapkan, menggunakan, menginterpretasi/ memperoleh hasil, maupun kemudahan dalam menyimpanya.
Kepraktisan juga merupakan salah satu
ukuran suatu instrumen evaluasi dikatakan baik atau tidak. Bila guru
menggunakan esay tes untuk mengukur tanggapan siswa terhadap suatu
produk pembelajaran, dan jumlah siswa yang dibimbingnya mencapai dua
ratus orang, maka upaya ini cenderung tidak praktis. Diperlukan cara
lain untuk menilai tanggapan siswa tersebut, misalnya dengan tes lisan
terhadap hasil diskusi kelompok. Kepraktisan diartikan pula sebagai
kemudahan dalam penyelenggaraan, membuat instrumen, dan dalam
pemeriksaan atau penentuan keputusan yang objektif, sehingga keputusan
tidak menjadi bias dan meragukan. Kepraktisan dihubungkan pula dengan
efisien dan efektifitas waktu dan dana. Sebuah tes dikatakan baik bila
tidak memerlukan waktu yang banyak dalam pelaksanaannya, dan tidak
memerlukan dana yang besar atau mahal.
Kepraktisan sebuah alat evaluasi lebih
menekankan pada tingkat efisiensi dan efektivitas alat evaluai tersebut,
beberapa kriteria yang dikemukakan oleh Gerson, dkk dalam mengukur
tingkat kepraktisan, diantaranya adalah:
- Waktu yang diperlukan untuk menyusun tes tersebut
- Biaya yang diperlukan untuk menyelenggarakan tes tersebut
- Waktu yang diperlukan untuk melaksanakan tes
- Tingkat kesulitas menyusun tes
- Tingkat kesulitan dalam proses pemeriksaan tes
- Tingkat kesulitan melakukan intrepetasi terhadap hasil tes
Kepraktisan alat evaluasi akan memberikan
manfaat yang besar bagi pelaksanaan maupun bagi peserta didik karena
dirancang sedemikian sistematis terutama materi instrumen tersebut.
Berkaitan kepraktisan dalam penelitian pengembangan Van den Akker (1999:10) menyatakan :
“Practically refers to the extent
that user (or other expert) consider the intervention as appealing and
usable in ‘normal’ conditions”
Artinya, kepraktisan mengacu pada tingkat bahwa pengguna (atau pakar-pakar lainnya) mempertimbangkan intervensi dapat digunakan dan disukai dalam kondisi normal.
Untuk mengukur tingkat kepraktisan yang
berkaitan dengan pengembangan instrument berupa materi pembelajaran,
Nieveen (1999) berpendapat bahwa untuk mengukur kepraktisannya dengan
melihat apakah guru (dan pakar-pakar lainnya) mempertimbangkan bahwa
materi mudah dan dapat digunakan oleh guru dan siswa. Khusus untuk
pengembangan model yang dikembangkan dalam penelitian pengembangan,
model tersebutdikatakan praktis jika para ahli dan praktisi menyatakan
bahwa secara teoritis bahwa model dapat diterapkan di lapangan dan
tingkat keterlaksanaannya model tersebut termasuk kategori “baik”.
Istilah “baik” ini masih memerlukan indikator-indikator yang diperlukan
untuk menentunkan tingkat “kebaikan” dari keterlaksanaan model yang di
kembangkan.
Berkaitan dengan kepraktisan di tinjau
dari apakah guru dapat melaksanakan pembelajaran di kelas. Biasanya
peneliti dan observer mengamati aktivitas yang dilakukan guru dalam
pelaksanaan pembelajaran.
Misalnya, melihat kegiatan guru dalam mempersiapkan siswa untuk belajar, memeriksa pekerjaan siswa, dll.
Misalnya, melihat kegiatan guru dalam mempersiapkan siswa untuk belajar, memeriksa pekerjaan siswa, dll.
E. Efek Potensial (Efektivitas)
Menurut Reigeluth (1999), aspek penting dalam keefektifan (efek potensial) dari suatu instrument, teori, atau model adalah mengetahui tingkat/derajat dari penerapan teori, atau model dalam suatu situasi tertentu. Tingkat keefektifan ini menurut Mager, biasanya dinyatakan dengan suatu skala numeric yang didasarkan pada kriteria tertentu. (Reiguluth, 1999).
Berkaitan dengan keefektifan pengembangan instrument, model, teori dalam dunia pendidikan, Van den Akker (1999:10) menyatakan :
“Effectiveness refer to the extent
that the experiences and outcomes with the intervention are consistent
with the intended aims”
Artinya, keefektifan mengacu pada tingkatan bahwa pengalaman dan hasil intervensi konsisten dengan tujuan yang dimaksud.
Keefektifan suatu bahan ajar biasanya
dilihat dari poitensial efek berupa kualitas hasil belajar, sikap., dan
motivasi peserta didik. Menurut Akker (1999) (dalam Yazid) ada dua aspek
keefektivan yang harus dipenuhi oleh suatu bahan ajar. Yakni :
- Ahli dan praktisi berdasarkan pengalamannya menyatakan bahwa bahan ajar tersebut efektif.
- Secara operasional bahan ajar tersebut memberikan hasil sesuai yang diharapkan.
Menurut Suryadi (2005) (dalam Yazid), bahan ajar dapat dikatakan efektif apabila :
- Rata-rata siswa aktif dalam aktivitas pembelajaran.
- Rata-rata siswa aktif dalam mengerjakan tugas.
- Rata-rata siswa efektif dalam keefektifan relatif penguasaan bahan pengajaran.
- Respon siswa terhadap pembelajaran yang dilaksaakan baik/positif
- Respon guru terhadap pembelajaran yang dilaksanakan baik/positif
DAFTAR PUSTAKA
Akker,J.V. 1999. Principles and Methods
of Development Research. In J. vam den Akker,R Branch,K Gustafson, N
Nieveen and Tj.Plomp (Eds). Design Approaches and Tools in Education and Training (hlm. 1-14). Dodrecht : Kluwer Academic Publisher.
Arifin, Zaenal.(1991). Evaluasi Instruksional.Bandung: PT. Remaja Rosdakarya
Arikunto, Suharsimi. (2010) Dasar-Dasar Evaluasi Pendidikan. Bumi Aksara : Yogyakarta.
Djali, dan Puji Muljono. (2008). Pengukuran dalam Bidang Pendidikan. PT. Gramedia : Jakarta.
Nieveen, Nienke.1999. Prototyping to
Reach Product Quality. In J. vam den Akker,R Branch,K Gustafson, N
Nieveen and Tj.Plomp (Eds). Design Approaches and Tools in Education and Training (hlm. 125-136). Dodrecht : Kluwer Academic Publisher
Nursalam. (2003). Konsep & Penerapan Metodologi Penelitian Ilmu Keperawatan: Pedoman Skripsi, Tesis, dan Instrumen Penelitian Keperawatan. Jakarta. Salemba Medika
Rochmad. (2011). Model Pengembangan Perangkat Pembelajaran Matematika. FMIPA UNNES : Semarang
Sudjana, D. (2004).manjemen Program Pendidikan Untuk Pendidikan Nonformal dan Pengembangan Sumber Daya Manusia. Bandung : Falah Production.
Sukadji, S. (2000). Menyusun dan Mengevaluasi Laporan Penelitian, Jakarta : UI-Press
Sugiyono, 2005, Metode Penelitian Kualitatif, Bandung: Alfabeta.
Yazid, A. (2011). Kevalidan, Kepraktisan, dan Efek Potensial Suatu Bahan Ajar. Pascasarjana Pendidikan Matematika Universitas Sriwijaya. aisyahyazid.blogspot.comhttp://zarmisukses.blogspot.com/2015/02/reliabilitas-kepraktisan-dan-efek.html