BUKU
PEDOMAN
PENYUSUNAN
ALAT UKUR POTENSI
Dari pengukuran hingga langkah dan klasifikasinya
ASSESSMENT AND DEVELOPMENT CENTER
KEMENTERIAN PERTAHANAN
DAFTAR ISI 01.
Pengukuran, Penilaian, Evaluasi
02.
Pengukuran Atribut Psikologi
03.
Potensi Dalam Konstruk Psikologi
04.
Skala Pengukuran
05.
Langkah Penyusunan Alat Ukur
06.
Klasifikasi Alat Ukur
ASSESSMENT AND DEVELOPMENT CENTER
Puji dan syukur kehadirat Allah SWT
KATA PENGANTAR karena berkat rahmat dan pertolongan-
Nya, penulis dapat menyelesaikan buku
pedoman penyusunan alat ukur potensi.
Buku ini disusun sebagai bentuk
pertanggung jawaban terhadap
rancangan aktualisasi pelatihan dasar
CPNS golongan III Kementerian
Pertahanan. Di samping itu, sebagai
pedoman assessor saat membuat atau
mengembangkan alat ukur potensi
khususnya pada assessment center
Kementerian Pertahanan.
Pengetahuan mengenai konstruksi alat ukur
potensi sangat penting diketahui oleh assessor
atau seseorang yang memiliki keinginan untuk
membuatnya sehingga menghasilkan test yang
terstandarisasi (standardized measurement
construction). Tidak itu saja, dengan adanya buku
ini maka alat ukur potensi di asssessment center
Kemhan dapat diperbaharu secara berkelanjutan.
Oleh karena itu, kobocoran soal akibat
penggunaan alat test yang belum pernah
diperbarui sama sekali.
Penulis menyadari terdapat banyak kekurangan
konten serta penulisan. Sehingga, mohon
berkenan untuk memberikan koreksi serta saran
kritik dari pembaca.
Jakarta,
November 2021
Penulis
ASSESSMENT AND DEVELOPMENT CENTER
01
01 PENGUKURAN, PENILAIAN
DAN EVALUASI
Pengukuran, penilaian dan evaluasi sejatinya adalah tiga istilah yang
berbeda. Namun dalam aplikasinya, tak sedikit peneliti terjebak
menyamakan ketiganya. Untuk memahami apa perbedaan serta
hubungan diantara ketiganya, dapat dilihat melalui contoh di
bawah ini:
Untuk menilai apakah seorang pegawai dapat menerima
beasiswa pendidikan di luar negeri salah satu syaratnya adalah
kemampuan Bahasa Inggris yang baik. Sebagai penyeleksi
dapat memberikannya beberapa tes secara lisan dan tertulis.
Dari hasil skor kedua test tersebut dapat dinilai tingkat
penguasaannya. Skor yang dinyatakan dengan bilangan
diperoleh melalui "pengukuran". Kemudian diinterpretasikan
untuk menentukan tingkat penguasaan konsep bahasa inggris.
Pegawai yang terpilih merupakan bagian dari penilaian.
Pengukuran dan
penilaian
merupakan dua
proses yang
berkesinambungan.
ASSESSMENT AND DEVELOPMENT CENTER
02
PENGUKURAN
Pengukuran (measurement) merupakan cara untuk mendapatkan
gambaran dan mengetahui suatu objek dalam bentuk angka sehingga
mudah menyampaikan hasilnya kepada orang lain. Andaikan dalam
seleksi pekerjaan Anda diminta untuk menyebutkan berat badan,
maka dengan mudah Anda akan mengambil timbangan kemudian
berdiri di atasnya. Angka yang tertera pada timbangan tersebut
menunjukan berat Anda. Kegiatan yang sudah Anda lakukan disebut
dengan pengukuran (measurement). Azwar (2007) menyatakan salah
satu tujuan pengukuran ialah membangun dasar-dasar
pengembangan tes yang lebih baik berdasarkan prosedur sistematis
sehingga menghasilkan tes yang berfungsi dengan optimal, valid dan
reliabel. Pengukuran bisa dilakukan pada sesuatu yang sifatnya fisik
dan non-fisik.
Crocker dan
Algina (1986)
mendefinisikan
pengukuran
sebagai berikut:
Azwar (2010) mengartikan Pengukuran (measurement)
pengukuran sebagai prosedur diartikan sebagai proses
pemberian angka (kuantifikasi) pemberian angka pada
terhadap atribut atau variabel sebuah objek tertentu
sepanjang garis kontinum. sepanjang garis kontinum
Reynolds, et al. (2010) untuk mengetahui atributnya
berdasarkan aturan.
mendefinisikan pengukuran
sebagai sekumpulan aturan
untuk menetapkan suatu
bilangan yang mewakili objek,
sifat atau karakteristtik, atribut
atau tingkah laku
ASSESSMENT AND DEVELOPMENT CENTER
03
Tiga Karakteristik Pengukuran
1 Pembandingan antara atribut dengan alat ukurnya
Terlebih dahulu ketahui atribut yang hendak diukur maka selanjutnya kita
akan mendapatkan alat ukur yang tepat untuk menggunakannya. Misal,
seorang perawat ingin mengetahui suhu badan (atribut) pasien maka bisa
memakai thermometer. Lain halnya, untuk mengetahui kecerdasan (atribut)
calon pegawai maka tester dapat menggunakan alat ukur Intelligence
Structure Test (IST).
2 Hasil pengukuran dinyatakan secara kuantitatif
Kuantitatif disini artinya hasil pengukuran berupa angka. Suatu proses
pengukuran akan dinyatakan selesai apabila hasilnya telah diwujudkan dalam
bentuk angka. Misal, hasil pengukuran kecerdasan calon pegawai tersebut
sebesar 125.
3 Hasilnya bersifat deskriptif
Pengukuran yang hasilnya berupa angka hanya bersifat deskriptif, artinya
tidak bisa diinterpretasikan lebih jauh. Misal, hasil kecerdasan pegawai
sebesar 125. Angka tersebut tidak dapat diikuti keterangan apakah termasuk
kecerdasan di bawah rata-rata, rata-rata, ataupun di atas rata-rata
kelompoknya.
ASSESSMENT AND DEVELOPMENT CENTER
04
Manfaat Pengukuran
Coba bayangkan jika kegiatan atau aktifitas yang kita lakukan tidak
menggunakan ukuran. Mulai dari mengetahui waktu bangun tidur,
membeli emas, kapan waktu pagi dan sore hari, mengetahui tingkat
kecerdasan seseorang, integritas pegawai, kemudian membedakan tipe
kepribadian dll. Dari beberapa analogi tersebut, pengukuran bermanfaat:
To make your life easy
Rasanya sulit membayangkan jika kehidupan kita
1 sehari-hari tidak memakai ukuran. Berkendara di jalan
tol sesuai dengan aturan maka melihat speedometer.
mengetahui anggota keluarga sedang demam atau
tidak menggunakan thermometer. Oleh sebab itu,
manfaat yang dirasakan dengan adanya ukuran maka
akan membuat hidup menjadi lebih mudah.
To distinguish object
Untuk mengetahui kecerdasan yang dimiliki,
2 bagaimana sikapnya dalam bekerja, integritas terhadap
pekerjaannya, serta mengenal kepribadian antar
individu. Dengan adanya pengukuran, maka
mengetahui, mengenal &membedakan kemampuan
antar individu dapat lebih tepat, objektif dan adil.
For science development
Dahulu kita mengenal ada dua tipe kepribadian
3 extrovert dan introvert. Kemudian Costa dan McCrea
(1970) mengeluarkan big five personality traits.
Selanjutnya, Ashton dan Lee (2007) mengklaim model
HEXACO six-factor dianggap lebih komprehensif. Dari
sini dapat dilihat bahwa teori kepribadian berkembang
dampak dari pengukuran.
YOUR NAFS SPENS SAMME EN T A N D D E V E L O P M E N T C E N T E RSDG PROGRESS REPORT 2020
05
PENILAIAN
Penilaian (assessment) biasanya
dimulai dengan kegiatan
pengukuran. Griffin dan Nix (1991)
menyatakan “assessment is the
process of gathering information to
make informed decisions”.
Sebagai contoh, hasil pengukuran
terhadap kecerdasan pegawai
sebesar 125. Dari infomasi hasil
pengukuran dapatkah kita
mengambil kesimpulan bahwa
pegawai tersebut dinilai layak atau
tidak untuk menduduki sebuah
jabatan? Tentu, jawabannya belum.
Untuk dapat menyatakan bahwa
pegawai tersebut layak atau
tidaknya maka kita masih
memerlukan informasi tambahan.
Informasi tersebut berupa “Untuk
jabatan apa pegawai tersebut
ditempatkan?” Dalam konteks
tersebut, secara tidak langsung kita
sudah melakukan penilaian.
Terlihat bahwa di dalam kegiatan penilaian membutuhkan
proses pengumpulan informasi untuk membuat keputusan
yang tepat. Penilaian didasarkan pada sejumlah fakta untuk
menjelaskan karakteristik individu.
Dengan demikian, penilaian merupakan prosedur sistematis yang
di dalamnya mencakup kegiatan mengumpulkan, menganalisis
serta menginterpretasikan informasi yang diperoleh guna
membuat kesimpulan mengenai karakteristik seseorang atau
objek.
ASSESSMENT AND DEVELOPMENT CENTER
06
EVALUASI
Evaluasi biasanya dimulai dengan kegiatan penilaian dan berhubungan
erat dengan pengambilan keputusan. Masih dengan contoh yang sama
yakni hasil kecerdasan pegawai sebesar 125, belum dianggap layak atau
tidak untuk menduduki sebuah jabatan karena masih tergantung
kepada jabatan apa yang dituju. Dikatakan layak ketika pegawai
tersebut menduduki jabatan yang membutuhkan kemampuan berfikir
strategis yang rumit. Namun hasil kecerdasan tidak layak bila
diperuntukkan untuk menduduki jabatan yang membutuhkan
kemampuan berfikir stategis yang rendah.
Dari ilustrasi tersebut, tampak interpretasi terhadap hasil
penilaian hanya dapat bersifat evaluatif apabila disandarkan pada
suatu norma atau kriteria tertentu. Norma dapat diartikan nilai
rata-rata pada kelompok tertentu. Sedangkan kelompok dapat
berupa kelompok usia, kelompok jabatan, kelompok tingkat
pendidikan dan lainnya. Sehingga akan ada norma berdasarkan
usia, norma jabatan, norma tingkat pendidikan dan lainnya.
Dengan adanya norma dan kriteria, maka hasil yang sama dari
suatu penilaian dapat memunculkan interpretasi yang berbeda.
ASSESSMENT AND DEVELOPMENT CENTER
07
Keterkaitan Pengukuran,
Penilaian dan Evaluasi
Dari penjelasan di atas kita dapat mengetahui definisi pengukuran,
penilaian dan evaluasi. Namun ketiganya terkait satu dengan yang
lainnya seperti di bawah ini:
Dari gambar di samping
dapat dikatakan bahwa
dalam proses evaluasi
melibatkan penilaian dan
pengukuran. Evaluasi
dapat terlaksana jika
sudah ada penilaian
sebelumnya. Sedangkan
tinggi rendahnya kualitas
penilaian ditentukan oleh
pengukuran yang
menggunakan alat ukur
sesuai dengan atribut apa
yang ingin dilihat atau
dipotret.
Begitu eratnya keterkaitan antara
ketiga konsep maka wajar jika
masih ada yang menganggap sama
terhadap konsep tersebut
ASSESSMENT AND DEVELOPMENT CENTER
08
02 PENGUKURAN ATRIBUT
PSIKOLOGI
Sudah kita ketahui bahwa pengukuran (measurement) merupakan
proses kuantifikasi pada objek untuk mengetahui atribut tertentu.
Objek pengukuran dapat dilakukan pada atribut fisik dan atribut
psikologis. Sehingga, hasil pengukuran baik terhadap atribut fisik atau
atribut psikologis diharapkan akan memberikan informasi yang benar
atau valid karenanya setiap proses dilakukan dengan sistematis.
Vs
FISIK/NON-PSIKOLOGI Atribut fisik (co: tinggi badan, Atribut psikologis tidak dapat PSIKOLOGI
gempa bumi serta kecepatan diamati secara langsung (latent
kendaraan) dapat diamati variable) (co: kecerdasan,
secara langsung. integritas, motivasi dll).
Pengukurannya dilakukan
secara langsung (direct sense). Pengukurannya secara tidak
langsung (indirect sense).
Hasilnya dap
at diperoleh
langsung & dipahami hampir Atribut psikologis dapat diukur
menggunakan indikator
semua orang.
perilaku yang dapat diamati
(manifest variable).
Validitas dan reliabilitas Indikator perilaku --> stimulus
pengukuran tidak lagi menjadi
sumber kekhawatiran banyak yang dituangkan dalam
orang. item/soal.
Respon dari peserta yang hasil
jawabannya diberikan angka /
koding.
ASSESSMENT AND DEVELOPMENT CENTER
09
Pengukuran Atribut Fisik / Non-psikologi
Pengukuran Atribut Psikologi
ASSESSMENT AND DEVELOPMENT CENTER
10
Pengukuran Atribut Psikologi
Dibandingkan pengukuran atribut fisik/non-psikologis, pengukuran
atribut-atribut psikologi lebih sukar untuk dilakukan. Bahkan
terkadang sulit untuk mendapatkan hasil validitas, reliabilitas dan
objektivitas yang tinggi. Berikut yang menyebabkan hal tersebut
terjadi (Azwar, 2014):
Atribut psikologi latent
variable
Namun, kehadiran atribut psikologi berupa konstrak
atau konseptual. Oleh sebab itu, pengukuran terhadap
atribut psikologi yang sifatnya laten hanya dapat
dilakukan jika kita memiliki indikator perilaku yang
dapat diamati secara langsung (manifest variable).
Item berdasarkan
indikator perilaku terbatas
Keterbatasan inilah yang mengakibatkan hasil
pengukuran menjadi tidak cukup komprehensif, Oleh
karenanya, pengukuran dalam psikologi hanya dapat
memotret sebagian perilaku (sample of behavior).
Stabilitas respon peserta
Jawaban yang diberikan oleh peserta sedikit banyak
dipengaruhi oleh variabel yang tidak relevan. Mudah
berubah sejalan dengan waktu, situasi dan kondisi.
Misalnya, suasana hati, kondisi psikis, persiapan saat
mengikuti ujian, situasi dan kondisi sekitar, dan lainnya.
Interpretasi normatif
Dalam pengukuran atribut psikologi terdapat lebih
banyak sumber error.
YOUR NAFSPS ENSAS MMEEN T A N D D E V E L O P M E N T C E N T ESRDG PROGRESS REPORT 2020
11
03 POTENSI DALAM KONSTRUK
PSIKOLOGI
Pengukuran (measurement) pada atribut fisik atau atribut psikologi
tertarik pada hal yang berbeda antara objek satu dengan yang lainnya.
Jika ini dikaitkan dengan pengukuran atribut psikologis, maka dapat
dilakukan selama individu satu dengan yang lainnya memiliki
perbedaan. Salah satu atribut psikologi yang memiliki variasi antar
individu ialah potensi.
Dalam, Permenhan No. 20 Tahun 2018,
menjelaskan potensi sebagai gambaran
individu yang terdiri dari kepribadian,
intelegensi, sikap kerja dan
kepemimpinan.
Kesemua gambaran individu
yang dinyatakan sebagai Atribut psikologi sifatnya latent
variable yang wujudnya
bagian potensi bukanlah
merupakan konsep, namun
sesuatu yang secara nyata pengukurannya tetap bisa
dilakukan melalui tanda-tanda
dapat dilihat melainkan atau indikator perilaku yang
konsep psikologis yang dapat diamati (manifest
variable).
dirumuskan secara hipotetik.
Oleh sebab itu,
pengukurannya tidak
mungkin dilakukan secara
langsung karena konsep
merupakan abstraksi dari ide
atau gagasan mengenai
sesuatu.
ASSESSMENT AND DEVELOPMENT CENTER
12
Konsep Teoritik
Memahami konsep teoritik
suatu atribut merupakan
pondasi awal untuk
membuat alat ukur yang
berkualitas
Berikut point-point yang harus diketahui:
Konsep teoritik atribut yang ingin diukur dapat ditemukan
dalam buku atau jurnal yang membicarakan mengenai makna,
ciri atau hakikat.
Sering kali untuk memahami konsepnya perlu melakukan
diskusi dengan orang yang ahli terkait atribut tersebut.
Pilih satu teori yang paling sesuai dengan tujuan pembuatan alat
ukur dengan mempertimbangkan kompleksitasnya.
Diizinkan untuk menggabungkan dua atau tiga teori. Namun
yang diperhatikan teori tersebut berasal dari mazhab, aliran atau
paradigma yang sama.
Menjadi acuan dalam merumuskan aspek/dimensi keperilakuan
atribut yang diukur.
Sedapat mungkin pilihlah teori
yang sederhana namun sesuai
dengan tujuan pembuatan
alat ukur yang diinginkan.
(Azwar, 2014)
ASSESSMENT AND DEVELOPMENT CENTER
13
Aspek / Dimensi
Aspek/dimensi dari suatu
atribut tidak boleh keluar
dari lingkup teorinya.
Hal apa saja yang mesti dipahami dalam membuat aspek/dimensi
berikut point-pointnya:
Hasil penguraian konstrak menjadi konsep perilaku yang lebih
konkrit, dimana aspek/dimensi menggambarkan ciri individu
memiliki atribut yang diukur.
Jika atribut yang ingin diukur mengenai kepemimpinan
transformasional, maka setidaknya dapat menjawab pertanyaan
“seperti apa gambaran atau ciri-ciri perilaku individu atau
pegawai yang memiliki kepemimpinan transformasional?”
Aspek/dimensi selalu ditulis dalam arah favorable (keperilakuan
mendukung atribut yang sedang dibuat alat ukurnya).
Ditulis dalam bentuk kalimat atau kata kerja, sehingga dapat
lebih menggambarkan makna perilaku yang dikehendaki dan
mudah melahirkan indikator-indikator perilaku yang operasional.
Setiap dimensi tidak harus mempunyai
jumlah indikator yang sama. Namun
wajib terdapat item/soal untuk
mengungkapkan aspek/dimensi yang
sudah ditentukan.
ASSESSMENT AND DEVELOPMENT CENTER
13
Indikator Perilaku
Saat aspek/dimensi atribut yang ingin diukur sudah sangat jelas
dan mudah dipahami maka penyusun alat ukur dapat langsung
menulis item/soal. Namun kebanyakan atribut psikologi bukanlah
variabel yang sederhana, ada baiknya penyusun melakukan satu
langkah lagi yakni membuat indikator keperilakuan.
Indikator keperilakuan
merupakan operasional dan
bergantung pada kreativitas.
Hal apa saja yang mesti dipahami dalam membuat aspek/dimensi
berikut point-pointnya:
Rumusan dalam indikator keperilakuan sangat operasional dan
jelas dapat diukur.
Indikator perilaku bergantung pada kreativitas penyusun alat
ukur, sepanjang indikator tersebut relevan dan logis dengan
aspek/dimensi tertentu.
Setiap indikator akan melahirkan item/soal, namun jumlahnya
tidak harus sama banyak.
ASSESSMENT AND DEVELOPMENT CENTER
14
Keterkaitan Konsep Teoritik,
Aspek/Dimensi dan Indikator Perilaku
Dari penjelasan di atas kita dapat mengetahui perihal apa saja yang
harus diperhatikan dalam konsep teoritik, aspek/dimensi dan
indikator perilaku. Ketiganya terkait satu dengan yang lainnya
seperti di bawah ini:
Sebagai penyusun alat ukur, harus memahami betul atribut yang
hendak diukur lengkap dengan aspek/dimensi di dalamnya. Kemudian
baru menurunkannya menjadi indikator perilaku yang operasional.
Semakin jelas indikator perilaku seperti apa yang menggambarkan
aspek/dimensi atributnya, maka akan mudah menulis item/soal.
Jangan mencoba untuk mengumpulkan
indikator perilaku kemudian menempatkan ke
dalam aspek/dimensi tertentu atau menulis item
selanjutnya mencocokan ke dalam indikator
perilaku yang ada
Hal tersebut akan menurunkan kualitias alat ukur sehingga tujuan
pengukuran tidak tercapai.
ASSESSMENT AND DEVELOPMENT CENTER
15
Contoh penguraian atribut kepemimpinan
transformasional berdasarkan konsep teoritik
yang disampaikan Bass (2004)
Pada gambar di atas memperlihatkan empat aspek/dimensi dari atribut
kepemimpinan transformasional yakni pengaruh ideal, motivasi
inspirasional, stimulus intelektual dan pertimbangan individual. Jika
individu cenderung memiliki kesesuaian dengan keempat
aspek/dimensi di atas maka dalam dirinya terdapat kepemimpinan
transformasional dan sebaliknya. Setiap dimensi memiliki dua indikator
dan setiap indikator akan dibuat dua item/soal.
Namun yang perlu diingat, jumlah indikator
untuk setiap dimensi tidak harus sama
banyaknya begitu juga dengan jumlah item/soal
untuk masing-masing indikator.
ASSESSMENT AND DEVELOPMENT CENTER
16
04 SKALA PSIKOLOGI
Item pada skala psikologi merupakan manifestasi dari indikator
perilaku. Walaupun peserta memahami isi item dalam alat ukur, namun
ia tidak menyadari arah jawaban serta kesimpulan apa yang diungkap
oleh setelah mengisi seluruh item. Sebelum membahas mengenai jenis
skala yang dapat digunakan. Terlebih dahulu kita mengetahui format
item dan tipe item.
FORMAT ITEM Pernyataan: kalimat yang
TIPEITEMsifatnya deklaratif berkenaan
dengan indikator perilaku
tertentu.
Pertanyaan: kalimat tanya
berkenaan dengan indikator
perilaku,dapat didahului atau
tidak menggunakan beberapa
kalimat / gambar.
Favorable: item yang ada
mendukung indikator
perilaku yang akan diukur
Unfavorable: item yang ada
tidak mendukung indikator
perilaku yang akan diukur
ASSESSMENT AND DEVELOPMENT CENTER
17
Likert Rating Scale
Penggunaan Likert
sesuai dengan nama
pencipta alat ukur ini
yakni Rencis Likert.
Skala ini disebut juga
dengan summated
rating scale ataupun
ordered categorical
ratings (Dunn-Rankin,
Knezek, Wallac &
Zhang, 2004).
Prinsip utama dari skala likert ialah peserta diminta untuk memberikan
tanggapan ketidaksetujuan atau kesetujuannya terhadap pernyataan
yang diberikan mengenai variabel psikologis untuk mengungkapkan
tingkat intensitas sikap ataupun perilaku serta perasaannya. Oleh
sebab itu, penyajian skala likert berupa kalimat pernyataan yang diikuti
oleh pilihan respon yang mengindikasikan tingkat persetujuan dari
pernyataan yang ada (De Vellis, 2003).
Dibandingkan dengan jenis skala yang lainnya, likert rating scale
merupakan skala yang paling sering dan paling luas digunakan dalam
pengukuran.
ASSESSMENT AND DEVELOPMENT CENTER
18
Karakteristik Likert Rating Scale
Bagian Skala
Skala ini terdiri dari dua bagian yakni pernyataan atau disebut
dengan item dan alternatif jawaban yang akan dipilih oleh peserta.
Item
Pernyataan yang disajikan sifatnya tertutup. Peserta hanya dapat
memilih salah satu jawaban yang sudah disediakan. Sehingga,
tidak ada jawaban lain selain pilihan yang sudah ada.
Pilihan Jawaban
Pilihan jawaban berbentuk rentang kontinum yang berjenjang.
Alternatif jawaban yang umum ditemui ialah ‘sangat tidak setuju’
hingga ‘sangat setuju’. Namun, alternatif atau pilihan tidak harus
demikian melainkan dapat disesuaikan dengan obyek yang akan
diukur.
Skoring
Pemberian skor (koding) dalam skala likert menunjukan tingkatan.
Hal yang diperhatikan dalam koding ini, skor harus sesuai dengan
tipe item pernyataannya (item favorable atau item unfavorable).
Interpretasi
Informasi dari skor tiap item tidak dapat diinterpretasi secara terpisah.
Oleh sebab itu, peserta diminta untuk menjawab seluruh pernyataan
tanpa ada yang terlewati. Apabila didapati peserta yang tidak lengkap
menjawab, maka data tersebut tidak dapat diikutsertakan dalam
pengolahan lebih lanjut.
ASSESSMENT AND DEVELOPMENT CENTER
19
Contoh skala likert mengenai atribut
kepemimpinan transformasional, dengan
menggunakan empat pilihan jawaban:
Instruksi pengerjaan skala likert:
Anda diminta untuk menjawab seluruh pernyataan yang ada sesuai
dengan yang Anda alami dengan memberikan tanda check silang (X)
pada salah satu kolom pilihan jawaban di bagian kanan.
Penggunaan pilihan:
Setuju --> peserta memberikan penilaian terhadap
item pernyataan mengenai sesuatu yang ada di
luar dirinya.
Sesuai --> peserta memberikan respon item dengan
mempertimbangkan sejauh mana pernyataan
menggambarkan keadaan dirinya
ASSESSMENT AND DEVELOPMENT CENTER
20
Thurstone Scale
Skala Thurstone meminta peserta untuk memilih pernyataan yang
disetujuinya atau dianggap paling sesuai dengan dirinya dari beberapa
item/soal yang disediakan. Sehingga dari seluruh item yang diberikan
pada skala Thurstone tidak semuanya dipilih peserta. Nilai diberikan
hanya terhadap pernyataan yang dijawab peserta. Setiap item
pernyataan mempunyai nilainya masing-masing. Tetapi, peserta tidak
mengetahui nilai dari setiap item pernyataan.
Tahap pembuatan Thurstone Scale
01 Penyusun membuat 02 Meminta kelompok
item pernyataan relevan penilai (judging group)
dengan atribut yang untuk memberikan
ingin diukur sesuai penilaian derajat
kaidah penulisan. favorable atau tidaknya
dari item yang sudah
dibuat.
03 Tidak tahu harus 04 Item yang sudah
meletakkan barang daur ditempatkan oleh
ulang di mana? Cari judging group
pusat daur ulang kemudian dihitung
setempat terdekat atau untuk menentukan nilai
cari tahu jadwal dari tiap itemnya.
pengangkutan barang
daur ulang di
lingkungan Anda.
Apabila terdapat penilai yang
memasukan kesemua item pada angka
yang sama, maka hasil penilaiannya
tidak dianalisis.
ASSESSMENT AND DEVELOPMENT CENTER
21
Contoh skala Thurstone mengenai atribut
keterampilan sosial (Wahyu, 2020):
Instruksi pengerjaan skala Thurstone:
Pilihlah tiga buah pernyataan yang paling sesuai dengan sikap Anda
dengan memberikan tanda check list (V) di kolom belakang.
Dalam pembuatan
skala Thurstone,
penyusun harus
memiliki item yang
berbeda tiap
levelnya. Mulai dari
yang paling rendah
intensitasnya
(memperhatikan)
hingga yang tinggi
(membahagiakan
orang lain).
ASSESSMENT AND DEVELOPMENT CENTER
22
Semantic Differential Scale
Skala ini dikembangkan oleh Osgood, Suci dan Tannenbaum yang
mengukur reaksi terhadap stimulus berupa kata-kata sifat. Tampilan
semantic differential scale menggunakan dua kutub (pollar) dimana
diantara kedua kutub tersebut terdapat ruang yang memiliki gradasi
skala (interval). Issac dan Michael (1984) menyatakan bahwa skala ini
dapat digunakan sebagai skala sikap yang fokus utamanya pada aspek
afektif atau dimensi evaluatif. Kemudian, skala semantic differential
digunakan untuk mengukur sifat-sifat semantik dari kata dengan lebih
objektif.
Kompenen skala semantic differential (Wahyu, 2021):
01 Stimulus berupa kata 02 Respon berupa
atau kalimat yang pasangan kata sifat
mengukur perilaku, (adjective) yang
sikap, keyakinan dan membentuk kontinum
opini terhadap benda, dengan dua kutub
orang, profesi,
produktivitas kerja dsb.
Output dari penggunaan skala semantic differential berbentuk profil.
Osgood dkk (Issac dan Michael, 1984) menyatakan ketika menggunakan
semantic differential scale akan melibatkan tiga dimensi dari ranah
sematik, yakni:
1 Evaluasi
kecenderungan tendensi seseorang untuk mendekati
atau menjauhi; menyenangi atau membenci stimulus
yang dihadirkan.
2 Potensi
besarnya usaha untuk melakukan penyesuaian
terhadap stimulus yang dihadirkan.
3 Aktifitas
perlu atau tidaknya seseorang membuat gerakan
untuk menyesuaikan diri terhadap stimulus yang
dihadirkan.
ASSESSMENT AND DEVELOPMENT CENTER
23
Tahap Pembuatan Semantic Differential Scale
01 Menentukan atribut 02 Melakukan elisitasi untuk
psikologi yang ingin menentukan indikator
diukur. sesuai atributnya.
Terdapat 2 cara yang bisa dilakukan
yakni meminta bantuan ahli untuk
mengidentifikasi karakteristik objek
pengukuran dan mengajukan
pertanyaan kepada calon responden
yang dianggap representative.
03 Memilah dan memilih 04 Membuat lawan kata
jawaban dari calon dari kata-kata yang
responden berupa kata sudah dipilih dan sesuai
sifat yang memiliki dengan kata sifat.
kaitannya dengan
dimensi evaluasi, potensi
dan aktifitas.
05 Menyusun item
sepanjang garis
kontinum. Dimana sifat
negatif ujung sebelah
kiri sedangkan sifat
positif ujung sebelah
kanan.
Contoh skala semantic differential mengenai atribut performa
karyawan:
Instruksi pengerjaan skala semantic differential
Anda diminta untuk memberikan tanda check silang (x) pada bagian
kosong (-) yang menurut Anda paling menggambarkan performa
karyawan.
ASSESSMENT AND DEVELOPMENT CENTER
Penerapan Skala Psikologi 24
Situational Judgment Test
Situational Judgment Test (SJT) merupakan penilaian yang dibuat
untuk mengukur asesi dalam setting peran yang relevan atau
pekerjaan. Alat ukur ini menampilkan skenario dan sejumlah daftar
respon yang mungkin terjadi. SJT mendorong asesi untuk
menggunakan perilaku efektif apabila dihadapkan pada situasi
tertentu.
SJT sudah digunakan dalam proses seleksi
selama beberapa kurun waktu terakhir
diberbagai kelompok kerja. Hal ini terungkap
SJT merupakan sebuah tahun 1873, calon pegawai negerisipil di
penilaian yang
Amerika Serikat diberikan test mengenai
didesain untuk situasi terkait pekerjaan dan harus
mengukur keputusan menuliskan respon menghadapi situasi
pada situasi (setting) tersebut. Pada proses perekrutan pegawai
tersebut, SJT digunakan dengan tujuan
kerja. untuk mengukur potensi pelamar kerja
dalam melakukan peran pengawasan.
Dalam skala besar, SJT lebih efisien
Stagl K. (Muktamiroh, dibandingkan melalui proses wawancara
2021)
apabila digunakan untuk mengetahui
pengalaman pelamar.
Situational judgement test
adalah tes yang dibuat untuk
menilai bagaimana kandidat
akan merespon dalam situasi-
situasi tertentu dalam dunia
kerja. Dalam tes ini, kandidat
akan diberikan sebuah skenario
yang dirancang mirip dengan
situasi yang akan dihadapi dalam
pekerjaannya. Mereka kemudian
dapat menilai tindakan seperti
apa yang paling tepat untuk
dilakukan sebagai respon
terhadap situasi tersebut.
ASSESSMENT AND DEVELOPMENT CENTER
25
Menurut McKimm (Oktaria, 2017), SJT memiliki beberapa kelebihan dan
kekurangan yakni:
KELEBIHAN Salah satu metode seleksi terbaik dan tervalid jika
dirancang secara tepat.
Skenarionya dapat dirancang sepesifik merefleksikan
terkait bidang pekerjaan.
Dalam menjalankan dan menilainya dapat
menggunakan komputer.
KEKURANGAN Dibutuhkan keahlian dalam menyusun item.
Dapat terjadi bias kultural
Kategori konstruk pada SJT (Christian dalam Muktamiroh,
2021):
1 Pengetahuan dan keterampilan kerja
2 Aplikasi keterampilan social meliputi
keterampilan interpersonal, kerja sama tim
dan kepemimpinan
Tendensi kepribadian diantaranya
3 kemampuan beradaptasi, inisiatif,
integritas, etos kerja dan kemampuan
menghadapi tekanan
ASSESSMENT AND DEVELOPMENT CENTER
26
Contoh penilaian kompetensi etik yang dibuat olehCONTOH ITEM SJT
University College London Careers Service dalam jurnal
Muktamiroh, dkk (2021)
Instruksi pengerjaan SJT:
Di bawah ini terdapat sebuah situasi dengan beberapa pilihan yang
disediakan. Anda diminta untuk menentukan 3 pilihan yang paling
tepat menurut Anda dari 8 pilihan yang disediakan.
Salah satu pasien Anda ialah seorang konsultan bedah umum.
Beberapa minggu yang lalu pasien tersebut melakukan tes HIV dan
dinyatakan positif. Walaupun demikian, Anda melihat rekan
sejawat tersebut masih melakukan operasi di RS swasta. Anda
membicarakan masalah ini dengan sejawat yang ternyata menolak
mengatakan hal ini pada RS swasta tempat praktiknya. Tentukan
tiga aksi yang paling sesuai untuk diambil pada situasi ini:
A. Pasien Anda memiliki hak kerahasiaan, karenanya saya tidak
dapat menginformasikan ke RS tersebut.
B. Saya menyampaikan kepadanya untuk menginformasikan
kepada RS karena ini adalah kepentingan umum
C. Saya akan melanggar kode etik jika memberitahu kepada
siapapun mengenai status HIV nya.
D. Saya mencatat keputusan dan aksi yang dilakukan.
E. Saya memberikan saran kepada sejawat untuk menyampaikan
kondisinya ke RS karena akan beresiko terhadap pasiennya.
F. Menginformasikan pada RS tersebut.
G. Tidak melakukan apa-apa karena ini bukan urusan saya.
H. Membuat catatan bahwa pada saat hari kerja saya akan
menelpon sejawat untuk memeriksa apakah dia sudah
menyampaikan hasil HIV ke RS.
ASSESSMENT AND DEVELOPMENT CENTER
27
Contoh lain situational judgment test
(https://quizizz.com/situational-judgement-test, 2021):
Instruksi pengerjaan SJT:CONTOH ITEM SJT
Pilihlah satu jawaban yang paling sesuai dengan sikap Anda dengan
memberikan tanda check list (x).
Anda beserta tiga rekan lainnya tergabung dalam satu tim untuk
mengerjakan sebuah projek. Sebelum projek dijalankan, tim harus
mempresentasikan rencanya yang akan dilakukan dihadapan
pimpinan. Pada hari presentasi, rekan satu tim yang sudah ditunjuk
untuk melakukan presentasi datang terlamba karena terjebak
macet. Semua undangan sudah hadir di ruangan. Apa yang Anda
lakukan?
A. Berkomunikasi terus dengan rekan tersebut untuk mencarikan
jalan alternatif yang tidak macet.
B. Memikirkan solusi terakhir dengan cara bersiap menggantikan
posisis sebagai presenter.
C. Menyerahkan keputusan kepada anggota tim lain, apabila saya
yang ditunjuk maka siap untuk presentasi.
D. Meminta perpanjangan waktu kepada undangan yang sudah
hadir dengan menginformasikan bahwa presenter datang
terlambat.
ASSESSMENT AND DEVELOPMENT CENTER
28
05 LANGKAH PENYUSUNAN
ALAT UKUR PSIKOLOGI
Instrument psikologi yang sering digunakan terkait pengukuran adalah test,
namun dapat juga berupa non-test (wawancara atau observasi). Test dalam
ranah psikologi digunakan untuk hasil pengukuran yang lebih akurat.
Menghasilkan test yang baik bukanlah kebetulan. Hal ini merupakan produk
dari penerapan prinsip-prinsip konstruksi alat ukur yang direncanakan dan
dilakukan dengan matang.
Perlu dikehatui bahwa test berisi sampel dari perilaku mengenai
atribut tertentu. Oleh karena itu, peneliti tidak mengetahui dengan
jelas dan pasti semua isi akal atau hati responden mengenai atribut
atau konstruk yang diukur. Lalu, bagaimana membuat test yang
sesuai dengan prosedur sehingga menghasilkan test terstandarkan
(standardized measurement construction)?
Alur proses penyusunan alat ukur tidak selalu dapat dilaksanakan secara ketat.
Keseluruhan proses menuntut keluwesan dari penyusun. Hal ini dikarenakan
banyaknya model skala pengukuran yang dapat dibuat tergantung tujuan
pembuatan alat ukur.
ASSESSMENT AND DEVELOPMENT CENTER
29
Menurut Crocker dan Algina (2008), proses pembuatan
atau pengembangan alat ukur dilakukan seperti di bawah
ini:
1 Identify Purpose of Test
Setiap test yang akan dibangun mungkin dapat diawali dengan pemikiran
penyusun atau pengembang alat ukur mengenai belum tersedianya test
yang dapat memotret atau mengukur mengenai atribut tertentu. Misal, saat
ini kita dihadapkan belum tersedianya alat ukur perekat bangsa. Oleh sebab
itu, kita dapat menggunakan beberapa pertanyaan yang dapat menstimulus
terbentuknya alat ukur yang baru.
ASSESSMENT AND DEVELOPMENT CENTER
30
Pertanyaan Awal Saat Membuat Alat Ukur
Cohen (2009) menyatakan ada beberapa pertanyaan di awal yang dapat
menstimulus pengembang test dalam menyusun alat ukur, diantaranya:
Test apBaaygainagn dSkiraalnacang?
InSikamlaeruinpi atkearndiprierdtaanriyadauna ybaanggiasnedyearhkanni apderannyjaatwaaanbaantnayua dteisrekbaiutt
edraetngbaangaitiemmandaanpaelntegrenmatbifajnagwatbesatn myaenngdaekfiannisdikipanilihkoonlethrupkesyearntag.
diukur. Apakah definisi konstruk yang akan dipakai sama atau
berbeda dengan test yang sudah ada sebelumnya?
Apa tujuaItnemdari test?
PPeerrtnanyaytaaaann yinani g mdeisnagjigkaanli simfaetnnygaentaeirtuutunptu. kPesaeprata htuajnuyaan datpeast
dmigeumnailkihans. aJlaikha ssautudahjawaadbaantesytansgebesuludmahnyda,iseadpiaakkaahn. tuSjeuhainngignai ,
staimdaakaatdaau jbaewrabbeadna?lain selain pilihan yang sudah ada.
Apakah ada kebutuhPainlihuanntuJkawmaebnagnembangkan tes ini?
PdAdh ieilipjmPbnutlumieeeehkggelnrnuaiugnankgjnrmaejai.aealtdadm‘nijstfasiiaesbawjmtnspanaitagmewnebmlalgaapuaatbiaeblinnunsnareetsknmdabttaeanueyendsyjranuttebandeg’nbea.gsauganntNpkratuauaubunmitmnrakariudakuuprtmaintseerneied,nrbrtsdeamtkuauanilantttaengeeiyintygmrakaanjnaaanduakndngeittoiienifdnlsaseg“etaaltAbiaanmtnpinhyaghuaaauam‘kn.kssnapKoaguhnimedoyl isgmaabhpuanhdyaurdtegeendaknhtthiietagbediyrndneaaasa,nrasekdnjiakdeafgsp?ni.aeah”ajaDdtaaukyanraaaajunpgtunnasya.’ guat
Siapa yang akan menggunakan tes ini?
Dari pertanyaannya jelas menggambarkan siapakah yang dapat
menggunakan test yang sedang dibuat. Misal, assessor dengan
latar belakang psikologi? atau assessor dengan latar belakang
apapun?
Apa tujuan dari test?
Hal ini terjawab jika penyusun test dapat memberikan gambaran
mengenai test yang sedang dibuat diperuntukan bagi siapa.
Mungkin ada kriteria tambahan peserta test, misal rentang usia
peserta tes atau untuk posisi atau jabatan apa yang bisa
menjawabnya.
ASSESSMENT AND DEVELOPMENT CENTER
31
Pertanyaan Awal Saat Membuat Alat Ukur (lanjutan)
Dimensi atau aspek apa BsaajgaiaynanSgkaalkaan tercakup oleh tes ini?
Sebagai penyusun test membutuhkan aspek/dimensi. Oleh sebab
itSuk, alakitiani tdearpdairti dmarei mdpueartbimagbiaanngykaaknni speemrnuyaataaatnauatasuebdaigseiabnut
asdpeenkg/adnimiteenmsi daapnaaslatejarnyaatnifgjaawkaabnadnipyaankagi.aAkapnabdiilpailsiuhdoalehhapdeasetertsat .
yang sama sebelumnya, aspek apa yang membedakannya
Bagaimana tesItaekman diberikan?
PePneyrunsyuantaatenstyanjuggadismajeikmanikisrikfaatnnybaatgearitmutaunpa. Ppeesmerbtaerihaannytaesdtapinait.
Dilmakeumkialinh sseaclaahra siantduivjiadwuabaatanu ykaenlgomspudoka?h Jdiiksaeddiailkaaknu.kaSnehisnegcgaraa,
indtiidviadkua/kdealojamwpaobka,nalpaiankasehlahinaspilinlihyaanbyearnbgedsau.dTaehraakdha.ir, media yang
akan digunakan dapat menggunakan paper pencil atau komputer.
Apa foPrimlihaatnteJsaywaanbgaindeal?
Sebagai penyusun, sudah memikirikan format terbaik untuk
digunakan dalam test ini. Dapat berupa benar-salah, esai, pilihan
ganda, atau dalam format lain yang menurut penyusun lebih tepat.
Ketika test ini akan dikembangkan, dapatkah test dibuat
dalam beberapa paket test?
Hal ini didasarkan biaya dalam pen
gembangan test cukup besar serta
manfaat yang diperoleh akan banyak. Harapannya, jika nanti test
akan dikembangkan maka memungkinkan ada beberapa paket yang
lainnya.
Bagaimana interpretasi skor pada tes ini?
Pada pertanyaan ini, penyusun me
mikirkan bagaimana skor peserta
diperlakukan. Apakah hasilnya nanti dibandingkan dengan peserta
lain yang mengikuti ujian yang sama atau membandingkannya
dengan kriteria kelompok yang sesuai.
ASSESSMENT AND DEVELOPMENT CENTER
32
2 Identify behaviors to represent the construct
Kegiatan mengidentifikasi perilaku ini dapat dilakukan dengan cara
mengumpulkan teori mengenai variabel atau atribut yang akan diukur. Di
bawah ini terdapat beberapa cara yang dapat dilakukan dalam
mengidentifikasi perilaku:
Content Analysis
1 Cara ini diperoleh apabila Anda sebagai seorang guru
atau pengajar ingin membuat test mengenai materi
yang akan diujikan. Content analysis diperoleh dengan
mengetahui bahan ajar atau kurikulum yang diajarkan
kepada peserta didik.
2 Literatur Review
3
Kegiatan ini dilakukan dengan membaca buku, jurnal
atau hasil penelitian terbaru yang terkait dengan
variabel atau atribut yang diukur.
Expert Judgment
Expert judgment dilakukan dengan cara berdiskusi
dengan pakar atau orang yang dianggap ahli terkait
variabel atau atribut yang diukur. Dari kegiatan ini
diharapkan dapat membantu peneliti untuk
menemukan clue mengenai atribut tersebut.
3 Test specification
Tahapan ini, penyusun membuat kisi-kisi test yang isinya mengenai detail
perilaku yang ingin diukur dan disajikan dalam matrik. Kisi-kisi ini dikenal
dengan istilah blue print. Tujuan sebenarnya ialah membantu penyusun
dalam pembuatan item/soal. Isi blue print terdiri dari aspek atau dimensi yang
sudah ditentukan, indikator, keterangan item/soal (favorable dan unfavorable)
serta jumlah item untuk masing-masing dimensi.
ASSESSMENT AND DEVELOPMENT CENTER
33
Contoh blue print atribut kepemimpinan transformasional:
4 Item Construction
Tahap ini penyusun akan menulis item sesuai format yang diinginkan
kemudian juga menentukan teknik penyekorannya. Item dapat dibuat
setelah penyusun menentukan indikator keperilakuan yang dapat dilihat di
dalam blue print. Berikut point-point yang diperhatikan dalam item
construction (Cohen, 2009) ialah:
01 Scaling methods, ini 02 Writing item, jumlah item
terkait dengan metode pada draft pertama
skala apa yang ingin disarankan sebanyak 2-3
dibuat apakah likert rating kali lebih banyak yang
scale, thurstone scale, nantinya akan disusun
semantic differential scale, dalam final version. Tahap
situational judgment test, ini juga memikirkan
atau yang lainnya. format item apa yang
ditulis (pertanyaan atau
Kompetensi penulis pernyataan).
terhadap pemahaman Dalam menulis item, diharapkan penyusun
atribut, tahapan memperhatikan kaidah-kaidah dalam
penulisannya. Setelah item dibuat, penyusun
penyusunan alat ukur, dapat menjadi reviewer pertama yakni
dan penguasaan bahasa
sangat menentukan memastikan apakah item yang ditulis sesuai
kualitas item. dengan indikator perilaku dan penulisannya
mengacu pada pedoman penulisan item.
ASSESSMENT AND DEVELOPMENT CENTER
34
Untuk menghasilkan item/soal berkualitas, maka penulis
perlu memperhatikan beberapa kaidah, diantaranya
(Azwar, 2014):
Gunakan kata dan kalimat sederhana, jelas dan mudah dipahami.
Tulis item yang tidak menimbulkan penafsiran ganda.
Membuat item mengacu pada indikator perilaku, jangan langsung
berkaitan dengan atribut yang diukur.
Pernyataan memungkin peserta untuk memberikan respon yang
sesuai dengan format skala/responnya.
Hindari pernyataan double negatif (bukan tidak mungkin) dan
pernyataan universal (selalu, pasti, setiap, tidak pernah)
Makna item tidak boleh mengandung social desirability (isi
pernyataan item dianggap baik oleh norma sosial)
Sebagian item dibuat favorable dan sebagian lainnya unfavorable.
Hal ini digunakan untuk menghindari stereotipe jawaban.
5 Item review and revision
Setelah item construction, tahap selanjutnya ialah mengecek atau
menelaah item yang sudah siap. Kegiatan ini dapat meminta bantuan
expert (orang yang berkompeten sesuai dengan atribut yang sedang
dibuat alat ukurnya) atau berdiskusi dengan team yang berpengalaman
untuk me-review.
Apakah item-item tersebut
sudah siap untuk diuji cobakan
ke peserta atau masih terdapat
item yang harus direvisi. Agar
setiap langkah dalam
penyusunan alat ukur ada
dokumentasinya, maka saat
menemui expert membawa
form yang akan diisi seperti di
halaman berikutnya:
ASSESSMENT AND DEVELOPMENT CENTER
35
Expert Review
Penjelasan Singkat Bass mengenai Kepemimpinan Transformasional
Pengukuran kepemimpinan transformasional yang digunakan dalam Bass
(2004) memiliki 4 dimensi yaitu pengaruh ideal, motivasi inspirasional,
stimulasi intelektual dan pertimbangan individual.
Pengertian operasional dimensi pengaruh ideal adalah sebagai berikut:
…………………………………………………………………………………………………………………………………………………………………
Dimensi Pengaruh Ideal
Form Penilaian
Pada setiap kolom bertuliskan kategori penilaian, terdapat 5 kolom berisi
angka 1-5. Mohon Bapak/ Ibu dapat menyilang pada salah satu angka (X)
dalam masing-masing kategori penilaiain, menurut kesesuaian dengan
kategori tersebut. Angka 1 menunjukkan tidak sesuai, angka 5 menunjukkan
sangat sesuai.
Penilaian Ahli (Expert Review)
Berikan penilaian objektif Anda terhadap setiap item yang tercantum dengan cara mengisi
Form Penilaian yang tersedia, dengan kategori penilaian sebagai berikut:
1.Tingkat Relevansi; artinya sejauh mana item tersebut relevan dengan indikator dan
dimensinya
2.Tingkat Kepentingan; artinya sejauh mana item tersebut penting untuk mengukur indikator
dan dimensinya
3.Tingkat Kejelasan; artinya sejauh mana kejelasan redaksi item tersebut akan dipahami oleh
peserta.
4.Masukan Untuk Revisi. Pada kolom “masukan untuk revisi”, mohon Bapak/Ibu dapat
memberikan masukan untuk merevisi item tersebut (terutama yang mendapatkan nilai 1 dan
2 di kolom kategori penilaian)
5.Masukan Secara Umum. Pada bagian terakhir, kami cantumkan bagian “masukan secara
umum”; mohon Bapak/Ibu berkenan mengisi dengan masukan terhadap instruksi tes,
penggunaan skala/format respon, serta tes secara keseluruhan.
ASSESSMENT AND DEVELOPMENT CENTER
36
6 Test AssemblyKELENGKAPAN
Setelah item direvisi, maka kegiatan selanjutnya ialah merakit item-item
tersebut menjadi sebuah test yang akan siap untuk diujicobakan ke peserta.
Sebagai pelengkapnya, maka disertakan:
Cover test.
Inform consent dan identitas diri peserta.
Instruction atau direction pengisian test.
Item yang akan diujicobakan
Lembar jawaban (terpisah atau disatukan)
7 Item dan Test Piloting
Dari tahapan pertama hingga keenam, test sudah siap untuk digunakan
dengan tujuan tertentu. Namun, agar test yang dibuat memenuhi
standardized measurement maka dilakukan uji coba atau try out. Kumpulan
item/soal yang telah berhasil melewati proses review oleh expert judgment
kemudian diujicobakan kepada sekelompok peserta yang memiliki
karakteristik sama dengan target peserta sebenarnya. Tujuannya ialah untuk
mengetahui apakah item/soal dapat dipahami dengan baik. Reaksi peserta
try out terhadap kata, pernyataan atau pertanyaan dalam item/soal
merupakan pertanda kurang komunikatifnya kalimat yang ditulis sehingga
memerlukan perbaikan.
5 - 10 x
Ada dua pendapat dalam jumlah item
menentukan banyaknya Nanually
peserta saat uji coba:
1000
responden
Lord
ASSESSMENT AND DEVELOPMENT CENTER
37
8 Item dan test analysisTest Finalization
Hasil uji coba akan diperoleh jawaban peserta yang kemudian diberikan skor
atau koding. Selanjutnya, penyusun melakukan analisis item dan test secara
kuantitatif. Sehingga hasil analisis menghasilkan informasi mana item/soal
yang baik dan yang buruk/jelek. Istilah item baik dan buruk, tidak lain item
valid (item/soal mengukur apa yang hendak diukur) dan tidak valid.
Jika terdapat item yang tidak valid maka penyusun dapat merevisinya atau
menggugurkannya. Sehingga, setelah analisis masih ada item yang mewakili
masing-masing indikator di dalam blue print. Untuk menjadi alat ukur baku,
maka informasi hasil analisis yang terkait dilaporkan. Informasi yang
dibutuhkan berupa:
Item Valid
Fokus pertanyaan validitas ialah mengukur yang benar.
Dalam hal ini apakah item-item yang dibuat benar dan
tepat mengukur atribut yang sudah ditentukan
sebelumnya?. Berdasarkan:
Teori test klasik menggunakan bantuan sofware
SPSS
Teori test modern, dapat dilakukan dengan dua cara
yakni pertama item response theory menggunakan
bantuan software Winstep dan kedua confirmatory
factor analysis menggunakan bantuan software
Lisrel atau Mplus
Reliabilitas
Reliabilitas diartikan sebagai keterpercayaan atau
konsistensi alat ukur. Hal ini mengandung makna
seberapa tinggi dan cermat hasil pengukurannya. Salah
satu instrument yang memiliki kualitas yang baik ialah
terpenuhinya reliabilitas.
Tahap terakhir dalam penyusunan alat ukur ialah merakit
9 item yang sudah memenuhi syarat psikometri (validitas dan
reliabilitas) sehingga layak menjadi sebuah test yang baku.
Format akhir alat ukur didesain dengan tampilan menarik
namun tetap memudahkan peserta dalam membaca dan
menjawab.
ASSESSMENT AND DEVELOPMENT CENTER
38
06 KLASIFIKASI ALAT UKUR
PSIKOLOGI
Organisasi yang bertanggung jawab untuk mengembangkan kualitas
layanan profesi psikologi ialah Himpunan Psikologi Indonesia (HIMPSI). Setiap
layanan yang akan diberikan berpegang teguh pada Kode Etik Psikologi
Indonesia. Salah satu informasi yang terdapat pada kode etik ialah mengatur
administrasi, pelaksanaan dan interpretasi test psikologi.
Hal tersebut dilakukan karena penggunaan test psikologi yang KEGUNAAN
semakin meluas. Sehingga masyarakat umum perlu mendapatkan KLASIFIKASI
informasi yang benar mengenai penggunaan test psikologi. Oleh
sebab itu, HIMPSI mengeluarkan aturan klasikasi test psikologi
sebagai pegangan bagi semua pihak dalam menggunakan test
psikologi dengan penuh tanggung jawab.
1 Memiliki pengetahuan yang sama mengenai jenis alat
ukur. Sehingga dapat mempertimbangkan
penggunaannya dengan tepat sesuai ketentuan.
2 Bertanggungjawab atas penggunaan dan interpretasi
alat ukur sesuai dengan klasifikasi dan kualifikasi
penggunanya.
3 Meyakinkan semua pihak yang terlibat dengan batasan
prinsip keilmuwan dan pengalamannya.
Sehingga HIMPSI mengelompokan alat ukur ke dalam 4 kategori yakni A, B, C dan D.
Setiap kategori yang ada terdapat informasi jenis tes, prosesnya (mulai dari
administrasi, skoring dan interpretasi), dan kriteria pelaksana (administrator (tester),
skorer dan interpreter).
ASSESSMENT AND DEVELOPMENT CENTER
39
Klasifikasi Alat Ukur oleh HIMPSI (2020)
Alat ukur psikologi diklasifikasikan ke dalam 4 kategori yakni A, B C, dan D.
Tiap kategorinya dibedakan menurut kualifikasi yang dibutuhkan sehingga
dapat mengadministrasikan, menginterpretasikan serta menulis laporan
dengan tepat.
A Test tidak bersifat B Tidak bersifat klinis
C klinis dan tidak D tetapi membutuhkan
membutuhkan keahlian administrasi
keahlian dalam sampai interpretasi.
administrasi. Dapat diadministrasi,
Dapat diadministrasi, skoring dan
skoring dan interpretasi oleh non-
interpretasi oleh non- psikolog tetapi
psikolog. dengan pelatihan.
Contoh kategori ini Test bidang
kuesioner pekerjaan, inventori
kesejahteraan minat termasuk
psikologi, kepuasan kategori ini
kerja, dll
Membutuhkan
Membutuhkan pengetahuan
pengetahuan konstruksi dan
konstruksi test dan pengalaman testing
prosedur minimal 1 tahun atau
penggunaannya. 100 kali.
Test ini Hanya dapat
mensyaratkan diadministrasikan
pemahaman psikologi dengan
psikometri, supervisi minimal 1
pengetahuan tahun oleh psikolog.
konstruksi alat ukur. Interpretasi oleh
Penggunaannya psikolog yang
dibawah supervisi menguasai teori,
psikolog. keahlian berbagai
aspek psikologis.
ASSESSMENT AND DEVELOPMENT CENTER
Daftar Pustaka
Ashton, M. C. & Lee, K. (2007). Empirical, theoretical and practical advantages of
the HEXACO model of personality structure. Personality & Social Psychology
Review, 11, 150-166.
Azwar, S. (2007). Dasar-Dasar Psikometri. Yogyakarta: Pustaka Pelajar.
Azwar, S. (2014). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Pelajar.
Bass, B., M., & Bruce J., A. (2004). The Multifactor Leadership Questionnaire
(Form 5X). Palo Alto, CA: Mind Garden, Inc.
Cohen-Swerdlik. (2009). Psychology Testing and Assessment: An Introduction
to Tests and Measurement 7th Edition. McGraw Hill.
Crocker, L., & Algina, J. (1986). Introduction to Classsical and Modern Test
Theory. Forth Worth: Holt, Rinehart and Winston, INC.
Griffin, Patrix., & Nix, Peter. (1991). Educational assesment and reporting.
Sydney: Harcout Brace javanovich, Publisher.
HIMPSI. (2020). Klasifikasi Test Psikologi. Jakarta Raya.
Issac, S. & Michael, W.B. (1984). Handbook in research and evaluation. San
Diego: Edits.
Muktamiroh, H., dkk (2001). The Potential Of Situational Judgement Test As An
Instrument Of Ethical Competence Assessment: A Literature Review. Jurnal
Pendidikan Kedokteran Indonesia – Vol. 10
Mustafa, Z. (2009). Mengurai Variabel Hingga Instrumentasi. Yogyakarta: Graha
Ilmu.
Oktarial, D., & Rika., O., Situational Judgement Test (SJT): Alternatif Metode
Seleksi Mahasiswa Baru di Fakultas Kedokteran. Fakultas Kedokteran,
Universitas Lampung.
https://talentics.id/blog/talentics/talent-assessment-and-selection/mengenal-
pengukuran-job-fit-untuk-seleksi-dalam-proses-rekrutmen