Teori uji klasik

Teori uji klasik / Psikologi eksperimental

Tes adalah a instrumen ilmiah sejauh mengukur apa yang dimaksudkannya, yaitu, itu valid, dan itu mengukur dengan baik, yaitu, tepat atau dapat diandalkan. Jika kita menemukan instrumen yang tidak dapat kita percayai dengan ukuran yang mereka berikan, karena mereka bervariasi dari waktu ke waktu ketika kita mengukur objek yang sama maka kita akan mengatakan bahwa itu tidak dapat diandalkan. Instrumen, untuk mengukur dengan benar sesuatu, itu harus tepat, karena jika tidak, mengukur apa yang Anda ukur, mengukurnya salah. Oleh karena itu, ketepatan adalah kondisi yang diperlukan tetapi tidak cukup. Selain itu, itu harus valid, yaitu, apa yang diukur secara akurat akan menjadi apa yang dimaksudkan untuk diukur, dan tidak ada yang lain.

Anda juga mungkin tertarik: Item Response Theory - Aplikasi dan Tes

Keandalan:

Keandalan absolut dan relatif: Kami dapat mengatasi masalah keandalan pengujian dalam dua cara berbeda, meskipun di latar belakang keduanya bertepatan..

Keandalan sebagai ketidakakuratan pengukurannya: Ketika subjek merespons tes, ia memperoleh skor empiris, yang dipengaruhi oleh kesalahan. Jika tidak ada kesalahan, subjek akan mendapatkan skor sejatinya. Tes ini tidak tepat karena skor empiris tidak cocok dengan skor sejati sejati. Perbedaan antara kedua skor ini adalah kesalahan pengambilan sampel, kesalahan pengukuran. itu kesalahan pengukuran tipikal akan standar deviasi kesalahan pengukuran. itu kesalahan pengukuran tipikal menunjukkan ketepatan absolut dari tes, karena memungkinkan memperkirakan perbedaan antara pengukuran yang diperoleh dan yang akan diperoleh jika tidak ada kesalahan.

Reliabilitas sebagai kestabilan pengukuran: Suatu tes akan lebih dapat diandalkan semakin konstan atau stabil hasil yang diberikannya ketika diulangi. Semakin stabil hasilnya pada dua kesempatan, semakin besar korelasi di antara mereka. Korelasi ini disebut koefisien reliabilitas. Ini mengekspresikan kita, bukan jumlah kesalahan, tetapi koherensi tes dengan dirinya sendiri dan keteguhan informasi yang ditawarkannya. itu koefisien reliabilitas menyatakan reliabilitas relatif dari tes.

Koefisien reliabilitas dan indeks reliabilitas: - Koefisien reliabilitas dari tes adalah korelasi dari tes itu sendiri, diperoleh misalnya, dalam dua bentuk paralel: rxx. - Indeks presisi adalah korelasi antara skor empiris suatu tes dan skor sebenarnya: rxv Indeks presisi akan selalu lebih besar daripada koefisien reliabilitas Untuk mengetahui koefisien reliabilitas, ketiga metode klasik ini patut disorot:

  • Temukan korelasi antara tes dan pengulangannya: Metode pengulangan atau tes-tes ulang: Terdiri dari menerapkan tes yang sama untuk kelompok yang sama pada dua kesempatan dan korelasi antara dua seri skor dihitung. Korelasi ini adalah koefisien reliabilitas. Metode ini biasanya memberikan koefisien reliabilitas yang lebih tinggi daripada yang diperoleh dengan prosedur lain, dan mungkin terkontaminasi oleh faktor-faktor yang mengganggu.
  • Temukan korelasi antara dua bentuk paralel dari tes: Metode bentuk paralel: Siapkan dua bentuk paralel dari tes yang sama, yaitu dua bentuk setara yang memberikan informasi yang sama, dan berlaku untuk kelompok subjek yang sama. Korelasi antara kedua bentuk tersebut adalah koefisien reliabilitas. Dengan metode ini, dengan tidak mengulangi pengujian yang sama, sumber keandalan pengujian ulang yang mengganggu dapat dihindari.
  • Temukan korelasi antara dua bagian paralel dari tes: Metode dua bagian: Tes dibagi menjadi dua bagian yang setara dan korelasi di antara keduanya ditemukan. Ini adalah metode yang lebih disukai, karena sederhana dan mengabaikan batasan prosedur sebelumnya. Anda dapat memilih elemen-elemen aneh tes, untuk membentuk setengah, dan elemen genap untuk membentuk yang lain.

Koefisien reliabilitas dan korelasi antara tes paralel

itu koefisien reliabilitas dari sebuah tes menunjukkan proporsi bahwa varian sebenarnya adalah varian empiris: gambar33 Koefisien reliabilitas suatu tes bervariasi antara 0 dan 1. Misalnya: jika korelasi antara dua tes paralel adalah rxx´ = 0,80, berarti bahwa 80% dari varians tes adalah karena ukuran nyata, dan sisanya, yaitu, 20% dari varians tes adalah karena kesalahan. itu indeks keandalan dari suatu tes adalah korelasi antara skor empirisnya dan nilai sebenarnya indeks reliabilitas = Indeks reliabilitasnya sama dengan akar kuadrat dari koefisien reliabilitas

Setelah dua bentuk paralel dari tes telah dikembangkan, prosedur analisis ragam diterapkan untuk memeriksa homogenitas ragam dan perbedaan antara langkah-langkah. Jika variansnya homogen, perbedaan antara rata-rata tidak signifikan dan kedua bentuk dikonstruksi dengan jumlah elemen yang sama dari jenis dan konten psikologis yang sama, dapat dikatakan bahwa mereka paralel. Jika tidak, Anda harus memperbarui mereka sampai mereka. Kurangnya keandalan diidentifikasi dengan nilai rxx´= 0 4.- Kesalahan pengukuran tipikal: Perbedaan antara skor empiris dan skor nyata adalah kesalahan acak, yang disebut kesalahan pengukuran. Standar deviasi kesalahan pengukuran disebut kesalahan pengukuran tipikal. itu kesalahan pengukuran tipikal memungkinkan untuk membuat estimasi tentang reliabilitas absolut dari tes, yaitu untuk memperkirakan seberapa banyak kesalahan pengukuran mempengaruhi skor.

Reliabilitas dan panjang: Panjang tes mengacu pada jumlah elemen-elemennya. Keandalan tergantung pada panjang ini. Jika tes terdiri dari tiga elemen, subjek dapat memperoleh skor 1 dan yang lain, atau secara paralel, skor dari

Dari satu kesempatan ke yang lain, skornya bervariasi berdasarkan satu poin; titik di atas tiga adalah variasi 33%, variasi tinggi. Jika subjek mendapatkan variasi acak dari jenis ini, korelasi tes dengan dirinya sendiri atau dengan dua bentuk tes paralel akan sangat berkurang dan tidak bisa tinggi. Jika tes lebih lama, jika Anda memiliki, misalnya, 100 item, subjek bisa mendapatkan 70 poin pada satu kesempatan dan 67 secara paralel. Dari satu ke yang lain telah berubah 3 poin; itu adalah varian yang relatif kecil dalam kaitannya dengan tes total, khususnya 3%. Perubahan kasual kecil dari besaran ini, yang terjadi dalam skor subjek, ketika beralih dari satu bentuk ke paralel, relatif tidak penting dan tidak akan berkurang sebanyak sebelum korelasi antara keduanya..

Koefisien reliabilitas akan jauh lebih tinggi daripada dalam kasus sebelumnya. Persamaan Spearman-Brown mengungkapkan hubungan antara reliabilitas dan panjang. Ketelitian suatu tes adalah nol ketika panjangnya adalah 0, dan itu meningkat dengan meningkatnya panjang. Meskipun peningkatannya relatif lebih kecil karena panjang bagian mana yang lebih besar. Ini berarti bahwa ketepatan tumbuh jauh di awal dan relatif lebih lambat. Ketika panjang cenderung tak terhingga, koefisien reliabilitas cenderung

Dengan meningkatkan panjang tes, akurasinya meningkat karena meningkatkan varians sebenarnya pada tingkat yang lebih tinggi daripada varians kesalahan. Ini berarti bahwa keakuratan tes meningkat karena proporsi varians karena kesalahan berkurang. Rumus Rulon, serta rumus Flanagan dan Guttman, terutama berlaku ketika menghitung koefisien reliabilitas dengan metode dua bagian. Ini adalah rumus yang digunakan untuk menghitung koefisien reliabilitas.

Keandalan dan konsistensi: Koefisien reliabilitas juga dapat ditemukan dengan cara lain, itu yang disebut koefisien alfa o koefisien generalisasi atau keterwakilan (Cronbach). Koefisien alfa ini menunjukkan akurasi yang digunakan beberapa item untuk mengukur aspek kepribadian atau perilaku. Ini dapat diartikan sebagai: Perkiraan korelasi rata-rata dari semua item yang mungkin dalam aspek tertentu. Ukuran keakuratan tes sesuai dengan koherensinya atau konsistensi internal (keterkaitan antara elemen-elemennya, sejauh mana elemen tes mengukur semua sama) dan panjangnya. Menunjukkan keterwakilan pengujian, yaitu, jumlah sampel item yang menyusunnya mewakili populasi item yang mungkin dari jenis dan konten psikologis yang sama. itu koefisien alfa mencerminkan terutama, dua konsep dasar dalam ketelitian suatu tes: 1. Keterkaitan antara elemen-elemennya: sejauh mana mereka semua mengukur hal yang sama.

Lamanya pengujian: ketika menambah jumlah kasus sampel, dan jika kesalahan sistematis dihilangkan, sampel tersebut mewakili populasi yang lebih baik daripada yang diekstraksi dan lebih kecil kemungkinannya bahwa kesalahan yang disengaja terlibat. Jika item tes dikotomi, (ya atau tidak, 1 atau 0, kesepakatan atau ketidaksepakatan, dll), persamaan koefisien alfa disederhanakan, sehingga menimbulkan persamaan Kuder-Richardson (KR20 dan KR21). Diberikan sejumlah item tertentu, tes akan lebih dapat diandalkan, ketika lebih homogen. Koefisien alfa memberi tahu kita reliabilitas karena mewakili homogenitas dan konsistensi atau konsistensi internal dari elemen-elemen tes.

Kriteria standar dan keandalan

Menurut model ruang sampel item, tujuan dari tes ini adalah untuk memperkirakan ukuran yang akan diperoleh jika semua item dalam ruang sampel digunakan. Ukuran ini akan menjadi skor sebenarnya, di mana pengukuran sebenarnya mendekati kurang lebih. Tergantung pada sejauh mana sampel item berkorelasi dengan skor sebenarnya, tes lebih atau kurang dapat diandalkan. Dalam model ini, matriks korelasi antara semua item dalam ruang sampel adalah pusat, model sampel ini lebih menekankan pada konsistensi internal, dan sejauh itu mencapai itu, secara tidak langsung menjamin stabilitas..

Model linear dari tes paralel menekankan lebih pada stabilitas skor, dan sejauh itu mencapai stabilitas, secara tidak langsung mendukung konsistensi internal. Jika kami menerapkan tes untuk menetapkan diagnosis dan perkiraan individu, koefisien reliabilitas harus 0,90 ke atas. Dalam prakiraan dan klasifikasi kolektif, tidak begitu banyak persyaratannya, meskipun tidak nyaman untuk jauh dari 0'90 hingga 0'80.

Terkadang, dalam beberapa jenis tes, seperti tes kepribadian, sulit untuk mencapai koefisien lebih dari 0,70. Jika bentuk paralel, atau bagian paralel, diterapkan setelah interval yang lebih atau kurang besar, kesalahan biasa bisa lebih banyak daripada yang mempengaruhi koefisien alfa. Hal ini karena apa yang mengurangi korelasi tidak hanya kesalahan acak intrinsik untuk pengujian dan pada satu kesempatan, yaitu kesalahan yang memperhitungkan koefisien alpha, tetapi juga mempengaruhi semua kesalahan yang mungkin berasal dari dua situasi yang berbeda , yang mungkin berbeda dalam banyak detail. Oleh karena itu, koefisien alfa biasanya lebih besar daripada koefisien lainnya.

Kecuali untuk koefisien yang ditemukan dengan mengulangi tes yang sama, karena ada lebih banyak kemungkinan bahwa kesalahan acak dari aplikasi pertama diulang dalam yang kedua, dan bukannya mengurangi korelasi antara keduanya, tambahkan saja. Harus dipastikan bahwa aplikasi kedua sepenuhnya independen dari yang pertama. Jika kita mencapai ini, ini akan menjadi metode termudah dan termurah dan disarankan ketika mencoba menghargai stabilitas skor, terutama selama periode waktu yang lama dan dengan tes yang kompleks. > Selanjutnya: Validitas tes

Artikel ini murni informatif, dalam Psikologi Online kami tidak memiliki fakultas untuk membuat diagnosis atau merekomendasikan perawatan. Kami mengundang Anda untuk pergi ke psikolog untuk menangani kasus Anda secara khusus.

Jika Anda ingin membaca lebih banyak artikel yang mirip dengan Teori uji klasik, Kami menyarankan Anda untuk memasukkan kategori Psikologi Eksperimental kami.