ทฤษฎีการทดสอบ TCT และ TRI

การทดสอบใช้ในจิตวิทยาเป็นเครื่องมือวัด. ในการประมาณแนวคิดและไม่มีความถูกต้องสมบูรณ์เพียงแค่เราใช้มิเตอร์เพื่อวัดความยาวเราสามารถใช้การทดสอบเพื่อวัดความฉลาดความจำความสนใจ ... หนึ่งในความแตกต่างระหว่างการกระทำหนึ่งกับการกระทำอื่นคือ การทดสอบไม่ใช่เรื่องง่ายที่จะสร้างนอกเหนือจากความสามารถในการใช้เพียงเล็กน้อยเท่านั้น.

นอกจากนี้เช่นเดียวกับการวัดเดี่ยวไม่อนุญาตให้เราพูดถึงปริมาณของวัตถุการบริหารการทดสอบเดี่ยวก็ไม่อนุญาตให้เราวินิจฉัยหรือเสนอการแทรกแซง ดังนั้น, การทดสอบมีความสำคัญสำหรับการประเมินผล แต่ไม่ได้เป็นตัวกำหนด.

นี่คือที่นักจิตวิทยามีบทบาทสำคัญที่สุด: ในบางวิธีเขาจะต้องใช้ข้อมูลที่เขาได้รับจากการทดสอบและจากแหล่งอื่น ๆ เพื่อ ให้รูปแบบการประเมินที่สอดคล้องกันซึ่งให้วิธีการวางแผนการแทรกแซง. กล่าวอีกนัยหนึ่งก็คือในเวลาที่รวมผลลัพธ์ของแหล่งข้อมูลต่าง ๆ ที่คุณภาพของผู้เชี่ยวชาญเห็นได้ชัดเจนที่สุด เราพูดถึงความเชี่ยวชาญที่ประสบความสำเร็จ แต่ด้วยประสบการณ์หลายปี.

ประวัติย่อของทฤษฎีการทดสอบ

ที่มาของการทดสอบมักจะอ้างถึงในการทดสอบที่ดำเนินการโดยจักรพรรดิจีน ในปี 3000 ก่อนพระคริสต์ ดังนั้นสิ่งเหล่านี้จึงมีวัตถุประสงค์เพื่อประเมินความสามารถทางวิชาชีพของเจ้าหน้าที่ที่จะเข้ารับราชการ (1)

การทดสอบปัจจุบันมีต้นกำเนิดใกล้เคียงที่สุดในการทดสอบที่ดำเนินการโดย Galton (1822-1911) ในห้องปฏิบัติการของเขา อย่างไรก็ตาม James Cattell เป็นคนแรกที่ใช้คำนี้ ทดสอบจิต, ในปี 1890 เนื่องจากการทดสอบครั้งแรกเหล่านี้ไม่ได้คาดการณ์ความสามารถในการรับรู้ของมนุษย์มากเกินไปนักวิจัยอย่าง Binet และ Simon (1905) จึงได้แนะนำงานองค์ความรู้แบบใหม่เพื่อประเมินด้านต่างๆเช่นการตัดสินความเข้าใจและการใช้เหตุผล.

สเกล Binet เปิดประเพณีของเครื่องชั่งเดี่ยว. นอกเหนือจากการทดสอบความรู้ความเข้าใจแล้วความก้าวหน้าครั้งยิ่งใหญ่ได้เกิดขึ้นในการทดสอบบุคลิกภาพ.

ทำไมทฤษฎีการทดสอบจึงมีความจำเป็น?

ก่อนที่ความก้าวหน้าทั้งหมดจะเกิดขึ้นพวกเขาจะเริ่มพัฒนาทฤษฎีการวัด (ทฤษฎีของการทดสอบ) ที่ส่งผลโดยตรงต่อการทดสอบในฐานะเครื่องมือที่มี ด้วยความกังวลในการสร้างเครื่องมือที่วัดสิ่งที่เราต้องการให้พวกเขาวัดและทำมันด้วยความคลาดเคลื่อนที่เป็นไปได้น้อยที่สุด. Psychometry ที่จะต้องใช้ทุกการทดสอบหรือเครื่องมือวัดที่อ้างว่าเป็นที่ถูกต้องและเชื่อถือได้,

จำได้ว่า ความเชื่อถือได้ เป็นที่เข้าใจกันว่าเสถียรภาพหรือความสอดคล้องของการวัดเมื่อกระบวนการวัดซ้ำแล้วซ้ำอีก. กล่าวอีกนัยหนึ่งการทดสอบจะมีความน่าเชื่อถือมากขึ้นและดีกว่าที่จะทำซ้ำผลลัพธ์เมื่อวัดสองวิชา - หรือวิชาเดียวกันในโอกาสที่แตกต่าง - ที่มีระดับเดียวกันในวัด สำหรับส่วนของ, ความถูกต้องหมายถึงระดับที่หลักฐานเชิงประจักษ์และทฤษฎีสนับสนุนการตีความคะแนน ของการทดสอบ (2)

ดังนั้นจึงมีทฤษฎีขนาดใหญ่สองข้อในการทดสอบหรือแนวทางเมื่อเราพูดถึงการวิเคราะห์และสร้างเครื่องมือประเภทนี้: ทฤษฎีคลาสสิกของการทดสอบ (TCT) และทฤษฎีการตอบสนองต่อรายการ (TRI).

ทฤษฎีคลาสสิกของการทดสอบ (TCT)

มันเป็นทฤษฎีที่โดดเด่นในการก่อสร้างและการวิเคราะห์ของการทดสอบ. ชาม: มันค่อนข้างง่ายในการสร้างแบบทดสอบที่ตรงตามข้อกำหนดขั้นต่ำของกระบวนทัศน์นี้ การประเมินผลการทดสอบตัวเองในแง่ของพารามิเตอร์ที่กล่าวถึงก็ค่อนข้างง่าย: ความน่าเชื่อถือและความถูกต้อง.

มีต้นกำเนิดในผลงานของ Spearman เมื่อต้นศตวรรษที่ 20. จากนั้นในปี 2511 ท่านนักวิจัยของลอร์ดและโนวิคได้ทำการปรับเปลี่ยนทฤษฎีนี้และเปิดทางสู่แนวทางใหม่ของ TRI.

ทฤษฎีนี้ใช้โมเดลเชิงเส้นตรงคลาสสิก. แบบจำลองนี้เสนอโดย Spearman และประกอบด้วยการสันนิษฐานว่า คะแนนที่บุคคลได้รับจากการทดสอบซึ่งเราเรียกว่าคะแนนเชิงประจักษ์ของเขาและโดยปกติแล้วจะถูกกำหนดด้วยตัวอักษร X ซึ่งประกอบด้วยสององค์ประกอบ. (2)

ในอีกด้านหนึ่งเราจะพบคะแนนที่แท้จริงของเรื่องในการทดสอบ (V) และในอีกทางหนึ่งข้อผิดพลาด (e) มันจะแสดงดังต่อไปนี้: X = V + e.

Spearman เพิ่มสมมติฐานสามข้อสำหรับทฤษฎีนี้:

ก่อนกำหนด คะแนนที่แท้จริง (V) เช่นเดียวกับ ความหวังทางคณิตศาสตร์ของ คะแนนเชิงประจักษ์: มันเป็นคะแนนที่คน ๆ หนึ่งจะได้รับจากการทดสอบว่าเขาทำมาได้ไม่ จำกัด จำนวนครั้ง.
ไม่ มี ความสัมพันธ์ ระหว่าง จำนวนคะแนนที่แท้จริง และ ขนาดของข้อผิดพลาด ที่มีผลต่อคะแนนเหล่านั้น.
ในที่สุด, ข้อผิดพลาดการวัดในการทดสอบ พวกเขาเป็น ที่เกี่ยวข้อง กับ ข้อผิดพลาดการวัดในการทดสอบอื่นที่แตกต่างกัน.

เพื่อทำให้ทฤษฎีนี้สมบูรณ์ Spearman ให้คำจำกัดความ การทดสอบแบบขนาน เหมือนการทดสอบที่วัดสิ่งเดียวกัน แต่มีรายการต่างกัน.

ข้อ จำกัด ของวิธีการคลาสสิก

ข้อ จำกัด แรกคือในทฤษฎีนี้การวัดไม่คงที่ ด้วยความเคารพต่อเครื่องมือที่ใช้ ซึ่งหมายความว่าหากนักจิตวิทยาประเมินความฉลาดของสามคนด้วยการทดสอบที่แตกต่างกันสำหรับแต่ละคนผลลัพธ์ที่ได้จะไม่เทียบเท่า แต่ทำไมถึงเกิดขึ้น??

ผลของเครื่องมือวัดทั้งสามนั้นไม่ได้อยู่ในระดับเดียวกัน: การทดสอบแต่ละครั้งมีขนาดของตัวเอง. เพื่อให้สามารถเปรียบเทียบตัวอย่างเช่นความฉลาดของคน X ที่ได้รับการประเมินด้วยการทดสอบความฉลาดที่แตกต่างกันมันเป็นสิ่งจำเป็น เปลี่ยนคะแนนที่ได้รับ โดยตรงจากการทดสอบในระดับอื่น ๆ.

ปัญหานี้คือโดยการเปลี่ยนคะแนนเป็น baremadas เราคิดว่ากลุ่มกฎเกณฑ์ที่พวกเขาได้รับการทำอย่างละเอียด ตาชั่งของการทดสอบที่แตกต่างกันคือ เปรียบได้ - เฉลี่ยเดียวกัน, ส่วนเบี่ยงเบนมาตรฐานเดียวกัน-, สิ่งที่ยากที่จะรับประกันในทางปฏิบัติ (1) ดังนั้นแนวทางใหม่ของ TRI จึงควรมีความก้าวหน้าอย่างมากเกี่ยวกับข้อเท็จจริงนี้ TRI จะบรรลุผลที่ได้จากการใช้เครื่องมือที่แตกต่างกันในระดับเดียวกัน.

ข้อ จำกัด ที่สองของวิธีนี้คือการขาดความไม่แน่นอนของคุณสมบัติการทดสอบ เกี่ยวกับคนที่ใช้ในการประเมิน ดังนั้นในกรอบของ TCT คุณสมบัติทางจิตวิทยาที่สำคัญของการทดสอบขึ้นอยู่กับประเภทของตัวอย่างที่ใช้ในการคำนวณ นี่คือความจริงที่พบวิธีการแก้ปัญหาอย่างน้อยบางส่วนในแนวทางของ TRI.

ทฤษฎีการตอบสนองข้อ (TRI)

ทฤษฎีการตอบสนองต่อรายการ (TRI) ถือกำเนิดขึ้นเป็นส่วนเสริมของทฤษฎีการทดสอบแบบดั้งเดิม. กล่าวอีกนัยหนึ่ง TCT และ TRI สามารถประเมินผลการทดสอบเดียวกันรวมถึงสร้างคะแนนหรือความเกี่ยวข้องสำหรับแต่ละรายการซึ่งจะให้ผลลัพธ์ที่แตกต่างกันสำหรับแต่ละคน ในทางกลับกันเพื่อชี้ให้เห็นว่า TRI จะมอบเครื่องมือสอบเทียบที่ดีกว่าให้กับเราปัญหาคือว่ากระบวนทัศน์นี้มีค่าใช้จ่ายที่สูงขึ้นมากและการมีส่วนร่วมของผู้เชี่ยวชาญเฉพาะทาง.

TRI มีข้อสันนิษฐานหลายประการ แต่บางทีสิ่งที่สำคัญที่สุดบอกเราว่าเครื่องมือวัดใดควรเป็นไปตามแนวคิด: มี ความสัมพันธ์การทำงานระหว่างค่าของตัวแปรที่วัดรายการและความน่าจะเป็นของการกดปุ่มเหล่านี้. ฟังก์ชั่นนี้เรียกว่า ลักษณะโค้งของไอเท็ม (CCI) ถ้าอย่างนั้นเราจะคิดอย่างไร?

สิ่งที่มาจากภายนอกนั้นดูสมเหตุสมผลและ TCT ไม่ได้ประเมิน. ตัวอย่างเช่นรายการที่ยากที่สุดจะเป็นของที่คนฉลาดเท่านั้นที่ตอบ ในทางกลับกันรายการที่ทุกคนตอบได้ดีจะไม่คุ้มค่าเพราะจะไม่มีอำนาจในการแยกแยะ มันจะไม่ให้ข้อมูลใด ๆ นี่เป็นเพียงภาพร่างเล็ก ๆ ของการปฏิวัติที่เสนอโดย TRI.

หากต้องการดูความแตกต่างที่ดีกว่าเล็กน้อยระหว่างแบบจำลองการวัดแบบหนึ่งกับแบบจำลองอีกแบบหนึ่งเราสามารถใช้ตารางอ้างอิงโดยJoséMuñiz (2010):

ตารางที่ 1. ความแตกต่างระหว่าง TCT และ TRI (Muñiz, 2010)

ด้าน	TCT	TRI
แบบ	เชิงเส้น	ไม่เชิงเส้น
สมมติฐาน	อ่อนแอ (ง่ายต่อการพบข้อมูล)	แข็งแรง (หายากสำหรับข้อมูล)
การวัดความแปรปรวน	ไม่	ใช่
ความไม่แน่นอนของคุณสมบัติการทดสอบ	ไม่	ใช่
มาตราส่วนของคะแนน	ระหว่าง 0 และสูงสุดในการทดสอบ	ความไม่มีที่สิ้นสุด
ความสำคัญ	ทดสอบ	ชิ้น
รายการทดสอบความสัมพันธ์	ไม่ได้ระบุ	ลักษณะโค้งของไอเท็ม
คำอธิบายของรายการ	ดัชนีความยากและการเลือกปฏิบัติ	พารามิเตอร์ a, b, c
ข้อผิดพลาดการวัด	ข้อผิดพลาดในการวัดทั่วไปทั่วไปสำหรับตัวอย่างทั้งหมด	ฟังก์ชั่นข้อมูล (แตกต่างกันไปตามระดับความถนัด)
ขนาดตัวอย่าง	มันสามารถทำงานได้ดีกับตัวอย่างระหว่าง 200 ถึง 500 คนโดยประมาณ	แนะนำมากกว่า 500 วิชา

นี่คือทฤษฎีที่เกี่ยวข้องกับการทดสอบทั้งสอง แม้ว่าจะเกือบจะเป็นยุคกลาง แต่ก็ชัดเจนว่า TRI เกิดขึ้นเพื่อตอบสนองต่อข้อ จำกัด หรือปัญหาที่ TCT สามารถพัฒนาได้. อย่างไรก็ตามดูเหมือนว่าการวิจัยยังคงมีทางยาวไปในด้านของ psychometrics นี้.

การทดสอบทางจิตวิทยา: ลักษณะและการทำงานการทดสอบทางจิตวิทยาเป็นเครื่องมือที่ใช้ในจิตวิทยาเพื่อวัดตัวแปรที่สนใจในการรู้ อ่านเพิ่มเติม "

« ทฤษฎีของกระบวนการคู่คือสิ่งที่พวกเขาเป็นและวิธีที่พวกเขาอธิบายจิตใจมนุษย์ ทฤษฎีความฉลาดของมนุษย์ »