ทฤษฎีการทดสอบ TCT และ TRI

ทฤษฎีการทดสอบ TCT และ TRI / ประสาท

การทดสอบใช้ในจิตวิทยาเป็นเครื่องมือวัด. ในการประมาณแนวคิดและไม่มีความถูกต้องสมบูรณ์เพียงแค่เราใช้มิเตอร์เพื่อวัดความยาวเราสามารถใช้การทดสอบเพื่อวัดความฉลาดความจำความสนใจ ... หนึ่งในความแตกต่างระหว่างการกระทำหนึ่งกับการกระทำอื่นคือ การทดสอบไม่ใช่เรื่องง่ายที่จะสร้างนอกเหนือจากความสามารถในการใช้เพียงเล็กน้อยเท่านั้น.

นอกจากนี้เช่นเดียวกับการวัดเดี่ยวไม่อนุญาตให้เราพูดถึงปริมาณของวัตถุการบริหารการทดสอบเดี่ยวก็ไม่อนุญาตให้เราวินิจฉัยหรือเสนอการแทรกแซง ดังนั้น, การทดสอบมีความสำคัญสำหรับการประเมินผล แต่ไม่ได้เป็นตัวกำหนด.

นี่คือที่นักจิตวิทยามีบทบาทสำคัญที่สุด: ในบางวิธีเขาจะต้องใช้ข้อมูลที่เขาได้รับจากการทดสอบและจากแหล่งอื่น ๆ เพื่อ ให้รูปแบบการประเมินที่สอดคล้องกันซึ่งให้วิธีการวางแผนการแทรกแซง. กล่าวอีกนัยหนึ่งก็คือในเวลาที่รวมผลลัพธ์ของแหล่งข้อมูลต่าง ๆ ที่คุณภาพของผู้เชี่ยวชาญเห็นได้ชัดเจนที่สุด เราพูดถึงความเชี่ยวชาญที่ประสบความสำเร็จ แต่ด้วยประสบการณ์หลายปี.

ประวัติย่อของทฤษฎีการทดสอบ

ที่มาของการทดสอบมักจะอ้างถึงในการทดสอบที่ดำเนินการโดยจักรพรรดิจีน ในปี 3000 ก่อนพระคริสต์ ดังนั้นสิ่งเหล่านี้จึงมีวัตถุประสงค์เพื่อประเมินความสามารถทางวิชาชีพของเจ้าหน้าที่ที่จะเข้ารับราชการ (1)

การทดสอบปัจจุบันมีต้นกำเนิดใกล้เคียงที่สุดในการทดสอบที่ดำเนินการโดย Galton (1822-1911) ในห้องปฏิบัติการของเขา อย่างไรก็ตาม James Cattell เป็นคนแรกที่ใช้คำนี้ ทดสอบจิต, ในปี 1890 เนื่องจากการทดสอบครั้งแรกเหล่านี้ไม่ได้คาดการณ์ความสามารถในการรับรู้ของมนุษย์มากเกินไปนักวิจัยอย่าง Binet และ Simon (1905) จึงได้แนะนำงานองค์ความรู้แบบใหม่เพื่อประเมินด้านต่างๆเช่นการตัดสินความเข้าใจและการใช้เหตุผล.

สเกล Binet เปิดประเพณีของเครื่องชั่งเดี่ยว. นอกเหนือจากการทดสอบความรู้ความเข้าใจแล้วความก้าวหน้าครั้งยิ่งใหญ่ได้เกิดขึ้นในการทดสอบบุคลิกภาพ.

ทำไมทฤษฎีการทดสอบจึงมีความจำเป็น?

ก่อนที่ความก้าวหน้าทั้งหมดจะเกิดขึ้นพวกเขาจะเริ่มพัฒนาทฤษฎีการวัด (ทฤษฎีของการทดสอบ) ที่ส่งผลโดยตรงต่อการทดสอบในฐานะเครื่องมือที่มี ด้วยความกังวลในการสร้างเครื่องมือที่วัดสิ่งที่เราต้องการให้พวกเขาวัดและทำมันด้วยความคลาดเคลื่อนที่เป็นไปได้น้อยที่สุด. Psychometry ที่จะต้องใช้ทุกการทดสอบหรือเครื่องมือวัดที่อ้างว่าเป็นที่ถูกต้องและเชื่อถือได้,

จำได้ว่า ความเชื่อถือได้ เป็นที่เข้าใจกันว่าเสถียรภาพหรือความสอดคล้องของการวัดเมื่อกระบวนการวัดซ้ำแล้วซ้ำอีก. กล่าวอีกนัยหนึ่งการทดสอบจะมีความน่าเชื่อถือมากขึ้นและดีกว่าที่จะทำซ้ำผลลัพธ์เมื่อวัดสองวิชา - หรือวิชาเดียวกันในโอกาสที่แตกต่าง - ที่มีระดับเดียวกันในวัด สำหรับส่วนของ, ความถูกต้องหมายถึงระดับที่หลักฐานเชิงประจักษ์และทฤษฎีสนับสนุนการตีความคะแนน ของการทดสอบ (2)

ดังนั้นจึงมีทฤษฎีขนาดใหญ่สองข้อในการทดสอบหรือแนวทางเมื่อเราพูดถึงการวิเคราะห์และสร้างเครื่องมือประเภทนี้: ทฤษฎีคลาสสิกของการทดสอบ (TCT) และทฤษฎีการตอบสนองต่อรายการ (TRI).

ทฤษฎีคลาสสิกของการทดสอบ (TCT)

มันเป็นทฤษฎีที่โดดเด่นในการก่อสร้างและการวิเคราะห์ของการทดสอบ. ชาม: มันค่อนข้างง่ายในการสร้างแบบทดสอบที่ตรงตามข้อกำหนดขั้นต่ำของกระบวนทัศน์นี้ การประเมินผลการทดสอบตัวเองในแง่ของพารามิเตอร์ที่กล่าวถึงก็ค่อนข้างง่าย: ความน่าเชื่อถือและความถูกต้อง.

มีต้นกำเนิดในผลงานของ Spearman เมื่อต้นศตวรรษที่ 20. จากนั้นในปี 2511 ท่านนักวิจัยของลอร์ดและโนวิคได้ทำการปรับเปลี่ยนทฤษฎีนี้และเปิดทางสู่แนวทางใหม่ของ TRI.

ทฤษฎีนี้ใช้โมเดลเชิงเส้นตรงคลาสสิก. แบบจำลองนี้เสนอโดย Spearman และประกอบด้วยการสันนิษฐานว่า คะแนนที่บุคคลได้รับจากการทดสอบซึ่งเราเรียกว่าคะแนนเชิงประจักษ์ของเขาและโดยปกติแล้วจะถูกกำหนดด้วยตัวอักษร X ซึ่งประกอบด้วยสององค์ประกอบ. (2)

ในอีกด้านหนึ่งเราจะพบคะแนนที่แท้จริงของเรื่องในการทดสอบ (V) และในอีกทางหนึ่งข้อผิดพลาด (e) มันจะแสดงดังต่อไปนี้: X = V + e.

Spearman เพิ่มสมมติฐานสามข้อสำหรับทฤษฎีนี้:

  • ก่อนกำหนด คะแนนที่แท้จริง (V) เช่นเดียวกับ ความหวังทางคณิตศาสตร์ของ คะแนนเชิงประจักษ์: มันเป็นคะแนนที่คน ๆ หนึ่งจะได้รับจากการทดสอบว่าเขาทำมาได้ไม่ จำกัด จำนวนครั้ง.
  • ไม่ มี ความสัมพันธ์ ระหว่าง จำนวนคะแนนที่แท้จริง และ ขนาดของข้อผิดพลาด ที่มีผลต่อคะแนนเหล่านั้น.
  • ในที่สุด, ข้อผิดพลาดการวัดในการทดสอบ พวกเขาเป็น ที่เกี่ยวข้อง กับ ข้อผิดพลาดการวัดในการทดสอบอื่นที่แตกต่างกัน.

เพื่อทำให้ทฤษฎีนี้สมบูรณ์ Spearman ให้คำจำกัดความ การทดสอบแบบขนาน เหมือนการทดสอบที่วัดสิ่งเดียวกัน แต่มีรายการต่างกัน.

ข้อ จำกัด ของวิธีการคลาสสิก

ข้อ จำกัด แรกคือในทฤษฎีนี้การวัดไม่คงที่ ด้วยความเคารพต่อเครื่องมือที่ใช้ ซึ่งหมายความว่าหากนักจิตวิทยาประเมินความฉลาดของสามคนด้วยการทดสอบที่แตกต่างกันสำหรับแต่ละคนผลลัพธ์ที่ได้จะไม่เทียบเท่า แต่ทำไมถึงเกิดขึ้น??

ผลของเครื่องมือวัดทั้งสามนั้นไม่ได้อยู่ในระดับเดียวกัน: การทดสอบแต่ละครั้งมีขนาดของตัวเอง. เพื่อให้สามารถเปรียบเทียบตัวอย่างเช่นความฉลาดของคน X ที่ได้รับการประเมินด้วยการทดสอบความฉลาดที่แตกต่างกันมันเป็นสิ่งจำเป็น เปลี่ยนคะแนนที่ได้รับ โดยตรงจากการทดสอบในระดับอื่น ๆ.

ปัญหานี้คือโดยการเปลี่ยนคะแนนเป็น baremadas เราคิดว่ากลุ่มกฎเกณฑ์ที่พวกเขาได้รับการทำอย่างละเอียด ตาชั่งของการทดสอบที่แตกต่างกันคือ เปรียบได้ - เฉลี่ยเดียวกัน, ส่วนเบี่ยงเบนมาตรฐานเดียวกัน-, สิ่งที่ยากที่จะรับประกันในทางปฏิบัติ (1) ดังนั้นแนวทางใหม่ของ TRI จึงควรมีความก้าวหน้าอย่างมากเกี่ยวกับข้อเท็จจริงนี้ TRI จะบรรลุผลที่ได้จากการใช้เครื่องมือที่แตกต่างกันในระดับเดียวกัน.

ข้อ จำกัด ที่สองของวิธีนี้คือการขาดความไม่แน่นอนของคุณสมบัติการทดสอบ เกี่ยวกับคนที่ใช้ในการประเมิน ดังนั้นในกรอบของ TCT คุณสมบัติทางจิตวิทยาที่สำคัญของการทดสอบขึ้นอยู่กับประเภทของตัวอย่างที่ใช้ในการคำนวณ นี่คือความจริงที่พบวิธีการแก้ปัญหาอย่างน้อยบางส่วนในแนวทางของ TRI.

ทฤษฎีการตอบสนองข้อ (TRI)

ทฤษฎีการตอบสนองต่อรายการ (TRI) ถือกำเนิดขึ้นเป็นส่วนเสริมของทฤษฎีการทดสอบแบบดั้งเดิม. กล่าวอีกนัยหนึ่ง TCT และ TRI สามารถประเมินผลการทดสอบเดียวกันรวมถึงสร้างคะแนนหรือความเกี่ยวข้องสำหรับแต่ละรายการซึ่งจะให้ผลลัพธ์ที่แตกต่างกันสำหรับแต่ละคน ในทางกลับกันเพื่อชี้ให้เห็นว่า TRI จะมอบเครื่องมือสอบเทียบที่ดีกว่าให้กับเราปัญหาคือว่ากระบวนทัศน์นี้มีค่าใช้จ่ายที่สูงขึ้นมากและการมีส่วนร่วมของผู้เชี่ยวชาญเฉพาะทาง.

TRI มีข้อสันนิษฐานหลายประการ แต่บางทีสิ่งที่สำคัญที่สุดบอกเราว่าเครื่องมือวัดใดควรเป็นไปตามแนวคิด: มี ความสัมพันธ์การทำงานระหว่างค่าของตัวแปรที่วัดรายการและความน่าจะเป็นของการกดปุ่มเหล่านี้. ฟังก์ชั่นนี้เรียกว่า ลักษณะโค้งของไอเท็ม (CCI) ถ้าอย่างนั้นเราจะคิดอย่างไร?

สิ่งที่มาจากภายนอกนั้นดูสมเหตุสมผลและ TCT ไม่ได้ประเมิน. ตัวอย่างเช่นรายการที่ยากที่สุดจะเป็นของที่คนฉลาดเท่านั้นที่ตอบ ในทางกลับกันรายการที่ทุกคนตอบได้ดีจะไม่คุ้มค่าเพราะจะไม่มีอำนาจในการแยกแยะ มันจะไม่ให้ข้อมูลใด ๆ นี่เป็นเพียงภาพร่างเล็ก ๆ ของการปฏิวัติที่เสนอโดย TRI.

หากต้องการดูความแตกต่างที่ดีกว่าเล็กน้อยระหว่างแบบจำลองการวัดแบบหนึ่งกับแบบจำลองอีกแบบหนึ่งเราสามารถใช้ตารางอ้างอิงโดยJoséMuñiz (2010):

ตารางที่ 1. ความแตกต่างระหว่าง TCT และ TRI (Muñiz, 2010)

ด้าน TCT TRI
แบบ เชิงเส้น ไม่เชิงเส้น
สมมติฐาน อ่อนแอ (ง่ายต่อการพบข้อมูล) แข็งแรง (หายากสำหรับข้อมูล)
การวัดความแปรปรวน ไม่ ใช่
ความไม่แน่นอนของคุณสมบัติการทดสอบ ไม่ ใช่
มาตราส่วนของคะแนน ระหว่าง 0 และสูงสุดในการทดสอบ ความไม่มีที่สิ้นสุด
ความสำคัญ ทดสอบ ชิ้น
รายการทดสอบความสัมพันธ์ ไม่ได้ระบุ ลักษณะโค้งของไอเท็ม
คำอธิบายของรายการ ดัชนีความยากและการเลือกปฏิบัติ พารามิเตอร์ a, b, c
ข้อผิดพลาดการวัด ข้อผิดพลาดในการวัดทั่วไปทั่วไปสำหรับตัวอย่างทั้งหมด ฟังก์ชั่นข้อมูล (แตกต่างกันไปตามระดับความถนัด)
ขนาดตัวอย่าง มันสามารถทำงานได้ดีกับตัวอย่างระหว่าง 200 ถึง 500 คนโดยประมาณ แนะนำมากกว่า 500 วิชา

นี่คือทฤษฎีที่เกี่ยวข้องกับการทดสอบทั้งสอง แม้ว่าจะเกือบจะเป็นยุคกลาง แต่ก็ชัดเจนว่า TRI เกิดขึ้นเพื่อตอบสนองต่อข้อ จำกัด หรือปัญหาที่ TCT สามารถพัฒนาได้. อย่างไรก็ตามดูเหมือนว่าการวิจัยยังคงมีทางยาวไปในด้านของ psychometrics นี้.

การทดสอบทางจิตวิทยา: ลักษณะและการทำงานการทดสอบทางจิตวิทยาเป็นเครื่องมือที่ใช้ในจิตวิทยาเพื่อวัดตัวแปรที่สนใจในการรู้ อ่านเพิ่มเติม "