ทฤษฎีการทดสอบ TCT และ TRI
การทดสอบใช้ในจิตวิทยาเป็นเครื่องมือวัด. ในการประมาณแนวคิดและไม่มีความถูกต้องสมบูรณ์เพียงแค่เราใช้มิเตอร์เพื่อวัดความยาวเราสามารถใช้การทดสอบเพื่อวัดความฉลาดความจำความสนใจ ... หนึ่งในความแตกต่างระหว่างการกระทำหนึ่งกับการกระทำอื่นคือ การทดสอบไม่ใช่เรื่องง่ายที่จะสร้างนอกเหนือจากความสามารถในการใช้เพียงเล็กน้อยเท่านั้น.
นอกจากนี้เช่นเดียวกับการวัดเดี่ยวไม่อนุญาตให้เราพูดถึงปริมาณของวัตถุการบริหารการทดสอบเดี่ยวก็ไม่อนุญาตให้เราวินิจฉัยหรือเสนอการแทรกแซง ดังนั้น, การทดสอบมีความสำคัญสำหรับการประเมินผล แต่ไม่ได้เป็นตัวกำหนด.
นี่คือที่นักจิตวิทยามีบทบาทสำคัญที่สุด: ในบางวิธีเขาจะต้องใช้ข้อมูลที่เขาได้รับจากการทดสอบและจากแหล่งอื่น ๆ เพื่อ ให้รูปแบบการประเมินที่สอดคล้องกันซึ่งให้วิธีการวางแผนการแทรกแซง. กล่าวอีกนัยหนึ่งก็คือในเวลาที่รวมผลลัพธ์ของแหล่งข้อมูลต่าง ๆ ที่คุณภาพของผู้เชี่ยวชาญเห็นได้ชัดเจนที่สุด เราพูดถึงความเชี่ยวชาญที่ประสบความสำเร็จ แต่ด้วยประสบการณ์หลายปี.
ประวัติย่อของทฤษฎีการทดสอบ
ที่มาของการทดสอบมักจะอ้างถึงในการทดสอบที่ดำเนินการโดยจักรพรรดิจีน ในปี 3000 ก่อนพระคริสต์ ดังนั้นสิ่งเหล่านี้จึงมีวัตถุประสงค์เพื่อประเมินความสามารถทางวิชาชีพของเจ้าหน้าที่ที่จะเข้ารับราชการ (1)
การทดสอบปัจจุบันมีต้นกำเนิดใกล้เคียงที่สุดในการทดสอบที่ดำเนินการโดย Galton (1822-1911) ในห้องปฏิบัติการของเขา อย่างไรก็ตาม James Cattell เป็นคนแรกที่ใช้คำนี้ ทดสอบจิต, ในปี 1890 เนื่องจากการทดสอบครั้งแรกเหล่านี้ไม่ได้คาดการณ์ความสามารถในการรับรู้ของมนุษย์มากเกินไปนักวิจัยอย่าง Binet และ Simon (1905) จึงได้แนะนำงานองค์ความรู้แบบใหม่เพื่อประเมินด้านต่างๆเช่นการตัดสินความเข้าใจและการใช้เหตุผล.
สเกล Binet เปิดประเพณีของเครื่องชั่งเดี่ยว. นอกเหนือจากการทดสอบความรู้ความเข้าใจแล้วความก้าวหน้าครั้งยิ่งใหญ่ได้เกิดขึ้นในการทดสอบบุคลิกภาพ.
ทำไมทฤษฎีการทดสอบจึงมีความจำเป็น?
ก่อนที่ความก้าวหน้าทั้งหมดจะเกิดขึ้นพวกเขาจะเริ่มพัฒนาทฤษฎีการวัด (ทฤษฎีของการทดสอบ) ที่ส่งผลโดยตรงต่อการทดสอบในฐานะเครื่องมือที่มี ด้วยความกังวลในการสร้างเครื่องมือที่วัดสิ่งที่เราต้องการให้พวกเขาวัดและทำมันด้วยความคลาดเคลื่อนที่เป็นไปได้น้อยที่สุด. Psychometry ที่จะต้องใช้ทุกการทดสอบหรือเครื่องมือวัดที่อ้างว่าเป็นที่ถูกต้องและเชื่อถือได้,
จำได้ว่า ความเชื่อถือได้ เป็นที่เข้าใจกันว่าเสถียรภาพหรือความสอดคล้องของการวัดเมื่อกระบวนการวัดซ้ำแล้วซ้ำอีก. กล่าวอีกนัยหนึ่งการทดสอบจะมีความน่าเชื่อถือมากขึ้นและดีกว่าที่จะทำซ้ำผลลัพธ์เมื่อวัดสองวิชา - หรือวิชาเดียวกันในโอกาสที่แตกต่าง - ที่มีระดับเดียวกันในวัด สำหรับส่วนของ, ความถูกต้องหมายถึงระดับที่หลักฐานเชิงประจักษ์และทฤษฎีสนับสนุนการตีความคะแนน ของการทดสอบ (2)
ดังนั้นจึงมีทฤษฎีขนาดใหญ่สองข้อในการทดสอบหรือแนวทางเมื่อเราพูดถึงการวิเคราะห์และสร้างเครื่องมือประเภทนี้: ทฤษฎีคลาสสิกของการทดสอบ (TCT) และทฤษฎีการตอบสนองต่อรายการ (TRI).
ทฤษฎีคลาสสิกของการทดสอบ (TCT)
มันเป็นทฤษฎีที่โดดเด่นในการก่อสร้างและการวิเคราะห์ของการทดสอบ. ชาม: มันค่อนข้างง่ายในการสร้างแบบทดสอบที่ตรงตามข้อกำหนดขั้นต่ำของกระบวนทัศน์นี้ การประเมินผลการทดสอบตัวเองในแง่ของพารามิเตอร์ที่กล่าวถึงก็ค่อนข้างง่าย: ความน่าเชื่อถือและความถูกต้อง.
มีต้นกำเนิดในผลงานของ Spearman เมื่อต้นศตวรรษที่ 20. จากนั้นในปี 2511 ท่านนักวิจัยของลอร์ดและโนวิคได้ทำการปรับเปลี่ยนทฤษฎีนี้และเปิดทางสู่แนวทางใหม่ของ TRI.
ทฤษฎีนี้ใช้โมเดลเชิงเส้นตรงคลาสสิก. แบบจำลองนี้เสนอโดย Spearman และประกอบด้วยการสันนิษฐานว่า คะแนนที่บุคคลได้รับจากการทดสอบซึ่งเราเรียกว่าคะแนนเชิงประจักษ์ของเขาและโดยปกติแล้วจะถูกกำหนดด้วยตัวอักษร X ซึ่งประกอบด้วยสององค์ประกอบ. (2)
ในอีกด้านหนึ่งเราจะพบคะแนนที่แท้จริงของเรื่องในการทดสอบ (V) และในอีกทางหนึ่งข้อผิดพลาด (e) มันจะแสดงดังต่อไปนี้: X = V + e.
Spearman เพิ่มสมมติฐานสามข้อสำหรับทฤษฎีนี้:
- ก่อนกำหนด คะแนนที่แท้จริง (V) เช่นเดียวกับ ความหวังทางคณิตศาสตร์ของ คะแนนเชิงประจักษ์: มันเป็นคะแนนที่คน ๆ หนึ่งจะได้รับจากการทดสอบว่าเขาทำมาได้ไม่ จำกัด จำนวนครั้ง.
- ไม่ มี ความสัมพันธ์ ระหว่าง จำนวนคะแนนที่แท้จริง และ ขนาดของข้อผิดพลาด ที่มีผลต่อคะแนนเหล่านั้น.
- ในที่สุด, ข้อผิดพลาดการวัดในการทดสอบ พวกเขาเป็น ที่เกี่ยวข้อง กับ ข้อผิดพลาดการวัดในการทดสอบอื่นที่แตกต่างกัน.
เพื่อทำให้ทฤษฎีนี้สมบูรณ์ Spearman ให้คำจำกัดความ การทดสอบแบบขนาน เหมือนการทดสอบที่วัดสิ่งเดียวกัน แต่มีรายการต่างกัน.
ข้อ จำกัด ของวิธีการคลาสสิก
ข้อ จำกัด แรกคือในทฤษฎีนี้การวัดไม่คงที่ ด้วยความเคารพต่อเครื่องมือที่ใช้ ซึ่งหมายความว่าหากนักจิตวิทยาประเมินความฉลาดของสามคนด้วยการทดสอบที่แตกต่างกันสำหรับแต่ละคนผลลัพธ์ที่ได้จะไม่เทียบเท่า แต่ทำไมถึงเกิดขึ้น??
ผลของเครื่องมือวัดทั้งสามนั้นไม่ได้อยู่ในระดับเดียวกัน: การทดสอบแต่ละครั้งมีขนาดของตัวเอง. เพื่อให้สามารถเปรียบเทียบตัวอย่างเช่นความฉลาดของคน X ที่ได้รับการประเมินด้วยการทดสอบความฉลาดที่แตกต่างกันมันเป็นสิ่งจำเป็น เปลี่ยนคะแนนที่ได้รับ โดยตรงจากการทดสอบในระดับอื่น ๆ.
ปัญหานี้คือโดยการเปลี่ยนคะแนนเป็น baremadas เราคิดว่ากลุ่มกฎเกณฑ์ที่พวกเขาได้รับการทำอย่างละเอียด ตาชั่งของการทดสอบที่แตกต่างกันคือ เปรียบได้ - เฉลี่ยเดียวกัน, ส่วนเบี่ยงเบนมาตรฐานเดียวกัน-, สิ่งที่ยากที่จะรับประกันในทางปฏิบัติ (1) ดังนั้นแนวทางใหม่ของ TRI จึงควรมีความก้าวหน้าอย่างมากเกี่ยวกับข้อเท็จจริงนี้ TRI จะบรรลุผลที่ได้จากการใช้เครื่องมือที่แตกต่างกันในระดับเดียวกัน.
ข้อ จำกัด ที่สองของวิธีนี้คือการขาดความไม่แน่นอนของคุณสมบัติการทดสอบ เกี่ยวกับคนที่ใช้ในการประเมิน ดังนั้นในกรอบของ TCT คุณสมบัติทางจิตวิทยาที่สำคัญของการทดสอบขึ้นอยู่กับประเภทของตัวอย่างที่ใช้ในการคำนวณ นี่คือความจริงที่พบวิธีการแก้ปัญหาอย่างน้อยบางส่วนในแนวทางของ TRI.
ทฤษฎีการตอบสนองข้อ (TRI)
ทฤษฎีการตอบสนองต่อรายการ (TRI) ถือกำเนิดขึ้นเป็นส่วนเสริมของทฤษฎีการทดสอบแบบดั้งเดิม. กล่าวอีกนัยหนึ่ง TCT และ TRI สามารถประเมินผลการทดสอบเดียวกันรวมถึงสร้างคะแนนหรือความเกี่ยวข้องสำหรับแต่ละรายการซึ่งจะให้ผลลัพธ์ที่แตกต่างกันสำหรับแต่ละคน ในทางกลับกันเพื่อชี้ให้เห็นว่า TRI จะมอบเครื่องมือสอบเทียบที่ดีกว่าให้กับเราปัญหาคือว่ากระบวนทัศน์นี้มีค่าใช้จ่ายที่สูงขึ้นมากและการมีส่วนร่วมของผู้เชี่ยวชาญเฉพาะทาง.
TRI มีข้อสันนิษฐานหลายประการ แต่บางทีสิ่งที่สำคัญที่สุดบอกเราว่าเครื่องมือวัดใดควรเป็นไปตามแนวคิด: มี ความสัมพันธ์การทำงานระหว่างค่าของตัวแปรที่วัดรายการและความน่าจะเป็นของการกดปุ่มเหล่านี้. ฟังก์ชั่นนี้เรียกว่า ลักษณะโค้งของไอเท็ม (CCI) ถ้าอย่างนั้นเราจะคิดอย่างไร?
สิ่งที่มาจากภายนอกนั้นดูสมเหตุสมผลและ TCT ไม่ได้ประเมิน. ตัวอย่างเช่นรายการที่ยากที่สุดจะเป็นของที่คนฉลาดเท่านั้นที่ตอบ ในทางกลับกันรายการที่ทุกคนตอบได้ดีจะไม่คุ้มค่าเพราะจะไม่มีอำนาจในการแยกแยะ มันจะไม่ให้ข้อมูลใด ๆ นี่เป็นเพียงภาพร่างเล็ก ๆ ของการปฏิวัติที่เสนอโดย TRI.
หากต้องการดูความแตกต่างที่ดีกว่าเล็กน้อยระหว่างแบบจำลองการวัดแบบหนึ่งกับแบบจำลองอีกแบบหนึ่งเราสามารถใช้ตารางอ้างอิงโดยJoséMuñiz (2010):
ตารางที่ 1. ความแตกต่างระหว่าง TCT และ TRI (Muñiz, 2010)
ด้าน | TCT | TRI |
แบบ | เชิงเส้น | ไม่เชิงเส้น |
สมมติฐาน | อ่อนแอ (ง่ายต่อการพบข้อมูล) | แข็งแรง (หายากสำหรับข้อมูล) |
การวัดความแปรปรวน | ไม่ | ใช่ |
ความไม่แน่นอนของคุณสมบัติการทดสอบ | ไม่ | ใช่ |
มาตราส่วนของคะแนน | ระหว่าง 0 และสูงสุดในการทดสอบ | ความไม่มีที่สิ้นสุด |
ความสำคัญ | ทดสอบ | ชิ้น |
รายการทดสอบความสัมพันธ์ | ไม่ได้ระบุ | ลักษณะโค้งของไอเท็ม |
คำอธิบายของรายการ | ดัชนีความยากและการเลือกปฏิบัติ | พารามิเตอร์ a, b, c |
ข้อผิดพลาดการวัด | ข้อผิดพลาดในการวัดทั่วไปทั่วไปสำหรับตัวอย่างทั้งหมด | ฟังก์ชั่นข้อมูล (แตกต่างกันไปตามระดับความถนัด) |
ขนาดตัวอย่าง | มันสามารถทำงานได้ดีกับตัวอย่างระหว่าง 200 ถึง 500 คนโดยประมาณ | แนะนำมากกว่า 500 วิชา |
นี่คือทฤษฎีที่เกี่ยวข้องกับการทดสอบทั้งสอง แม้ว่าจะเกือบจะเป็นยุคกลาง แต่ก็ชัดเจนว่า TRI เกิดขึ้นเพื่อตอบสนองต่อข้อ จำกัด หรือปัญหาที่ TCT สามารถพัฒนาได้. อย่างไรก็ตามดูเหมือนว่าการวิจัยยังคงมีทางยาวไปในด้านของ psychometrics นี้.
การทดสอบทางจิตวิทยา: ลักษณะและการทำงานการทดสอบทางจิตวิทยาเป็นเครื่องมือที่ใช้ในจิตวิทยาเพื่อวัดตัวแปรที่สนใจในการรู้ อ่านเพิ่มเติม "