การหาคุณภาพแบบทดสอบ

การหาคุณภาพของแบบทดสอบ และแบบสอบถามด้วยโปรแกรมคอมพิวเตอร์
(การวิเคราะห์ข้อสอบ : Item analysis)

 

จุดประสงค์เชิงพฤติกรรม

เมื่อศึกษาบทเรียนนี้แล้ว ผู้เรียนมีความสามารถ ดังนี้
1. สามารถวิเคราะห์ข้อสอบตามแนวคิดอิงกลุ่มได้
2. สามารถวิเคราะห์ข้อสอบตามแนวคิดอิงเกณฑ์ได้
3. สามารถวิเคราะห์ข้อสอบแบบอัตนัยได้
4. สามารถวิเคราะห์แบบสอบถามแบบมาตราส่วนประมาณค่าได้

 

แนวคิดพื้นฐานเกี่ยวกับการหาคุณภาพแบบทดสอบ
                การตรวจสอบคุณภาพของแบบทดสอบ เพื่อหาคุณลักษณะของแบบทดสอบที่ดี  โดยปกติจะตรวจสอบตั้งแต่ก่อนนำแบบทสอบไปใช้ โดยตรวจสอบว่าข้อสอบที่สร้างขึ้นเป็นไปตามหลักการเขียนข้อสอบ  ตรงตามแผนสร้างแบบทดสอบ (Test  blue print) ข้อสอบที่สร้างมีความเป็น
ปรนัย  ตรงตามพฤติกรรมที่ต้องการจะวัดหรือไม่  และตรวจสอบหลังนำไปใช้ โดยการคำนวณค่าสถิติ  ของแบบทดสอบเป็นรายข้อและตรวจสอบคุณภาพแบบทดสอบทั้งฉบับ (ชวาล แพรัตกุล. 2516 : 10-11) โดยการตรวจสอบคุณภาพแบบทดสอบเป็นรายข้อมีจุดมุ่งหมายเพื่อตรวจสอบคุณภาพ 2 ประการ คือ  ความยากของข้อสอบ (difficulty : p) และอำนาจจำแนกของข้อสอบ (discrimination : r, D) ส่วนการตรวจสอบคุณภาพของแบบทดสอบทั้งฉบับ มีจุดมุ่งหมายเพื่อหาคุณภาพ 2 ประการ คือ ความตรง (validity) และความเที่ยงของแบบทดสอบ (reliability)

การตรวจสอบคุณภาพแบบทดสอบ หรือ การวิเคราะห์ข้อสอบ (Item analysis) หมายถึง การตรวจสอบคุณภาพแบบทดสอบว่ามีคุณภาพดีเพียงใด หลังจากที่นำแบบทดสอบไปทดสอบและตรวจให้คะแนนแล้ว การตรวจสอบคุณภาพแบบทดสอบ จะช่วยในการปรับปรุงเทคนิคการสอนของครู ช่วยให้ครูสามารถค้นหาข้อบกพร่องต่าง ๆ ในการเรียนของนักเรียน โดยพิจารณาว่าผู้เรียนยังอ่อนในเนื้อหาส่วนใด และยังมีเนื้อหาในส่วนใดบ้างที่ครูต้องสอนซ่อมเสริม (อนันต์  ศรีโสภา. 2525 : 185) นอกจากนี้ การตรวจสอบคุณภาพแบบทดสอบยังช่วยประหยัดเวลาในการสร้างข้อสอบที่ดีขึ้นใหม่อีกด้วย นอกจากนี้ในการทำวิจัยทางการศึกษาทั่วๆไปต้องมีการใช้แบบทดสอบที่มี
คุณภาพดีตามเกณฑ์ที่เป็นสากล  โดยเฉพาะงานวิจัยที่เป็นวิทยานิพนธ์ (Thesis)

การวิเคราะห์ข้อสอบแบ่งออกเป็น 2  ประเภทคือ
                  1. การวิเคราะห์ข้อสอบตามแนวคิดอิงกลุ่ม (Norm reference : NR)
                  2. การวิเคราะห์ข้อสอบตามแนวคิดอิงเกณฑ์ (Criterion  reference : CR)

การวิเคราะห์ข้อสอบตามแนวคิดอิงกลุ่ม

การประเมินผลตามแนวคิดอิงกลุ่ม เป็นการเปรียบเทียบความสามารถของผู้เรียนในกลุ่ม เพื่อดูว่าใครเก่ง-อ่อนกว่ากัน ดังนั้น ลักษณะที่สำคัญของข้อสอบจะต้องคำนึงถึงความยาก (difficulty) และอำนาจจำแนก (discrimination) โดยพยายามเลือกข้อสอบที่มีค่าความยากพอเหมาะ และสามารถจำแนกผู้สอบได้

1.  ความยากของข้อสอบ (difficulty : p) หมายถึง สัดส่วนของจำนวนผู้ที่ทำข้อสอบข้อนั้นถูกกับจำนวนคนทั้งหมด ซึ่งมีสูตร ดังนี้

สูตร     

กรณีใช้กับตัวถูก ค่า p  คือค่า ความยาก  กรณีใช้กับตัวลวง ค่า  p  หมายถึง  ประสิทธิภาพของตัวลวง

เมื่อ  P  แทน ค่าความยากของข้อสอบรายข้อ เมื่อ P แทน ค่าความยากของตัวลวง
                     R  แทน  จำนวนผู้ที่ทำข้อสอบข้อนั้นถูก R แทน จำนวนผู้ที่ตอบตัวลวงนั้น
                     N  แทน  จำนวนคนทั้งหมด N แทน จำนวนคนทั้งหมด

 

ตัวอย่าง  1 ในการสอบวิชาภาษาไทยจำนวน 20 ข้อ มีผู้เข้าสอบทั้งหมด 30 คน ปรากฏว่าในข้อที่ 1     
                  มีผู้ทำถูก 20 คน จงหาความยากของข้อสอบข้อที่ 1

                   จากสูตร          =  20/30 = 0.67                  

                   ข้อสอบข้อที่ 1 มีความยากเท่ากับ  0.67

 

คุณสมบัติของความยาก (P) มีดังนี้

1. ค่าความยากมีค่าตั้งแต่ .00  ถึง 1.00

2. ถ้าค่าความยากของตัวถูกมีค่าสูง แสดงว่าข้อสอบง่าย หรือมีคนทำถูกมาก
3. ถ้าค่าความยากของตัวถูกมีค่าต่ำ แสดงว่าข้อสอบยาก หรือมีคนทำถูกน้อย
4. ค่าความยากที่ดีสำหรับตัวถูกมีค่าอยู่ระหว่าง .20 ถึง .80
     ส่วนตัวลวงมีค่าอยู่ระหว่าง .05 ถึง .30
5. เกณฑ์ในการพิจารณาความยากแบบทุกตัวเลือกมี ดังนี้ 

 ตาราง 1   เกณฑ์การพิจารณาค่าความยากของตัวถูก และตัวลวง

ค่า P ตัวถูก

ค่า P ตัวลวง

.00 ถึง .09 ยากมาก

.10 ถึง .19 ยาก

.00 ถึง .04 ใช้ไม่ได้

.20 ถึง .39 ค่อนข้างยาก

.40 ถึง .60 ปานกลาง

.61 ถึง .80 ค่อนข้างง่าย

.05 ถึง .09 พอใช้

.10 ถึง .20 ใช้ได้

.21 ถึง .30 พอใช้

.81 ถึง .90 ง่าย

.91 ถึง 1.00 ง่ายมาก

.31 ถึง 1.00 ใช้ไม่ได้

ตัวอย่าง  2 ในการสอบวิชาคณิตศาสตร์แบบเลือกตอบ จำนวน 30 ข้อ มีผู้เข้าสอบ จำนวน 20 คน จงหาค่าความยาก (P) พร้อมทั้งบอกผลการพิจารณา

 

ข้อที่

ตัวเลือก

จำนวนคนที่เลือก

P

ผลการพิจารณา

สรุป

1

ก.

(ข.)

ค.

4

12

4

.20

.60

.20

ใช้ได้

ปานกลาง

ใช้ได้

ใช้ได้

2

ก.

(ข.)

ค.

0

19

1

.00

.95

.05

ใช้ไม่ได้

ง่ายมากใช้ไม่ได้

พอใช้

ใช้ไม่ได้

ตัดทิ้ง

 

 

 

 

 

 

30

(ก.)

ข.

ค.

2

13

5

.10

.65

.25

ยากมากใช้ไม่ได้

ใช้ไม่ได้

ใช้ได้

ใช้ไม่ได้

ตัดทิ้ง

               จากการพิจารณาค่า P ในข้อ 1 เป็นข้อสอบที่ดี เพราะว่าทั้งตัวถูกและตัวลวงอยู่ในเกณฑ์ดี
ในข้อ 2 พบว่าเป็นข้อสอบที่ใช้ไม่ได้ เพราะว่าค่า P ตัวถูกง่ายมาก ส่วนค่า P ตัวลวง (ก)
ใช้ไม่ได้ สมควรตัดทิ้ง ในข้อ 30 พบว่าเป็นข้อสอบที่ใช้ไม่ได้ เพราะว่าค่า P ตัวถูกยาก และค่า P
ตัวลวง (ข) ใช้ไม่ได้ สมควรตัดทิ้ง

                2. อำนาจจำแนกของข้อสอบ (discrimination = r) หมายถึง ประสิทธิภาพของข้อสอบในการจำแนกเด็กออกเป็นกลุ่มเก่งและกลุ่มอ่อน หรือกลุ่มสูงและกลุ่มต่ำ เขียนเป็นสูตรได้ ดังนี้

สูตร หรือ

เมื่อ  Rh, Rl แทน  จำนวนคนที่ตอบถูกในกลุ่มสูงและกลุ่มต่ำตามลำดับ
      Nh, Nl  แทน  จำนวนคนในกลุ่มสูงและกลุ่มต่ำตามลำดับ
               N แทน  จำนวนคนทั้งหมด

คุณสมบัติของค่าอำนาจจำแนก (r) มีดังนี้
1. ค่าอำนาจจำแนกมีค่าตั้งแต่ -1.00 ถึง 1.00
2. ถ้าค่าอำนาจจำแนกสูง แสดงว่าข้อสอบมีอำนาจจำแนกสูง
3. ถ้าค่าอำนาจจำแนกต่ำ หรือเป็นศูนย์ แสดงว่าข้อสอบไม่มีอำนาจจำแนก
4. ค่าอำนาจจำแนกที่ดีของตัวถูกมีค่าอยู่ระหว่าง .20 ถึง 1.00 ส่วนตัวลวงมีค่าอยู่ระหว่าง .05 ถึง .30
5. ในกรณีที่พิจารณาค่าอำนาจจำแนกทั้งตัวถูกและตัวลวงมีเกณฑ์ ดังนี้ (สมนึก ภัททิยธนี. 2537 : 151-152)

 

 

 

 ตาราง 2  เกณฑ์การพิจารณาค่าอำนาจจำแนกตัวถูก และตัวลวง

ค่า r ตัวถูก

ค่า r ตัวลวง

ค่าลบ ใช้ไม่ได้

.00 ไม่มีอำนาจจำแนก
.01 ถึง .09 ต่ำ
.10 ถึง .19 ค่อนข้างต่ำ

 

ค่าลบ ใช้ไม่ได้
.00 ถึง .04 ใช้ไม่ได้

.20 ถึง .29 ค่อนข้างสูง
.30 ถึง .50 สูง
.51 ถึง 1.00 สูงมาก

.05 ถึง .09 พอใช้

.10 ถึง .30 ใช้ได้

.31 ถึง .50 พอใช้

 

.51 ถึง 1.00 ใช้ไม่ได้

  

ขั้นตอนการวิเคราะห์ข้อสอบรายข้อ มีดังนี้

1. นำข้อสอบที่สร้างขึ้นตามตารางวิเคราะห์หลักสูตรไปสอบกับนักเรียน สมมติว่าไปทดสอบกับ
   นักเรียน 30 คน แล้วนำมาตรวจให้คะแนน
2. เรียงกระดาษคำตอบจากคะแนนสูงไปหาคะแนนต่ำ
3. ใช้เทคนิค 27 % (อาจใช้เทคนิค 25% ถึง 50 %ก็ได้ โดยยึดหลักว่า ถ้าจำนวนคนที่สอบมีน้อยให้ใช้เปอร์เซ็นต์สูง แต่ถ้ามีคนเข้าสอบมาก ๆ ให้ใช้เปอร์เซ็นต์ต่ำ โดยไม่ต่ำกว่า 25%) วิธีการหากลุ่มสูง ให้เอา คูณจำนวนคนทั้งหมดที่เข้าสอบ เช่น คนสอบ 30 คนจะได้กลุ่มสูงเท่ากับ ประมาณ 8 คน ส่วนการหากลุ่มต่ำก็ใช้วิธีการเช่นเดียวกัน คือได้จำนวน 8 คน

4. นับจำนวนกระดาษเรียงคะแนนสูงสุดลงมา 27% ของผู้เข้าสอบคือประมาณ 8 คน เรียกว่ากลุ่มสูง (high group) ใช้สัญลักษณ์ ส หรือ H และเรียงกระดาษคำตอบจากคะแนนต่ำสุด 27% คือประมาณ 8 คน เรียกว่ากลุ่มต่ำ (low group) ใช้สัญลักษณ์ ต  หรือ  L
5. นำกระดาษในกลุ่มสูง (H1-H8) ไปลงรอยขีด (tally) ในแบบฟอร์ม
6. ส่วนกลุ่มต่ำให้ทำในทำนองเดียวกันกับกลุ่มสูง

 

 

ตารางวิเคราะห์ข้อสอบเป็นรายข้อทุกตัวเลือก โดยใช้เทคนิค 27%
วิชา………………........ชั้น……………......กลุ่มสูง (H1-H8 : คนที่ได้คะแนนสูง)
(กรณีทำด้วยมือ นับความถี่ผู้ตอบถูกลงในตาราง ของทุกข้อ โดยแบ่งกลุ่มสูง 27% บน  และกลุ่มต่ำ  27% กล่มล่าง)
 

 

ข้อที่

 

1

 

 

2

 

 

 

60

 

คนที่

(ก)

(ค)

 

(ข)

H1

H2

H3

H4

H5

H6

H7

H8

/

/

/

/

/

/

 

 

 

 

 

 

/

 

 

 

 

 

 

/

 

 

/

/

/

/

/

/

/

/

 

/

/

/

/

/

 

 

 

 

 

 

 

/

 

 

 

 

 

 

 

/

รวม(RH)

6

1

1

0

0

8

 

5

2

1

 

 

 

 

 

 

ตารางวิเคราะห์ข้อสอบเป็นรายข้อทุกตัวเลือก โดยใช้เทคนิค 27%

วิชา..…………….......ชั้น……………….......กลุ่มต่ำ (L1 - L8 : คนได้คะแนนน้อย)

 

 

ข้อที่

 

1

 

 

2

 

 

 

60

 

คนที่

(ก)

(ค)

 

(ข)

L1

L2

L3

L4

L5

L6

L7

L8

/

/

 

 

/

/

/

 

/

 

 

 

 

/

/

 

/

/

/

/

/

/

/

/

 

/

/

 

/

/

/

/

/

/

 

รวม(RL)

2

3

3

0

1

7

 

2

6

0

 

7. นำค่ารวม (RH) และค่ารวม (RL) ของแต่ละตัวไปหาค่าความยาก (P) และค่าอำนาจจำแนก (r) โดยใช้สูตรดังนี้

ตัวถูก    

ตัวลวง

 

 เมื่อ

P  แทน  ค่าความยากของข้อสอบ P แทน ค่าความยากของข้อสอบ

R  แทน  ค่าอำนาจจำแนกของข้อสอบ r แทน ค่าอำนาจจำแนกของข้อสอบ

RH แทน จำนวนคนในกลุ่มสูงที่ตอบถูก RH แทนจำนวนคนในกลุ่มสูงที่ตอบตัวเลือกนั้น

RL แทน จำนวนคนในกลุ่มต่ำที่ตอบถูก RL แทน จำนวนคนในกลุ่มต่ำที่ตอบตัวเลือกนั้น

NH แทน จำนวนคนทั้งหมดในกลุ่มสูง NH แทน จำนวนคนทั้งหมดในกลุ่มสูง

NL แทน จำนวนคนทั้งหมดในกลุ่มต่ำ NL แทน จำนวนคนทั้งหมดในกลุ่มต่ำ

 

ตัวอย่าง  3 ในข้อ 1 มีวิธีการหาค่า P และ r ดังนี้

ตัวถูก (ก) ;

ตัวลวง (ข) ; ตัวลวง (ค) ;

 

ส่วนข้ออื่น ๆ มีวิธีการคำนวณเช่นเดียวกัน

8. นำค่า P, r ที่คำนวณได้บรรจุลงในตารางวิเคราะห์ข้อสอบ พร้อมทั้งบอกผลการพิจารณา

 

 

 

 

ตาราง  3 ตารางวิเคราะห์ข้อสอบเป็นรายข้อแบบทุกตัวเลือก แสดงค่า p, r และผลการพิจารณา

 

ข้อ

ตัว

L

H

P

r

ผลการพิจารณา

สรุป

ที่

เลือก

 

 

 

 

ค่า P

ค่า r

 

1

(ก)

2

3

3

6

1

1

.50

.25

.25

.50

.25

.25

ปานกลาง

ใช้ได้

ใช้ได้

สูง

ใช้ได้

ใช้ได้

ดี เพราะค่า P,r เข้าเกณฑ์

2

(ค)

0

1

7

0

0

8

.00

.06

.94

.00

.13

.13

ใช้ไม่ได้

พอใช้

ง่ายมาก

ใช้ไม่ได้

ใช้ได้

ค่อนข้างต่ำ

ตัดทิ้ง เพราะว่าเป็นข้อสอบที่ง่ายมากและมีอำนาจจำแนกต่ำ

 …..

 

 

 

 

 

 

 

 

60

(ข)

2

6

0

5

2

1

.44

.50

.06

-.38

-.50

-.12

พอใช้

ปานกลาง

พอใช้

ใช้ไม่ได้

ใช้ไม่ได้

ใช้ไม่ได้

ตัดทิ้ง เพราะว่าข้อสอบไม่มีอำนาจจำแนก

  จากตาราง ข้อ 1 ตัวถูก (ก) และตัวลวง (ข,ค)  ค่า P และ r  เข้าเกณฑ์ซึ่งเป็นข้อสอบที่ดี
ข้อ 2 ตัวถูก (ค) ค่า P และ r ไม่เข้าเกณฑ์ ส่วนตัวลวง(ก) ค่า P , r ก็ไม่เข้าเกณฑ์ สมควรตัดทิ้ง
ข้อ 60 ตัวถูก (ข) ค่า P เข้าเกณฑ์ แต่ค่า r ใช้ไม่ได้ ส่วนตัวลวง (ก,ค) มีค่า r ใช้ไม่ได้ ดังนั้นสมควรตัดทิ้ง

สรุป
            1.  ข้อสอบที่ใช้ได้ ต้องใช้ได้ทั้งค่า p ค่า r  (ใช้ได้ทั้งคู่ของข้อสอบแต่ละข้อ)
           2.  วิธีการคำนวณค่า p และ r ที่กล่าวมาทั้งหมดใช้โปรแกรม Evana
คำนวณได้โดยง่าย และยังคำนวณคุณภาพแบบทดสอบทั้งฉบับ (ความเที่ยง โดยวิธี
KR-20 ให้ด้วย)

วิธีการหาค่าคุณภาพแบบทดสอบด้วยโปรแกรม EVANA   (กลับไปที่หน้าแรก (เมนู) ศึกษาวิธีวิเคราะห์แบบทดสอบด้วยโปรแกรมคอมพิวเตอร์)                                                                                       

2.jpg (26205 bytes)