Phương pháp chấm điểm của bài thi Đánh giá tư duy TSA

Nguyễn Ánh Hiền
Điểm đáng chú ý trong phương pháp chấm điểm của bài Đánh giá tư duy TSA của Đại học Bách khoa Hà Nội là không sử dụng phương pháp chấm điểm truyền thống mà áp dụng lý thuyết đáp ứng câu hỏi trong việc tính toán điểm số của thí sinh để có thể ước lượng năng lực thí sinh một cách chính xác và tin cậy.
Đại học Bách khoa Hà Nội (Ảnh: HUST)
Đại học Bách khoa Hà Nội (Ảnh: HUST)

Bài thi Đánh giá tư duy (Thinking Skills Assessment - TSA) của Đại học Bách khoa Hà Nội nhằm đánh giá ba năng lực tư duy nền tảng của học sinh, bao gồm: Tư duy Toán học, Tư duy Đọc hiểu và Tư duy Khoa học/Giải quyết vấn đề - những yếu tố quan trọng giúp học sinh có thể học tập tốt nhất tại môi trường giáo dục đại học.

Theo đó, bài thi gồm 3 phần thi: Tư duy Toán học (60 phút), Tư duy Đọc hiểu (30 phút) và Tư duy Khoa học/Giải quyết vấn đề (60 phút). Đây là 3 phần thi độc lập, câu hỏi thi sẽ tập trung vào đánh giá năng lực tư duy của thí sinh trong mỗi phần thi, không đi vào kiểm tra trực diện kiến thức của môn học nào.

Bài thi TSA gồm ba phần thi độc lập (Tư duy Toán học, Tư duy Đọc hiểu, Tư duy Khoa học/Giải quyết vấn đề) tập trung đánh giá năng lực thí sinh, không đi vào kiểm tra trực diện kiến thức của môn học nào.

Về phương pháp chấm điểm của bài thi Đánh giá năng lực TSA có một số điểm đáng chú ý.

Ban Tuyển sinh- Hướng nghiệp, Đại học Bách khoa Hà Nội cho biết, phương pháp chấm điểm truyền thống là sử dụng điểm thô để làm kết quả đánh giá bài thi cuối cùng. Theo lý thuyết trắc nghiệm cổ điển, điểm thô của bài thi là tổng điểm của các câu hỏi trong đề thi đó.

Thí dụ như, với đề kiểm tra có 100 câu hỏi, mỗi câu hỏi trả lời đúng thí sinh đạt được 1 điểm. Nếu làm đúng được 70 câu thí sinh sẽ được 70 điểm. Điểm số này gọi là điểm thô và được sử dụng trong việc xét kết quả cũng như so sánh với điểm của các thí sinh khác.

Một trong những nhược điểm của việc sử dụng điểm thô là khó phân biệt được khả năng của thí sinh có cùng mức điểm thô khi làm cùng một đề thi ở cùng một thời điểm. Ngoài ra, khi tính điểm năng lực bằng điểm thô, năng lực của thí sinh sẽ thay đổi khi làm hai đề thi có độ khó khác nhau ở cùng một thời điểm. Thí dụ trong một đợt thi, thì các thí sinh làm đúng 70 câu hỏi bất kỳ sẽ có cùng điểm thô là 70 điểm.

Trong thực tế, các thí sinh này có thể trả lời đúng tập hợp các câu hỏi khác nhau và độ khó của các câu hỏi này trong đề thi cũng khác nhau vì vậy điểm 70 không phản ánh đúng năng lực của các thí sinh này.

Để giải quyết vấn đề này, các kỳ thi quan trọng ở các nước trên thế giới đã sử dụng các lý thuyết đo lường giáo dục hiện đại để có thể ước lượng năng lực của thí sinh một cách chính xác và tin cậy hơn. Một trong số đó là áp dụng lý thuyết đáp ứng câu hỏi. Lý thuyết này đưa ra giả thuyết là mỗi thí sinh trả lời một câu hỏi trong đề kiểm tra có mức năng lực nhất định và thí sinh có năng lực cao sẽ có xác suất trả lời đúng câu hỏi bất kỳ cao hơn so với thí sinh có năng lực thấp. Dựa vào lý thuyết này có thể định lượng được các tham số như độ khó và độ phân biệt của các câu hỏi cũng như năng lực của thí sinh và các yếu tố này độc lập với nhau.

Điều này có nghĩa các tham số là đặc trưng của câu hỏi, không phụ thuộc vào mẫu thí sinh trả lời câu hỏi đó và ngược lại, năng lực của thí sinh là bất biến đối với các câu hỏi mà các em trả lời. Do đó, việc ước lượng năng lực của thí sinh sẽ đáng tin cậy hơn so với cách tính bằng điểm thô.

Căn cứ kết quả thi của thí sinh, thuật toán chấm thi sẽ xác định mức độ tư duy của mỗi câu hỏi theo tỷ lệ thí sinh trả lời đúng câu hỏi, theo nguyên tắc câu có ít thí sinh trả lời đúng sẽ là câu có mức độ tư duy cao, câu có nhiều thí sinh trả lời đúng sẽ là câu có mức độ tư duy thấp.

Bài thi đánh giá tư duy TSA của đại học Bách Khoa Hà Nội sử dụng lý thuyết đáp ứng câu hỏi trong việc tính toán điểm số TSA của học sinh. Với cách tính như vậy, các thí sinh mặc dù có cùng số điểm thô nhưng căn cứ vào mức độ khó của các câu hỏi mà từng thí sinh trả lời được thì mức năng lực tương ứng sẽ được ước lượng, sau đó, điểm số này sẽ được quy đổi về thang điểm 100.

Barem chấm điểm sẽ được hình thành sau khi có kết quả làm bài thi của thí sinh sau mỗi đợt thi. Căn cứ kết quả thi của thí sinh, thuật toán chấm thi sẽ xác định mức độ tư duy của mỗi câu hỏi theo tỷ lệ thí sinh trả lời đúng câu hỏi đó, theo nguyên tắc câu có ít thí sinh trả lời đúng sẽ là câu có mức độ tư duy cao, câu có nhiều thí sinh trả lời đúng sẽ là câu có mức độ tư duy thấp. Barem chấm điểm hình thành theo nguyên tắc câu hỏi có mức độ tư duy cao sẽ được điểm cao tương ứng với tỷ lệ thí sinh trả lời đúng, câu có mức độ tư duy thấp sẽ được điểm thấp trong tương ứng với tỷ lệ thí sinh trả lời đúng.

Bên cạnh đó, để bảo đảm tính công bằng giữa các đợt thi với nhau, kỳ thi TSA của Đại học Bách khoa Hà Nội cũng áp dụng bộ câu hỏi "cầu" chuẩn - hay còn gọi là câu hỏi cầu nối, câu hỏi chung - giữa các đề thi để đưa các chỉ số đánh giá kỳ thi về cùng một thang đo. Công nghệ này sẽ bảo đảm các thí sinh trong đợt thi khác nhau đều được đánh giá trên cùng một thang đo chung, từ đó bảo đảm tính công bằng về kết quả giữa các đợt thi.

Trong mùa tuyển sinh đại học năm 2024, đã có gần 50.000 lượt với tổng số khoảng 21.000 thí sinh tham dự thi Đánh giá tư duy TSA của Đại học Bách khoa Hà Nội. Kết quả của kỳ thi đã được hơn 50 trường đại học sử dụng để phục vụ cho công tác tuyển sinh đại học hệ chính quy. Năm 2025, dự kiến các đợt thi Đánh giá tư duy sẽ được tổ chức trong thời gian từ tháng 1 đến tháng 4.