ĐH Bách khoa Hà Nội: Điểm TSA không phải tổng điểm của từng câu hỏi thi
Với cách chấm điểm theo mô hình lý thuyết IRT 2 tham số, thí sinh càng làm được nhiều câu hỏi khó thì điểm số càng cao và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp.

Các thí sinh dự thi Đánh giá tư duy. (Ảnh: Đại học Bách khoa Hà Nội).
Phó giáo sư, Tiến sỹ Vũ Duy Hải, Trưởng ban Tuyển sinh - Hướng nghiệp, Đại học Bách khoa Hà Nội cho biết trường áp dụng mô hình lý thuyết IRT 2 tham số (độ khó và độ phân biệt) trong chấm điểm bài thi Đánh giá tư duy (TSA).
Trả lời số câu hỏi đúng như nhau nhưng điểm khác nhau
Theo Phó giáo sư, Tiến sỹ Vũ Duy Hải, với cách chấm điểm theo mô hình lý thuyết IRT 2 tham số, thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp. Điều này dẫn đến việc các thí sinh có thể trả lời đúng được số câu hỏi như nhau nhưng sẽ đạt được điểm TSA khác nhau.
Để đảm bảo yếu tố chính xác và công bằng giữa các đợt thi khác nhau, thuật toán chấm điểm theo mô hình lý thuyết IRT 2 tham số được thực hiện theo nhiều công đoạn, xử lý trên dữ liệu thi chung trước đó để ước lượng các tham số, sau đó mới tính toán ra điểm số TSA cho từng thí sinh.
Cụ thể, Đại học Bách khoa Hà Nội áp dụng quy trình 4 bước chấm điểm IRT hai tham số trong TSA:
Bước 1: Căn cứ theo kết quả làm bài của toàn bộ thí sinh trong từng kíp thi, phần mềm chấm thi sẽ thực hiện ước lượng độ khó và độ phân biệt của từng câu hỏi trong đề thi hiện tại.
Bước 2: Phần mềm chấm thi thực hiện ước lượng điểm năng lực tư duy của từng thí sinh dựa theo kết quả làm bài thi và thang đo của đề thi hiện tại.
Bước 3: Phần mềm chấm thi thực hiện quy đổi thang đo của đề thi hiện tại về thang tham chiếu chung với các đợt thi trước để đưa điểm năng lực tư duy của thí sinh về cùng một thang đo.
Bước 4: Phần mềm chấm thi thực hiện quy đổi điểm năng lực tư duy của thí sinh đã tham chiếu sang thang điểm TSA.
Theo Phó giáo sư, Tiến sỹ Vũ Duy Hải, với quy trình chấm điểm IRT hai tham số như trên, điểm TSA không chỉ được xác định từ số câu trả lời đúng của thí sinh mà từ toàn bộ kết quả trả lời của thí sinh đó trên bài thi.
Kết quả này trước hết được tính trên thang đo của cùng kíp thi, sau đó được quy đổi về thang tham chiếu chung với các đợt thi trước để tạo sự công bằng. Trên cơ sở đó, phần mềm chấm thi sẽ ước lượng điểm năng lực tư duy của từng thí sinh, sau đó thực hiện cân bằng điểm năng lực này về thang chung giữa các đợt thi. Cuối cùng là thực hiện quy đổi sang điểm TSA tương ứng cho thí sinh.
Vì vậy, điểm TSA không phải được tính bằng cách cộng điểm của từng câu hỏi thi mà là kết quả của quá trình ước lượng năng lực tư duy từ toàn bộ bài thi của thí sinh. Theo đó, nếu thí sinh làm đúng nhiều câu hỏi ở dải khó và có độ phân biệt cao thì điểm năng lực tư duy của thí sinh được ước lượng sẽ cao và điểm TSA cũng sẽ cao. Ngược lại, nếu thí sinh chủ yếu làm đúng các câu dễ và trung bình thì điểm TSA sẽ thấp.

Phó giáo sư, Tiến sỹ Vũ Duy Hải. (Ảnh: Vietnam+)
Bên cạnh đó, với phương pháp chấm này, điểm TSA không phải là điểm thô bị cộng thêm hoặc trừ bớt đi, và cũng không phụ thuộc vào điểm số của thí sinh đạt mức cao nhất trong đợt thi.
Khắc phục hạn chế điểm thô
Cách tính điểm này hoàn toàn khác với cách tính điểm truyền thống của Việt Nam khi hầu hết các kỳ thi quan trọng đều sử dụng điểm thô để làm kết quả đánh giá cuối cùng. Theo lý thuyết trắc nghiệm cổ điển, điểm thô của một bài thi là tổng điểm của các câu hỏi trong đề thi đó.
Phó giáo sư Vũ Duy Hải cho biết một trong những nhược điểm của việc sử dụng điểm thô là khó phân biệt được khả năng của các thí sinh có cùng điểm thô khi làm cùng một đề thi ở cùng một thời điểm. Ngoài ra, khi tính điểm năng lực bằng điểm thô, năng lực của thí sinh sẽ thay đổi khi làm hai đề thi có độ khó khác nhau ở cùng một thời điểm. Ví dụ, trong một đợt thi, các thí sinh làm đúng 70 câu hỏi bất kỳ sẽ có cùng điểm thô là 70 điểm. Tuy nhiên, trong thực tế, các thí sinh này có thể trả lời đúng tập hợp các câu hỏi khác nhau và độ khó của các câu hỏi này trong đề thi cũng khác nhau. Vì vậy, 70 điểm không phản ánh đúng năng lực của các thí sinh này.
Để giải quyết vấn đề này, các kỳ thi quan trọng ở các nước trên thế giới đã sử dụng các lý thuyết đo lường giáo dục hiện đại hơn để có thể ước lượng được năng lực của thí sinh một cách chính xác và tin cậy, trong đó có mô hình lý thuyết ứng đáp câu hỏi IRT (Item Response Theory).
Mô hình lý thuyết này đưa ra giả thuyết là mỗi thí sinh trả lời một câu hỏi trong đề kiểm tra có một mức năng lực nhất định và thí sinh có năng lực cao sẽ có xác suất trả lời đúng một câu hỏi bất kỳ cao hơn so với thí sinh có năng lực thấp. Dựa vào mô hình lý thuyết này, có thể định lượng được các tham số về độ khó và độ phân biệt của câu hỏi cũng như năng lực của thí sinh. Các yếu tố này độc lập với nhau và điều này có nghĩa là các tham số là đặc trưng của câu hỏi, không phụ thuộc vào mẫu thí sinh trả lời câu hỏi đó và ngược lại, năng lực của thí sinh là bất biến đối với các câu hỏi mà các em trả lời. Do đó, việc ước lượng năng lực của thí sinh sẽ tin cậy hơn so với cách tính bằng điểm thô.
Phó giáo sư, Tiến sỹ Vũ Duy Hải cho hay với mong muốn mang Kỳ thi Đánh giá tư duy của các nước phát triển trên thế giới về với học sinh Việt Nam, từ năm 2020, Đại học Bách khoa Hà Nội đã tiến hành nghiên cứu, thiết kế và triển khai tổ chức Kỳ thi Đánh giá tư duy để mở rộng các phương thức tuyển sinh đại học.
Mục tiêu của bài thi là đánh giá năng lực tư duy tổng quát của thí sinh, được thể hiện qua ba nội dung về tư duy toán học, tư duy đọc hiểu và tư duy khoa học/giải quyết vấn đề để có thể lựa chọn được những sinh viên có thể học tập tốt nhất tại môi trường giáo dục đại học, đặc biệt trong các lĩnh vực khoa học kỹ thuật, công nghệ, kinh tế, tài chính, ngân hàng, thương mại... và tiệm cận với các kỳ thi đánh giá tư duy hiện đại trên thế giới, như SAT hay ACT.
Việc áp dụng mô hình lý thuyết IRT 2 tham số trong chấm điểm bài thi Đánh giá tư duy (TSA) tiệm cận với quốc tế, đánh giá chính xác hơn năng lực của thí sinh và phù hợp với mục tiêu sử dụng kết quả để tuyển sinh đại học của kỳ thi./.













