Cách chấm điểm bài thi Đánh giá tư duy của Đại học Bách khoa Hà Nội

Đại học Bách khoa Hà Nội đang triển khai áp dụng mô hình lý thuyết IRT 2 tham số (độ khó và độ phân biệt) trong chấm điểm bài thi Đánh giá tư duy TSA. Có thể hiểu là khi thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp.

Thí sinh tham dự Đánh giá tư duy năm 2026 thực hiện thủ tục kiểm tra thông tin cá nhân tự động trước khi vào phòng thi.

Thí sinh tham dự Đánh giá tư duy năm 2026 thực hiện thủ tục kiểm tra thông tin cá nhân tự động trước khi vào phòng thi.

Phương pháp chấm điểm Đánh giá tư duy TSA

Ngày 25/3, Đại học Bách khoa Hà Nội thông tin về phương pháp chấm điểm bài thi Đánh giá tư duy TSA cho thí sinh.

Từ năm 2020, Đại học Bách khoa Hà Nội đã tiến hành nghiên cứu, thiết kế và triển khai tổ chức Kỳ thi Đánh giá tư duy (TSA - Thinking Skills Assessment) để mở rộng các phương thức tuyển sinh đại học. Mục tiêu của bài thi là đánh giá năng lực tư duy tổng quát của thí sinh, được thể hiện qua ba nội dung về tư duy toán học, tư duy đọc hiểu và tư duy khoa học/giải quyết vấn đề để có thể lựa chọn được những sinh viên có thể học tập tốt nhất tại môi trường giáo dục đại học, đặc biệt trong các lĩnh vực khoa học kỹ thuật, công nghệ, kinh tế, tài chính, ngân hàng, thương mại... và tiệm cận với các kỳ thi đánh giá tư duy hiện đại trên thế giới, như SAT hay ACT.

Theo Đại học Bách khoa Hà Nội, hầu hết các kỳ thi quan trọng hiện nay đang sử dụng điểm thô để làm kết quả đánh giá cuối cùng.

Theo lý thuyết trắc nghiệm cổ điển, điểm thô của một bài thi là tổng điểm của các câu hỏi trong đề thi đó.

Đại học Bách khoa Hà Nội đang triển khai áp dụng mô hình lý thuyết ứng đáp câu hỏi IRT (Item Response Theory) - một trong những lý thuyết đo lường hiện đại để có thể ước lượng được năng lực của thí sinh một cách chính xác và tin cậy.

Thí dụ, đề kiểm tra có 100 câu hỏi, và mỗi câu hỏi trả lời đúng đạt được 1 điểm thì nếu thí sinh làm đúng được 70 câu, thí sinh đó sẽ được 70 điểm.

"Một trong những nhược điểm của việc sử dụng điểm thô là khó phân biệt được khả năng của các thí sinh có cùng điểm thô khi làm cùng một đề thi ở cùng một thời điểm. Ngoài ra, khi tính điểm năng lực bằng điểm thô, năng lực của thí sinh sẽ thay đổi khi làm hai đề thi có độ khó khác nhau ở cùng một thời điểm", Phó Giáo sư, Tiến sĩ Vũ Duy Hải, Trưởng ban Tuyển sinh-Hướng nghiệp Đại học Bách khoa Hà Nội cho biết.

Thí dụ, trong một đợt thi, các thí sinh làm đúng 70 câu hỏi bất kỳ sẽ có cùng điểm thô là 70 điểm. Trong thực tế, các thí sinh này có thể trả lời đúng tập hợp các câu hỏi khác nhau và độ khó của các câu hỏi này trong đề thi cũng khác nhau. Vì vậy, 70 điểm không phản ánh đúng năng lực của các thí sinh này.

Để giải quyết vấn đề này, các kỳ thi quan trọng ở các nước trên thế giới, đặc biệt là sử dụng trong công tác tuyển sinh đã sử dụng các lý thuyết đo lường giáo dục hiện đại hơn để có thể ước lượng được năng lực của thí sinh một cách chính xác và tin cậy.

Một trong số chúng là mô hình lý thuyết ứng đáp câu hỏi IRT (Item Response Theory). Mô hình lý thuyết này đưa ra giả thuyết là mỗi thí sinh trả lời một câu hỏi trong đề kiểm tra có một mức năng lực nhất định và thí sinh có năng lực cao sẽ có xác suất trả lời đúng một câu hỏi bất kỳ cao hơn so với thí sinh có năng lực thấp.

Dựa vào mô hình lý thuyết này, có thể định lượng được các tham số về độ khó và độ phân biệt của câu hỏi cũng như năng lực của thí sinh. Các yếu tố này độc lập với nhau và điều này có nghĩa là các tham số là đặc trưng của câu hỏi, không phụ thuộc vào mẫu thí sinh trả lời câu hỏi đó và ngược lại, năng lực của thí sinh là bất biến đối với các câu hỏi mà các em trả lời. Do đó, việc ước lượng năng lực của thí sinh sẽ tin cậy hơn so với cách tính bằng điểm thô.

Thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp.

Đại học Bách khoa Hà Nội đang triển khai áp dụng mô hình lý thuyết IRT 2 tham số (độ khó và độ phân biệt) này trong việc chấm điểm bài thi TSA cho thí sinh.

Hiểu một cách đơn giản, với việc chấm thi theo mô hình lý thuyết IRT 2 tham số, thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao và ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ thì điểm số TSA sẽ thấp. Điều này dẫn đến việc các thí sinh có thể có điểm thô giống nhau hay nói cách khác là trả lời đúng được số câu hỏi như nhau nhưng sẽ đạt được điểm TSA khác nhau.

Tuy nhiên để đảm bảo yếu tố chính xác và công bằng giữa các đợt thi khác nhau, thuật toán chấm điểm theo mô hình lý thuyết IRT 2 tham số được thực hiện theo nhiều công đoạn, xử lý trên dữ liệu thi chung trước đó để ước lượng các tham số, sau đó mới tính toán ra điểm số TSA cho từng thí sinh.

Quy trình 4 bước chấm điểm IRT hai tham số trong TSA

Bước 1: Căn cứ theo kết quả làm bài của toàn bộ thí sinh trong từng kíp thi, phần mềm chấm thi sẽ thực hiện ước lượng độ khó và độ phân biệt của từng câu hỏi trong đề thi hiện tại.

Bước 2: Phần mềm chấm thi thực hiện ước lượng điểm năng lực tư duy của từng thí sinh dựa theo kết quả làm bài thi và thang đo của đề thi hiện tại.

Bước 3: Phần mềm chấm thi thực hiện quy đổi thang đo của đề thi hiện tại về thang tham chiếu chung với các đợt thi trước để đưa điểm năng lực tư duy của thí sinh về cùng một thang đo.

Bước 4: Phần mềm chấm thi thực hiện quy đổi điểm năng lực tư duy của thí sinh đã tham chiếu sang thang điểm TSA.

Điểm TSA không phải được tính bằng cách cộng điểm của từng câu hỏi thi, mà là kết quả của quá trình ước lượng năng lực tư duy từ toàn bộ bài thi của thí sinh.

Vớiquy trình chấm điểm IRT hai tham số như trên, điểm TSA không chỉ được xác định từ số câu trả lời đúng của thí sinh, mà là từ toàn bộ kết quả trả lời của thí sinh đó trên bài thi.

Kết quả này trước hết được tính trên thang đo của cùng kíp thi, sau đó được quy đổi về thang tham chiếu chung với các đợt thi trước để tạo sự công bằng. Trên cơ sở đó, phần mềm chấm thi sẽ ước lượng điểm năng lực tư duy của từng thí sinh, sau đó thực hiện cân bằng điểm năng lực này về thang chung giữa các đợt thi.

Cuối cùng là thực hiện quy đổi sang điểm TSA tương ứng cho thí sinh. Chính vì vậy, điểm TSA không phải được tính bằng cách cộng điểm của từng câu hỏi thi, mà là kết quả của quá trình ước lượng năng lực tư duy từ toàn bộ bài thi của thí sinh.

Theo đó, nếu thí sinh làm đúng nhiều câu hỏi ở dải khó và có độ phân biệt cao thì điểm năng lực tư duy của thí sinh được ước lượng sẽ cao và điểm TSA cũng sẽ cao. Ngược lại, nếu thí sinh chủ yếu làm đúng các câu dễ và trung bình thì điểm TSA sẽ thấp.

Bên cạnh đó, với phương pháp chấm này, điểm TSA không phải là điểm thô bị cộng thêm hoặc trừ bớt đi, và cũng không phụ thuộc vào điểm số của thí sinh đạt mức cao nhất trong đợt thi.

THANH XUÂN

Nguồn Nhân Dân: https://nhandan.vn/cach-cham-diem-bai-thi-danh-gia-tu-duy-cua-dai-hoc-bach-khoa-ha-noi-post950707.html