Thi tốt nghiệp THPT: Cần có ngân hàng câu hỏi chuẩn hóa và ma trận đề thi

Tiến sỹ Đặng Xuân Cương, Giám đốc Khoa học nền tảng Khaothi.Online đã có những chia sẻ, phân tích chuyên sâu từ góc nhìn chuyên gia khảo thí về đề thi Tốt nghiệp trung học phổ thông.

Cần xây dựng ngân hàng câu hỏi chuẩn hóa, bồi dưỡng kiểm tra đánh giá cho giáo viên, cụ thể hóa các năng lực học sinh cần đạt… là những kiến nghị của Tiến sỹ Đặng Xuân Cương, Giám đốc Khoa học nền tảng Khaothi.Online, Công ty Trách nhiệm hữu hạn FPT IS trong cuộc trao đổi với phóng viên Báo Điện tử VietnamPlus.

Để đánh giá chính xác, cần chờ kết quả thi

- Thưa ông, Kỳ thi Tốt nghiệp trung học phổ thông 2025 là kỳ thi đầu tiên được tổ chức theo chương trình giáo dục phổ thông mới theo định hướng đánh giá năng lực học sinh. Kết quả thi nhằm các mục tiêu khác nhau: đánh giá đúng kết quả học tập của người học theo yêu cầu cần đạt, là một trong các cơ sở đánh giá chất lượng giáo dục, cung cấp dữ liệu đủ tin cậy để xét tuyển đại học. Là nhà nghiên cứu về khảo thí, ông đánh giá như thế nào về đề thi năm nay so với mục tiêu đặt ra?

Tiến sỹ Đặng Xuân Cương: Để đánh giá được kỳ thi có đạt được các mục tiêu hay không thì không chỉ dựa vào đề thi mà còn cần phải đánh giá một cách toàn diện tất cả các bước từ khâu xây dựng khung đánh giá, khâu thiết kế câu hỏi, đề thi, tổ chức thi cũng như phân tích dữ liệu sau kỳ thi.

Là một người rất quan tâm đến đo lường và đánh giá, cá nhân tôi cũng hồi hộp chờ đợi các đề thi Tốt nghiệp trung học phổ thông 2025. Qua nội dung các đề thi, có thể thấy ngoài việc có các loại hình câu hỏi khác nhau thì một điểm khác biệt so với đề thi trước đây, đó là các nhóm biên soạn đề thi đã có những cố gắng trong việc kết nối các kiến thức, kỹ năng quy định trong Chương trình giáo dục phổ thông 2018 với các tình huống thực tiễn. Trong các đề thi cũng xuất hiện một số câu hỏi được cho là khó để giúp phân loại được giữa các nhóm học sinh.

Tôi cho rằng các nhóm ra đề đã cố gắng để đề thi đạt được các mục tiêu của kỳ thi.

 Tiến sỹ Đặng Xuân Cương. (Ảnh: NVCC)

Tiến sỹ Đặng Xuân Cương. (Ảnh: NVCC)

Trong một kỳ thi phục vụ đồng thời nhiều mục tiêu, đặc biệt là làm căn cứ để tuyển sinh đại học, việc có một số câu hỏi ở mức độ nhận thức cao nhằm phân hóa khả năng của học sinh là điều cần thiết. Và khi đó, nhóm học sinh có khả năng ở mức trung bình khó kỳ vọng có thể làm được hết các câu hỏi trong đề thi.

Tuy nhiên, để nói các đề thi của kỳ thi Tốt nghiệp trung học phổ thông 2025 khó đến đâu và sự phân hóa được thể hiện như thế nào cần chờ đến khi công bố kết quả và phân tích dữ liệu chuyên sâu mới có thể đưa ra các kết luận hợp lý.

Ở đây, có một điểm rất cần được lưu ý, đó là với các kỳ thi chuẩn hóa như kỳ thi Tốt nghiệp trung học phổ thông thì trước khi đưa vào đề thi chính thức, việc đánh giá một câu hỏi là khó hay dễ, có độ phân biệt giữa các nhóm thí sinh ra sao và có chất lượng thế nào không nên chỉ dựa vào đội ngũ biên soạn và thẩm định câu hỏi mà nó cần được đánh giá một cách khoa học qua quá trình thiết kế thử nghiệm và phân tích dữ liệu ứng dụng các lý thuyết đo lường.

Để giải quyết được việc này, chúng ta sẽ cần triển khai những giải pháp hiệu quả hơn để đồng bộ cả ba yếu tố chương trình, giảng dạy và đánh giá.

Nên xây dựng ma trận đề thi

- Bộ Giáo dục và Đào tạo cho hay đề thi không được xây dựng trên ngân hàng câu hỏi mà xây dựng trên phương pháp chuyên gia là chính, đề thi không theo ma trận có trước mà ma trận sinh ra ngẫu nhiên trong quá trình ra đề, cả về nội dung và cấp độ tư duy.

Tuy nhiên, nhiều ý kiến có rằng điều này là không phù hợp vì đây là kỳ thi đại trà với mục tiêu chính để xét tốt nghiệp. Theo ông, cách ra đề như vậy có phù hợp với kỳ thi không? Vì sao?

 Các thí sinh trao đổi bài buổi thi. (Ảnh: Phạm Mai/Vietnam+)

Các thí sinh trao đổi bài buổi thi. (Ảnh: Phạm Mai/Vietnam+)

Tiến sỹ Đặng Xuân Cương: Do không có cơ hội tham gia buổi họp báo nên tôi không hiểu được hết ý đối với các vấn đề này. Dưới góc độ chuyên môn, việc xây dựng câu hỏi, đề thi cần được thực hiện cẩn thận.

Khi chưa triển khai xây dựng ngân hàng câu hỏi thì việc thiết kế đề thi cũng cần tuân thủ theo một quy trình chuẩn hóa, trong đó tất cả các câu hỏi thi, sau khi được biên soạn, thẩm định một cách kỹ lưỡng, đều cần được thử nghiệm và phân tích chuyên sâu để cung cấp thông tin về chất lượng các câu hỏi đó. Từ kết quả phân tích, chuyên gia sẽ có thêm thông tin để xem xét, chỉnh sửa câu hỏi “có vấn đề” mà họ đã thiết kế.

Trong những năm qua, sau khi phân tích dữ liệu, cá nhân tôi đã chỉ ra cho nhiều cán bộ thiết kế câu hỏi ở một số kỳ thi, đánh giá quan trọng rằng, kết quả của một số câu hỏi cung cấp những thông tin trái ngược với những nhận định của họ về độ khó, độ phân biệt, về chất lượng câu hỏi, chất lượng các phương án nhiễu, về độ tin cậy và độ giá trị của đề thi.

Về vấn đề ma trận được sinh ngẫu nhiên, tôi cho rằng có thể Bộ có các tiêu chí ít nhất là về tỉ lệ cho các mạch nội dung và các cấp độ tư duy để ‘sinh ngẫu nhiên’ ma trận.

 Các đề thi trở thành chủ đề bàn luận sôi nổi của dư luận sau kỳ thi với nhiều ý kiến khác nhau. (Ảnh: Minh Sơn/Vietnam+)

Các đề thi trở thành chủ đề bàn luận sôi nổi của dư luận sau kỳ thi với nhiều ý kiến khác nhau. (Ảnh: Minh Sơn/Vietnam+)

Với các đánh giá quan trọng thì khung đánh giá cần được xây dựng, trong đó có xác định các nội dung đánh giá chi tiết. Thông thường, nội dung đánh giá gồm nhiều mạch nội dung, chủ đề và hệ thống biểu hiện/yêu cầu cần đạt.

Tuy nhiên, mỗi đề thi chỉ có thể có một số lượng câu hỏi nhất định (thể hiện qua ma trận đề thi) và có thể không bao phủ được hết các nội dung đánh giá. Điều này dẫn đến một kỳ thi có thể có nhiều ma trận khác nhau.

Mặc dù như vậy, các ma trận nên được xây dựng và đánh giá cẩn thận dựa trên các nguyên tắc cụ thể để đảm bảo tính cân đối, tính đại diện của cả các mạch nội dung và các mức độ nhận thức. Một yếu tố nữa cũng rất cần được xem xét, đó là tính tương đồng của các mã đề thi trong cùng một năm cũng như giữa các năm để có cơ sở so sánh và tạo ra sự công bằng cho kỳ thi.

Đến thời điểm này, các ma trận, đề thi và dữ liệu thi của học sinh đều đã có. Tôi cho rằng, việc triển khai đánh giá lại toàn bộ các khâu kết hợp với phân tích dữ liệu chuyên sâu là rất cần thiết để giải đáp băn khoăn của xã hội.

Cần xây dựng ngân hàng câu hỏi chuẩn hóa

- Là nhà nghiên cứu về khảo thí, ông có thể cho biết một kỳ thi có tính chất và quy mô như Kỳ thi Tốt nghiệp trung học phổ thông ở Việt Nam thì thường và nên được tổ chức như thế nào trong khâu ra đề thi? Đề thi phải đáp ứng các yêu cầu gì?

Tiến sỹ Đặng Xuân Cương: Với một kỳ thi có ảnh hưởng lớn như kỳ thi này - với hàng triệu thí sinh, khâu thiết kế đề thi đóng vai trò vô cùng quan trọng. Và để làm tốt công việc này, cần xây dựng ngân hàng câu hỏi chuẩn hóa.

"Ngân hàng câu hỏi là một hệ thống câu hỏi được biên soạn và định cỡ một cách cẩn thận. Tuy nhiên, ở Việt Nam, khái niệm này đang được hiểu khá đơn giản, (...) bước định cỡ chưa được chú trọng trong nhiều kỳ thi," Tiến sỹ Đặng Xuân Cương nói.

Ngân hàng câu hỏi là một hệ thống câu hỏi được biên soạn và định cỡ một cách cẩn thận. Tuy nhiên, ở Việt Nam, khái niệm này đang được hiểu khá đơn giản, và thường chỉ chú trọng đến ý “được biên soạn một cách cẩn thận” bởi các chuyên gia mà ít chú trọng đến ý “được định cỡ một cách cẩn thận”. Từ “định cỡ” ở đây được hiểu là quá trình xác định các tham số của câu hỏi dựa trên dữ liệu cũng như đưa các câu hỏi trong ngân hàng về cùng một thang đo chung.

 Tiến sỹ Đặng Xuân Cương cho rằng với tính chất và quy mô của Kỳ thi Tốt nghiệp trung học phổ thông, cần xây dựng ngân hàng câu hỏi chuẩn hóa. (Ảnh: Hoài Nam/Vietnam+)

Tiến sỹ Đặng Xuân Cương cho rằng với tính chất và quy mô của Kỳ thi Tốt nghiệp trung học phổ thông, cần xây dựng ngân hàng câu hỏi chuẩn hóa. (Ảnh: Hoài Nam/Vietnam+)

Để thực hiện việc định cỡ đòi hỏi quá trình thử nghiệm phải được thiết kế khoa học, việc phân tích cần được thực hiện trên dữ liệu thử nghiệm ứng dụng các lý thuyết đo lường. Vì vậy, việc này tốn nhiều thời gian và nguồn lực. Từ quan sát cá nhân, tôi cho rằng bước định cỡ này chưa thật sự được chú trọng trong nhiều kỳ thi ở Việt Nam.

Sau khi đã có ngân hàng câu hỏi, mỗi câu hỏi thi sẽ có nhiều thông số thống kê cổ điển và hiện đại để biết được mức độ khó - dễ, khả năng phân biệt giữa các nhóm thí sinh, khả năng trả lời bằng đoán mò, mức độ phù hợp của câu hỏi với các mô hình phân tích, đường cong thông tin, đường cong đặc trưng cũng như các thông tin khác liên quan của câu hỏi đó. Các thông số này sẽ được sử dụng để thiết kế đề thi cũng như làm cơ sở so sánh các đề thi khác nhau.

Các kỳ thi quan trọng ở các nước trên thế giới hoặc của các tổ chức khảo thí uy tín đều có cách làm như vậy để đảm bảo độ tin cậy, độ giá trị của đề thi cũng như tính công bằng cho người dự thi.

Bộ GD-ĐT cần xây dựng khung năng lực rõ ràng

- Đề thi năm nay nhận được nhiều phản ứng trái chiều, ông có nhận định và đề xuất gì cho việc triển khai Chương trình giáo dục phổ thông 2018 trong thời gian tới?

 Tiến sỹ Đặng Xuân Cương được đào tạo và là nhà nghiên cứu chuyên sâu về khảo thí. (Ảnh: NVCC)

Tiến sỹ Đặng Xuân Cương được đào tạo và là nhà nghiên cứu chuyên sâu về khảo thí. (Ảnh: NVCC)

Tiến sỹ Đặng Xuân Cương: Có thể thấy rằng, dư luận mấy ngày qua vẫn đi theo hai hướng khác nhau, hướng thứ nhất đang ủng hộ cách ra đề thi hiện tại và hướng còn lại có những phê phán khá gay gắt. Tuy nhiên, tôi nghĩ chúng ta cần nhìn nhận vấn đề một cách sâu sắc hơn.

Cá nhân tôi cho rằng, từ cách ra đề thi của Bộ Giáo dục và Đào tạo, có thể thấy kỳ thi này đang đi trước một bước so với những gì thực tiễn dạy học và đánh giá trong nhà trường đang diễn ra.

Trong cấu trúc của một hệ thống đánh giá, chúng ta có đánh giá trong lớp học, đánh giá diện rộng và các kỳ thi. Nếu cách tiếp cận của các kỳ thi khác với các cấu phần còn lại, đặc biệt là đánh giá trong lớp học thì điều này sẽ dẫn tới sự hoang mang, lo lắng cho cả cán bộ quản lý, giáo viên, học sinh và cả xã hội.

Bên cạnh quan niệm ngân hàng câu hỏi thì đánh giá năng lực cũng là vấn đề mà chúng ta cần có cách hiểu đúng.

Đánh giá năng lực là một lĩnh vực khó, không chỉ ở Việt Nam mà còn là thách thức ở nhiều quốc gia và tổ chức khảo thí trên thế giới. Với trải nghiệm của mình, tôi cho rằng đang có các cách hiểu (và làm) khác nhau về đánh giá năng lực khi triển khai thực hiện Chương trình giáo dục phổ thông 2018.

Theo Luật Giáo dục 2019, “chuẩn đầu ra là yêu cầu cần đạt về phẩm chất và năng lực của người học sau khi hoàn thành một chương trình giáo dục”. Trong Quy chế thi Tốt nghiệp trung học phổ thông 2025, Điều 5 Khoản c về đề thi cũng đưa ra quy định “Bám sát yêu cầu cần đạt trong chương trình giáo dục phổ thông”.

Tuy nhiên, chương trình đang đưa ra hai loại yêu cầu cần đạt. Yêu cầu cần đạt về nội dung giáo dục, được quy định chi tiết cho từng khối lớp trong mỗi môn học. Yêu cầu cần đạt về năng lực và phẩm chất (chính là chuẩn đầu ra theo Luật Giáo dục 2019), được quy định cho cuối mỗi cấp học và vẫn mang tính trừu tượng cao.

"Để đánh giá được một năng lực bất kỳ, việc đầu tiên cần làm đó là xây dựng một khung năng lực rõ ràng bao gồm các thành tố và hệ thống biểu hiện cụ thể, có thể “cân, đo, đong, đếm” được. Sau khi có khung năng lực, chúng ta mới thiết kế các câu hỏi thi," Tiến sỹ Đặng Xuân Cương nói.

Chính vì những quy định chưa được cụ thể, rõ ràng như vậy sẽ làm cho cán bộ quản lý, giáo viên và cả các em học sinh gặp nhiều khó khăn trong quá trình thực hiện chương trình.

Quay lại vấn đề đề thi, nếu chỉ dựa vào các câu hỏi mang tính thực tiễn và chúng ta nói rằng đó là đề thi đánh giá năng lực thì theo tôi là chưa được đầy đủ. Để đánh giá được một năng lực bất kỳ, việc đầu tiên cần làm đó là xây dựng một khung năng lực rõ ràng bao gồm các thành tố và hệ thống biểu hiện cụ thể, có thể “cân, đo, đong, đếm” được. Sau khi có khung năng lực, chúng ta mới thiết kế các câu hỏi thi, và mỗi câu hỏi cần đo biểu hiện cụ thể của năng lực đó.

Các khung năng lực này không chỉ là căn cứ để xây dựng ngân hàng câu hỏi, đề thi cho kỳ thi mà cũng là căn cứ cho việc giảng dạy và đánh giá trong các nhà trường nhằm giúp học sinh phát triển năng lực.

Tôi cho rằng việc xây dựng khung năng lực như vậy cho các năng lực quy định trong Chương trình là điều rất quan trọng và cần thiết.

 Thí sinh dự thi Tốt nghiệp trung học phổ thông. (Ảnh: PV/Vietnam+)

Thí sinh dự thi Tốt nghiệp trung học phổ thông. (Ảnh: PV/Vietnam+)

Từ góc nhìn cá nhân, tôi mạnh dạn đề xuất một số nội dung sau đây:

Thứ nhất, Chương trình giáo dục phổ thông 2018 cần tiếp tục được phát triển, trong đó chú trọng đến việc triển khai hoàn thiện các khung năng lực và phẩm chất, đồng thời xây dựng các tài liệu hướng dẫn thực hiện chương trình.

Thứ hai, làm rõ vai trò của chương trình giáo dục trong mối quan hệ với hoạt động giảng dạy và đánh giá. Về mặt bản chất, hoạt động giảng dạy và đánh giá trong nhà trường là để giúp cho học sinh đạt được các yêu cầu (cả về nội dung giáo dục và năng lực, phẩm chất) đã được quy định. Thực tế làm việc với giáo viên trong những năm qua, tôi cho rằng họ vẫn đang quá chú trọng vào bộ sách giáo khoa mà họ chọn thay vì tập trung nghiên cứu và triển khai chương trình.

Thứ ba, triển khai xây dựng các ngân hàng câu hỏi dựa trên các khung đánh giá được xây dựng để phục vụ cho các cấu phần đánh giá khác nhau, trong đó ứng dụng các thành tựu của khoa học đo lường và đánh giá trong quá trình xây dựng.

Thứ tư, nâng cao kỹ năng đánh giá cho giáo viên, trong đó chú trọng đến việc khai thác các dữ liệu đánh giá để phục vụ quá trình dạy học. Công nghệ hiện nay có thể hỗ trợ tốt cho những công việc này.

Tôi tin rằng, khi giáo viên nâng cao được kỹ năng đánh giá lớp học để cân bằng với hoạt động giảng dạy dựa vào Chương trình và khung năng lực chi tiết, điều đó sẽ góp phần to lớn trong việc thực hiện thành công Chương trình giáo dục phổ thông 2018, và có như vậy, chúng ta mới từng bước đồng bộ được các cấu phần của hệ thống đánh giá.

- Xin trân trọng cảm ơn ông!

 Kỳ thi Tốt nghiệp trung học phổ thông 2025 là kỳ thi đầu tiên theo chương trình giáo dục phổ thông mới 2018. (Ảnh: PV/Vietnam+)

Kỳ thi Tốt nghiệp trung học phổ thông 2025 là kỳ thi đầu tiên theo chương trình giáo dục phổ thông mới 2018. (Ảnh: PV/Vietnam+)

(Vietnam+)

Nguồn VietnamPlus: https://www.vietnamplus.vn/thi-tot-nghiep-thpt-can-co-ngan-hang-cau-hoi-chuan-hoa-va-ma-tran-de-thi-post1047726.vnp