Phải chăng “Thi trắc nghiệm môn Toán là sai lầm 100%”?

Lượt xem:

Đọc bài viết

Câu chuyện thi trắc nghiệm môn Toán đã nóng trước đây khoảng 3 năm, nay tự dưng bùng lại từ sau ý kiến của một đại biểu trong kỳ họp của Quốc hội. Một số Giáo sư Toán học đã phát biểu, một số giáo viên cũng đã phát biểu. Hiểu câu chuyện này thế nào?

Trước hết cũng phải khẳng định rằng: Với mỗi một vấn đề sẽ thuộc một lĩnh vực khoa học nào đó mà những ai không nghiên cứu chuyên sâu trong lĩnh vực sẽ có thể mắc sai lầm khi không đọc những kết quả nghiên cứu. Nhà nghiên cứu Toán học chưa hẳn đã là chuyên gia trong lĩnh vực liên quan tới đo lường trong giáo dục. 
TS. Phạm Xuân Thanh TS. Phạm Xuân Thanh
Bài viết dưới đây của TS. Phạm Xuân Thanh, trước đây công tác ở Vụ Sau đại học, Bộ GD&ĐT (1989-2002); nguyên Trưởng phòng kiểm định Vụ Đại học (2002-2003); Trưởng phòng kiểm định chất lượng giáo dục, Cục Khảo thí và Kiểm định chất lượng giáo dục (2003-2007); Phó Cục trưởng Cục Khảo thí Kiểm định chất lượng giáo dục, Bộ GD ĐT (2007-2015); từ năm 2015 đến 2018 là Tham tán Giáo dục Đại sứ quán Việt Nam tại Australia. TS. Phạm Xuân Thành là một chuyên gia về đánh giá từng 2 năm tu nghiệp tại Đại học Melboune; đã từng Phụ trách chương trình PISA Việt Nam, chương trình READ về đánh giá; gần 10 năm làm giảng viên đào tạo các khóa thạc sĩ đo lường và đánh giá của Đại học Quốc gia Hà Nội.
Cảm ơn TS. Phạm Xuân Thanh đã cho phép Diễn đàn BigSchool đăng ý kiến và mong các nhà khoa học cùng trao đổi.

Cuộc “chiến tranh luận” thi trắc nghiệm hay thi tự luận trong các kỳ thi có quy mô lớn như thi tốt nghiệp ở Việt Nam và ở nhiều nước khác tưởng chừng chỉ là những tranh cãi của mấy chục năm về trước, nào ngờ một giáo sư đã học nước ngoài, đứng đầu một viện nghiên cứu khoa học cơ bản của Việt Nam đã xới lại vấn đề này. Phải chăng Giáo sư thiển cận hay cả thế giới đang sai lầm?

Hãy tự nghĩ xem, môn Toán hay các môn học khác, nếu tổ chức thi tự luận, học sinh sẽ trình bày bài làm với những diễn giải, lập luận của mình trên nhiều trang giấy. Mỗi bài tự luận phải có 2 giáo viên cùng chấm. Vậy trên dưới một triệu thí sinh thì cần bao nhiêu giáo viên chấm bài cho mỗi môn học? 3 môn thi cần bảo nhiêu giáo viên chấm? 6 môn thi cần bao nhiêu người chấm thi trong cả nước. Có lẽ GS không đến nỗi không hiểu về vấn đề này.

Nhưng vấn đề không phải là số lượng giáo viên chấm mà sự thiếu đồng nhất khi có nhiều người tham gia chấm bài. Chúng tôi gọi là Subjective (tính chủ quan) trong chấm thi. Số lượng giáo viên chấm rất lớn, GS có thể tính ra được con số này, thì sự sai lệch trong chấm thi giữa các giáo viên cũng sẽ rất lớn. Có thể GS không quan tâm đến điều này, nhưng biết bao thí sinh bị trượt oan, bị mất cơ hội vào học đại học do tính chủ quan trong chấm thi. Nó có thể còn kinh hoàng hơn những vụ gian lận ở Sơn La, Hòa Bình năm 2018 vừa rồi, đều là do con người gây ra, nhưng có ai biết, có bao nhiêu học sinh không được vào đại học do chấm chặt, chấm lỏng, do tính thiếu khách quan trong chấm thi tự luận. Chắc chắn rất nhiều người không biết mình trượt oan hay đỗ oan. Ai quan tâm đến nỗi lo lắng và tủi nhục của thí sinh khi thi trượt, nhất là khi trượt oan. Vậy GS và các nhà hoạch định chính sách sẽ làm thế nào để đảm bảo công bằng trong chấm thi?

Việc viết các câu hỏi thi trắc nghiệm với những câu hỏi chỉ để đánh giá sự nhận biết, hiểu, áp dụng không đến nỗi quá khó, nhưng quả là khó và rất khó để viết được những câu hỏi để đánh giá các năng lực phân tích, tổng hợp và đánh giá (evaluation).

Rất may, có nhiều nghiên cứu đã chỉ ra rằng: năng lực nhận biết, hiểu và áp dụng có mối tương quan thuận với các năng lực phân tích, tổng hợp và đánh giá của các thí sinh. Đấy là lý do đề thi trắc nghiệm trên thế giới không có nhiều câu hỏi quá khó để đánh giá các năng lực tư duy bậc cao. Ngày nay, trong các đề thi trắc nghiệm cũng có những bài giải quyết vấn đề (problem solving), với khả năng tư duy cao, lập luận chắn chắn, thí sinh có thể nhận biết đâu là phương án trả lời đúng để lựa chọn. Một lý do khác là trong quá trình học, học sinh đã giải nhiều bài toán, đã biết cách lập luận, diễn giải, đâu cần phải trình diễn khả năng lập luận logic trong kỳ thi tốt nghiệp hay thi đại học. Một số người cho rằng thi trắc nghiệm thì chỉ cần đoán mò cũng làm được bài. Xin thưa, nếu làm bài bằng cách đoán mò, kết quả trả lời đúng chỉ khoảng 25%. Đâu đủ điểm để tốt nghiệp hay vào đại học.

Ngày nay thi trắc nghiệm có quy mô lớn đã khá phổ biến ở trên thế giới. Đâu phải các nước phát triển không có các chuyên gia giỏi, không hiểu vấn đề nên mới tổ chức thi trắc nghiệm cho các môn học, trong đó có môn toán. Thực ra, họ đã nghiên cứu những vấn đề này từ thế kỷ trước. Mô hình Rasch và Lý thuyết hồi đáp (Item Response Theory – IRT) ra đời để giúp giải quyết những vấn đề phức tạp trong thi cử trên diện rộng. Sự ra đời của lý thuyết hồi đáp và máy tính IBM có khả năng xử lý dữ liệu lớn là tiền đề cho việc tổ chức thi trắc nghiệm trên quy mô lớn. Ngay cả ở Miền Nam Việt Nam trước đây, từ những năm 1972-1973, Chính quyền lúc đó cũng đã đưa ra kế hoạch tổ chức thi trắc nghiệm vào năm 1974-1975, với lý do: thi trắc nghiệm để tạo cơ hội cho nhiều thí sinh dự thi, không bị hạn chế bởi khả năng chấm thi của các trường đại học. GS và nhiều người khác chắc chắn đã biết các kỳ thi SAT, ACT, GMAT ở Hoa Kỳ đều là thi trắc nghiệm. Chẳng lẽ họ cũng sai lầm 100% như GS nghĩ?

Nhưng tại sao thi cử ở Việt Nam vẫn xẩy ra tiêu cực trong các kỳ thi trắc nghiệm? Lỗi ở đây đâu phải tại thi trắc nghiệm. Thi tự luận cũng có thể gian lận. Một khi các cán bộ của đơn vị tổ chức thi ở địa phương đã cấu kết với các bên liên quan để gian lận trong khi thi và chấm thi thì làm sao tránh được. Liệu trước đó và nhiều năm trước khi tổ chức thi trắc nghiệm, có tiêu cực như thế không? Có nước nào, nơi nào, ngay sau khi thi, thậm chí trong khi thi, đề bài, đáp án đã lọt ra ngoài, đã được đưa lên mạng? Ngay các tổ chức khảo thí quốc tế tổ chức thi ngoại ngữ tại Việt Nam, sau khi thi xong, đâu thấy đề thi và đáp án được đưa lên mạng một cách công khai như các kỳ thi của Bộ ta.

Trách nhiệm của ai đây? Lẽ ra, chúng ta phải đảm bảo để trong khi thi, đề bài thi không lọt ra ngoài, khi thi xong thu lại tất cả đề thi và bài làm như các tổ chức khảo thí vẫn làm. Sau khi thi, bài thi được bảo vệ cẩn mật. Quét bài càng sớm càng tốt. Sau đó thực hiện phân tích kết quả thi trên cơ sở dữ liệu chung của cả nước sẽ phát hiện được những bất thường trong kỳ thi. Thậm chí, các phần mềm có thể giúp phát hiện những thí sinh có kết quả giống nhau do nhận bài từ bên ngoài đưa vào hay chép của nhau do ngồi gần nhau nên có kết quả trả lời giống nhau. Thiết bị công nghệ phòng thi giúp xác định các hành vi nghi vấn…

Xử lý dữ liệu thi không có gì khó trong khi chúng ta có hơn 200 học viên cao học và nghiên cứu sinh đã học môn học Mô hình Rasch và phân tích kết quả thi, trong đó có một lãnh đạo của Cục do tôi trực tiếp giảng dạy, chưa kể nhiều chuyên gia khác được đào tạo ở trong và ngoài nước đều dễ dàng đánh giá độ tin cậy của mỗi kỳ thi? Nhưng tại sao vẫn có những sự cố trong thi? Đâu phải là lỗi của thi trắc nghiệm, mà là lỗi dùng người. Có lẽ GS nên xem lại nhận định: “Thi trắc nghiệm 100% môn Toán là sai lầm”. Hay đấy là giải pháp hiện đại?
TS. Phạm Xuân Thanh trong chuyến công tác năm 2014TS. Phạm Xuân Thanh trong chuyến công tác năm 2014
Mỗi dạng thức thi đều có ưu và nhược điểm riêng. Ra đề thi tự luận quả là dễ, ít tốn thời gian và công sức. Trong các kỳ thi quan trọng như thi tốt nghiệp hay thi tuyển đại học, các tiểu ban ra đề tự luận khá nhẹ nhàng. Hầu như mỗi thầy cô đã có sẵn vốn đề trong đầu hay để ở đâu đó. Chỉ sau một hai ngày là đã đề xuất một đề của mình. Trưởng tiểu ban tổ hợp thành 3-4 đề, đánh số đề rồi bốc thăm đề chính thức, đề dự bị 1, đề dự bị 2… rồi các thành viên lại đọc, rà soát, làm đáp án. Sau cùng là ngồi làm hướng dẫn chấm. Quy trình này cũng đã được viết nhiều trong các sách vở nên chẳng mấy ai thèm tranh cãi. Nhưng tổ chức chấm thi tự luận cho một triệu thí sinh quả là cơn ác mộng. Cũng may ở nước ta, nếu có chấm nhầm, chấm sót thì cũng chẳng ai biết mà thắc mắc, kiện cáo. Có lẽ vì thế mà nhiều người cho rằng chấm chặt, chấm lỏng là việc bình thường vẫn xẩy ra, ít ai kiểm soát được. Thí sinh không được quyền thắc mắc. Nếu có xin phúc tra thì người ta chỉ kiểm tra có chấm sai, chấm sót hay không, nhưng tuyệt đối không xử lý các thắc mắc chấm chặt, chấm lỏng.
Xu thế dân chủ trong giáo dục đã dẫn đến những kỳ thi mà kết quả chấm thi không phụ thuộc vào tính chủ quan của người chấm. Đó là đánh giá khách quan (objective tests).
Nhưng objective tets lại là con ác mộng cho các nhà tổ chức thi. Mỗi đề thi trắc nghiệm khách quan có 50-60 câu hỏi, mỗi câu hỏi có 4-5 lựa chọn đúng/sai dẫn đến từ 200 đến 300 nguy cơ xẩy ra sai sót cho mỗi môn thi. 5 môn thi sẽ là sẽ là 1000 đến 1500 nguy cơ có thể xẩy ra. Cho nên các nhà khảo thí chuyên nghiệp mới bỏ ra hằng năm trời để làm ngân hàng đề thi được định cỡ, tốn kém biết bao nhiêu tiền và thời gian. Chỉ cần một vài sai sót nhỏ là cả cơ nghiệp đã bay thành mây khói.
Ở nước ta, chẳng ai làm gì được người cầm cái nên giáo viên thích đề tự luận hơn đề trắc nghiệm. Nhà cầm trịch cũng chẳng bận tâm. Phương án A đúng mà D cũng đúng. Làm gì được nhau. Có lẽ những điều này đã giải thích vì sao bạn bè tôi, là các nhà giáo, vấn ủng hộ thi tự luận hơn là trắc nghiệm. Nếu chúng ta quay lại với thi tự luận thì liệu thế giới sẽ học tập Việt Nam: cứ tổ chức thi tự luận, cần gì objective tests cho tốn kém, nhất là đối với môn Toán.

TS. Phạm Xuân Thanh

BigSchool: Ngoài ý kiến của chuyên gia Phạm Xuân Thành, GS Lâm Quang Thiệp nguyên Vụ trưởng Vụ Giáo dục Đại học cho biết trên báo Giáo dục & Thời đại:
GS Lâm Quang Thiệp GS Lâm Quang Thiệp
Việc thi trắc nghiệm môn Toán là phù hợp cho kỳ thi đánh giá quy mô lớn như thi THPT quốc gia hiện nay. Hình thức thi này khắc phục được nhiều hạn chế của thi tự luận như: Đánh giá được toàn diện kiến thức của học sinh thay vì chỉ đánh giá được một vài phần kiến thức của thi tự luận; học sinh phải học toàn diện thay vì học tủ – thi tủ như thi tự luận. Đặc biệt, việc chấm thi trắc nghiệm bằng máy sẽ khách quan, chính xác hơn chấm thi tự luận bị phụ thuộc vào khả năng chuyên môn của người chấm. 

Ngoài ra, khi thi tự luận, do trình độ người chấm khác nhau nên buộc phải làm thang điểm tỷ mỉ bằng cách chia nhỏ bài thi thành nhiều ý để đếm ý tính điểm. Với cách chấm này, theo GS Lâm Quang Thiệp, chẳng khác nào biến một đề tự luận có thể tốt thành một đề trắc nghiệm tồi. Bởi lẽ, trắc nghiệm chính là cách đếm ý để tính điểm, nhưng đề thi được thiết kế ngay từ đầu lựa chọn ý nào, cấp độ khó dễ thế nào.

“Tóm lại, với một kỳ thi quy mô lớn lớn thì hình thức thi tự luận không bao giờ tạo chất lượng tốt được”, GS Lâm Quang Thiệp nhấn mạnh. Ông đồng thời lưu ý rằng, việc chọn hình thức thi nào phụ thuộc vào mục tiêu của kỳ thi, thi THPT quốc gia và tuyển sinh đại học là kỳ thi phân loại thô, chọn hình thức trắc nghiệm và một phần nhỏ tự luận là thích hợp, còn thi Olympic Toán học để tuyển chọn nhân tài thì không nên dùng hình thức trắc nghiệm.

Để việc thi Toán THPT quốc gia được tốt hơn, GS Lâm Quang Thiệp kiến nghị, song song với những câu hỏi trắc nghiệm có sẵn đáp án để thí sinh lựa chọn, đề thi có thể bổ sung các câu hỏi để thí sinh tự điền đáp án, và có thể thêm vài câu tự luận ngắn để đánh giá khả năng giải quyết vấn đề.

Chất lượng của hình thức thi trắc nghiệm được quyết định bằng chất lượng của đề thi, mà đề thi khi đầu tư nhiều thời gian sẽ có thể làm tốt. Nhưng chất lượng thi tự luận lại phụ thuộc vào năng lực của người chấm thi. Đối với kỳ thi như thi THPT quốc gia, ta không thể có được đội ngũ 100% người chấm có trình độ chuyên môn cao để chấm được hàng triệu bài thi một cách chất lượng trong một thời gian ngắn. Do đó, thi trắc nghiệm với bài thi chấm bằng máy tính sẽ là lựa chọn phù hợp hơn.

Nguồn : st