
Thí sinh thảo luận đề thi sau giờ thi tại điểm thi Trường THPT Phan Đình Phùng, Hà Nội - Ảnh: DANH KHANG
Khi nhận xét về đề thi tốt nghiệp THPT hằng năm, có một kỳ vọng "ngầm" nhưng mạnh mẽ, đó là đề thi phải "được lòng công chúng". Tuy nhiên, đây có thể là một cái "bẫy" cần tránh bởi đề thi là công cụ đánh giá trong giáo dục, không phải một sản phẩm truyền thông.
Kỳ thi tốt nghiệp THPT là một hoạt động kiểm tra kiến thức và kỹ năng của học sinh cuối lớp 12, nhằm đánh giá kết quả học tập và làm căn cứ để xét công nhận tốt nghiệp, đồng thời là một trong những cơ sở để xét tuyển vào các trường đại học, cao đẳng.
Trong giáo dục, đánh giá là một hoạt động gắn liền với việc dạy và học, bao gồm các hình thức như bài kiểm tra, dự án học tập, hoặc các kỳ thi.
Đánh giá cũng được chia thành đánh giá quá trình và đánh giá tổng kết, và kỳ thi tốt nghiệp THPT là hình thức đánh giá tổng kết. Hệ thống giáo dục nhiều quốc gia đều có kỳ thi này, ví dụ như GCSE và A level tại Anh, hay Cao Khảo tại Trung Quốc.
Có một số tiêu chí phổ biến dùng trong đánh giá trong giáo dục được công nhận rộng rãi.
Thứ nhất là tính hợp lệ (validity), tức là kết quả đánh giá có phù hợp, có ý nghĩa và hữu ích cho việc đánh giá học sinh hay không. Kỳ thi tốt nghiệp THPT hiện nay có chức năng kép, vừa đánh giá mức độ hoàn thành bậc học phổ thông của học sinh, vừa giúp sàng lọc, phân hóa trình độ thí sinh để các trường đại học có cơ sở dùng kết quả tốt nghiệp trung học cho việc tuyển sinh vào đại học.
Giả sử áp dụng vào môn ngữ văn, nếu đề thi ngữ văn đánh giá được kiến thức văn học của thí sinh đối với các tác phẩm văn học đã học, đánh giá năng lực sử dụng ngôn ngữ đời sống và ngôn ngữ học thuật, cũng như khả năng cảm thụ các tác phẩm văn học nói chung thì đó là một đề thi có tính hợp lệ cao.
Ngược lại, một đề văn tuy mang đầy tính thời sự nóng bỏng nhưng không có khả năng đánh giá đúng năng lực môn văn của học sinh có thể là một đề văn "lạc đề".
Tiêu chí thứ hai là tính đáng tin cậy (reliability), tức là đảm bảo sự ổn định và nhất quán. Nếu đề thi năm trước và năm sau cho ra kết quả (điểm) khác nhau "một trời một vực" thì tính đáng tin cậy có thể đang có vấn đề, hoặc đề thi đã có tính thiên vị (bias), khiến một nhóm thí sinh này "có lợi", trong khi một nhóm khác gặp "bất lợi".
Sự khác biệt quá lớn giữa "thi thử" và "thi thật" phản ánh mức độ trồi sụt của đề thi, và do vậy ảnh hưởng đến độ tin cậy của đề.
Tiêu chí thứ ba là tính chân thực (authenticity), tức là trong khi cơ quan ra đề lý giải hướng tới việc đánh giá "năng lực" của người học thì năng lực đó có trùng khớp với năng lực ngoài đời sống không, hay là những năng lực khác xa nhau giữa "trường" và "đời".
Ở khía cạnh này, sự phản hồi của công chúng có ý nghĩa rất lớn mà các nhà giáo dục cần lắng nghe để điều chỉnh.
Ví dụ, ở môn tiếng Anh mục tiêu đánh giá là khả năng giao tiếp, đặc biệt là đọc - viết với yêu cầu là mức độ 3 (tương đương B1), thì việc đưa các nội dung phân hóa lên tới cao hơn hai, ba bậc (C1, C2) là điều hiếm xảy ra trong khảo thí ngôn ngữ.
Thông thường các kỳ thi quốc tế trong tiếng Anh cũng chỉ đẩy độ khó lên cao hơn không quá 1 bậc so với mức độ mục tiêu (target) để đánh giá các thí sinh có khả năng vượt trên yêu cầu.
Tiêu chí tiếp theo là hiệu ứng (washback), tức là kỳ thi ảnh hưởng như thế nào đến việc học, là "học gì thi nấy", hoặc thi thế nào thì học sẽ như vậy.
Về mặt này, Bộ GD-ĐT đã nêu quan điểm hướng tới việc đánh giá năng lực học sinh, do vậy nếu trường học và người học vẫn học theo cách thức cũ tập trung vào ghi nhớ kiến thức, hay luyện tập kỹ năng giải đề thì sẽ ngày càng bất lợi với cách ra đề mới.
Băn khoăn tính thực tế của kỳ thi
Dư luận cũng đặt câu hỏi về tính thực tế của kỳ thi (practicality), theo tôi có cơ sở.
Mỗi nền giáo dục có cách xử lý khác nhau. Có nền giáo dục yêu cầu học sinh thi tốt nghiệp quốc gia như Việt Nam (một năm một lần), nước Anh (một năm có vài kỳ thi A-Levels), hoặc không có kỳ thi tốt nghiệp quốc gia như Mỹ, mà chia ra thành xét tốt nghiệp theo tín chỉ do trường tự làm và kỳ thi đánh giá năng lực chung vào đại học, cao đẳng (SAT, ACT) do tổ chức khảo thí cung cấp suốt trong năm.
Ở Việt Nam, chỉ trong 2 ngày, ngành giáo dục giải quyết việc thi và phân loại cho hơn 1 triệu thí sinh thì đây là một nỗ lực vượt bậc, thể hiện rõ tính thực tế xét về hiệu quả sử dụng nguồn lực thời gian, con người, chi phí. Tuy nhiên vẫn không loại trừ có những phương án tối ưu hơn như thi trên máy tính mà chúng ta cần hướng tới trong thời gian tới.
Rõ ràng là kỳ thi tốt nghiệp THPT có mục đích phục vụ cho cả xét tốt nghiệp lẫn xét tuyển sinh đại học, và cần tuân theo những tiêu chuẩn, tiêu chí của đánh giá trong giáo dục hơn là gây ấn tượng với công chúng như một "sản phẩm truyền thông".
Tuy nhiên khi có nhiều phản hồi rằng đề thi không ăn nhập với việc dạy và học ở trường, cũng như khiến thí sinh lo lắng, thấy không công bằng… thì cũng rất cần "đánh giá lại công cụ đánh giá" một cách khoa học và giải trình minh bạch.
Bùi Khánh Nguyên là chuyên gia giáo dục song ngữ. Ông tốt nghiệp cử nhân văn học Anh - Mỹ, Đại học Quốc gia Hà Nội, và có bằng thạc sĩ giảng dạy tiếng Anh của Đại học Benedictine (Mỹ).