Trắc nghiệm tổng hợp Kiểm tra đánh giá trong giáo dục HNUE
Tổng hợp bộ câu hỏi trắc nghiệm môn Kiểm tra đánh giá trong giáo dục theo giáo trình của PGS.TS Nguyễn Công Khanh - ĐH Sư phạm Hà Nội (HNUE). Tài liệu bao quát toàn bộ kiến thức trọng tâm: cơ sở lí luận đo lường, các loại hình đánh giá (tổng kết, quá trình, chẩn đoán), kỹ thuật thiết kế trắc nghiệm khách quan, tự luận, đánh giá năng lực và lý thuyết khảo thí hiện đại (IRT). Bộ đề giúp sinh viên sư phạm ôn luyện hiệu quả cho kỳ thi kết thúc học phần.
Từ khoá: trắc nghiệm kiểm tra đánh giá trong giáo dục kiểm tra đánh giá giáo dục hnue giáo trình nguyễn công khanh đáp án trắc nghiệm kiểm tra đánh giá đề thi hnue đánh giá năng lực học sinh lý thuyết khảo thí hiện đại phương pháp kiểm tra đánh giá công cụ đánh giá giáo dục sư phạm hà nội ôn thi
Câu 1: Một giáo viên thực hiện quan sát học sinh trong tuần đầu tiên của năm học để tìm hiểu về phong cách học tập và đặc điểm cá nhân nhằm tổ chức lớp học hiệu quả. Hoạt động này thuộc loại hình đánh giá nào?
A. Đánh giá quá trình (Formative Assessment)
B. Đánh giá sơ khởi (Placement Assessment)
C. Đánh giá tổng kết (Summative Assessment)
D. Đánh giá dựa theo tiêu chí (Criterion-referenced)
Câu 2: Trong một bài thi trắc nghiệm, nếu một phương án nhiễu (distractor) hoàn toàn không có học sinh nào lựa chọn, giáo viên nên nhận định như thế nào về chất lượng của phương án đó?
A. Phương án nhiễu hoạt động rất tốt vì không đánh lừa được ai.
B. Phương án nhiễu quá lộ liễu hoặc thiếu tính hợp lý, cần phải sửa đổi.
C. Đây là câu hỏi có độ phân biệt cực kỳ cao đối với học sinh giỏi.
D. Đáp án đúng của câu hỏi chắc chắn là một nội dung rất dễ.
Câu 3: Khi điểm số của học sinh được đối chiếu trực tiếp với mục tiêu học tập và chuẩn đầu ra mà không quan tâm đến vị trí của học sinh đó so với các bạn khác, hình thức này gọi là gì?
A. Đánh giá dựa theo chuẩn (Norm-referenced)
B. Đánh giá chủ quan (Subjective Assessment)
C. Đánh giá sơ khởi (Placement Assessment)
D. Đánh giá dựa theo tiêu chí (Criterion-referenced)
Câu 4: Tại sao đo lường trong khoa học giáo dục và tâm lý thường được coi là khó chính xác hơn so với khoa học tự nhiên?
A. Vì đối tượng đo lường là con người với các biến số tâm lý phức tạp và gián tiếp.
B. Vì giáo viên thường không được đào tạo về các phép tính thống kê phức tạp.
C. Vì các thang đo trong giáo dục luôn có số 0 tuyệt đối làm sai lệch kết quả.
D. Vì học sinh thường cố tình trả lời sai trong các bài kiểm tra trắc nghiệm.
Câu 5: Một bài kiểm tra có độ khó
p=0.25. Kết luận nào sau đây về bài kiểm tra này là chính xác nhất?
A. Đây là một bài kiểm tra tương đối khó với đa số học sinh tham gia.
B. Đây là một bài kiểm tra rất dễ, phù hợp để đánh giá kiến thức cơ bản.
C. Bài kiểm tra có tính phân biệt rất kém giữa học sinh khá và giỏi.
D. Có khoảng 75% học sinh trong mẫu khảo sát đã trả lời đúng câu hỏi.
Câu 6: Trong mô hình lý thuyết hồi đáp câu hỏi (IRT), giả thiết của mô hình Rasch về mối quan hệ giữa năng lực và độ khó được phát biểu như thế nào?
A. Người có năng lực cao và thấp đều có xác suất trả lời đúng câu khó như nhau.
B. Một người bất kỳ luôn có xác suất trả lời đúng câu hỏi khó cao hơn câu hỏi dễ.
C. Xác suất trả lời đúng câu hỏi của một cá nhân tỉ lệ nghịch với năng lực của họ.
D. Người có năng lực cao có xác suất trả lời đúng một câu hỏi lớn hơn người có năng lực thấp.
Câu 7: Giáo viên yêu cầu học sinh làm một bài tập mà bối cảnh là giải quyết một tình huống ô nhiễm nguồn nước thực tế tại địa phương. Hình thức này minh họa rõ nét nhất cho khái niệm nào?
A. Đánh giá khách quan (Objective Assessment)
B. Đánh giá xác thực (Authentic Assessment)
C. Đánh giá chính thức (Formal Assessment)
D. Đánh giá dựa theo chuẩn (Norm-referenced)
Câu 8: Sự khác biệt chính giữa "Bảng kiểm tra" (Checklist) và "Thang đo" (Rating Scale) trong phương pháp quan sát là gì?
A. Bảng kiểm tra dùng để đo cường độ, còn thang đo dùng để đếm số lượng.
B. Thang đo chỉ yêu cầu trả lời Có/Không, còn bảng kiểm tra yêu cầu chỉ ra mức độ.
C. Bảng kiểm tra xác định sự hiện diện của hành vi, còn thang đo xác định mức độ đạt được của hành vi đó.
D. Thang đo luôn khách quan hơn bảng kiểm tra vì nó sử dụng nhiều con số hơn.
Câu 9: Một bài kiểm tra được thiết kế gồm các câu hỏi trắc nghiệm khách quan với đáp án duy nhất và chấm bằng máy tính. Mục tiêu chính của thiết kế này là gì?
A. Đánh giá năng lực tư duy phê phán và sáng tạo của người học.
B. Tăng cường tính chủ quan của giáo viên trong quá trình phán xét giá trị.
C. Đảm bảo tính khách quan, tin cậy và bao quát phạm vi nội dung rộng.
D. Khuyến khích học sinh tự đánh giá và phản hồi lẫn nhau trên lớp.
Câu 10: Thuật ngữ "Năng lực" (Competence) theo xu hướng đổi mới giáo dục hiện nay được hiểu là sự kết hợp của các yếu tố nào?
A. Chỉ bao gồm tri thức chuyên môn và các kỹ năng thao tác cơ bản.
B. Sự tổng hòa kiến thức, kỹ năng, thái độ và sẵn sàng hành động trong bối cảnh cụ thể.
C. Khả năng tái hiện lại chính xác nội dung sách giáo khoa trong bài thi viết.
D. Chỉ số thông minh (IQ) và các năng lực nhận thức bẩm sinh của học sinh.
Câu 11: Trong quy trình 9 bước thiết lập kế hoạch đánh giá trên lớp, bước đầu tiên "Xác định mục tiêu, loại hình, phạm vi" đóng vai trò gì?
A. Xác định xem ai sẽ là người thực hiện việc chấm điểm cuối cùng.
B. Là nền tảng để lựa chọn phương pháp, nội dung và công cụ đánh giá phù hợp.
C. Giúp giáo viên thống kê được số lượng học sinh cần hỗ trợ đặc biệt.
D. Thay thế cho việc viết báo cáo phản hồi kết quả cho phụ huynh.
Câu 12: "Đánh giá quá trình" (Formative Assessment) khác biệt cơ bản với "Đánh giá tổng kết" (Summative Assessment) ở điểm nào?
A. Chỉ có đánh giá tổng kết mới được phép sử dụng điểm số để báo cáo.
B. Đánh giá quá trình diễn ra liên tục để cải thiện việc học, đánh giá tổng kết diễn ra cuối giai đoạn để xác nhận thành tích.
C. Đánh giá quá trình luôn khách quan hơn vì nó dựa trên các bài thi chuẩn hóa diện rộng.
D. Đánh giá tổng kết không bao giờ quan tâm đến các mục tiêu về kỹ năng và thái độ.
Câu 13: Khi một giáo viên đưa ra nhận xét: "Em đã có tiến bộ trong việc trình bày luận điểm, tuy nhiên cần chú ý thêm về cách liên kết các đoạn văn", giáo viên đang thực hiện chức năng nào của đánh giá?
A. Chẩn đoán các vấn đề tâm lý lâm sàng bên ngoài lớp học.
B. Phản hồi và khích lệ để thúc đẩy sự tiến bộ của học sinh.
C. Phân loại học sinh vào các nhóm năng lực khác nhau để xếp lớp.
D. Giải trình chất lượng giáo dục với các cấp quản lý cấp trên.
Câu 14: Một bài kiểm tra có độ tin cậy cao nhưng lại đo sai mục tiêu kiến thức cần đánh giá thì được nhận định như thế nào về "Độ giá trị" (Validity)?
A. Có độ giá trị cao vì điểm số của học sinh giữa các lần thi rất ổn định.
B. Có độ giá trị thấp vì nó không đo lường đúng cái cần đo.
C. Độ giá trị không liên quan gì đến việc bài thi đo đúng mục tiêu hay không.
D. Bài thi này đạt độ giá trị nội dung tuyệt đối nhưng thiếu giá trị cấu trúc.
Câu 15: Tại sao việc sử dụng "Câu hỏi tự luận hạn chế" (Short essay) lại phù hợp hơn với các bài kiểm tra trên lớp có thời lượng ngắn (30-45 phút)?
A. Vì nó cho phép học sinh hoàn toàn tự do trình bày mọi suy nghĩ cá nhân.
B. Vì nó tập trung vào một nội dung cụ thể, giúp chấm điểm chính xác và tiết kiệm thời gian hơn tự luận dài.
C. Vì giáo viên có thể sử dụng máy tính để chấm điểm tự động cho loại câu hỏi này.
D. Vì nó đảm bảo bao quát được toàn bộ chương trình học chỉ trong một câu hỏi duy nhất.
Câu 16: Trong kỹ thuật thiết kế câu hỏi trắc nghiệm, "Phương án đúng" (Key) nên được trình bày như thế nào để đảm bảo chất lượng đo lường?
A. Luôn là phương án dài nhất và chứa nhiều thuật ngữ chuyên môn phức tạp nhất.
B. Cần có sự tương đồng về độ dài, cấu trúc ngữ pháp và tính hợp lý so với các phương án nhiễu.
C. Phải chứa các từ khóa gợi ý như "luôn luôn", "chắc chắn" để học sinh dễ nhận biết.
D. Nên được đặt cố định ở vị trí phương án cuối cùng trong mọi câu hỏi của đề thi.
Câu 17: Một học sinh thường xuyên tự hỏi: "Mình đã làm gì để theo đuổi ước mơ?" và viết câu trả lời vào nhật ký học tập. Đây là minh chứng của năng lực nào?
A. Năng lực tương tác và hợp tác nhóm trong môi trường xã hội.
B. Năng lực giải quyết vấn đề toán học thông qua các con số thống kê.
C. Năng lực tự suy ngẫm (Self-reflection) và phát triển bản thân.
D. Năng lực sử dụng công nghệ thông tin trong việc lưu trữ dữ liệu cá nhân.
Câu 18: Sự khác biệt lớn nhất giữa lý thuyết khảo thí hiện đại (IRT) và lý thuyết khảo thí cổ điển (CTT) về mặt đánh giá năng lực là gì?
A. Lý thuyết hiện đại chỉ quan tâm đến tổng điểm, lý thuyết cổ điển quan tâm từng câu hỏi.
B. CTT cho rằng điểm thực là sự kết hợp của năng lực và sai số, IRT dựa trên mô hình xác suất giữa độ khó và khả năng.
C. CTT yêu cầu sử dụng các phần mềm máy tính cực kỳ phức tạp để xử lý các dữ liệu nhỏ.
D. IRT không thể thực hiện so sánh thành tích giữa các học sinh ở các vùng miền khác nhau.
Câu 19: Khi thiết kế một Rubric để đánh giá bài thuyết trình nhóm, yếu tố nào sau đây là thành phần bắt buộc phải có?
A. Danh sách họ tên và địa chỉ liên lạc của tất cả các thành viên trong nhóm.
B. Các tiêu chí đánh giá, các mức độ đạt được và thông tin mô tả cho từng mức độ.
C. Chữ ký xác nhận của Ban giám hiệu nhà trường và đại diện hội phụ huynh.
D. Một đoạn văn dài kể về lịch sử hình thành của các thành viên tham gia nhóm.
Câu 20: Tại sao giáo viên không nên sử dụng các bài kiểm tra có sẵn trong sách tham khảo mà không có sự chỉnh sửa hay xem xét lại?
A. Vì các bài kiểm tra đó luôn vi phạm bản quyền tác giả nếu không xin phép.
B. Vì chúng có thể không phù hợp với mục tiêu cụ thể và trình độ thực tế của học sinh trong lớp.
C. Vì học sinh chắc chắn đã có sẵn đáp án của các bài kiểm tra này từ trước.
D. Vì sách tham khảo không bao giờ chứa các câu hỏi trắc nghiệm khách quan đa lựa chọn.
Câu 21: "Đánh giá đồng đẳng" (Peer assessment) mang lại lợi ích giáo dục cốt lõi nào cho học sinh khi thực hiện làm việc nhóm?
A. Giúp học sinh trốn tránh được trách nhiệm đối với kết quả cuối cùng của cả nhóm.
B. Giúp học sinh học hỏi điểm tốt, rút kinh nghiệm từ bạn và hình thành khả năng tự chịu trách nhiệm.
C. Cho phép học sinh giỏi có quyền quyết định hoàn toàn điểm số của các bạn yếu hơn.
D. Làm giảm bớt khối lượng kiến thức mà học sinh cần phải nghiên cứu cho bài học.
Câu 22: Trong kỹ thuật đặt câu hỏi vấn đáp, hình thức "Vấn đáp gợi mở" thường được ưu tiên sử dụng vào giai đoạn nào của bài học?
A. Chỉ sử dụng vào cuối giờ để kiểm tra xem học sinh có nhớ được tên bài học hay không.
B. Sử dụng khi cung cấp tri thức mới để dẫn dắt học sinh tự khám phá ra chân lý.
C. Sử dụng khi lớp học quá ồn ào nhằm mục đích trừng phạt những học sinh mất trật tự.
D. Sử dụng để thay thế hoàn toàn cho các bài kiểm tra viết định kỳ vào cuối mỗi học kỳ.
Câu 23: Một bài kiểm tra toán có 10 câu, mỗi câu 1 điểm. Học sinh A được 7 điểm, cao hơn học sinh B được 5 điểm với khoảng cách là 2 điểm. Đây là ví dụ của loại thang đo nào?
A. Thang định khoảng (Interval scale)
B. Thang định hạng (Ordinal scale)
C. Thang tỉ lệ (Ratio scale)
D. Thang định danh (Nominal scale)
Câu 24: Mục tiêu học tập về "Suy luận" (theo cách phân loại của Stiggins) liên quan trực tiếp đến cấp độ nào trong thang nhận thức Bloom?
A. Chỉ bao gồm hai cấp độ đầu tiên là Nhận biết và Thông hiểu kiến thức.
B. Bao gồm các cấp độ cao: Áp dụng, Phân tích, Tổng hợp và Đánh giá.
C. Chỉ tập trung vào khả năng ghi nhớ máy móc các định nghĩa và công thức toán học.
D. Không có bất kỳ mối liên hệ nào với các cấp độ tư duy trong thang Bloom.
Câu 25: "Đánh giá xác thực" thường bị phê phán về nhược điểm nào sau đây trong quá trình triển khai thực tế?
A. Không thể đánh giá được các năng lực tư duy bậc cao và kỹ năng giải quyết vấn đề.
B. Quá dễ dàng thực hiện nên không gây được áp lực cần thiết cho học sinh học tập.
C. Tốn nhiều thời gian chuẩn bị, chấm bài và đòi hỏi giáo viên phải rất sáng tạo.
D. Luôn mang định kiến về giới tính và văn hóa trong các câu hỏi trắc nghiệm đa lựa chọn.
Câu 26: Trong lý thuyết IRT, tham số "Weighted MNSQ" khác 1 theo cả hai phía (lớn hơn hoặc nhỏ hơn 1) có ý nghĩa gì đối với một câu hỏi?
A. Câu hỏi đó hoàn toàn phù hợp với mô hình và có độ tin cậy tuyệt đối.
B. Sự phù hợp của số liệu thực tế với mô hình dự báo là rất kém.
C. Câu hỏi có độ khó cực kỳ thấp, hầu hết học sinh đều trả lời đúng.
D. Xác suất đoán mò của học sinh đối với câu hỏi này là bằng 0.
Câu 27: Tại sao giáo viên cần tránh đưa ra phản hồi mang tính "áp đặt" (ví dụ: chữa bài bằng cách chỉ đưa ra lời giải đúng duy nhất của mình)?
A. Vì học sinh sẽ cảm thấy quá tự tin và không thèm nghe giáo viên giảng bài nữa.
B. Vì nó không giúp học sinh phân tích, mổ xẻ các cách tư duy chưa phù hợp dẫn đến sai sót.
C. Vì lời giải của giáo viên thường luôn phức tạp hơn so với cách tư duy của học sinh.
D. Vì quy định của ngành giáo dục cấm giáo viên cung cấp đáp án đúng cho người học.
Câu 28: Trong cấu trúc đa thành tố của năng lực, "Vòng tròn giữa" bao quanh vòng trung tâm đại diện cho những thành phần nào?
A. Các chức năng hành động thực tế và mục tiêu cuối cùng của nhiệm vụ.
B. Kiến thức, các khả năng nhận thức, thực hành, thái độ, cảm xúc và động cơ.
C. Toàn bộ bối cảnh và điều kiện ngoại cảnh tác động đến việc học tập.
D. Chỉ bao gồm các thiết bị công nghệ hỗ trợ cho việc giảng dạy trên lớp.
Câu 29: Một bài kiểm tra yêu cầu học sinh đóng vai "nhà quảng cáo" để thiết kế một chiến dịch truyền thông cho sản phẩm xanh. Đây là dạng đánh giá nào?
A. Đánh giá truyền thống dựa trên sự ghi nhớ máy móc.
B. Đánh giá sơ khởi để phân loại trình độ đầu năm.
C. Đánh giá chẩn đoán khó khăn trong học tập.
D. Đánh giá năng lực tạo ra sản phẩm (Product Assessment).
Câu 30: Khi giáo viên sử dụng trò chơi "Nhận diện người bạn thực sự" và yêu cầu học sinh chấm điểm cho nhau, hoạt động này thực hiện hình thái đánh giá nào?
A. Hình thái đánh giá dựa trên đo lường tâm lý cổ điển.
B. Hình thái đánh giá cá nhân hóa và gắn với bối cảnh giáo dục.
C. Hình thái đánh giá chính thức sử dụng các bài test chuẩn hóa quốc gia.
D. Hình thái đánh giá chẩn đoán năng lực đọc hiểu của học sinh tiểu học.
Câu 31: Chỉ số "Point Biserial" (Pt Bis) trong bảng phân tích câu hỏi trắc nghiệm khách quan đại diện cho đặc tính đo lường nào?
A. Độ khó của câu hỏi đối với nhóm mẫu học sinh khảo sát.
B. Hệ số tương quan giữa điểm câu hỏi và tổng điểm (độ phân biệt).
C. Tỉ lệ học sinh đã bỏ sót không trả lời câu hỏi đó trong đề thi.
D. Khoảng tin cậy 95% của các giá trị ngưỡng trong câu hỏi tự luận.
Câu 32: Tại sao việc đánh giá "Thái độ" lại được coi là lĩnh vực phức tạp và khó khăn nhất đối với giáo viên?
A. Vì thái độ luôn biểu hiện trực tiếp và ổn định qua các bài kiểm tra viết trên giấy.
B. Vì giáo viên thường không quan tâm đến các yếu tố tình cảm của học sinh trên lớp.
C. Vì nó đòi hỏi sự hiểu biết sâu về tâm lý và quan sát lâu dài trong nhiều tình huống khác nhau.
D. Vì các quy định hiện hành cấm giáo viên đánh giá về mặt tình cảm của người học.
Câu 33: Trong quy trình 7 bước xây dựng Rubric, tại sao bước đầu tiên yêu cầu học sinh xem xét các sản phẩm "Tốt" và "Chưa tốt"?
A. Để học sinh có thể sao chép y nguyên các mẫu sản phẩm tốt đã có từ trước.
B. Giúp học sinh nhận diện các tiêu chuẩn chất lượng và có cơ sở để thảo luận về tiêu chí.
C. Nhằm mục đích phê bình công khai những học sinh đã làm sản phẩm chưa tốt.
D. Để giáo viên không phải thực hiện các bước giải thích lý thuyết về kỹ năng viết.
Câu 34: Một giáo viên quyết định thay đổi cách dạy từ thuyết trình sang kể chuyện hoặc trò chơi ngay giữa giờ học khi thấy học sinh bắt đầu chán. Đây là ví dụ của mục tiêu đánh giá nào?
A. Phân loại học sinh theo các nhóm tính cách khác nhau.
B. Lên kế hoạch và điều chỉnh hoạt động giảng dạy kịp thời.
C. Phán đoán giá trị cuối cùng về năng lực của học sinh.
D. Giải trình với ban giám hiệu về tính sáng tạo trong dạy học.
Câu 35: Tại sao phương pháp "Ghi chép sự kiện thường nhật" (Anecdotal records) nên tách riêng phần mô tả sự kiện và phần nhận xét của giáo viên?
A. Để làm cho cuốn sổ ghi chép trông đẹp mắt và khoa học hơn đối với người đọc.
B. Để đảm bảo tính khách quan của sự kiện trước khi đưa vào những phán xét chủ quan.
C. Vì phần nhận xét của giáo viên thường không có giá trị trong việc đánh giá hành vi.
D. Nhằm mục đích tiết kiệm không gian ghi chép trong sổ theo dõi học sinh hàng ngày.
Câu 36: "Đánh giá dựa vào nhà trường" (School-based assessment) khác với "Đánh giá trên diện rộng" ở đặc điểm nào sau đây?
A. Chỉ quan tâm đến kết quả các bài kiểm tra toán học và ngoại ngữ định kỳ.
B. Tập trung vào sự phát triển toàn diện nhân cách và các kỹ năng ngoại khóa của học sinh.
C. Do các nhà quản lý giáo dục cấp quốc gia chủ trì thực hiện hoàn toàn.
D. Không bao giờ sử dụng các kết quả quan sát hành vi của học sinh trên lớp học.
Câu 37: Một bài kiểm tra đo lường năng lực giải quyết vấn đề bằng cách yêu cầu học sinh xử lý một tình huống mới chưa từng được học. Điều này nhấn mạnh khía cạnh nào của năng lực?
A. Khả năng ghi nhớ máy móc các định nghĩa trong sách giáo khoa.
B. Khả năng tái hiện lại chính xác các thao tác đã được giáo viên làm mẫu.
C. Khả năng vận dụng linh hoạt kiến thức vào những điều kiện mới, không quen thuộc.
D. Khả năng sử dụng các phần mềm máy tính để tìm kiếm đáp án có sẵn trên mạng.
Câu 38: Tại sao đánh giá cá nhân (Individual assessment) như thang WISC-IV lại có lợi thế trong việc chẩn đoán hơn đánh giá nhóm?
A. Vì nó tiết kiệm được rất nhiều thời gian và tiền bạc cho nhà trường.
B. Vì nó cho phép người đánh giá quan sát sâu các biểu hiện tâm lý và cách giải quyết vấn đề của từng trẻ.
C. Vì bất kỳ giáo viên nào cũng có thể thực hiện được mà không cần bằng cấp chuyên môn.
D. Vì kết quả của nó luôn đại diện cho thành tích của toàn bộ học sinh trong một khối lớp.
Câu 39: Trong thang Bloom cải tiến, hành động "phê bình, kiểm tra, phán xét dựa trên các tiêu chí" thuộc về cấp độ tư duy nào?
Câu 40: Khi giáo viên cung cấp phản hồi cho bài tập làm văn bằng cách ghi chú những gì học sinh đã làm được và những gì cần tìm hiểu thêm, hoạt động này thực hiện chức năng nào?
A. Chức năng giải trình về điểm số cho các cơ quan quản lý.
B. Chức năng giáo dục và phát triển của đánh giá giáo dục.
C. Chức năng phân loại học sinh vào các nhóm hạnh kiểm yếu.
D. Chức năng dự báo về khả năng đỗ đại học của học sinh trong tương lai.