Bài test chuyên môn IT: Dữ liệu lớn Big Data có đáp án
Bài test chuyên môn IT về Big Data bao gồm các câu hỏi trắc nghiệm (MCQ) được biên soạn kỹ lưỡng nhằm kiểm tra kiến thức của bạn về cơ sở hạ tầng dữ liệu lớn, công nghệ phân tích, và các công cụ phổ biến như Hadoop, Spark, và NoSQL. Đây là tài liệu hữu ích cho những ai đang học hoặc làm việc trong lĩnh vực Big Data, giúp đánh giá năng lực chuyên môn và hiểu biết sâu về lĩnh vực này. Kèm đáp án chi tiết và hỗ trợ làm bài online, bài test giúp người học tự tin nâng cao kiến thức Big Data.
Từ khoá: IT Big Data kiểm tra chuyên môn trắc nghiệm MCQ Hadoop Spark NoSQL bài kiểm tra online đáp án chi tiết kiến thức dữ liệu lớn chuyên gia IT
Câu 1: Các thành phần chính của Big Data là gì?
D. Tất cả các thành phần trên
Câu 2: Trong các lựa chọn sau, node slave (nô lệ) là gì?
Câu 3: Thuật ngữ nào được dùng để định nghĩa mô hình đa chiều của kho dữ liệu (data warehouse)?
Câu 4: Đúng hay sai: Qubole là một công cụ Big Data.
Câu 5: Hadoop được viết bằng ngôn ngữ nào?
Câu 7: Hadoop chạy trên nền tảng nào trong các nền tảng sau?
Câu 8: Các đơn vị logic nhỏ, nơi kho dữ liệu (data warehouse) lưu giữ lượng dữ liệu lớn được gọi là gì?
Câu 9: Kết quả của các nhiệm vụ map được ghi vào đâu?
Câu 10: Có bao nhiêu dạng dữ liệu lớn (big data)?
Câu 11: Tổng số V của Big Data là bao nhiêu?
Câu 12: Giao dịch dữ liệu của ngân hàng thuộc loại dữ liệu nào?
A. Dữ liệu không cấu trúc
Câu 13: Hoạt động nào có thể được thực hiện trên kho dữ liệu (data warehouse)?
Câu 14: Kích thước tối thiểu của dữ liệu mà một đĩa có thể đọc hoặc ghi trong HDFS là gì?
D. Không có đáp án nào đúng
Câu 15: Nguồn của tất cả dữ liệu kho dữ liệu (data warehouse) được gọi là gì?
B. Môi trường kho dữ liệu (data warehouse)
Câu 16: Thời gian lưu trữ dữ liệu trong kho dữ liệu (data warehouse) là bao lâu?
Câu 17: Mục đích của việc làm sạch dữ liệu là gì?
B. Thực hiện chuyển đổi để sửa dữ liệu sai
C. Sửa chữa các bất nhất trong dữ liệu
Câu 18: Dữ liệu có thể được cập nhật ở đâu?
B. Môi trường kho dữ liệu (data warehouse)
D. Môi trường khai thác dữ liệu
Câu 19: Lợi ích của xử lý Big Data là gì?
A. Doanh nghiệp có thể sử dụng thông tin bên ngoài khi đưa ra quyết định
B. Hiệu quả hoạt động tốt hơn
C. Cải thiện dịch vụ khách hàng
Câu 20: Công cụ nào thường được sử dụng để làm sạch và chuẩn bị dữ liệu lớn?
B. Hồ dữ liệu (Data Lake)
D. kho dữ liệu (data warehouse) (Data Warehouse)
Câu 21: Điều nào sau đây không phải là một phần của quy trình khoa học dữ liệu?
C. Vận hành hóa (Operationalize)
D. Lập kế hoạch mô hình (Model Planning)
Câu 22: Điều nào đúng về Big Data?
A. Big Data có thể được xử lý bằng các kỹ thuật truyền thống
B. Big Data đề cập đến các tập dữ liệu ít nhất ở kích thước petabyte
C. Phân tích Big Data không liên quan đến báo cáo và khai thác dữ liệu
D. Big Data có vận tốc thấp nghĩa là nó được tạo ra chậm
Câu 23: __________ là dữ liệu về dữ liệu.
Câu 24: __________ là một tập hợp dữ liệu được sử dụng với khối lượng lớn, nhưng đang phát triển theo cấp số nhân theo thời gian.
A. Cơ sở dữ liệu lớn (Big Database)
C. Tệp dữ liệu lớn (Big Datafile)
D. Dữ liệu lớn (Big Data)
Câu 25: Các bảng thực tế (Fact Tables) là gì?
Câu 26: Thuộc tính nào được cấu hình trên tệp mapred-site.xml?
A. Các biến môi trường Java
B. Hệ số sao chép (Replication Factor)
C. Tên thư mục để lưu trữ tệp HDFS
D. Máy chủ và cổng nơi chạy nhiệm vụ MapReduce
Câu 27: Chọn lý do đúng tại sao việc phân tích Big Data khó tối ưu hóa.
A. Công nghệ khai thác dữ liệu
B. Dữ liệu và các cách hiệu quả về chi phí để khai thác dữ liệu phục vụ mục đích kinh doanh
C. Phân tích Big Data không khó tối ưu hóa
D. Không có đáp án nào đúng
Câu 28: Thành phần nào xử lý việc thu nạp dữ liệu luồng vào Hadoop?
Câu 29: Thành phần nào thực hiện điều khiển nhiệm vụ (Job Control) trong Hadoop?
Câu 30: Phân tích Big Data thực hiện các tác vụ sau đây, ngoại trừ?
Câu 31: Chọn thuộc tính không chính xác của kho dữ liệu (data warehouse) (Data Warehouse).
A. Thu thập từ các nguồn không đồng nhất
B. Hướng đối tượng (Subject Oriented)
C. Biến đổi theo thời gian (Time Variant)
Câu 32: Chọn ngôn ngữ được sử dụng trong khoa học dữ liệu.
Câu 33: Chọn đặc điểm chính của Big Data trong các tùy chọn dưới đây.
D. Tất cả các đáp án trên
Câu 34: Dữ liệu có kích thước ________ byte được gọi là Big Data.
Câu 35: DSS trong kho dữ liệu (data warehouse) là viết tắt của ________.
A. Hệ thống quyết định đơn lẻ (Decision Single System)
B. Hệ thống hỗ trợ quyết định (Decision Support System)
C. Hệ thống hỗ trợ dữ liệu (Data Support System)
D. Hệ thống lưu trữ dữ liệu (Data Storable System)
Câu 36: Các vấn đề liên quan đến "Hiệu suất và khả năng mở rộng của thuật toán khai thác dữ liệu" thuộc vào?
A. Phương pháp khai thác và các vấn đề tương tác người dùng
B. Các vấn đề về hiệu suất
C. Các vấn đề về loại dữ liệu đa dạng
D. Không có đáp án nào đúng
Câu 37: Tất cả các mục sau đây mô tả chính xác về Hadoop, ngoại trừ:
A. Mã nguồn mở (Open Source)
C. Thời gian thực (Real-time)
D. Phương pháp tính toán phân tán
Câu 38: Các phần kích thước cố định của công việc MapReduce được gọi là ________.
Câu 39: Gói Hadoop Common chứa gì?
Câu 40: Có bao nhiêu phương pháp tiếp cận để tích hợp cơ sở dữ liệu không đồng nhất trong kho dữ liệu (data warehouse)?
Câu 41: Xác định hệ thống mà kho dữ liệu (data warehouse) chủ yếu được sử dụng.
A. Khai thác dữ liệu và lưu trữ dữ liệu
B. Tích hợp dữ liệu và lưu trữ dữ liệu
C. Báo cáo và phân tích dữ liệu
D. Làm sạch dữ liệu và lưu trữ dữ liệu
Câu 42: Xác định mô hình tính toán và hệ thống runtime mục đích chung cho Phân tích Dữ liệu Phân tán.
D. Tất cả các đáp án trên
Câu 43: Định nghĩa chính xác của dữ liệu hòa giải (Reconciled Data) là gì?
A. Dữ liệu được lưu trữ trong một hệ thống vận hành trong tổ chức.
B. Dữ liệu được chọn và định dạng để hỗ trợ các ứng dụng người dùng cuối.
C. Dữ liệu hiện tại được dự định là nguồn duy nhất cho tất cả các hệ thống hỗ trợ quyết định.
D. Không có đáp án nào đúng.
Câu 44: Xác định các yếu tố cần cân nhắc trước khi đầu tư vào khai thác dữ liệu.
A. Xem xét nhà cung cấp (Vendor consideration)
B. Chức năng (Functionality)
C. Tính tương thích (Compatibility)
D. Tất cả các đáp án trên
Câu 45: Xác định các đặc điểm khác nhau của Phân tích Dữ liệu Lớn (Big Data Analytics).
A. Mã nguồn mở (Open-source)
B. Khôi phục dữ liệu (Data recovery)
C. Khả năng mở rộng (Scalability)
D. Tất cả các đáp án trên
Câu 46: Xác định công nghệ Big Data không chính xác.
Câu 47: Xác định tác nhân thay đổi dữ liệu phổ biến nhất trong việc làm mới kho dữ liệu (data warehouse).
B. Cooperative change data
Câu 48: Xác định node nào hoạt động như một node kiểm tra trong HDFS.
Câu 49: Big Data thường được đặc trưng bởi các thuộc tính nào?
A. Volume, Variety, Velocity
B. Volume, Veracity, Value
D. Không có đáp án nào đúng
Câu 50: Công cụ nào sau đây không được sử dụng để xử lý Big Data?