Đề Thi Trắc nghiệm Dữ liệu lớn Big Data HUBT có đáp án Tổng hợp Đề Thi môn Big Data tại HUBT (Đại Học Kinh Doanh Và Công Nghệ Hà Nội) - Miễn Phí, kèm theo đáp án chi tiết. Đây là tài liệu hữu ích giúp sinh viên nắm vững kiến thức về Big Data, công nghệ phân tích dữ liệu lớn, hỗ trợ học tập và chuẩn bị tốt nhất cho kỳ thi. Nội dung đề thi được biên soạn sát với chương trình đào tạo tại HUBT, mang tính ứng dụng cao.
Từ khoá: Đề Thi Big Data HUBT Đại Học Kinh Doanh Và Công Nghệ Hà Nội Đề Thi Online Miễn Phí Đáp Án Đề Thi Big Data Ôn Thi Big Data HUBT Tài Liệu Ôn Tập Big Data Đề Thi Có Đáp Án Công Nghệ Phân Tích Dữ Liệu HUBT Ngân Hàng Đề Thi HUBT Ôn Tập Hiệu Quả Big Data
Mã đề 1 Mã đề 2 Mã đề 3
Bạn chưa làm Mã đề 1!
Bắt đầu làm Mã đề 1
Câu 1: Đâu là phân tích chuẩn đoán ?
A. Mô tả tương quan dữ liệu
B. Cung cấp cái nhìn sâu sắc về vấn đề
C. Phân tích sự bất thường từ dữ liệu lưu trữ
D. Mô hình hóa dữ liệu theo điều kiện
Câu 2: Kiến trúc Hadoop hỗ trợ những ngôn ngữ nào ?
Câu 3: CSDL nào không phải kiểu Document:
Câu 4: Vấn đề chính gặp phải khi đọc và ghi dữ liệu song song từ nhiều đĩa là gì?
A. Xử lý khối lượng lớn dữ liệu nhanh hơn.
B. Kết hợp dữ liệu từ nhiều đĩa.
C. Phần mềm cần thiết để thực hiện nhiệm vụ này là cực kỳ tốn kém.
D. Phần cứng cần thiết để thực hiện tác vụ này là cực kỳ tốn kém.
Câu 5: Yếu tố giới hạn hiện tại đối với kích thước của một cụm hadoop là
A. Giới hạn trên của RAM trong NameNode
B. Giới hạn trên của băng thông mạng
C. Nhiệt lượng dư thừa tạo ra trong trung tâm dữ liệu
Câu 6: Đám mây Microsoft Azure cung cấp dịch vụ NoSQL Database
Câu 7: CSDL nào không phải kiểu Graph:
Câu 8: Các dạng thức khoa học dữ liệu của Jim Gray?
Câu 9: So với RDBMS, Hadoop
A. Có tính toàn vẹn dữ liệu cao hơn.
B. Có giao dịch ACID không
C. Thích hợp để đọc và truy vấn nhanh
D. Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc.
Câu 10: Loại phân tích dữ liệu nào kết quả thu được cho ta biết làm thế nào để nó xảy ra ?
A. Phân tích đề xuất
B. Phân tích chuẩn đoán
Câu 11: Nhược điểm của tích hợp dữ liệu theo phương pháp Tight Coupling
B. Phản hồi truy vấn
C. Phụ thuộc vào nguồn dữ liệu
Câu 12: Apache Kafka là nền tảng mở được phát triển bởi ?
Câu 13: Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu
Câu 14: Dịch vụ tích hợp dữ liệu trên đám mây trên Google Cloud Platform
B. Google Cloud Data Fusion
Câu 15: Đâu không phải là RDBMS ?
Câu 16: Mô hình MapReduce có thể chạy trên số lượng máy chủ
D. Một máy chủ Master
Câu 17: Hoạt động của Map Reduce bao gồm:
A. Trộn & sắp xếp-Map-Reduce
B. Reduce- Map- Trộn & sắp xếp
C. Map- Trộn & sắp xếp Reduce
D. Sắp xếp- Trộn & Map Reduce
Câu 18: Thành phần không thuộc Hadoop
Câu 19: Thị trường Big Data bao gồm:
Câu 20: Đâu là một kiểu của CSDL NoSQL
Câu 21: Dữ liệu của Big Data là loại nào ?
Câu 22: Chọn đúng 5 đặc trưng cho Big Data ?
A. Volume, Velocity, Variety, Veracity, Value
B. Volume, Videos, Velocity, Variability, Value
C. Volume, Variability, Veracity, Visualization, Value
D. Volume, Velocity, Veracity, Visualization, Value
Câu 23: Hệ quản trị CSLD DynamoDB là kiểu nào ?
Câu 24: CSDL nào không phải kiểu Wide-Column:
Câu 25: Mô hình MapReduce Thuộc lớp nào ?
A. Lớp lưu trữ dữ liệu
B. Lớp xử lý dữ liệu
C. Lớp thu thập dữ liệu
D. Lớp phân tích dữ liệu
Câu 26: Tích hợp dữ liệu là quá trình ?
A. Kết hợp các dữ liệu không đồng nhất từ nhiều nguồn khác nhau
B. Sao chép dữ liệu vào CSDL hệ thống để tiến hành phân tích
C. Làm sạch các dữ liệu thu thập được từ các hệ thống thành phần
D. Tăng giá trị từ các tài nguyên dữ liệu đang lưu trữ phân tán
Câu 28: Các tệp HDFS được thiết kế cho
A. Nhiều người viết và sửa đổi ở các hiệu số tùy ý.
B. Chỉ nối vào cuối tệp.
C. Chỉ ghi thành tệp một lần.
D. Truy cập dữ liệu có độ trễ thấp.
Câu 29: Ưu điểm của công nghệ Cluster
D. Khả năng mở rộng linh hoạt
Câu 30: Lợi ích từ phân tích dữ liệu lớn là ?
A. Cải tiến theo định hướng dữ liệu cho thị trường
B. Ra quyết định nhanh hơn, tốt hơn
C. Giảm chi phí và tăng hiệu quả hoạt động
Câu 31: Khó khăn khi đọc và ghi dữ liệu song song từ nhiều nguồn là gì?
A. Xử lý khối lượng lớn dữ liệu nhanh hơn
B. Phần cứng cần thiết để thực hiện tác vụ này là cực kỳ tốn kém
C. Phần mềm cần thiết kế để thực hiện nhiệm vụ này là cực kỳ tốn kém
D. Kết hợp dữ liệu từ nhiều nguồn
Câu 32: Mô hình Điện toán đám mây SaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Câu 33: Loại nào không phải là CSDL NoSQL ?
Câu 34: Apache Kafka là công cụ hỗ trợ ?
A. Thu thập dữ liệu
Câu 35: Lợi ích của Cloud Computing với Big Data là ?
A. Triển khai hạ tầng nhanh chóng
B. Phân tích theo thời gian thực
C. Tối ưu chi phí duy trì hoạt động
Câu 36: Ưu điểm của DFS là gì ?
A. Hệ thống lưu trữ song song nên tránh được ảnh hưởng khi một máy chủ hoặc bộ nhớ bị lỗi
B. Hệ thống được sao lưu tại Server thứ hai nên đảm bảo việc cung cấp dữ liệu
C. Khi một máy chủ hoặc bộ nhớ bị lỗi, hệ thống tệp phân tán vẫn đảm bảo có thể cung cấp dữ liệu ổn định
Câu 37: Mô hình chính dành cho điện toán đám mây ?
A. Cơ sở hạ tầng dưới dạng dịch vụ (IaaS)
B. Nền tảng dưới dạng dịch vụ (PaaS)
D. Phần mềm dưới dạng dich vụ (SaaS)
Câu 38: Dịch vụ lưu trữ của Google Cloud Platfom là?
D. Google Cloud Datastore
Câu 39: Điều nào sau đây đúng đối với Hadoop?
A. Đây là một khung phân tán.
B. Thuật toán chính được sử dụng trong đó là Map Reduce.
C. Nó chạy có thể thực thi trên hạ tầng Cloud Computing.
Câu 40: So với RDBMS,Hadoop
A. Có tính toàn vẹn dữ liêu cao hơn.
B. Có giao dich ACID không
C. Thích hợp để đọc và truy vấn nhanh
D. Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc