Đề Thi Trắc nghiệm Dữ liệu lớn Big Data HUBT có đáp án

Tổng hợp Đề Thi môn Big Data tại HUBT (Đại Học Kinh Doanh Và Công Nghệ Hà Nội) - Miễn Phí, kèm theo đáp án chi tiết. Đây là tài liệu hữu ích giúp sinh viên nắm vững kiến thức về Big Data, công nghệ phân tích dữ liệu lớn, hỗ trợ học tập và chuẩn bị tốt nhất cho kỳ thi. Nội dung đề thi được biên soạn sát với chương trình đào tạo tại HUBT, mang tính ứng dụng cao.

Từ khoá: Đề Thi Big Data HUBT Đại Học Kinh Doanh Và Công Nghệ Hà Nội Đề Thi Online Miễn Phí Đáp Án Đề Thi Big Data Ôn Thi Big Data HUBT Tài Liệu Ôn Tập Big Data Đề Thi Có Đáp Án Công Nghệ Phân Tích Dữ Liệu HUBT Ngân Hàng Đề Thi HUBT Ôn Tập Hiệu Quả Big Data

Số câu hỏi: 117 câuSố mã đề: 3 đềThời gian: 1 giờ

69,272 lượt xem 5,358 lượt làm bài


Bạn chưa làm Mã đề 1!

Xem trước nội dung
Câu 1: 0.25 điểm
Đâu là phân tích chuẩn đoán ?
A.  
Mô tả tương quan dữ liệu
B.  
Cung cấp cái nhìn sâu sắc về vấn đề
C.  
Phân tích sự bất thường từ dữ liệu lưu trữ
D.  
Mô hình hóa dữ liệu theo điều kiện
Câu 2: 0.25 điểm
Kiến trúc Hadoop hỗ trợ những ngôn ngữ nào ?
A.  
Tất cả
B.  
Java
C.  
C++
D.  
Python
Câu 3: 0.25 điểm
CSDL nào không phải kiểu Document:
A.  
MongoDB
B.  
CouchDB
C.  
Elasticsearch
D.  
Riak
Câu 4: 0.25 điểm
Vấn đề chính gặp phải khi đọc và ghi dữ liệu song song từ nhiều đĩa là gì?
A.  
Xử lý khối lượng lớn dữ liệu nhanh hơn.
B.  
Kết hợp dữ liệu từ nhiều đĩa.
C.  
Phần mềm cần thiết để thực hiện nhiệm vụ này là cực kỳ tốn kém.
D.  
Phần cứng cần thiết để thực hiện tác vụ này là cực kỳ tốn kém.
Câu 5: 0.25 điểm
Yếu tố giới hạn hiện tại đối với kích thước của một cụm hadoop là
A.  
Giới hạn trên của RAM trong NameNode
B.  
Giới hạn trên của băng thông mạng
C.  
Nhiệt lượng dư thừa tạo ra trong trung tâm dữ liệu
D.  
4000 datanode
Câu 6: 0.25 điểm
Đám mây Microsoft Azure cung cấp dịch vụ NoSQL Database
A.  
Table Storage
B.  
SQL DB
C.  
Azure Functions
D.  
Cloud Service
Câu 7: 0.25 điểm
CSDL nào không phải kiểu Graph:
A.  
InfoGrid
B.  
Hbase
C.  
InfiniteGraph
D.  
IBM Graph
Câu 8: 0.25 điểm
Các dạng thức khoa học dữ liệu của Jim Gray?
A.  
Thực nghiệm
B.  
Lý thuyết
C.  
Tính toán
D.  
Tất cả các ý
Câu 9: 0.25 điểm
So với RDBMS, Hadoop
A.  
Có tính toàn vẹn dữ liệu cao hơn.
B.  
Có giao dịch ACID không
C.  
Thích hợp để đọc và truy vấn nhanh
D.  
Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc.
Câu 10: 0.25 điểm
Loại phân tích dữ liệu nào kết quả thu được cho ta biết làm thế nào để nó xảy ra ?
A.  
Phân tích đề xuất
B.  
Phân tích chuẩn đoán
C.  
Phân tích dự án
D.  
Phân tích mô tả
Câu 11: 0.25 điểm
Nhược điểm của tích hợp dữ liệu theo phương pháp Tight Coupling
A.  
Độ trễ
B.  
Phản hồi truy vấn
C.  
Phụ thuộc vào nguồn dữ liệu
D.  
Tất cả
Câu 12: 0.25 điểm
Apache Kafka là nền tảng mở được phát triển bởi ?
A.  
IBM
B.  
FACEBOOK
C.  
GOOGLE
D.  
Linkedln
Câu 13: 0.25 điểm
Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu
A.  
Google Data Catalog
B.  
Google Cloud Dataprep
C.  
Google Data Catalog
D.  
Google BigQuery
Câu 14: 0.25 điểm
Dịch vụ tích hợp dữ liệu trên đám mây trên Google Cloud Platform
A.  
Google Cloud Dataprep
B.  
Google Cloud Data Fusion
C.  
Google Data Catalog
D.  
Google BigQuery
Câu 15: 0.25 điểm
Đâu không phải là RDBMS ?
A.  
IBM DB2
B.  
MS SQL Server
C.  
MS Access
D.  
Cassandra
Câu 16: 0.25 điểm
Mô hình MapReduce có thể chạy trên số lượng máy chủ
A.  
Vài Máy
B.  
Hàng nghìn máy
C.  
Hàng Trăm máy
D.  
Một máy chủ Master
Câu 17: 0.25 điểm
Hoạt động của Map Reduce bao gồm:
A.  
Trộn & sắp xếp-Map-Reduce
B.  
Reduce- Map- Trộn & sắp xếp
C.  
Map- Trộn & sắp xếp Reduce
D.  
Sắp xếp- Trộn & Map Reduce
Câu 18: 0.25 điểm
Thành phần không thuộc Hadoop
A.  
YANR
B.  
GPS
C.  
MapReduce
D.  
HDFS
Câu 19: 0.25 điểm
Thị trường Big Data bao gồm:
A.  
Phần cứng
B.  
Phần Mềm
C.  
Tất cả
D.  
Dịch vụ
Câu 20: 0.25 điểm
Đâu là một kiểu của CSDL NoSQL
A.  
SQL
B.  
Document databases
C.  
JSON
D.  
Tất cả
Câu 21: 0.25 điểm
Dữ liệu của Big Data là loại nào ?
A.  
Structured Data
B.  
Semi-Structured Data
C.  
Unstructured Data
D.  
Tất cả
Câu 22: 0.25 điểm
Chọn đúng 5 đặc trưng cho Big Data ?
A.  
Volume, Velocity, Variety, Veracity, Value
B.  
Volume, Videos, Velocity, Variability, Value
C.  
Volume, Variability, Veracity, Visualization, Value
D.  
Volume, Velocity, Veracity, Visualization, Value
Câu 23: 0.25 điểm
Hệ quản trị CSLD DynamoDB là kiểu nào ?
A.  
Key value
B.  
Wide Column based
C.  
Document based
D.  
Graph based
Câu 24: 0.25 điểm
CSDL nào không phải kiểu Wide-Column:
A.  
Hbase
B.  
Cassandra
C.  
BigTable
D.  
Dex
Câu 25: 0.25 điểm
Mô hình MapReduce Thuộc lớp nào ?
A.  
Lớp lưu trữ dữ liệu
B.  
Lớp xử lý dữ liệu
C.  
Lớp thu thập dữ liệu
D.  
Lớp phân tích dữ liệu
Câu 26: 0.25 điểm
Tích hợp dữ liệu là quá trình ?
A.  
Kết hợp các dữ liệu không đồng nhất từ nhiều nguồn khác nhau
B.  
Sao chép dữ liệu vào CSDL hệ thống để tiến hành phân tích
C.  
Làm sạch các dữ liệu thu thập được từ các hệ thống thành phần
D.  
Tăng giá trị từ các tài nguyên dữ liệu đang lưu trữ phân tán
Câu 27: 0.25 điểm
NoSQL là ?
A.  
Database
B.  
Field
C.  
Document
D.  
Collection
Câu 28: 0.25 điểm
Các tệp HDFS được thiết kế cho
A.  
Nhiều người viết và sửa đổi ở các hiệu số tùy ý.
B.  
Chỉ nối vào cuối tệp.
C.  
Chỉ ghi thành tệp một lần.
D.  
Truy cập dữ liệu có độ trễ thấp.
Câu 29: 0.25 điểm
Ưu điểm của công nghệ Cluster
A.  
Tất cả
B.  
Hiệu quả chi phí
C.  
TÍnh sẵn sàng cao
D.  
Khả năng mở rộng linh hoạt
Câu 30: 0.25 điểm
Lợi ích từ phân tích dữ liệu lớn là ?
A.  
Cải tiến theo định hướng dữ liệu cho thị trường
B.  
Ra quyết định nhanh hơn, tốt hơn
C.  
Giảm chi phí và tăng hiệu quả hoạt động
D.  
Tất cả
Câu 31: 0.25 điểm
Khó khăn khi đọc và ghi dữ liệu song song từ nhiều nguồn là gì?
A.  
Xử lý khối lượng lớn dữ liệu nhanh hơn
B.  
Phần cứng cần thiết để thực hiện tác vụ này là cực kỳ tốn kém
C.  
Phần mềm cần thiết kế để thực hiện nhiệm vụ này là cực kỳ tốn kém
D.  
Kết hợp dữ liệu từ nhiều nguồn
Câu 32: 0.25 điểm
Mô hình Điện toán đám mây SaaS ?
A.  
Cơ sở hạ tầng dưới dạng dịch vụ
B.  
Nền tảng dưới dạng dịch vụ
C.  
Phần mềm dưới dạng dịch vụ
D.  
Internet dưới dạng dịch vụ
Câu 33: 0.25 điểm
Loại nào không phải là CSDL NoSQL ?
A.  
SQL Server
B.  
MongoDB
C.  
Cassandra
D.  
Không có
Câu 34: 0.25 điểm
Apache Kafka là công cụ hỗ trợ ?
A.  
Thu thập dữ liệu
B.  
Lưu trữ phân tán
C.  
Hệ quản trị CSDL
D.  
Xử lý phân tán
Câu 35: 0.25 điểm
Lợi ích của Cloud Computing với Big Data là ?
A.  
Triển khai hạ tầng nhanh chóng
B.  
Phân tích theo thời gian thực
C.  
Tối ưu chi phí duy trì hoạt động
D.  
Tất cả
Câu 36: 0.25 điểm
Ưu điểm của DFS là gì ?
A.  
Hệ thống lưu trữ song song nên tránh được ảnh hưởng khi một máy chủ hoặc bộ nhớ bị lỗi
B.  
Hệ thống được sao lưu tại Server thứ hai nên đảm bảo việc cung cấp dữ liệu
C.  
Khi một máy chủ hoặc bộ nhớ bị lỗi, hệ thống tệp phân tán vẫn đảm bảo có thể cung cấp dữ liệu ổn định
D.  
Tất cả
Câu 37: 0.25 điểm
Mô hình chính dành cho điện toán đám mây ?
A.  
Cơ sở hạ tầng dưới dạng dịch vụ (IaaS)
B.  
Nền tảng dưới dạng dịch vụ (PaaS)
C.  
Tất cả
D.  
Phần mềm dưới dạng dich vụ (SaaS)
Câu 38: 0.25 điểm
Dịch vụ lưu trữ của Google Cloud Platfom là?
A.  
Google Driver
B.  
Goolge Functions
C.  
Google Cloud Storage
D.  
Google Cloud Datastore
Câu 39: 0.25 điểm
Điều nào sau đây đúng đối với Hadoop?
A.  
Đây là một khung phân tán.
B.  
Thuật toán chính được sử dụng trong đó là Map Reduce.
C.  
Nó chạy có thể thực thi trên hạ tầng Cloud Computing.
D.  
Tất cả đều đúng
Câu 40: 0.25 điểm
So với RDBMS,Hadoop
A.  
Có tính toàn vẹn dữ liêu cao hơn.
B.  
Có giao dich ACID không
C.  
Thích hợp để đọc và truy vấn nhanh
D.  
Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc