Đề Thi Ôn Luyện Big Data Mở Rộng - Đại Học Bách Khoa Hà Nội Miễn Phí, Có Đáp Án

Bạn đang tìm kiếm đề thi ôn luyện Big Data mở rộng từ Đại Học Bách Khoa Hà Nội? Tại đây, chúng tôi cung cấp tài liệu ôn tập chuyên sâu và đề thi Big Data mở rộng với đầy đủ đáp án chi tiết, hoàn toàn miễn phí. Bộ tài liệu giúp sinh viên nắm vững kiến thức từ cơ bản đến nâng cao về Big Data, từ xử lý dữ liệu lớn, phân tích dữ liệu đến các thuật toán phức tạp. Đây là tài liệu lý tưởng để ôn luyện và làm quen với cấu trúc đề thi mở rộng. Phù hợp cho sinh viên ngành Công nghệ Thông tin và những người muốn nâng cao kiến thức về Big Data. Tải ngay để chuẩn bị tốt nhất cho kỳ thi sắp tới.

Từ khoá: đề thi Big Data mở rộngôn luyện Big Data mở rộngtài liệu Big Data Đại Học Bách Khoađề thi Big Data có đáp ántài liệu ôn tập Big Data miễn phíBig Data mở rộng Bách Khoahọc Big Data mở rộngôn thi Big Data mở rộng Bách Khoaxử lý dữ liệu lớn mở rộngđề thi Big Data mở rộng kèm đáp án

Số câu hỏi: 26 câuSố mã đề: 1 đềThời gian: 1 giờ

92,319 lượt xem 7,090 lượt làm bài

Xem trước nội dung

Câu 1: 1 điểm

Trong hệ sinh thái của Spark không có công cụ hay thành phần nào sau đây:

MLib

GraphX

Sqoop

Cluster Managers

Câu 2: 1 điểm

Spark Streaming trừu tượng hóa cũng như thao tác với các dòng dữ liệu (data stream) dựa trên khái niệm nào:

shared variable

RDD

DStream

DataFrame

Câu 3: 1 điểm

Spark hỗ trợ các cluster manager nào

Standalone Cluster manager

MESOS

YARN

tất cả đáp án trên

Câu 4: 1 điểm

Đáp án nào không phải là một “output operation ” khi thao tác với DStream

saveAsTextFile

foreachRDD

saveasHadoopFile

reduceByKeyAndWindow

Câu 5: 1 điểm

Đáp án nào không phải là một “Transformation” khi thao tác với DStream

reduceByWindow

window

foreachWindow

countByWindow

Câu 6: 1 điểm

Mục đích của sử dụng sparkML là gì ?

chạy MapReduce

chạy các thuật toán dự đoán

tính toán phân toán

cả b và c

Câu 7: 1 điểm

dữ liệu đầu vào được gán là feature và dự đoán được gán vào label

dữ liệu đầu vào được gán là label và kết quả của dữ liệu đầu vào đó được gán vào feature

dữ liệu đầu vào được gán là feature và kết quả của dữ liệu đầu vào được gán

vào label

dữ liệu đầu vào được gán là label và kết quả dự đoán được gán vào feature

Câu 8: 1 điểm

Đâu là lệnh lưu trữ dữ liệu ra ngoài chương trình Spark:

input.saveAsTextFile(‘file:///usr/momoinu/mon_loz/hihi.txt’)

input.saveAsTextFile(‘/usr/momoinu/mon_loz/hihi.txt’)

input.saveAs (‘file:///usr/momoinu/mon_loz/hihi.txt’)

input.saveAsTextFile: ‘file:///usr/momoinu/mon_loz/hihi.txt’

Câu 9: 1 điểm

Đâu là cách submit đúng 1 job lên Spark cluster hoặc chế độ local

./spark-submit wordcount.py README.md

./spark-submit README.md wordcount.py

spark-submit README.md wordcount.py

phương án a và c

Câu 10: 1 điểm

Câu lệnh MapReduce trong Spark dưới đây, chia mỗi dòng thành từ dựa vào

delimiter nào : input.flatMap( lambda x: x.split(“\t”) ).map(lambda x: (x, 1)).reduceByKey(add)

Tab

Dấu cách

Dấu hai chấm

Dấu phẩy

Câu 11: 1 điểm

Cơ chế chịu lỗi của datanode trong HDFS

dử dụng ZooKeeper để quản lý các thành viên datanode trong cụm

sử dụng cơ chế heartbeat, định kỳ các datanode thông báo về trạng thái cho Namenode

sử dụng cơ chế heartbeat, Namenode định kỳ hỏi các datanode về trạng thái tồn tại của datanode

Câu 12: 1 điểm

Cơ chế tổ chức dữ liệu của Datanode trong HDFS

các chunk là các tệp tin trong hệ thống tệp tin cục bộ của máy chủ datanode

các chunk là các vùng dữ liệu liên tục trên ổ cứng của máy chủ data node

các chunk được lưu trữ tin cậy trên datanode theo cơ chế RAID

Câu 13: 1 điểm

Bản chất DStream:

là một chuỗi liên tục RDD

Là một chuỗi liên tục DataFrame

Là một chuỗi liên tục DataSet

ko có đáp án đúng

Câu 14: 1 điểm

Đầu vào dữ liệu cho chương trình Spark có thể là:

Local file

HDFS, NFS

Amazon S3, Elasticsearch

Cả 3 phương án trên

Câu 15: 1 điểm

Đâu là lệnh lưu dữ liệu ra ngoài chương trình Spark:

input.saveAsTextFile('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile('/usr/zeppelin/notebook/dataset/new.txt')

input.saveAs('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile:'file:///usr/zeppelin/notebook/dataset/new.txt'

Câu 16: 1 điểm

Đâu là cách submit đúng một job lên Spark cluster hoặc chế độ local:

./spark-submit wordcount.py README.md

./spark-submit README.md wordcount.py

spark-submit README.md wordcount.py

Phương án A và C

Câu 17: 1 điểmchọn nhiều đáp án

Data Pipeline nào sau đây là đúng trên Spark

Spark -> RabbitMQ -> Elasticsearch -> Hiển thị

Dữ liệu sensor -> RabbitMQ -> Elasticsearch -> Spark ->Hiển thị

Dữ liệu sensor -> Elasticserach -> RabbitMQ -> Spark ->Hiển thị

Spark -> Elasticsearch ->Hiển thị (đ biết có đúng ko)

Câu 18: 1 điểm

Mục đích của sử dụng RabbitMQ là gì?

Lưu trữ dữ liệu

Tránh dữ liệu bị mất mát

Hiển thị dữ liệu

Phân tích dữ liệu

Câu 19: 1 điểm

Spark có thể chạy ở chế độ nào khi chạy trên nhiều máy?

Chạy trên YARN

Chạy trên ZooKeeper

Phương án A và B đều sai

Cả 2 phương án A và B

Câu 20: 1 điểm

Mục đích của sử dụng Spark ML là gì?

Chạy MapReduce

Chạy các thuật toán dự đoán

Tính toán phân tán

Cả B and C

Câu 21: 1 điểm

Cái nào trong số này cung cấp hệ thống xử lý Luồng được sử dụng trong hệ

sinh thái Hadoop?

Solr

Tez

Spark

D – Hive

Câu 22: 1 điểm

Chế độ nào sau đây không phải là chế độ hoạt động của Hadoop?

Pseudo distributed mode

Globally distributed mode

Stand alone mode

Fully-Distributed mode

Câu 23: 1 điểm

Chọn phát biểu đúng khi nói về MongoDB

MongoDB có các trình điều khiển driver cho nhiều ngôn ngữ lập trình khác nhau.

các văn bản có thể chứa nhiều cặp key-value hoặc key-array, hoặc các văn bản lồng (nested documents)

tất cả các phương án trên

MongoDB hay các NoSQL có khả năng khả mở tốt hơn các CSDL quan hệ truyền thống

Câu 24: 1 điểm

Công cụ Hadoop được sử dụng để phân tán dữ liệu một cách đồng nhất trên các DataNode được đặt tên là:

Scheduler

Balancer

Spreader

Reporter

Câu 25: 1 điểm

Thuộc tính được sử dụng để đặt hệ thống tệp mặc định cho Hadoop trong

core-site.xml là

filesystem.default

fs.default

fs.defaultFS

hdfs.default

Câu 26: 1 điểm

Tùy chọn nào trong số này không phải là tùy chọn lập lịch có sẵn với YARN?

Optimal Scheduler

FIFO scheduler

Capacity scheduler

Fair scheduler

Đề thi tương tự

Đề Thi Ôn Luyện Kinh Tế Vĩ Mô Chương 2 - Phần 2 Có Đáp Án

1 mã đề 50 câu hỏi

Đề Thi Ôn Luyện Môn Luật Kinh Tế (2) EPU Đại Học Điện Lực - Miễn Phí Có Đáp Án

1 mã đề 30 câu hỏi

Đề Thi Ôn Luyện Lịch Sử Đảng - Đại Học Vinh VINHUNI

2 mã đề 80 câu hỏi

Đề Thi Ôn Luyện Môn Bảng Tính Điện Tử Excel - HUBT Có Đáp Án

3 mã đề 109 câu hỏi

Đề Thi Ôn Luyện Môn An Toàn Điện EPU Đại Học Điện Lực - Miễn Phí Có Đáp Án

3 mã đề 106 câu hỏi

LetQA - Website ôn thi trắc nghiệm online

Về chúng tôi

LetQA là website ôn thi trắc nghiệm trực tuyến - công cụ hỗ trợ học sinh, sinh viên, giáo viên, cơ sở đào tạo trong việc ôn luyện, kiểm tra kiến thức online thông qua làm đề thi trắc nghệm.
LetQA KHÔNG cung cấp dịch vụ mạng xã hội.

Thông tin liên hệ & hỗ trợ

Đơn vị chủ quản, phát triển và vận hành: Công ty Cổ phần Metis

Địa chỉ liên hệ: Tầng 5, số 202 đường Mỹ Đình, Phường Từ Liêm, Thành phố Hà Nội, Việt Nam

Số giấy chứng nhận ĐKKD: 0109293202 cấp ngày 03/08/2020 tại Sở Kế hoạch và Đầu tư thành phố Hà Nội

Hotline: 0566.685.688

Email: hotro@letqa.vn

Facebook: LetQA (fb.com/letqavn)

Website liên kết

Phần mềm kiểm tra trùng lặp đạo văn Kiểm Tra Tài Liệu

Phần mềm xuất bản tạp chí điện tử VOJS

Công cụ hỗ trợ trích dẫn và phân tích khoa học Scholar Hub

Hệ thống Cơ sở Dữ liệu Khoa học & Công nghệ Scibase