Đề Thi Data Mining - Khai phá dữ liệu - HUBT có đáp án
Từ khoá: đề thi Data Mining HUBT Đại học Kinh doanh và Công nghệ Hà Nội miễn phí có đáp án ôn thi kiểm tra kiến thức khai thác dữ liệu dữ liệu lớn kỳ thi data mining ôn luyện miễn phí
Số câu hỏi: 100 câuSố mã đề: 2 đềThời gian: 1 giờ
66,153 lượt xem 5,079 lượt làm bài
Sử dụng thuật toán liên kết đơn (Single Linkage) để phân cụm tập dữ liệu trên. Anh (chị) hãy cho biết tất cả các phần tử được gom vào 1 cụm ở ngưỡng bằng bao nhiêu?
Sử dụng thuật toán liên kết đầy đủ (Complete Linkage). Bước đầu tiên gom x1 và x2 hình thành cụm C1={x1, x2}; bước 2 ta gom x3 và x4 hình thành cụm C2={x3, x4}. Anh (chị) hãy cho biết bước thứ 3, ta sẽ gom thế nào?
Anh (chị) hãy cho biết nhóm item bị loại bỏ do không thỏa mãn Min_Support là nhóm item nào?
Sau khi loại bỏ các item không thỏa mãn Min_Support, ta xây dựng lại bảng các item chỉ chứa các mục thường xuyên, trong mỗi giao dịch được sắp xếp theo độ giảm dần của độ thường xuyên. Anh (chị) hãy cho biết giao dịch thứ 2 sau khi được sắp xếp là gì?
Anh (chị) hãy cho biết tập nào là tập mục thường xuyên có độ hỗ trợ cao nhất?
Sử dụng thuật toán liên kết đơn (Single Linkage). Bước đầu tiên ta gom x1, x2, vào cụm C1, Anh (chị) hãy cho biết bước thứ 2 ta sẽ gom hai cụm nào với nhau?
Cho tập mẫu :
Cho tập mẫu X = <Quang cảnh=“Nắng”, Nhiệt độ=“Mát”, Độ ẩm=“Cao”, Gió=“Mạnh”> và phương pháp phân lớp theo mô hình xác suất Bayes.
Tập mẫu X được gán vào lớp C1 (Chơi = ‘Không’) với xác suất là bao nhiêu?
2.5 hỏi có mấy cụm được sinh ra ?
Anh (chị) hãy cho biết luật kết hợp nào có độ tin cậy = 100%?
Anh (chị) hãy cho biết cơ sở điều kiện của nút M là gì?
Anh (chị) hãy cho biết tập mục thường xuyên có 4 mục thỏa mãn Min_Supp là tập nào trong các tập mục sau?
Cho C1 gồm các phần tử x1=(1,0,0), x2=(2, 0, 0), x3=(0, 0, 0); C2 gồm các phần tử y1=(0, 2, 1), y2=(3, 4, 0 ).
Anh(chị) hãy cho biết khoảng cách d giữa cụm C1 và C2 có giá trị là gì?
Khoảng cách Ơclit giữa 2 cụm C1, C2 được định nghĩa là khoảng cách bé nhất giữa phần tử x thuộc C1 và y thuộc C2 (x, y bất kỳ).
Cho C1 gồm các phần tử x1=(1,1,0), x2=(2, 0, 0), x3=(0, 0, 0); C2 gồm các phần tử y1=(0, 2, 1), y2=(2, 2, 0 ).
Anh (chị) hãy cho biết khoảng cách d giữa cụm C1 và C2 có giá trị là bao nhiêu?
Nếu sử dụng thuật toán Apriori để tìm các tập mục thường xuyên thì số lần duyệt CSDL là bao nhiêu?
Khoảng cách Ơclit giữa 2 cụm C1, C2 được định nghĩa là khoảng cách giữa các vector đại diện của cụm.
Giả sử vector đại diện của cụm là vector trung bình của cụm.
Cho C1 gồm x1=(1,0), x2=(3,2) ; C2 gồm y1=(3, 2) , y2=(7, 8).
Anh (chị) hãy cho biết khoảng cách d giữa cụm C1 và C2 có giá trị là bao nhiêu ?
2 mã đề 100 câu hỏi
3 mã đề 117 câu hỏi
3 mã đề 117 câu hỏi
3 mã đề 149 câu hỏi

