
BỘ CÂU HỎI ÔN TẬP MÔN DATA MINING
Câu 1: Data Mining được định nghĩa là gì ?
a. Là một quy trình tìm kiếm, phát hiện các tri thức mới, tiềm ẩn, hữu dụng trong cơ sở
dữ liệu lớn
b. Khai phá dữ liệu
c. Khai khoáng dữ liệu
d. Tìm kiếm thông tin trên Internet
Câu 2: Thuật ngữ Data Mining dịch ra tiếng Việt có nghĩa là:
a. Khai phá dữ liệu hoặc Khai thác dữ liệu
b. Khai phá luật kết hợp
c. Khai phá tập mục thường xuyên
d. Khai phá tri thức từ dữ liệu lớn
Câu 3: Thuật ngữ Knowledge Discovery from Databases – KDD có nghĩa là:
a. Trích chọn các mẫu hoặc tri thức hấp dẫn (không tầm thường, ẩn, chưa biết và hữu
dụng tiềm năng) từ tập dữ liệu lớn
b. Khai phá dữ liệu
c. Khai thác dữ liệu
d. Tìm kiếm dữ liệu
Câu 4: Phát biểu nào sau đây là đúng ?
a. Data Mining là một bước trong quá trình khai phá tri thức-KDD
b. Thuật ngữ Data Mining đồng nghĩa với thuật ngữ Knowledge Discovery from
Databases
c. Data Mining là quá trình tìm kiếm thông tin có ích trên Internet
d. Tiền xử lí dữ liệu là qua trình tìm kiếm thông tin có ích từ cơ sở dữ liệu lớn
Câu 5: Hiện nay, Data Mining đã được ứng dụng trong:
a. Hệ quản trị CSDL SQL Server
b. Hệ quản trị CSDL Access
c. Hệ quản trị CSDL Foxpro
d. Microsoft Word 2010
Câu 6: Thuật ngữ Tiền xử lí dữ liệu bằng tiếng Anh là:
a. Data Preprocessing
Khoa CNTT – Data Mining 1

b. Data Processing
c. Preprocessing in Database
d. Data Process
Câu 7: Cho CSDL Giao tác như hình vẽ,
Số lượng giao dịch trong cơ sở dữ liệu là:
a. 5
b. 16
c. 6
d. 10
Câu 8: Cho CSDL giao dịch như hình vẽ,
Độ hỗ trợ của tập mục X={A, M} là:
a. 3 (60%)
b. 4 (80%)
c. 5 (100%)
d. 2 (40%)
Câu 9: Thuật toán Apriori có nhược điểm chính là:
a. Tốn nhiều bộ nhớ và thời gian. Không thích hợp với các mẫu lớn. Chi phí để duyệt
CSDL nhiều.
b. Không tìm được các tập thường xuyên
c. Kết quả của thuật toán không ứng dụng được trong các bài toán thực tế
d. Thuật toán quá phức tạp, khó hiểu
Khoa CNTT – Data Mining 2

Câu 10: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%).
Tập nào là tập mục thường xuyên thỏa Min_support:
a. {A,C}
b. {D}
c. {A,D}
d. {B, C, D}
Câu 11: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%).
Tập nào không là tập mục thường xuyên:
a. {A,C,D}
b. {A,E}
c. {A, C}
d. {B,E}
Câu 12: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%).
Tập nào không là tập mục thường xuyên:
a. {D}
b. {A,E}
c. {A, C}
d. {B,E}
Câu 13: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%).
Khoa CNTT – Data Mining 3

Sử dụng thuật toán Apriori, sau lần duyệt thứ nhất, tập mục chứa 1-item bị loại bỏ là:
a. {D}
b. {A}
c. {B}
d. {A}, {D}
Câu 14: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%).
Tập nào không là tập mục thường xuyên:
a. {B, D}
b. {A, E}
c. {A, C}
d. {B, E}
Câu 15: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%).
Tập nào là tập mục thường xuyên với độ hỗ trợ là 75%:
a. {B,E}
b. {A,E}
c. {A, C}
d. {B,C}
Câu 16: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%).
Khoa CNTT – Data Mining 4

Tập nào là tập mục thường xuyên với độ hỗ trợ là = 70%
a. Không có tập nào
b. {A, E}
c. {A, C, D}
d. {B, C, D}
Câu 17: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%), Min_Cofidence
= 50%.
Luật kết hợp nào thỏa mãn các điều kiện đã cho:
a. A-->C
b. A-->D
c. A--> E
d. AB-->C
Câu 18: Cho CSDL giao dịch như hình vẽ với Min_Support = 2 (50%), Min_Cofidence
= 50%.
Luật kết hợp nào thỏa mãn các điều kiện đã cho:
a. B-->E
b. A-->D
c. A--> E
d. AB-->C
Khoa CNTT – Data Mining 5