BM-003
Trang 1 / 6
TRƯỜNG ĐẠI HC VĂN LANG
ĐƠN V: Khoa CNTT
ĐỀ THI VÀ ĐÁP ÁN
THI KT THÚC HC PHN
Hc k 2, năm học 2023-2024
I. Thông tin chung
Tên hc phn:
Nhp môn Phân tích D liuHc sâu
Mã hc phn:
71ITDS30203
S tin ch:
3
Mã nhóm lp hc phn:
Hình thc thi: Trc nghim kết hp T lun
Thi gian làm bài:
60
Thí sinh đưc tham kho tài liu:
Không
Gi ý:
- SV gõ trc tiếp trên khung tr li ca h thng thi;
II. Các yêu cu của đề thi nhằm đáp ứng CLO
hiu
CLO
Ni dung CLO
Hình
thc
đánh giá
Trng s CLO
trong thành phn
đánh giá (%)
Câu
hi
thi s
Đim
s
ti đa
Ly d
liu đo
ng
mc đt
PLO/PI
(1)
(2)
(3)
(4)
(5)
(6)
(7)
CLO 1
Hiểu được nn tng
phân tích d liu da
trên các thut toán, quy
trình phát trin ng
dụng (thư viện phn
mm) dùng trong phân
tích d liu bng ngôn
ng lp trình Python
Trc nghim
30%
1-20
3
PLO1/P I1.2
CLO 2
Làm quen vi các khái
niệm bản ca Hc
sâu, hiu biết v các thư
vin và công c s dng
ph biến trong Hc sâu.
T lun
50%
Bài 1,
Bài 2
5
PLO1/P I1.2
CLO 3
kiến thức bản v
quy trình phân tích d
liu, xây dng khai
thác các thư viện và gii
thut trong Học sâu để
gii quyết mt s bài
toán thc tế
Trc nghim
+ T lun
20%
1-20
2
PLO1/P I1.2
BM-003
Trang 2 / 6
III. Ni dung câu hi thi
PHN TRC NGHIM (tng s câu hỏi + thang điểm tng câu hi)
Câu 1: Hàm nào trong NumPy được s dụng để to mng?
A) array()
B) create_array()
C) new_array()
D) make_array()
Câu 2: Phương thức nào trong Pandas được s dụng để đọc tp CSV vào DataFrame?
A) import_csv()
B) load_csv()
C) open_csv()
D) read_csv()
Câu 3: Làm thế nào để tìm giá tr trung bình ca mt mng trong NumPy?
A) mean()
B) average()
C) mean_value()
D) mean_array()
Câu 4: Hàm nào trong Pandas được s dụng để x lý d liu thiếu?
A) remove_na()
B) delete_na()
C) omit_na()
D) dropna()
Câu 5: Làm thế nào để to mt DataFrame t mt t điển trong Pandas?
A) DataFrame.from_dict()
B) DataFrame()
C) DataFrame.from_dictionary()
D) DataFrame.create_from_dict()
Câu 6: Hàm nào được s dụng để ghép hai mng trong NumPy?
A) concatenate()
B) append()
BM-003
Trang 3 / 6
C) merge()
D) combine()
Câu 7: Trc mặc định cho phương thức drop trong Pandas là gì?
A) 0 (hàng)
B) 1 (ct)
C) None
D) 2 (phn t)
Câu 8: Làm thế nào để chn mt ct c th t DataFrame trong Pandas?
A) df.column_name
B) df['column_name']
C) df.select('column_name')
D) df.column('column_name')
Câu 9: Hàm nào được s dụng để to s ngu nhiên trong NumPy?
A) random.rand()
B) rand.random()
C) generate_random()
D) random_generate()
Câu 10: Làm thế nào để tính độ lch chun ca mt ct trong DataFrame trong Pandas?
A) df['column_name'].stdev()
B) df['column_name'].std_dev()
C) df['column_name'].std()
D) df['column_name'].deviation()
Câu 11: Phương thức nào trong Pandas được s dụng để xóa các hàng trùng lp?
A) remove_duplicates()
B) drop_duplicates()
C) delete_duplicates()
D) omit_duplicates()
Câu 12: Hàm nào trong NumPy được s dụng để tính tích chm ca hai mng?
A) dot()
B) multiply()
C) product()
D) dot_product()
BM-003
Trang 4 / 6
Câu 13: Làm thế nào để chuyển đổi mt ct trong DataFrame sang dng datetime trong
Pandas?
A) pd.to_date()
B) pd.to_time()
C) pd.to_datetime()
D) pd.datetime_convert()
Câu 14: Phương thức nào trong Pandas có th được s dụng để đếm s ng giá tr thiếu
trong DataFrame?
A) null_count()
B) missing_values()
C) na_count()
D) isnull().sum()
Câu 15: Làm thế nào để lưu DataFrame vào tệp CSV trong Pandas?
A) to_csv()
B) save_csv()
C) export_csv()
D) write_csv()
Câu 16: Tình hung X lý d liu thiếu: Bn có mt DataFrame df vi nhiu ct cha giá tr
thiếu. Làm thế nào để bn x lý các giá tr thiếu này để chun b d liu cho phân tích?
A) Xóa tt c các hàng có giá tr thiếu.
B) Đin các giá tr thiếu bng giá tr trung bình ca ct.
C) Xóa các ct có giá tr thiếu.
D) Đin các giá tr thiếu bng mt giá tr c định (ví d: 0).
Câu 17: Tình hung Phát hiện điểm ngoi lai (outliers): Bạn được giao mt tp d liu vi
mt ct s salary. Làm thế nào để bn phát hin và xcác điểm ngoi lai trong ct này?
A) Xóa các giá tr lớn hơn một ngưỡng c th.
B) Thay thế các điểm ngoi lai bng giá tr trung bình.
C) S dng Z-score (outlier) để phát hiện các điểm ngoi lai và loi b chúng.
D) B qua các điểm ngoi lai.
Câu 18: Tình hung Chun hóa d liu: Tp d liu ca bn chứa các đặc trưng với các thang
đo khác nhau. Làm thế nào để bn chuẩn hóa các đặc trưng này?
A) Chia cho giá tr nh nht.
BM-003
Trang 5 / 6
B) S dng Min-Max scaling.
C) Tr đi giá trị trung bình và chia cho độ lch chun.
D) Để các đặc trưng như hiện ti.
Câu 19: Tình hung Chia d liu: Bn cn chia tp d liu ca mình thành tp hun luyn và
tp kim tra. Phương thức nào bn s s dng trong Pandas?
A) train_test_split()
B) split_data()
C) divide_data()
D) split_train()
Câu 20: Tình hung K thuật đặc trưng: Bn có mt tp d liu vi ct date dng chui.
Làm thế nào để bn tạo các đặc trưng mới như year, month, và day?
A) Chia ct date theo các du phân cách.
B) S dng biu thức chính quy để trích xuất các đặc trưng.
C) Gi nguyên ct date.
D) Chuyển đổi ct date sang dng datetime và trích xuất các đặc trưng.
PHN T LUN (tng s câu hỏi + thang đim tng câu hi)
Câu hi 1: (2.5 đim)
Cho input là mt ảnh kích thước 4x4 và kernel (b lọc) kích thước 2x2. Tính toán output ca phép
tích chp (convolution) vi stride = 1 và padding = 0.
Câu hi 2: (2.5 đim)
Cho tp kết qu test gm 10 phn t và giá tr thc tế (ground truth) tương ứng. Tính s TP, TN,
FN, FP, recall, precision, và accuracy. Hãy giải thích ý nghĩa của TP, TN, FN, FP.
Predicted: 0 0 1 0 1 1 0 1 1 0
Actual (Ground truth): 0 1 1 0 1 1 1 1 0 1
Lưu ý: Sinh viên s được min thi nếu thc hin tiu lun môn học được đánh giá GIỎI