Trang 1
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN ĐỀ THI CUỐI HỌC KỲ I (2023-2024)
KHOA KHOA HỌC MÁY TÍNH MÔN: Nhập môn thị giác máy tính
Mã môn/lớp: CS231.O2x
Thời gian: 75 phút
(Sinh viên được sử dụng tài liệu khi làm bài)
HỌ VÀ TÊN SV: ……………………………………
MSSV: ……………………………………………….
STT: ………………………………………………….
PHÒNG THI:…..………………………………
CÁN BỘ COI THI
CÂU HỎI TỰ LUẬN
Câu 1
a) Ảnh số là gì ? Cho ví dụ ảnh số có kích thước 3x4
Ảnh số là ảnh (độ phân giải, kích thước ảnh) được biểu diễn dưới dạng ma trận số, trong
đó mỗi phần tử (pixel) đại diện cho một giá trị cường độ ánh sáng hoặc màu sắc.
Kích thước 3x4: ma trận 3 dòng 4 cột (hcn cao 3 rộng 4).
b) Thị giác máy tính là gì ?
Thị giác máy tính là lĩnh vực nghiên cứu các phương pháp để máy tính có thể hiểu và
phân tích dữ liệu hình ảnh hoặc video như con người.
c) So sánh sự khác nhau và giống nhau giữa Thị giác của con người và Thị giác máy tính ?
Giống nhau:
Cả hai đều xử lý và phân tích hình ảnh để đưa ra nhận thức.
Khác nhau:
d) nhiều loại đặc trưng ảnh chúng thường được phân thành hai loại đặc trưng thủ
công (còn gọi đặc trưng mức thấp hay hand craft feature) đặc trưng học sâu (còn
gọi deep feature). Anh/chị hãy trình bày tóm tắt cho biết đặc trưng thủ công
đặc trưng học sâu là gì. Liệt kê ít nhất hai tên đặc trưng tương ứng với mỗi loại.
Đặc trưng thủ công (Hand-crafted features):
Trang 2
Là các đặc trưng được thiết kế thủ công dựa trên hiểu biết con người.
Ví dụ: SIFT (Scale-Invariant Feature Transform), HOG (Histogram of Oriented
Gradient).
Đặc trưng học sâu (Deep features):
Là các đặc trưng được trích xuất tự động bởi các mô hình học sâu.
Ví dụ: CNN (Convolutional Neural Network), VGG.
Câu 2
a) Giải thích khái niệm Phân đoạn ảnh (image segmentation)/ phân loại ảnh ?
Là quá trình chia ảnh thành các vùng có đặc tính đồng nhất hoặc nhóm các pixel có ý
nghĩa tương tự nhau, mỗi vùng tương ứng với một đối tượng hoặc phần cụ thể của ảnh.
b) Nêu một ứng dụng của Phân đoạn ảnh trong thực tế.
Ví dụ: Phân đoạn ảnh trong y tế, như xác định vùng khối u trong ảnh MRI hoặc CT.
c) Hãy kể tên ít nhất 3 phương pháp phân đoạn ảnh đã được học ?
 Phân đoạn dựa trên ngưỡng (Threshold-based segmentation).
 Phân đoạn dựa trên cạnh (Edge-based segmentation).
 Clustering-based segmentation (như K-means, Fuzzy Clustering).
Câu 3
a) Hãy liệt kê một số phương pháp dò tìm cạnh (edge) trong ảnh
đã được học?
Sobel: Sử dụng các toán tử gradient để phát hiện cạnh theo
phương ngang hoặc dọc.
Prewitt: Tương tự Sobel nhưng với nhân tích chập khác.
Canny: Phương pháp phát hiện cạnh tiên tiến, bao gồm
làm mịn, tính gradient và áp dụng ngưỡng kép.
b) Áp dụng phương pháp Sobel với kích thước của nhân ch
chập S là 3x3 để dò tìm các cạnh thẳng đứng có trong ảnh I
như trong hình bên. Anh/chị hãy:
- Cho biết các giá trị của nhân tích chập S tương ứng.
S = [[-1, 0, 1],
[-2, 0, 2],
[-1, 0, 1]]
-Xác định ma trận ảnh kết quả G sau khi tính tích chập
giữa ảnh I S. (Lưu ý: các vị trí biên trong ảnh kết
quả G sẽ không tính được gán 0; Sinh viên phải
ghi ra cách tính cho từng giá trị kết quả).
0 1 2 3
0210 220 10 10
1210 180 30 20
2220 250 60 50
3206 50 20 90
4250 30 20 60
Trang 3
Trang 4
-Từ ma trận kết quả được xác định, hãy chọn giá trị ngưỡng T tương ứng và xác định
những điểm ảnh nào trong ảnh G là cạnh (sẽ được gán giá trị 1) và những điểm ảnh
nào không phải cạnh (sẽ được gán giá trị 0).
Quy tắc:
Nếu G[i,j]T|G[i,j]| \geq TG[i,j]≥T: cnh (n g tr1).
Nếu G[i,j]<T|G[i,j]| < TG[i,j]<T: Không phải cạnh (n giá trị 0).
Nếu muốn giữ biên mạnh và một số biên yếu: Chọn T=500.
Nếu muốn loại bỏ nhiễu và chỉ giữ biên mạnh: Chọn T=600.
Nếu chỉ quan tâm đến biên mạnh nhất: Chọn T=700.
Kết luận:
Với ma trận G này, ngưỡng T=600 một lựa chọn hợp để giữ lại các giá trị đại diện cho biên mạnh,
đồng thời loại bỏ nhiễu và các biên yếu.
Trang 5
Câu 4 (2 điểm) (CLO1, CLO2) ?
Một trong những phương pháp để dò tìm các điểm interest points là sử dụng Harris
detector. Hãy giải thích vì sao Harris detector không bất biến với phép biến đổi tỉ lệ ?
và cho biết ý tưởng chính để giải quyết hạn chế này như thế nào?
Harris Detector không bất biến với biến đổi tỉ lệ: vì nó sử dụng cửa sổ cố định để tính
gradient, không thay đổi kích thước khi ảnh phóng to hoặc thu nhỏ mà việc tính ma
trận gradient phụ thuộc vào kích thước của các điểm ảnh, khiến các giá trị thay đổi khi
ảnh được thu phóng.
Giải pháp: Sử dụng Gaussian Scale-Space để phát hiện các điểm đặc trưng ở nhiều mức tỉ
lệ.
Hoặc
Ý tưởng giải quyết: Sử dụng các đặc trưng bất biến như SIFT để đảm bảo tính bất biến với tỉ lệ.
Câu 5
Cho biết Input và Ouput của các bài toán trong thị giác máy tính:
Bài toán Input Output
classification
-Dataset: tập hợp các hình ảnh dữ
liệu.
-Hình ảnh/ các hình ảnh mới cần
được xử lí.
Nhãn tương ứng với ảnh cần xử lí.
(class)
object detection
-Dataset: tập hợp các hình ảnh dữ
liệu.
-Hình ảnh/ các hình ảnh mới cần
được xử lí.
Vị trí và nhãn đối tượng. (bounding
box with class)
Câu 6
Cho biết kết quả phân loại ảnh của một mô hình M trên tập đánh giá (test) như sau:
Số lượng
ảnh
Tên lớp (class) đã biết trước
(ground truth)
Mô hình dự đoán (predict)
25 Cat Cat
10 Cat Dog