
1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Thị Hương
GIẢI PHÁP RANKCOMPETE PHÂN CỤM
VÀ XẾP HẠNG LẠI TRONG META-TÌM KIẾM ẢNH
VÀ CÀI ĐẶT THỬ NGHIỆM
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành:Công nghệ thông tin
HÀ NỘI - 2011

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Thị Hương
GIẢI PHÁP RANKCOMPETE PHÂN CỤM
VÀ XẾP HẠNG LẠI TRONG META-TÌM KIẾM ẢNH
VÀ CÀI ĐẶT THỬ NGHIỆM
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành:Công Nghệ Thông Tin
Cán bộ hướng dẫn:PGS.TS. Hà Quang Thụy
Cán bộ đồng hướng dẫn:ThS. Nguyễn Cm Tú
HÀ NỘI - 2011

Lời cảm ơn
Trước tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới Phó Giáo sư Tiến
sĩ Hà Quang Thụy và Thạc sĩ Nguyễn CNm Tú, người đã tận tình chỉ bảo và hướng dẫn tôi
trong suốt quá trình thực hiện khoá luận tốt nghiệp.
Tôi chân thành cảm ơn các thầy, cô đã tạo những điều kiện thuận lợi cho tôi học tập
và nghiên cứu tại trường Đại học Công nghệ. Xin cảm ơn sự hỗ trợ từ đề tài QG.10.38
trong thời gian tôi thực hiện khóa luận.
Tôi cũng xin gửi lời cảm ơn tới các anh chị và các bạn sinh viên trong nhóm “Khai
phá dữ liệu” đã giúp tôi rất nhiều trong việc hỗ trợ kiến thức chuyên môn để hoàn thành
tốt khoá luận.
Cuối cùng, tôi muốn gửi lời cảm vô hạn tới gia đình và bạn bè, những người thân
yêu luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp.
Tôi xin chân thành cảm ơn!
Sinh viên
Nguyễn Thị Hương

Tóm tắt
Sự phát triển mạnh mẽ của công nghệ ảnh số khiến lượng ảnh được sử dụng và lưu
trữ trên Web tăng lên một cách nhanh chóng, tạo nguồn ảnh phong phú đáp ứng nhu cầu
của người sử dụng. Mặc dù sự ra đời của các máy tìm kiếm ảnh đã thỏa mãn phần nào
nhu cầu tìm kiếm ảnh, song nâng cao chất lượng tìm kiếm luôn là vấn đề thời sự. Vì vậy,
các bài toán cốt lõi của các máy tìm kiếm ảnh như phân cụm hay xếp hạng ảnh đã và đang
nhận được sự chú ý đặc biệt.
Đầu tiên, khóa luận khảo sát các thuật toán phân cụm và tính hạng ảnh, đặc biệt là
RankCompete [8] và Co-reranking [27]dựa trên độ tương đồng giữa các ảnh được tính
theo các đặc trưng vùng văn bản xung quanh ảnh hay nội dung hiển thị. Tiếp theo đó,
khóa luận đề xuất một mô hình hệ thống tìm kiếm ảnh lớp trên (image meta-search
engine) trong đó sử dụng thuật toán RankCompete tích hợp thêm thuật toán Co-reranking
làm thành phần phân cụm và xếp hạng ảnh. Máy tìm kiếm ảnh lớp trên này sử dụng một
cơ sở dữ liệu lưu trữ các câu truy vấn và các ảnh tương ứng với chúng như một giải pháp
nhằm rút ngắn thời gian phản hồi yêu cầu truy vấn.
Thực nghiệm do khóa luận tiến hành bước đầu đã thu được những kết quả tương đối
khả quan, độ đo F1 của hệ thống khi áp dụng thuật toán với đặc trưng văn bản và đặc
trưng hiển thị đạt trung bình 81.55% đã khẳng định tính khả thi của mô hình cho xây
dựng một máy tìm kiếm ảnh lớp trên trong thực tế.

Lời cam đoan
Khóa luận được hoàn thành trong thời gian tôi làm Sinh viên tại Bộ môn Các hệ
thống thông tin, Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, Đại học Quốc
gia Hà Nội.
Tôi xin cam đoan khóa luận “Giải pháp RankCompete phân cụm và xếp hạng lại
trong meta-tìm kiếm ảnh và cài đặt thử nghiệm" là công trình nghiên cứu của bản
thân. Các số liệu, kết quả được trình bày trong khóa luận là hoàn toàn trung thực và chưa
từng được công bố trong bất kỳ một công trình nào khác.
Hà Nội, ngày 20 tháng 05 năm 2011
Tác giả
Nguyễn Thị Hương

