ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Lê Thị Kim Dung
MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ
BIẾN VÀ ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM
ẢNH LỚP TRÊN THỬ NGHIỆM
KHLUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: ng nghệ thông tin
HÀ NỘI - 2010
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Lê ThKim Dung
MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PH
BIẾN VÀ ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM
ẢNH LỚP TRÊN TH NGHIỆM
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hướng dẫn: PGS.TS Hà Quang Thụy
Cán bộ đồng hướng dẫn: Th.s Nguyễn Cẩm Tú
HÀ NỘI - 2010
Lời cảm ơn
Trước tiên, tôi xin gi lời cảm ơn lòng biết ơn sâu sắc nhất tới P Giáo
Tiến Hà Quang Thy và Thạc Nguyễn Cẩm Tú, người đã tn tình chbảo và
hướng dẫn tôi trong suốt quá trình thực hiện khoá lun tốt nghiệp.
Tôi chân thành cảm ơn c thầy, đã tạo những điều kiện thuận lợi cho tôi hc
tpnghiên cứu tại trường Đại học Công nghệ.
Tôi cũng xin gửi lời cảm ơn tới các anh chvà các bạn sinh viên trong nhóm
“Khai phá d liệuđã giúp i rất nhiu trong việc htrợ kiến thức chuyên môn đ
hoàn thành tốt khoá luận.
Cuối cùng, tôi muốn gửi lời cảm vô hạn tới gia đình và bạn bè, nhng người thân
yêu luôn bên cạnh và động viên tôi trong sut quá trình thc hiện khóa luận tốt nghiệp.
Tôi xin chân thành cảm ơn!
Sinh viên
Lê ThKim Dung
Tóm tắt
Sự ng không ngừng về ợng nh trên Web tạo nguồn ảnh phong phú đáp ứng
được nguồn cung ảnh cho nhu cầu của con ni. Mặc dù một số y tìm kiếm ảnh đã
ra đời đáp ứng phần nào nhu cầu tìm kiếm ảnh, song nâng cao chất lượng tìm kiếm
luôn vấn đề được đặt ra. Bài toán xếp hng ảnh i toán cốt lõi của c máy tìm
kiếm ảnh nâng cao chất lượng xếp hạng ảnh đã đang nhận được s quan tâm
đặc biệt.
Đầu tiên, ka luận khảo sát các thuật toán tính hạng ảnh, đặc biệt là VisualRank
[39] theo độ đo tương đng giữa các ảnh được nh theo các đặc trưng nội dung văn
bản nội dung hiển th. Sau đó, khóa luận đxuất một mô hình hthống tìm kiếm
ảnh lớp trên (image meta-search engine [18] [11]), trong đó sử dụng thuật toán nói trên
làm thành phần xếp hạng ảnh. Hthống tìm kiếm ảnh này sdụng mt sở dữ liệu
lưu trữ các u truy vấn và các ảnh ơng ng với chúng nmột giải pháp nhm rút
ngắn thời gian đáp ứng yêu cầu truy vấn. Đồng thời, hthống sdụng một bộ từ điển
dùng trong việc hỗ trợ các truy vấn dng tiếng Việt.
Thực nghiệm do khóa luận tiến hành ớc đầu đã thu được những kết quả tương
đối khả quan, độ chính xác của hthống khi áp dụng thuật toán với đặc trưng n bản
đặc trưng hiển thị đạt 81.2%. Trong phạm vi các thử nghim của khóa luận, kết qu
y tốt hơn so với hai máy tìm kiếm nh lớn Google và Yahoo đã khẳng định
được tính khả thi của mô hình.
Mc lục
Mở đầu ....................................................................................................................... 1
Chương 1. Khái quát vcác thuật toán tính hạng.................................................... 3
1.1. Giới thiu về bài toán tính hạng ...................................................................... 3
1.2. Tính hạng trang Web ...................................................................................... 4
1.2.1. Tính hạng theo liên kết ............................................................................. 4
1.2.2. Tính hạng định hướng ngữ cảnh ............................................................. 15
1.3. Tính hạng thực thể ........................................................................................ 17
1.4. Sơ bộ về tính hạng ảnh.................................................................................. 18
1.5. Một số công trình nghiên cứu liên quan ........................................................ 20
Tóm tắt chương một ................................................................................................. 22
Chương 2. Mt số thuật toán tính hạng ảnh phổ biến ........................................... 23
2.1. Giới thiu ..................................................................................................... 23
2.2. VisualRank ................................................................................................... 23
2.3. Multiclass VisualRank .................................................................................. 26
2.4. Visual contextRank....................................................................................... 28
2.5. Nhn xét ....................................................................................................... 32
Tóm tắt chương hai .................................................................................................. 32
Chương 3. Mô hình máy tìm kiếm ảnh lớp trên ..................................................... 34
3.1. Kiến trúc chung của máy tìm kiếm lớp trên .................................................. 34
3.1.1. Giao din ngưi dùng ............................................................................. 35
3.1.2. Bộ điều vận ............................................................................................ 35
3.1.3. Bộ x lý kết quả ..................................................................................... 36
3.1.4. đun nh hạng ................................................................................... 36
3.2. Mô hình máy tìm kiếm ảnh lớp trên MetaSEEk ............................................ 37
3.2.1. Truy vấn trc quan dựa trên nội dung ..................................................... 38
3.2.2. Giao din truy vấn .................................................................................. 38
3.2.3. Bộ điều vận ............................................................................................ 40
3.2.4. Thành phần hiển th................................................................................ 42
3.2.5. Đánh giá................................................................................................. 43
3.3. Xếp hạng ảnh trongy tìm kiếm ảnh lớp trên............................................. 43
Tóm tắt chương ba ................................................................................................... 45