trùng.Luận văn Thạc sĩ Khoa học máy tính: Nghiên cứu phát triển hệ thống tra cứu các loài thực vật quý hiếm tại Khu bảo tồn thiên nhiên Na Hang, tỉnh Tuyên Quang
lượt xem 19
download
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: trùng.Luận văn Thạc sĩ Khoa học máy tính: Nghiên cứu phát triển hệ thống tra cứu các loài thực vật quý hiếm tại Khu bảo tồn thiên nhiên Na Hang, tỉnh Tuyên Quang
- ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VŨ THANH BÌNH NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG TRA CỨU CÁC LOÀI THỰC VẬT QUÝ HIẾM TẠI KHU BẢO TỒN THIÊN NHIÊN NA HANG TỈNH TUYÊN QUANG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2019
- ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VŨ THANH BÌNH NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG TRA CỨU CÁC LOÀI THỰC VẬT QUÝ HIẾM TẠI KHU BẢO TỒN THIÊN NHIÊN NA HANG TỈNH TUYÊN QUANG Chuyên ngành: Khoa học máy tính Mã số: 8.48.0101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS. Nguyễn Văn Tảo THÁI NGUYÊN - 2019
- i LỜI CAM ĐOAN Sau quá trình học tập tại Trƣờng Đại học Công nghệ thông tin & Truyền thông, với những kiến thức lý thuyết và thực hành đã tích lũy đƣợc, với việc vận dụng các kiến thức vào thực tế, em đã tự nghiên cứu các tài liệu, các công trình nghiên cứu, tự tìm kiếm dữ liệu hình ảnh trên thực tế, đồng thời phân tích, tổng hợp, đúc kết và phát triển để hoàn thành luận văn thạc sĩ của mình. Em xin cam đoan luận văn này là công trình do bản thân em tự tìm hiểu, nghiên cứu và hoàn thành dƣới sự hƣớng dẫn của thầy giáo, TS. Nguyễn Văn Tảo. Thái Nguyên, tháng năm 2019 Học viên Vũ Thanh Bình
- ii LỜI CẢM ƠN Trong thời gian 2 năm của chƣơng trình đào tạo thạc sĩ, trong đó gần một nửa thời gian dành cho các môn học, thời gian còn lại dành cho việc lựa chọn luận văn, giáo viên hƣớng dẫn, tập trung vào nghiên cứu, viết, chỉnh sửa và hoàn thiện luận văn. Với quỹ thời gian nhƣ vậy và với vị trí công việc đang phải đảm nhận, không riêng bản thân em mà hầu hết các sinh viên cao học muốn hoàn thành tốt luận văn của mình mình trƣớc hết đều phải có sự sắp xếp thời gian hợp lý, có sự tập trung học tập và nghiên cứu với tinh thần nghiêm túc nỗ lực hết mình; tiếp đến là có sự ủng hộ về tinh thần, sự giúp đỡ về chuyên môn - một trong những điều kiện không thể thiếu quyết định đến việc thành công của luận văn. Để hoàn thành đƣợc luận văn này trƣớc tiên em xin gửi lời cảm ơn sâu sắc đến thầy giáo hƣớng dẫn TS. Nguyễn Văn Tảo, là ngƣời đã định hƣớng nội dung, hƣớng phát triển của luận văn và có nhiều ý kiến đóng góp quan trọng ảnh về những vấn đề chuyên môn của luận văn, giúp em tháo gỡ kịp thời những vƣớng mắc trong quá trình làm luận văn. Em cũng xin chân thành cảm ơn các thầy cô giáo Trƣờng Đại học Công nghệ thông tin và Truyền thông và bạn bè cùng lớp đã có những ý kiến bổ ích để luận văn đƣợc hoàn thiện hơn. Xin cảm ơn gia đình, ngƣời thân, đồng nghiệp luôn quan tâm ủng hộ về tinh thần trong suốt thời gian học tập và hoàn thành luận văn. Em xin hứa sẽ cố gắng tự nghiên cứu, nâng cao năng lực chuyên môn của mình để sau khi hoàn thành luận văn này sẽ có hƣớng tập trung nghiên
- iii cứu sâu hơn, tiếp tục hoàn thiện luận văn này để có những ứng dụng thiết thực trong thực tế. Thái Nguyên, tháng năm 2019 Học viên Vũ Thanh Bình
- iv MỤC LỤC LỜI CAM ĐOAN .............................................................................................. i LỜI CẢM ƠN ................................................................................................... ii MỤC LỤC ........................................................................................................ iv DANH SÁCH HÌNH VẼ ................................................................................. vi DANH MỤC CÁC BẢNG............................................................................. viii MỞ ĐẦU ........................................................................................................... 1 1. Đặt vấn đề...................................................................................................... 1 2. Bài toán tra cứu/ nhận dạng thực vật ............................................................ 3 3. Cấu trúc luận văn .......................................................................................... 4 CHƢƠNG 1: MỘT SỐ NGHIÊN CỨU LIÊN QUAN .................................... 6 1.1 Tổng quan về tra cứu ảnh ............................................................................ 6 1.2 Tổng quan về nhận dạng, tra cứu thực vật ................................................ 10 1.3 Một số nghiên cứu liên quan ..................................................................... 11 CHƢƠNG 2: PHƢƠNG PHÁP TRA CỨU LÁ CÂY SỬ DỤNG KDES ..... 13 2.1 Giới thiệu................................................................................................... 13 2.2 Phƣơng pháp KDES .................................................................................. 13 2.2.1 Gradient, màu sắc, và hình dạng kernels tƣơng ứng........................... 13 2.2.2 Học tính năng nhỏ gọn ........................................................................ 17 2.3 Phƣơng pháp tra cứu lá cây sử dụng KDES cải tiến ................................. 21 2.4 Biểu diễn ảnh lá cây .................................................................................. 23 2.4.1 Tính toán đặc trƣng mức Pixel............................................................ 23 2.4.2 Tính toán đặc trƣng mức patch ........................................................... 23 2.4.2.1 Sinh tập patch với kích thƣớc patch thích nghi ............................ 23 2.4.2.2 Tính toán véctơ đặc trƣng mức patch ........................................... 26 2.4.3 Tính toán đặc trƣng mức ảnh .............................................................. 31 2.5 Phân lớp ảnh lá cây ................................................................................... 37 2.5.1 Máy véctơ hỗ trợ - SVM ..................................................................... 37
- v 2.5.2 Máy véctơ hỗ trợ nhiều lớp – MSVM ................................................ 41 2.5.2.1 Từ Binary classification tới multi-class classification.................. 41 2.5.2.2 Xử lý dữ liệu ảnh ......................................................................... 41 2.5.2.3 Softmax Regression. ..................................................................... 42 CHƢƠNG 3: THỰC NGHIỆM ...................................................................... 44 3.1 Thu thập dữ liệu ........................................................................................ 44 3.1.1 Cơ sở dữ liệu hình ảnh ........................................................................ 44 3.1.2 Phƣơng pháp lấy mẫu hình ảnh lá cây: ............................................... 45 3.2 Tiền xử lý ảnh trong bộ cơ sở dữ liệu ....................................................... 48 3.3 Phƣơng pháp đánh giá ............................................................................... 53 3.4 Thử nghiệm và kết quả. ............................................................................. 54 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN. ..................................................... 60 TÀI LIỆU THAM KHẢO ............................................................................... 60
- vi DANH SÁCH HÌNH VẼ Hình 2.1 : Xấp xỉ hữu hạn chiều ................................................................... 19 Hình 2.2: Sơ đồ hệ thống nhận dạng cây thuốc sử dụng KDES ................... 22 Hình 2.3: Patch thích nghi với = = 8, do đó = =9 ....................................................................................................................... 24 Hình 2.4: Một số ví dụ minh họa patch cố định và patch thích nghi ............ 25 Hình 2.5: Ý tưởng cơ bản của việc biểu diễn dựa trên kernel method ......... 29 Hình 2.6: Cấu trúc pyramid .......................................................................... 32 Hình 2.7: Nhược điểm của cách gán cứng .................................................. 34 Hình 2.8: Mô hình Softmax Regression dưới dạng Neural network............. 42 Hình 3.1: Hình ảnh 38 mẫu lá cây đã thu thập được trong đề tài................ 46 Hình 3.2. Phân đoạn ảnh tự động ................................................................. 48 Hình 3.3. giải thuật sử dụng Salient region segmentation ........................... 49 Hình 3.4. Sự chuyển đổi hai không gian màu RGB và Lab .......................... 50 Hình 3.5. Co ảnh nhị phân ............................................................................ 50 Hình 3.6. Giãn ảnh nhị phân......................................................................... 51 Hình 3.7. Chuẩn hóa hướng của lá cây ........................................................ 53 Hình 3.8. Sơ đồ các khối chức năng của giai đoạn huấn luyện ................... 55 Hình 3.9. Sơ đồ các khối chức năng của giai đoạn kiểm thử ....................... 55 Hình 3.10: Một phần mã code chương trình................................................. 56 Hình 3.11: quá trình Huấn luyện của chương trình ..................................... 57 Hình 3.12: Kết thúc quá trình huấn luyện .................................................... 57 Hình 3.13: Tính toán số vòng lặp so sánh .................................................... 58
- vii Hình 3.14: Hình ảnh ma trận nhầm lẫn của phương pháp KDES cải tiến .. 58 Hình 3.7: Hình ảnh nhầm lân ma trận của phương pháp KDES gốc........... 59 Hình 3.8: Hình ảnh nhầm lẫn ma trân của phương pháp KDES cải tiến .... 60
- viii DANH MỤC CÁC BẢNG Bảng 3.1: Danh sách mẫu thực vật trong cơ sở dữ liệu ............................. 47 Bảng 3.2: So sánh kết quả giữa KDES gốc và phương pháp lựa chọn (KDES cải tiến). ....................................................................................................... 59
- 1 MỞ ĐẦU 1. Đặt vấn đề Khu Bảo tồn thiên nhiên Na Hang là một trong những nơi có nguồn tài nguyên cây thuốc đa dạng và phong phú [1]. Hiện biết có 275 loài cây thuốc, thuộc 4 ngành, 96 họ, 204 chi của thực vật có mạch, đã đƣợc ghi lại trong các cuộc điều tra thực địa. Trong số đó, có 204 loài, thuộc 3 ngành, 85 họ, 168 chi của thực vật có mạch đƣợc sử dụng bởi Cao Lan dân tộc; đã 05 loài đƣợc liệt kê trong Sách Đỏ Việt Nam và Danh lục Đỏ cây thuốc Việt Nam. Trong số 85 họ, có 11 họ có số loài nhiều nhất là họ Rubiaceae, Euphorbiaceae, Zingberaceae, Araceae, Vitaceae, Acanthaceae, Verbenaceae, Myrsinaceae, Moraceae, Menispermaceae và Convallariaceae. Bốn loại phổ biến của cây thuốc là cây thân thảo (41,63%), cây bụi (22.01%), cây thân gỗ (16,75%) và leo núi (17.70%). Các bộ phận đƣợc sử dụng nhiều nhất thân, lá, rễ và toàn cây. Các nguồn tài nguyên cây thuốc ở khu bảo tồn thiên nhiên Na Hang có giá trị kinh tế quan trọng và một tiềm năng để phát triển dƣợc phẩm mới và các sản phẩm tự nhiên khác. Rừng đặc dụng Na Hang (trƣớc đây là Khu bảo tồn thiên nhiên Tát kẻ - Bản Bung huyện Na Hang) đƣợc thành lập theo Quyết định 274/UB-QĐ ngày 9 tháng 5 năm 1994 của Uỷ ban nhân dân tỉnh Tuyên Quang. Nằm trên địa bàn các xã Khâu Tinh, Côn Lôn, Sơn Phú, Thanh Tƣơng của huyện Na Hang, tỉnh Tuyên Quang. Rừng đặc dụng Na Hang có diện tích tự nhiên khoảng 22.401,5 ha, trong đó diện tích khu vực có địa hình dƣới 300 m chiếm khoảng 30%, 300-800 m chiếm 60%, trên 900m chiếm 10%. Mùa đông nhiệt độ trung bình 15 - 20oC, mùa hè nhiệt độ lên đến 30oC hoặc có thể hơn. Hệ
- 2 thống sông ngòi chỉ ở mức trung bình, có hai con sông lớn chảy qua là sông Gâm (phía Tây Tát Kẻ) và sông Năng (phía đông Na Hang). Hiện nay, nguồn nƣớc từ rừng đặc dụng Na Hang đƣợc phân phối, điều hòa bởi hệ thống lòng hồ và đập thủy điện Na Hang. Hệ thực vật tại Khu bảo tồn thiên nhiên (BTTN) Na Hang có 1.162 loài thực vật, thuộc 604 chi, 159 họ của 4 ngành thực vật bậc cao có mạch. Trong đó ngành Hạt kín (Angiospermae) có 1.083 loài, 570 chi, 135 họ; ngành Hạt trần (Gymnospermae) có 11 loài, 8 chi, 5 họ; ngành Dƣơng xỉ (Polypodiophyta) có 63 loài, 34 chi, 17 họ; nhành Thông đất (Lycopodiophyta) có 5 loài, 2 chi, 2 họ. Trong số 1162 loài thực vật đƣợc ghi nhận tại Khu BTTN Na Hang, có 558 loài thực vật đƣợc ghi nhận có giá trị làm thuốc. Việc nghiên cứu hiện trạng và bảo tồn nguồn tài nguyên cây cối có vị trí rất quan trọng trong việc phát triển nguồn tài nguyên sinh vật ở rừng đặc dụng Na Hang. Để hỗ trợ cho công tác này, việc phát triển các công cụ, dịch vụ công nghệ thông tin hỗ trợ là cần thiết nhằm giúp cho việc xây dựng chiến lƣợc quản lý, bảo tồn và phát triển bền vững tính đa dạng sinh học của Na Hang, tỉnh Tuyên Quang trong tƣơng lai đƣợc thuận lợi hơn. Bƣớc đầu tiên của việc bảo vệ thực vật là tự động nhận ra hoặc phân loại chúng. Có nghĩa là hiểu chúng là gì và chúng đến từ đâu. Nhƣng rất khó để ngƣời ta nhận ra một loại cây một cách chính xác và ngay lập tức bởi vì số lƣợng loài rất lớn. Một hệ thống tự động nhận dạng, tra cứu sẽ rất hữu ích trong quản lý, bảo tồn hệ thống các loài cây quý hiếm, nhận dạng ra các loại cây với thông tin của nó v.v. Tuy nhiên, hiện nay chƣa có một cơ sở dữ liệu với đầy đủ thông tin cần thiết về các loài thực vật quý hiếm tại Khu bảo tồn Thiên nhiên Na Hang
- 3 cùng với công cụ tra cứu, tiếp cận thông tin một cách thuận tiện. Do đó, đề tài luận văn thạc sỹ này tập trung vào việc xây dựng cơ sở dữ liệu các loài thực vật quý hiếm tại Khu bảo tồn thiên nhiên Na Hang, tỉnh Tuyên Quang và nghiên cứu, áp dụng một phƣơng pháp tra cứu tự động dựa trên thông tin hình ảnh, với đề tài: “Nghiên cứu phát triển hệ thống tra cứu các loài thực vật quý hiếm tại Khu bảo tồn thiên nhiên Na Hang, tỉnh Tuyên Quang”. Hiện nay, nhiều nhà khoa học đã và đang nghiên cứu, đề xuất nhiều phƣơng pháp giải quyết bài toán nhận dạng lá cây thông qua thông tin hình ảnh, [15] [17] [18]. Trong đó, nhiều phƣơng pháp khai thác thông tin hình ảnh lá cây [2]. Lá cây đƣợc sử dụng nhiều bởi vì đây là bộ phận dễ thu nhận, hiện diện ở hầu hết các mùa. Trên cơ sở đó, đề tài luận văn thạc sỹ này, em sẽ kế thừa một số kết quả nghiên cứu về nhận dạng ảnh lá cây để áp dụng vào bài toán tra cứu các loài thực vật quý hiếm tại Khu bảo tồn thiên nhiên Na Hang. 2. Bài toán tra cứu/ nhận dạng thực vật Tra cứu hoặc nhận dạng thực vật là một quá trình nhằm xác định xem một mẫu thực vật nào đó giống nhất hoặc thuộc loài nào trong danh mục các loài cây đã biết. Đây là một nhiệm vụ khó khăn và tốn thời gian ngay cả đối với các chuyên gia thực vật học. Tra cứu thực vật là đƣa ra một danh sách các loài thực vật theo mức độ phù hợp với câu truy vấn. Trong bài toán tra cứu thông tin/ hình ảnh tổng quát thì câu truy vấn có thể là văn bản, hình ảnh, ... Ở đây, em đề cập đến câu truy vấn là ảnh cây hoặc một vài bộ phận của cây. Gần đây với nghiên cứu tiên tiến trong cộng đồng thị giác máy tính, một số công trình đã tập trung nghiên cứu bài toán nhận dạng thực vật dựa trên hình ảnh [3]. Mục đích chính của các công trình này là nghiên cứu phát triển phƣơng pháp để xây dựng hệ thống chƣơng trình máy tính hỗ trợ việc nhận
- 4 dạng thực vật bằng các kỹ thuật nhận dạng và xử lý ảnh.. Trong các bộ phận của cây thì lá cây đƣợc sử dụng rộng rãi nhất. Gần đây một số tác giả đã cố gắng kết hợp các hình ảnh bộ phận khác của cây. Một hệ thống tự động nhận dạng phân loại hoặc tra cứu thực vật nói chung và cây thuốc nói riêng có thể sử dụng các đặc trƣng khác nhau của hệ thực vật, bắt đầu từ mức độ rất đơn giản nhƣ: Hình dạng và màu sắc của lá, loại hoa và quả, kiểu phân nhánh, loại rễ, lễ thời vụ, vụ triển vọng, ảnh cho đến đặc trƣng rất phức tạp nhƣ cấu trúc tế bào và mô, cấu trúc di truyền. Hiện tại, điện thoại di động có khả năng thu đƣợc hình ảnh chất lƣợng cao với camera của chúng, điều này làm cho khả năng ứng dụng của một hệ thống nhƣ vậy trở nên rộng lớn. Lá cây có những đặc trƣng quan trọng, ảnh hữu ích để phân loại các loại thực vật khác nhau. Trong thị giác máy tính, đã có nhiều loại đặc trƣng đƣợc đề xuất để phân loại đối tƣợng. Năm 2010, Liefeng Bo [5] đề xuất một bộ mô tả hiệu quả cho bài toán nhận dạng đối tƣợng có tên là KDES (Kernel descriptor). Trong khuôn khổ đề tài luận văn này, này em tìm hiểu và áp dụng KDES cho bài toán tra cứu ảnh lá cây quý hiếm tại Khu bảo tồn thiên nhiên Na Hang, tỉnh Tuyên Quang. 3. Cấu trúc luận văn Ngoài phần mở đầu, kết luận, mục lục, danh mục tài liệu, tài liệu tham khảo, luận văn đƣợc chia thành 3 chƣơng nhƣ sau: - CHƢƠNG 1: MỘT SỐ NGHIÊN CỨU LIÊN QUAN Chƣơng này giới thiệu bài toán và thông tin tổng quan về tra cứu/ nhận dạng thực vật. Trong chƣơng này cũng trình bày sơ lƣợc một số nghiên cứu liên quan đến bài toán nhận dạng, tra cứu ảnh lá cây; giới thiệu sử dụng
- 5 phƣơng pháp KDES (kernel descriptor) cho bài toán tra cứu thông tin về cây thông qua hình ảnh lá cây. - CHƢƠNG 2: PHƢƠNG PHÁP TRA CỨU LÁ CÂY SỬ DỤNG KDES Trong chƣơng này trình bày phƣơng pháp tra cứu thông tin cây thông qua hình ảnh lá cây sử dụng phƣơng pháp KDES. CHƢƠNG 3: THỰC NGHIỆM Nội dung chƣơng này bao gồm phƣơng pháp thu thập dữ liệu, phƣơng pháp đánh giá, việc thử nghiệm và kết quả của thử nghiệm trên cơ sở dữ liệu đã thu thập.
- 6 CHƢƠNG 1 MỘT SỐ NGHIÊN CỨU LIÊN QUAN 1.1 Tổng quan về tra cứu ảnh Những năm gần đây ảnh số ngày càng thu hút đƣợc sự quan tâm của nhiều ngƣời, một phần là do các thiết bị thu nhận ảnh số ngày càng phổ biến và có giá cả phù hợp, cho phép nhiều ngƣời có thể sở hữu và sử dụng. Mặt khác các công nghệ chế tạo thiết bị lƣu trữ luôn đƣợc cải tiến để cho ra đời các thiết bị lƣu trữ có dung lƣợng lớn và giá thành hạ làm cho việc lƣu trữ ảnh dƣới dạng các file trở nên phổ biến. Thêm nữa là sự phát triển của mạng internet làm cho số lƣợng ảnh số đƣợc đƣa lên lƣu trữ và trao đổi qua internet là rất lớn. Năm 2006, trên 300 triệu hình ảnh đã đƣợc tải lên Flickr, một trong những cộng đồng chia sẻ hình ảnh lớn nhất trên internet. Con số này cho thấy thực tế là số lƣợng ảnh số đƣợc lƣu trữ trong các cơ sở dữ liệu đang gia tăng nhanh chóng. Tuy nhiên khi số lƣợng ảnh đƣợc lƣu trữ trở lên rất lớn thì vấn đề là phải có những phƣơng pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm kiếm tra cứu ảnh có hiệu quả có độ chính xác cao và có hiệu năng tốt. Việc tìm kiếm đƣợc một bức ảnh mong muốn trong hàng triệu bức ảnh thuộc đủ loại chủ đề khác nhau là rất khó. Khi số lƣợng ảnh trong một bộ sƣu tập còn ít, việc nhận diện bức ảnh hay việc so sánh sự giống và khác nhau giữa nhiều bức ảnh có thể đƣợc thực hiện bằng mắt thƣờng, tuy nhiên khi số lƣợng ảnh rất lớn thì việc so sánh bằng mắt thƣờng là rất khó khăn, đòi hỏi phải có những phƣơng pháp hiệu quả và chính xác hơn. Trong thực tế, bài toán tra cứu ảnh số có rất nhiều ứng dụng quan trọng. Ví dụ nhƣ trong lĩnh vực ngân hàng, việc so sánh chữ ký của khách hàng với mẫu chữ ký đã đƣợc lƣu trữ sẵn có thể thực hiện rất nhanh và chính xác nếu có đƣợc một phần mềm so sánh mẫu chữ ký tốt. Thực tế hiện nay tại các ngân
- 7 hàng ở Việt Nam, ngƣời ta vẫn phải sử dụng phƣơng pháp so sánh bằng mắt thƣờng và việc so sánh chữ ký bằng phần mềm vẫn chƣa thực hiện đƣợc. Một ví dụ khác là bài toán quản lý biểu trƣng (logo) trong lĩnh vực sở hữu trí tuệ. Khi một đơn vị muốn đăng ký logo riêng cho đơn vị của mình thì cơ quan quản lý phải tiến hành đánh giá xem mẫu logo đó đã đƣợc sử dụng hay chƣa hoặc có tƣơng tự với mẫu logo nào đó đang đƣợc sử dụng hay không. Trong trƣờng hợp này, nếu sử dụng mắt thƣờng để duyệt thì sẽ tốn rất nhiều thời gian, nếu có các phần mềm cho phép tìm kiếm trong cơ sở dữ liệu ảnh có sẵn những biểu trƣng tƣơng tự với biểu trƣng mẫu thì việc đánh giá sự tƣơng tự sẽ dễ dàng hơn nhiều. Trong lĩnh vực khoa học hình sự, nhu cầu so sánh mẫu vân tay, hay tìm kiếm hình ảnh tội phạm đặt ra những bài toán tra cứu ảnh. Giả sử chúng ta tổ chức quản lý nhân khẩu với thông tin ảnh vân tay của từng ngƣời. Trong một vụ án, nhân viên điều tra thu thập đƣợc mẫu vân tay trên hiện trƣờng, khi đó ngƣời ta cần xem mẫu vân tay đó khớp với vân tay của ai trong hàng chục triệu hình ảnh vân tay trong cơ sở dữ liệu. Nếu có phần mềm thực hiện chính xác, nhanh chóng sẽ giúp ích rất nhiều cho công tác điều tra. Một ví dụ nữa là trong lĩnh vực bảo tồn, bảo tàng. Vấn đề lƣu trữ và tra cứu ảnh số có vai trò càng ngày càng quan trọng. Ảnh của các tác phẩm hội họa, điêu khắc hoặc các cổ vật đƣợc lƣu trữ dƣới dạng các file ảnh sẽ đảm bảo đƣợc chất lƣợng tốt hơn, thời gian lƣu trữ lâu dài hơn và việc trao đổi hay giới thiệu với công chúng cũng dễ dàng hơn. Bài toán tra cứu của vật xuất phát từ một thực tế của ngành bảo tồn, bảo tàng là khi sƣu tầm đƣợc một cổ vật mới, ngƣời ta cần xác định hàng loạt các thuộc tính nhƣ niên đại, nguồn gốc và có thể là chủ sở hữu của vật đó. Nếu có đƣợc sự trợ giúp của phần mềm tra cứu ảnh phù hợp thì ngƣời ta ta có thể dễ dàng xác định xem mẫu cổ vật đó đã đƣợc lƣu trữ trong cơ sở dữ liệu nào hay chƣa, có những loại cổ vật nào tƣơng tự với nó trong kho tàng cổ vật của thế giới, và phần mềm có thể đƣa ra ảnh
- 8 của các loại cổ vật có màu sắc, hình dáng, hoa văn tƣơng tự với cổ vật vừa tìm thấy. Những thông tin này sẽ giúp ích rất nhiều cho các chuyên gia trong quá trình phân loại, kiểm chứng một cổ vật. Một số hệ thống tra cứu ảnh nổi tiếng nhƣ QBIC (IBM), Virage (Virage Inc.), Photobook (MIT), VisualSEEK (Columbia University)... Trƣớc năm 1990, ngƣời ta thƣờng sử dụng phƣơng pháp tra cứu ảnh theo văn bản (Text Based Image Retrieval). Theo cách này ngƣời ta sẽ gán cho mỗi bức ảnh một lời chú thích phù hợp với nội dung hoặc một đặc điểm nào đó của ảnh, sau đó việc tra cứu ảnh đƣợc thực hiện dựa trên những lời chú thích này. Phƣơng pháp này khá đơn giản, tuy nhiên lại không thể áp dụng để tra cứu các cơ sở dữ liệu có số lƣợng ảnh lớn và kết quả tra cứu thì mang tính chủ quan và cảm ngữ cảnh. Bởi về các kỹ thuật tra cứu dựa trên văn bản chỉ có thể đƣợc áp dụng khi hình ảnh đã đƣợc mô tả. Việc tự động hiểu nội dung một bức tranh theo cách của con ngƣời là một công việc rất khó. Vấn đề này đƣợc gọi là lỗ hổng ngữ nghĩa (semantic gap). Một trong những phƣơng pháp đƣợc nhiều ngƣời quan tâm nghiên cứu hiện nay là phƣơng pháp ”Tra cứu ảnh dựa theo nội dung” (Content Base Image Retrieval). Ý tƣởng phƣơng pháp này là chích chọn các đặc điểm dựa vào nội dung trực quan của ảnh nhƣ màu sắc, kết cấu, hình dạng và bố cục không gian của ảnh để làm cơ sở dữ liệu cho việc tra cứu, sắp xếp, tổ chức cơ sở dữ liệu ảnh. Kỹ thuật tra cứu ảnh trên cơ sở màu cơ bản có nhiều hạn chế: - Hạn chế thứ nhất của ảnh kỹ thuật cơ sở là không sử dụng tính tƣơng đồng giữa các màu. Khi đó, hai ảnh với màu cảm nhận tƣơng đồng nhƣng không có màu chung thì khoảng cách giữa chúng sẽ rất lớn, có thể là cực đại.
- 9 Với hạn chế thứ nhất này, ngƣời ta đã đƣa ra những cách khắc phục bằng cách: đƣa ra thƣớc đo mức độ giống nhau trong đó quan tâm đến đóng góp các màu cảm nhận tƣơng tự; tính toán khoảng cách màu trong đó các giá trị biểu đồ màu đƣợc điều chỉnh trên cơ sở mức độ tƣơng tự màu; sử dụng biểu đồ trọng số cảm nhận (PWH -perceptually weighted histogram). - Hạn chế thứ hai là không sử dụng quan hệ không gian giữa các pixel. Để giải quyết vấn đề này, ngƣời ta có thể tách màu nền khỏi màu cận cảnh (phân đoạn ảnh) sau đó biểu đồ màu nền và biểu đồ màu cận cảnh đƣợc tính toán và sử dụng. - Hạn chế thứ ba là không gian màu lựa chọn đƣợc lƣợng tử hóa đồng nhất mặc dù các màu điểm ảnh không phân bổ đồng nhất trong không gian màu. Một số giải pháp: lƣợng tử hóa màu không đồng nhất; lựa chọn không gian màu thích hợp cũng đã đƣợc đề cập; cải tiến việc tính toán các bins màu cách sử dụng kỹ thuật phân lớp dữ liệu. Kỹ thuật tra cứu cơ sở dựa trên lƣợc đồ màu chƣa tận dụng đƣợc các đặc tính cục bộ của vùng của ảnh nhƣ màu và không gian. Ngƣời ta đã đề cập đến kỹ thuật tra cứu ảnh dựa vào các đặc tính cục bộ của vùng áp dụng trong tra cứu các ảnh phong cảnh: kỹ thuật đối sánh cặp màu để mô hình các đƣờng bao đối tƣợng phân biệt; mở rộng kỹ thuật cặp màu để thực hiện tra cứu các ảnh đã đƣợc phân đoạn. Các hạn chế trong kỹ thuật tra cứu dựa vào màu bao gồm: thiếu khả năng nhận dạng các đối tƣợng tƣơng tự có các màu khác nhau, nhạy cảm với tỷ lệ của đối tƣợng. Ảnh ngƣời ta đƣa ra kỹ thuật tra cứu ảnh dựa vào các đặc tính cục bộ của vùng bao gồm màu và không gian áp dụng trong tra cứu các ảnh phong cảnh. Kỹ thuật này nhằm khắc phục các hạn chế đã đƣợc đề cập ở trên thông qua một quá trình ba bƣớc: phân đoạn ảnh thành các cụm dựa vào màu (sử dụng thuật toán phân lớp dữ liệu K-Means); chia
- 10 các ảnh thành dãy các hình chữ nhật bằng phƣơng pháp phủ hình chữ nhật tối thiểu có độ thuần nhất; Cuối cùng, thông tin của vùng đƣợc trích rút trong bƣớc thứ hai đƣợc sử dụng để tra cứu các ảnh liên quan từ một cơ sở dữ liệu ảnh phong cảnh. Với phƣơng pháp tra cứu ảnh dựa trên hình dạng, có nhiều phƣơng pháp biểu diễn đặc trƣng hình dạng và thƣớc đo độ tƣơng tự khác nhau: phƣơng pháp tiếp cận dựa trên hình dạng sử dụng logic mờ. Đầu tiên, ảnh đƣợc phân đoạn thành một tập các vùng. Mỗi vùng đƣợc biểu diễn bởi một tập mờ. Khoảng cách giữa hai ảnh đƣợc tính toán dựa trên việc so sánh khoảng cách giữa tất cả các cặp vùng của hai ảnh kết hợp với gán trọng số cho mỗi vùng; phƣơng pháp biểu diễn đặc trƣng của vùng bởi một vectơ 15 chiều bao gồm các thành phần màu đặc trƣng của vùng và các đặc trƣng hình dạng; Kết hợp hai phƣơng pháp trên đồng thời đƣa ra cải tiến cách biểu diễn vectơ đặc trƣng của một vùng sử dụng 6 thành phần (3 thành phần đặc trƣng màu sắc và 3 thành phần đặc trƣng hình dạng); hình dạng các vùng đƣợc xấp xỉ bởi đa giác. Đa giác biểu diễn hình dạng các vùng đƣợc xác định theo cách hoạt động của radar. 1.2 Tổng quan về nhận dạng, tra cứu thực vật Tự động phân loại và tra cứu thực vật có thể đƣợc thực hiện bằng cách trích xuất các đặc trƣng từ lá của nó. Có nhiều cách tiếp cận khác nhau đã đƣợc đề xuất. Đầu tiên, ảnh lá đƣợc thu nhận bằng camera hoặc máy quét. Sau đó, đó ngƣời dùng có thể chọn điểm gốc của lá và một vài điểm tham chiếu trên phiến lá hoặc tự động thực hiện việc này. Tiếp theo, một số đặc trƣng hình thái học đƣợc trích xuất. Các đặc trƣng này đƣợc sử dụng làm đầu vào cho hệ thống phân loại, ví dụ nhƣ mạng nơron nhân tạo. Mạng nơron đƣợc huấn luyện với lá từ các loài thực vật khác nhau. Sau đó, độ chính xác
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Luận văn Thạc sĩ Khoa học giáo dục: Thực trạng quản lí đổi mới phương pháp dạy học môn Ngữ văn ở các trường trung học phổ thông thành phố Bến Tre
154 p | 225 | 50
-
Luận văn Thạc sĩ Khoa học thư viện: Nghiên cứu phát triển và khai thác nguồn lực thông tin của trung tâm thông tin thư viện trường Đại học Kiến trúc Hà Nội
119 p | 458 | 49
-
Luận văn Thạc sĩ Khoa học giáo dục: Quản lý hoạt động nghiên cứu khoa học của giáo viên ở Trường Trung cấp nghề giao thông Công Chính Hà Nội đáp ứng yêu cầu đổi mới giáo dục
152 p | 177 | 49
-
Luận văn Thạc sĩ Khoa học: Khảo sát thành phần hoạt chất và tác động của dầu Neem (Azadirachta indica A. juss) đối với sâu xanh (Heliothis armigera)
136 p | 205 | 43
-
Tóm tắt luận văn Thạc sĩ Khoa học xã hội và nhân văn: Đặc trưng ngôn ngữ và văn hóa của ngôn ngữ “chat” trong giới trẻ hiện nay
26 p | 318 | 40
-
Luận văn thạc sĩ khoa học: Nghiên cứu các cấu trúc hải dương phục vụ dự báo ngư trường vùng biên khơi miền Trung Việt Nam
69 p | 219 | 37
-
Luận văn Thạc sĩ Khoa học giáo dục: Dự báo nhu cầu giáo viên trung học cơ sở tỉnh Tây Ninh đến năm 2010
127 p | 168 | 33
-
Luận văn Thạc sĩ Khoa học lịch sử: Quan hệ ngoại giao của triều Quang Trung với nhà Thanh (1788 - 1792)
94 p | 150 | 29
-
Luận văn Thạc sĩ khoa học Giáo dục: Rèn luyện năng lực chủ động sáng tạo cho học sinh trong dạy học Hóa học ở trường Trung học cơ sở
158 p | 135 | 24
-
Luận văn Thạc sĩ Khoa học Toán học: Nghiên cứu didactic về phép kéo theo và phép tương đương trong dạy và học Toán ở trung học phổ thông
116 p | 101 | 12
-
Luận văn Thạc sĩ Khoa học lịch sử: Quan hệ Hoa Kì – Cộng hòa Nhân dân Trung Hoa (1972 – 1991)
162 p | 81 | 11
-
Tóm tắt luận văn Thạc sĩ Khoa học xã hội và nhân văn: Đặc điểm truyện ngắn trung đại Việt Nam
26 p | 147 | 10
-
Luận văn Thạc sĩ Khoa học giáo dục: Nghiên cứu đề xuất chương trình liên thông từ bậc trung học chuyên nghiệp lên đại học ngành Vận hành máy tàu biển
143 p | 80 | 5
-
Tóm tắt luận văn Thạc sĩ Khoa học xã hội và nhân văn: Ngôn ngữ Trường thơ loạn Bình Định
26 p | 191 | 5
-
Luận văn Thạc sĩ Khoa học: Nghiên cứu một số loài Malassezia sp. gây bệnh lang ben ở bệnh nhân đến khám tại Bệnh viện Da liễu Trung ương
77 p | 27 | 5
-
Luận văn Thạc sĩ Khoa học: Sàng lọc và xác định vi khuẩn Acinetobacter baumannii kháng carbapenem ở các bệnh nhân điều trị tại Bệnh viện Bệnh Nhiệt đới Trung ương năm 2017
83 p | 33 | 4
-
Luận văn Thạc sĩ Khoa học giáo dục: Quản lý hoạt động bồi dưỡng năng lực dạy học môn Toán theo chương trình giáo dục phổ thông mới cho giáo viên ở các trường trung học cơ sở huyện Trấn Yên, tỉnh Yên Bái
139 p | 23 | 4
-
Luận văn Thạc sĩ Khoa học giáo dục: Tích hợp nội dung giáo dục biến đổi khí hậu trong dạy học môn Hóa học lớp 10 trường trung học phổ thông
119 p | 5 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn