BỘ GIÁO DỤC VÀ ĐÀO TO
TRƯỜNG ĐẠI HỌC CH KHOA HÀ NỘI
NGUYỄN THỊ THANH NHÀN
NGHIÊN CỨU VÀ PHÁT TRIỂN C PHƯƠNG
PHÁP NHẬN DẠNG Y DỰA TRÊN NHIỀU ẢNH
BỘ PHẬN CỦA Y, TƯƠNG TÁC VỚI NGƯỜI
SỬ DỤNG
Ngành: Khoa học y tính
số: 9480101
TÓM TT LUẬN ÁN TIẾN
KHOA HỌC Y TÍNH
Nội 2020
Công trình được hoàn thành tại:
Trường Đại học Bách khoa Nội
Người hướng dẫn khoa học:
1. PGS. TS. Thị Lan
2. PGS. TS. Hoàng Văn Sâm
Phản biện 1: PGS. TS. Nguyễn Thị Thủy
Phản biện 2: PGS. TS. Trần Quang Bảo
Phản biện 3: PGS. TS. Phạm Văn Cường
Luận án sẽ được bảo v trước Hội đồng đánh giá luận án tiến
cấp Trường họp tại Trường Đại học Bách khoa Nội:
Vào hồi giờ, ngày tháng năm
thể tìm hiểu luận án tại thư viện:
1. Thư viện T Quang Bửu - Trường ĐHBK Nội
2. Thư viện Quốc gia Việt Nam
GIỚI THIỆU
Động
Thực vật một vai trò quan trọng trong hệ sinh thái. Ngày nay, sự đa dạng của
hệ sinh thái nói chung và hệ thực vật nói riêng đang đứng trước nguy bị suy giảm
do sự khai thác không hợp của con người. Nhiều giải pháp đã được đề xuất nhằm
bảo v đa dạng sinh học của hệ thực vật trong đó việc nâng cao hiểu biết của người
dân được đánh giá một trong những giải pháp hữu hiệu trong đó tên của thực
vật chìa khóa quan trọng cho phép truy nhập đến các thông tin khác. Tuy nhiên, số
y một người bình thường khả năng nhận biết thường rất thấp so với số lượng
y trong hệ thực vật.
Sự phát triển và phổ dụng của các thiết bị thu nhận và lưu trữ như y ảnh, điện
thoại cho phép y dựng được một sở dữ liệu hình ảnh lớn về các loài y trong hệ
thực vật. Cùng với đó, các tiến b trong các kỹ thuật xử hình ảnh và nhận dạng
cho phép thực tiễn hóa ước y dựng các hệ thống nhận dạng cây tự động.
Trong những năm vừa qua, các nghiên cứu về nhận dạng y dựa trên hình ảnh
của y đã nhận được sự quan tâm của các nhà nghiên cứu liên lĩnh vực: thị giác y
tính, học y và thực vật học. Nhiều cải tiến đáng k về chất lượng nhận dạng đã
được ghi nhận [4]. Một số hệ thống nhận dạng và tìm kiếm y cũng đã được triển
khai trên thực tế.
Tuy vậy, nhận dạng y hiện vẫn chưa được sử dụng rộng rãi do hai hạn chế chính.
Hạn chế thứ nhất số loài cây thể nhận dạng được vẫn còn rất thấp so với số lượng
y trong hệ thực vật. sở dữ liệu hình ảnh cây lớn nhất là LifeCLEF 2017 với
10,000 loài y [2]) so với số lượng hơn 400,000 loài cây tồn tại trên trái đất [3]). Hạn
chế thứ hai độ chính xác của nhận dạng cây tự động vẫn còn thấp đặc biệt khi
làm việc trên dữ liệu đa dạng với số lớp lớn.
Mục tiêu
Luận án NCS hướng đến y dựng các phương pháp hiệu quả cho phép nâng cao
độ chính xác của nhận dạng y dựa vào hình ảnh.
Để đạt được mục tiêu y, trước tiên luận án tập trung vào cải thiện độ chính xác
của nhận dạng y dựa trên ảnh của một b phận. nhiều bộ phận trên cây thể
được dùng để xác định y. Tuy nhiên, trong các bộ phận khác nhau của cây, b
phận được lựa chọn nhiều nhất. Các nghiên cứu trước đó thường dựa trên giả thuyết
được chụp trên nền đồng nhất. Giả thuyết y thường không thỏa mãn trong các
điều kiện làm việc thực tế, do đó trong luận án y, chúng tôi tập trung nghiên cứu và
1
phát triển phương pháp nhận dạng trên nền phức tạp.
Thứ hai, xuất phát từ quan sát việc sử dụng hình ảnh của một bộ phận để
nhận dạng không phải lúc nào cũng phù hợp. Nhiều y rất dễ bị nhận nhầm nếu sử
dụng nhưng lại khả năng phân biệt rất cao nếu dựa trên hoa. Nhận dạng y dựa
trên nhiều b phận thể được hình hóa thành bài toán kết hợp muộn: các kết
quả của nhận dạng y dựa trên nhiều ảnh b phận thể được xác định dựa trên kết
quả nhận dạng đơn b phận qua các chiến lược kết hợp. Do đó, mục tiêu thứ hai của
luận án đề xuất các phương pháp kết hợp hiệu quả cho bài toán nhận dạng y dựa
trên các b phận.
Mục tiêu cuối cùng của luận án liên quan đến ứng dụng của các kết quả nghiên
cứu trong việc quảng thông tin của một tập các loài y tương đối đặc thù: y
thuốc Việt Nam thông qua việc phát triển chức năng tìm kiếm dựa trên hình ảnh trong
hệ thống tra cứu y thuốc Việt Nam VnMed. Các mục tiêu của luận án được tóm tắt
lại như sau:
Phát triển phương pháp nhận dạng y dựa trên ảnh với nền phức tạp;
Đề xuất kỹ thuật kết hợp cho nhận dạng y dựa trên nhiều b phận;
Phát triển chức năng tìm kiếm y dựa trên hình ảnh tích hợp trong ứng dụng
hệ thống tìm kiếm y thuốc Việt Nam.
Các đóng góp
Luận án ba đóng góp chính như sau:
Đóng góp 1: Một phương pháp nhận dạng y dựa trên ảnh nền phức tạp
được đề xuất. Phương pháp đề xuất kết hợp đồng thời phân đoạn tương tác và
b tả đặc trưng nhân (KDES) cải tiến.
Đóng góp 2: Một kỹ thuật kết hợp cho nhận dạng y dựa trên hai b phận.
Kỹ thuật kết hợp y tích hợp giữa luật kết hợp nhân và kỹ thuật kết hợp dựa
trên phân lớp.
Đóng góp 3: Cuối cùng, một đun tìm kiếm y dựa trên hình ảnh được phát
triển và tích hợp trong ứng dụng tìm kiếm cây thuốc Việt Nam.
Cấu trúc luận án
Giới thiệu: Phần y trình y động và mục tiêu của luận án, cũng như ngữ
cảnh, hạn chế và thách thức gặp phải trong i toán nhận dạng cây. Phần cuối
của phần y trình y một đồ làm việc chung và các đóng góp chính của luận
án.
Chương 1: Các nghiên cứu liên quan: Chương y hệ thống lại các nghiên cứu
liên quan và các cách tiếp cận đề xuất cho nhận dạng y tự động.
2
Chương 2: Trong chương y, một phương pháp cho nhận dạng y dựa trên ảnh
nền phức tạp được đề xuất. Trong phương pháp đề xuất, để trích chọn vùng
từ ảnh, chúng tôi đề xuất áp dụng phân đoạn tương tác. Sau đó, đặc trưng
nhân KDES cải tiến được áp dụng để trích chọn các đặc trưng của lá.
Chương 3: Chương y tập trung vào nhận dạng cây dựa trên nhiều bộ phận của
y. Chúng tôi đề xuất một phương pháp kết hợp cho nhận dạng y nhiều b
phận dựa trên các kết quả một b phận.
Chương 4: Trong chương y, chúng tôi đề xuất một cách tiếp cận mới để xây
dựng hệ thống nhận dạng y tự động khi sở dữ liệu không sẵn và ứng dụng
của cách tiếp cận đề xuất trong việc y dựng chức năng tìm kiếm cây thuốc
Việt Nam dựa trên hình ảnh.
Kết luận: Chương y đưa ra các kết luận và các hướng nghiên cứu tiếp theo.
CHƯƠNG 1
C NGHIÊN CỨU LIÊN QUAN
1.1 Nhận dạng y từ các ảnh của một b phận
Các nghiên cứu trước đây thường tập trung nhận dạng y dựa trên ảnh của một
b phận y. Giữa các b phận của cây thì bộ phận được sử dụng rộng rãi nhất [4]
bởi thường tồn tại trong thời gian dài, số lượng lớn, cấu trúc phẳng nên
dễ thu thập hơn so với các b phận khác. Các nghiên cứu thường tập trung nhiều cho
ảnh trên nền đơn giản do tính đơn giản của ảnh. Sau b phận thì hoa b phận
phổ biến tiếp theo [5] ảnh hoa rất dễ phân biệt các loài y do các đặc điểm rất đặc
trưng của hoa như màu sắc, hình dạng, sắp xếp cánh hoa,..Các b phận khác cũng
được sử dụng để nhận dạng y như b phận quả, thân, cành, toàn bộ.
Hiện nay hai cách tiếp cận cho bài toán nhận dạng y. Đối với cách tiếp cận
thứ nhất, các phương pháp nhận dạng dựa trên các đặc trưng được thiết kế th công
[4]. Các đặc trưng bao gồm đặc trưng toàn cục (đặc trưng màu sắc, kết cấu, hình dạng)
và đặc trưng b phận. Các nghiên cứu thường kết hợp hai hay nhiều đặc trưng cho
mỗi b phận bởi không một đặc trưng nào đủ mạnh để phân biệt được tất cả các
lớp.
Đối với cách tiếp cận thứ hai áp dụng các phương pháp học sâu [2]. Mạng
ron tích chập (CNN) một phương pháp học sâu, gần đây đã đạt được rất nhiều
thành công trong các bài toán thị giác y tính như phát hiện đối tượng, phân đoạn,
và phân lớp ảnh [6]. CNN thể học tự động các đặc trưng từ các ảnh đầu vào
không phải thực hiện trích chọn th công. Các CNN phổ biến như AlexNet, VGG,
3