
❼
Chương 2: Trong chương này, một phương pháp cho nhận dạng cây dựa trên ảnh
lá nền phức tạp được đề xuất. Trong phương pháp đề xuất, để trích chọn vùng
lá từ ảnh, chúng tôi đề xuất áp dụng phân đoạn tương tác. Sau đó, đặc trưng
nhân KDES cải tiến được áp dụng để trích chọn các đặc trưng của lá.
❼
Chương 3: Chương này tập trung vào nhận dạng cây dựa trên nhiều bộ phận của
cây. Chúng tôi đề xuất một phương pháp kết hợp cho nhận dạng cây nhiều bộ
phận dựa trên các kết quả một bộ phận.
❼
Chương 4: Trong chương này, chúng tôi đề xuất một cách tiếp cận mới để xây
dựng hệ thống nhận dạng cây tự động khi cơ sở dữ liệu không có sẵn và ứng dụng
của cách tiếp cận đề xuất trong việc xây dựng chức năng tìm kiếm cây thuốc
Việt Nam dựa trên hình ảnh.
❼
Kết luận: Chương này đưa ra các kết luận và các hướng nghiên cứu tiếp theo.
CHƯƠNG 1
CÁC NGHIÊN CỨU LIÊN QUAN
1.1 Nhận dạng cây từ các ảnh của một bộ phận
Các nghiên cứu trước đây thường tập trung nhận dạng cây dựa trên ảnh của một
bộ phận cây. Giữa các bộ phận của cây thì bộ phận lá được sử dụng rộng rãi nhất [4]
bởi vì lá thường tồn tại trong thời gian dài, có số lượng lớn, có cấu trúc phẳng nên
dễ thu thập hơn so với các bộ phận khác. Các nghiên cứu thường tập trung nhiều cho
ảnh lá trên nền đơn giản do tính đơn giản của ảnh. Sau bộ phận lá thì hoa là bộ phận
phổ biến tiếp theo [5] vì ảnh hoa rất dễ phân biệt các loài cây do các đặc điểm rất đặc
trưng của hoa như màu sắc, hình dạng, sắp xếp cánh hoa,..Các bộ phận khác cũng
được sử dụng để nhận dạng cây như bộ phận quả, thân, cành, toàn bộ.
Hiện nay có hai cách tiếp cận cho bài toán nhận dạng cây. Đối với cách tiếp cận
thứ nhất, các phương pháp nhận dạng dựa trên các đặc trưng được thiết kế thủ công
[4]. Các đặc trưng bao gồm đặc trưng toàn cục (đặc trưng màu sắc, kết cấu, hình dạng)
và đặc trưng bộ phận. Các nghiên cứu thường kết hợp hai hay nhiều đặc trưng cho
mỗi bộ phận bởi vì không có một đặc trưng nào đủ mạnh để phân biệt được tất cả các
lớp.
Đối với cách tiếp cận thứ hai là áp dụng các phương pháp học sâu [2]. Mạng nơ
ron tích chập (CNN) là một phương pháp học sâu, gần đây đã đạt được rất nhiều
thành công trong các bài toán thị giác máy tính như phát hiện đối tượng, phân đoạn,
và phân lớp ảnh [6]. CNN có thể học tự động các đặc trưng từ các ảnh đầu vào mà
không phải thực hiện trích chọn thủ công. Các CNN phổ biến như AlexNet, VGG,
3