Tp chí Khoa học Đi hc Th Du Mt S 5(72)-2024
https://vjol.info.vn/index.php/tdm 27
NG DNG MÔ HÌNH HC MÁY FASTER R-CNN
PHÁT HIN NM ĂN ĐƯỢC VÀ KHÔNG ĂN ĐƯỢC
Trần Thu Hương(1)
(1) Trường Đại hc Th Du Mt
Ngày nhận bài 21/7/2024; Chấp nhận đăng 11/9/2024
Liên hệ email: huongtt@tdmu.edu.vn
Tóm tt
Nm t lâu đã được biết đến như một ngun thc phẩm giàu dinh dưỡng, giàu
cht chng oxi hóa chất xơ. Đặc bit mt ngun nhiu vitamin B, selen, kẽm đồng
- các cht quan trng trong vic sn xuất năng lượng trong tế bào, cn thiết cho mt h
thng min dch mnh m. Đối với con ngưi, nm tr thành món ăn ưa chuộng trên toàn
thế gii. Tuy nhiên, vic tiêu th nhm nm độc th dẫn đến hu qu nghiêm trng,
bao gm bun nôn, nôn mửa, suy nhược thn kinh, ri lon, thiếu máu cp tính, thm c
th dn ti t vong nếu không cp cu kp thi. Nhưng không phải ai cũng biết cách
nhn biết nm độc, chất độc nm ăn được, rất khó để chúng ta phân bit nm ăn
được hay nấm không ăn được, t hình dáng bên ngoài ging nhau ca chúng. Bài viết
này nhm gii quyết vấn đề bng cách s dng hình hc máy Faster Region-based
Convolutional Neural Network (Faster R-CNN) để phân loi nm ăn đưc nm độc.
hình Faster R-CNN đưc hun luyn trên tp d liu hình nh nm đa dạng, tp trung
vào các đặc điểm hình dng, màu sc kết cu. Sau quá trình hun luyện, hình đã
đạt độ chính xác ấn tượng lên đến 99,10% trong vic phân loi nm. Kết qu này chng
minh tiềm năng của mô hình Faster R-CNN trong vic h tr người dùng nhn din nm
an toàn, góp phn gim thiểu nguy cơ ngộ độc và t vong do nm độc.
T khóa: học máy, Faster R-CNN , nm ăn được, nm độc
Abstract
APPLICATION OF FASTER R-CNN MACHINE LEARNING MODEL TO
DETECTE EDIBLE AND NON-EDIBLE MUSHROOMS
Mushrooms have long been recognized as a nutritious food source, rich in
antioxidants and fiber. They are also a good source of B vitamins, selenium, zinc, and
copper - essential elements for cellular energy production and a strong immune system.
As a result, mushrooms have become a popular culinary ingredient worldwide.
However, accidental consumption of poisonous mushrooms can lead to severe
consequences, including nausea, vomiting, neurological impairment, disorders, acute
anemia, and even death if not treated promptly. Distinguishing between poisonous and
edible mushrooms is not always easy, as their appearances can be remarkably similar.
This paper aims to address this issue by utilizing the Faster Region-based
Convolutional Neural Network (Faster R-CNN) machine learning model to classify
edible and poisonous mushrooms. The Faster R-CNN model is trained on a diverse
dataset of mushroom images, focusing on features such as shape, color, and texture.
Following the training process, the model achieved an impressive accuracy of 99.10%
Tp chí Khoa học Đi hc Th Du Mt ISSN (in): 1859-4433; (online): 2615-9635
https://vjol.info.vn/index.php/tdm 28
in mushroom classification. This result demonstrates the potential of Faster R-CNN in
aiding users to identify safe mushrooms, contributing to the reduction of mushroom
poisoning and related fatalities.
1. Đặt vấn đề
Nm có tên khoa hc là Fungi tiếng Anh là Mushroom, bao gm các sinh vt nhân
chun d ng tế bào cu to bi Kitin. Chúng không phi thc vt, thuc gii
riêng bit. Nm có vai trò quan trng trong h sinh thái, tham gia vào quá trình phân hy
các cht hữu cơ và to nên mi quan h cng sinh vi nhiu loi thc vt. Gii nm bao
gm rt nhiu loi khác nhau t nấm men đơn bào đến nm lớn như nấm rơm, nm m,
nấm hương…, cho đến gần đây nhiu loi nm đã được miêu t da trên những đặc điểm
hình thái, như kích cỡ và hình dng các bào t hay qu th (Hibbett, Binder, Bischoff và
cs., 2007). Sinh sn ca nm thưng thông qua bào tử, được to ra trên các cu trúc đc
bit hoc qu th (như tai nấm, muc nm). Mt s loài mt kh năng tạo ra cu trúc sinh
sn chuyên bit và nhân lên bng sinh sn sinh ng. c loài ph biến nhất được ăn
như rau trong nhiu bữa ăn trên khp thế gii, mt s loi nm ph biến nht bao gm:
nm m, nấm rơm, nấm hương, nấm kim châm, nấm bào ngư, nm dai, nấm đùi …,
(Nguyn Lân Dũng, 2004; Friedman,2015). Nm kh năng thích nghi đáng kinh ngc,
chúng phân b trên toàn thế gii phát trin nhiu loại môi trường sng khác nhau,
bao gm c sa mc, nhng nơi nồng độ mui cao, bc x ion hóa (Vaupotic và cs.,
2008; Dadachova và cs., 2007) cũng như trầm tích bin sâu (Raghukumar và cs., 1998).
Da vào t l gia s loài nm vi s loài thc vt trong cùng một môi trường, người
ta ưc tính gii nm khong 1,5 triu loài (Hawksworth, 2006), trong đó khong
hơn 300 loài nm dược liệu được ghi nhn trong tng s hơn 2000 loài nm ăn được
được xác định, trong đó khong 20 loài có th được nuôi trng: nm m, nấm rơm, nấm
hương, nm sò, mộc nhĩ, nấm kim châm…, (Friedman, 2015; Nguyễn Lân Dũng, 2004).
Các loài nm qu th được biết đến vi hai dng: nm ăn được nm không ăn được,
thông thường ta th nhn dng nm ăn được không ăn được bng cách quan sát
hình thái bên ngoài ca nm (Vũn Hùng cs., 2023). Nm ăn được: thường không
có màu sc sc s, không có bao gc nm và vòng cung nm, không có đc t hoc rt
ít độc t không gây hi, nm độc: thường màu sc sc s hơn, bao gc nm và
thêm vòng cung nm bao quanh thân nm i phiến nm ràng, độc t t ít
đến cao cùng, s gây hi nhiên (Văn Hùng cs., 2023). Tuy nhiên, vic nhn
dng nấm ăn được và nm độc ch dựa vào hình thái bên ngoài là không đcó th gây
nguy him. Có mt s loi nấm không ăn được rt ging nấm ăn đưc, khiến vic phân
bit bng mắt thưng tr nên khó khăn. Ví dụ, nấm rơm thể b nhm vi mt s loi
nấm độc, đặc biệt là trong giai đoạn nấm còn non và chưa nở hoàn toàn như nấm độc tán
trng, nấm mũ tử thn.
Để gii quyết vn đ này và gim thiu s ca t vong do ăn phải nấm độc, bài viết
này đề xut s dng mt mô hình ci tiến da trên mạng nơ-ron tích chp Faster Region-
based Convolutional Neural Networks (Faster R-CNN). hình này được k vng s
tăng tốc độ duy trì độ chính xác cao trong vic phân loi nấm không ăn được nm
ăn được.
Các nghiên cu v s dng mô hình Học sâu được s dng cho vic nhn dng nm
được mô t trong bng 1.
Tp chí Khoa học Đi hc Th Du Mt S 5(72)-2024
https://vjol.info.vn/index.php/tdm 29
Bng 1. Các nghiên cu cùng mc tiêu quan đến vic nhn dng nm
Tác gi
Kiu d liu
Phương
pháp
Kết
qu
G Devika và Asha
Gowda
Karegowda (2021)
Các hình ảnh dùng để th nghiệm được thu thp
t các ngun: http://www.mushroom.world và
http://archive.ics.uci.edu/ml/datasets/Mushroom.
DCNN
Norbert Kiss và
László Czúni
(2021)
Tác gi tham ly d liu hình nh t: hai ngun d
liệu được gn nhãn, c th tp d liu ca Th
thách Phân loi nm FGVCx 2018 (Challenge,
n.d.) và hình nh t trang web tên Mushroom
Observer (observer, n.d.).
Classification
with CNNs
Orawan haowalit,
Fuangfar Pensiri
và Porawat
Visutsak (2020)
Kiu d liu trong tài liu hình nh nm này được
tác gi ly t nhiu ngun d liu khác nhau
đưc chp t máy nh K thut s.
Classification
by
Convolution
Neural
Networks.
Wacharaphol
Ketwongsa (2022)
Dữ liệu hình ảnh được sử dụng trong nghiên cứu
này được tác giả thu thập trực tiếp phía đông bắc,
Thái Lan hai loại nấm: Khon Kaen và Sakon
Nakhon. Được chứng nhận bởi PGS. Giáo sư Tiến
Sophon Boonlue, Khoa Vi sinh, Đại học Khon
Kaen.
R-CNN
(ResNet-50)
2. Tng quan
Bài viết này trình bày một chiến lược nhận dạng đối tượng đnhận dạng nấm ăn
được không ăn được thình ảnh trong bộ dữ liệu huấn luyện. Đầu ra yêu cầu là xác
định vị trí của nấm ăn được trong ảnh và liệu chúng có thực sự ăn được hay không. Đầu
vào thlà hình ảnh hoặc video chứa một hoặc nhiều đối tượng, tđó các đặc trưng
thể được xuất ra. Bằng cách x các hình ảnh đầu vào với nhiều lớp tích chập
(convolutional layers) lớp tổng hợp (pooling layers), mạng -ron ch chập (CNN)
thể trích xuất các đặc trưng nh ảnh quan trọng, chẳn hạn như hình dáng, màu sắc,
kết cấu. Các đặc trưng này được học từ dữ liệu và có thể được sử dụng để phân loại hoặc
nhận dạng các đối tượng trong ảnh. Trong trường hợp phân loại nấm ăn được nấm
không ăn được, CNN có thể học cách nhận biết các đặc điểm đặc trưng của các loại nấm
(mũ nấm, phiến nấm, màu sắc), sau khi được huấn luyện trên tập dữ liệu nấm đã được
gắn nhãn, CNN có thể dự đoán xem một hình ảnh nấm mới là nấm ăn được hay nấm độc
với độ chính xác cao. Fast R-CNN (Shaoqing Ren và cs., 2016) được tạo ra từ điều này,
bao gồm hai giai đoạn chính. Tìm kiếm bộ lọc được sử dụng trước tiên đm các hộp
giới hạn phù hợp nhất (được gọi Vùng quan tâm hoặc RoI), sau đó CNN được sử dụng
để trích xuất các hộp giới hạn. Để tìm các khu vực được đxuất, R-CNN được kết hợp
với một chiến lược tìm kiếm chọn lọc, đóng vai trò là nền tảng cho Fast R-CNN. (Inkyu
Sa và cs., 2016) đề xuất sử dụng phương pháp mạng nơ-ron tích chập để huấn luyện mô
hình nhận dạng trái cây trong “Hệ thống phát hiện trái y sdụng mạng nơ-ron sâu”.
(Byoungjun Kim cs., 2021) đề xuất một phương pháp cải tiến dựa trên thị giác để phát
hiện bệnh Dâu tây bằng cách sử dụng mạng -ron sâu (DNN) khả năng được tích
hợp vào hệ thống robot tự động. Jose Luis Rojas-Aranda cs. (2020) đã trình bày một
phương pháp phân loại hình ảnh, dựa trên mạng nơ-ron tích chập (CNN) nhẹ để tăng độ
chính xác phân loại, các đặc trưng đầu vào khác nhau được thêm vào kiến trúc CNN.
(Changqing Cao cs., 2019) đề xuất một thuật toán cải tiến dựa trên CNN dựa trên
Tp chí Khoa học Đi hc Th Du Mt ISSN (in): 1859-4433; (online): 2615-9635
https://vjol.info.vn/index.php/tdm 30
vùng nhanh hơn (Faster R-CNN) để phát hiện vật thể nhỏ. Tang Yunchao và cs. (2020 )
đề xuất một phương pháp đào tạo dựa trên mạng nơ-ron sâu để phát hiện trái cây từ ảnh.
Muresan Oltean (2018) đề xuất sử dụng mạng -ron ch chập (CNN) với thị giác
máy tính để tạo ra một hệ thống nhận dạng trái cây. Có rất nhiều nghiên cứu sử dụng mô
hình nhận dạng CNN các hình cải tiến được đề xuất để áp dụng trong phát hiện
và nhận dạng hình ảnh kỹ thuật số (Yuting Zhang và cs., 2015; Nguyễn Huy Cường
cs., 2021). Việc nhận dạng và phân loại nấm một công việc khó khăn thử thách,
cần phải một công cụ nhận dạng hiệu quả để nhận dạng nấm độc không độc. Trong
bài viết này, đề xuất một giải pháp công nghsử dụng Faster R-CNN bsung tham
khảo để xây dựng mô hình dự đoán nấm độc hay nấm ăn được. hình phân loại được
xây dựng bằng Faster R-CNN thể phân loại trong hoàn cảnh thực tế, chẳng hạn như
khi thực hiện các thử nghiệm về nông nghiệp thì thủ tục phân loại sẽ được thực hiện trên
bộ phân loại đã được huấn luyện để tìm nấm độc hay không độc. Grishick (2021),
Shaoqing Ren và Kaiming He (2015) bổ sung tham khảo để xây dựng hình dđoán
nấm độc hay nấm ăn được.
3. Phương pháp đề xut
Trong bài viết này, toàn b quá trình được chia thành ba giai đon: i) tin x lý d
liu; ii) hun luyện hình; iii) đánh giá kết quả, đồ đưc hin th trong hình bên dưới
Hình 1. Quy trình thiết kế h thng nhn dng nm ăn được và nấm độc
i) Tin x d liu: Giai đoạn này bao gồm c bước như thu thập d liu hình
nh nm, làm sch d liu, chuẩn hóa kích thước ảnh tăng cường d liệu để làm phong
phú thêm tp d liu hun luyn.
ii) Hun luyn mô hình: giai đoạn này, mô hình Faster R-CNN ci tiến s được
hun luyn trên tp d liệu đã qua tin x lý. Quá trình hun luyn s điu chnh các tham
s ca hình để th hc ch phân bit các đặc trưng của nấm ăn được nấm độc.
iii) Đánh giá kết qu: Sau khi hun luyn, mô hình s được đánh giá trên mt tp
d liu riêng biệt để kim tra hiu suất và độ chính xác ca nó trong vic phân loi nm.
Tp chí Khoa học Đi hc Th Du Mt S 5(72)-2024
https://vjol.info.vn/index.php/tdm 31
3.1. Giai đoạn 1: Thu thp và x lý d liu
Trong giai đoạn này, tôi đã thu thp một lượng ln hình nh nấm ăn được nm
không ăn được t ngun (Marcos Volpato, 2021), tp d liệu có hơn 3.000 hình nh ca
nấm ăn được không ăn được: gm 1.181 nấm ăn được 2.220 nấm không ăn được.
Để tăng cường kh năng khái quát hóa của hình, nghiên cu này đã áp dng các k
thuật tăng cường d liệu như xoay ảnh, ct nh, làm sắc nét, điều chỉnh độ tương phn
động. Công c Roboflow Annotate đã được s dụng để t động gán nhãn cho các hình
nh, giúp tiết kim thi gian công sc so vi vic gán nhãn th công. Công c
Roboflow Annotate được s dng để t động gn nhãn d liệu, giúp đơn giản hóa vic
x nh thô thành hình th giác máy nh để triển khai đào to dùng đặt tên cho
các nh thu thập được. Tp d liu nm được chia thành ba phn: tp hun luyn, tp xác
định và tp kim tra, vi các t l lần lượt là 0,8; 0,1 và 0,1. Mc tiêu chính ca hc máy
là xây dng mô hình có kh năng khái quát hóa tốt, tc là hoạt động tt trên d liu mi
chưa từng gp trong quá trình hun luyn. Vic chia d liu thành các tp riêng bit giúp
đánh giá khả năng này một cách khách quan hơn. Tt c hình ảnh đã được x để loi
b d liệu sai, sau đó được xác định và lưu vào các thư mục khác nhau. Đây là một t l
phân chia khá ph biếnthường được s dụng khi kích thước tp d liệu đ ln. T l
này đảm bo tp hun luyện đủ lớn để mô hình học được các đặc trưng quan trọng, đồng
thi tp xác thc và tp kiểm tra đủ lớn để đánh giá mô hình một cách đáng tin cậy. Vic
la chn t l này da trên kinh nghim thc tế các nghiên cứu trước đây trong nh
vc hc máy. T l 80% cho tp hun luyện đảm bảo hình đủ d liệu để hc các
đặc trưng quan trọng. Tp xác thực (10%) giúp đánh giá hình trong quá trình huấn
luyện điều chnh các siêu tham s. Cui cùng, tp kiểm tra (10%) được s dụng để
đánh giá hiệu sut cui cùng ca mô hình trên d liệu chưa từng thy.
Hình 2. Giai đoạn x lý Tp d liu hình nh nm bng Roboflow Annotate
Tp hun luyện được s dụng để phù hp vi mô hình, tp xác thực được s dng
để điều chnh các tham s của mô hình và đánh giá sơ bộ hiệu năng của mô hình, b kim
tra cuối cùng đưc s dng để xác nhn kh năng khái quát của mô hình. Công c này có
th to ra mt hình ch nht xung quanh nm th nhìn thấy được. Kết qu không ch
thu được các hp gii hn còn có các pixel ca nm dựa trên đặc điểm hình thái ca
chúng như: vảy nấm, nấm, phiến nm, màu sắc... Đầu ra cui cùng s tp d liu
chú thích được lưu dưới dng Microsoft COCO t Roboflow. Tiếp theo s thay đổi
kích thước ca ảnh thành 224×224×3 làm đầu vào ca mô hình.