TRƯỜNG ĐẠI HỌC SÀI GÒN SAIGON UNIVERSITY<br />
TẠP CHÍ KHOA HỌC SCIENTIFIC JOURNAL<br />
ĐẠI HỌC SÀI GÒN OF SAIGON UNIVERSITY<br />
Số 65 (5/2019) No. 65 (5/2019)<br />
Email: tcdhsg@sgu.edu.vn ; Website: https://tapchikhoahoc.sgu.edu.vn<br />
<br />
<br />
NHẬN DẠNG VÀ XÁC ĐỊNH VỊ TRÍ CỎ DẠI TRÊN LUỐNG HOA<br />
MÀU DÙNG MÁY VÉC TƠ HỖ TRỢ VÀ MẠNG NƠ-RON<br />
Weed detection in vegetable garden using support-vector<br />
machine and neural networks<br />
<br />
TS. Nguyễn Tất Bảo Thiện(1), Nguyễn Thị Cẩm Tú(2)<br />
Học viện Công nghệ Bưu chính Viễn thông, Cơ sở tại TP.HCM<br />
(1)<br />
<br />
Trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM<br />
(2)<br />
<br />
<br />
TÓM TẮT<br />
Ngày nay, trí tuệ nhân tạo được ứng dụng trong hầu hết trên mọi lĩnh vực. Nông nghiệp công nghệ cao<br />
ứng dụng hệ thần kinh nhân tạo cũng theo xu thế đó, đây là hệ thống sản xuất nhằm đáp ứng chính xác<br />
yêu cầu của cây trồng, ngăn việc sử dụng phân bón hữu cơ, phân bón hóa học, thuốc diệt cỏ một cách<br />
lãng phí, qua đó không những góp phần bảo vệ môi trường, tiết kiệm được sức lao động của con người<br />
mà còn làm tăng năng suất của cây trồng. Trong nghiên cứu này, các mô hình máy học như vectơ hỗ trợ<br />
và mạng nơ-ron được ứng dụng nhằm huấn luyện, nhận dạng và phân loại đồng thời định vị cỏ dại trên<br />
ảnh màu. Kết quả của quá trình phân loại và định vị cỏ dại sẽ được dùng làm thông tin đầu vào cho thiết<br />
bị điều khiển phun thuốc diệt cỏ phù hợp cho từng loại cỏ mà không gây ảnh hưởng đến cây trồng.<br />
Từ khóa: máy học, mạng nơ-ron nhiều lớp, nông nghiệp công nghệ cao, nhận dạng lá cây, support-<br />
vector machine - SVM<br />
ABSTRACT<br />
Nowadays, artificial intelligence is present in almost every fields. Precision agriculture is following the<br />
trend, which is a production system that accurately meets the requirements of plants and prevents<br />
excessive use of organic fertilizers, chemical fertilizers or herbicides. Thereby, it does not only<br />
contribute to protect the environment and save the human labor but also increase the crop productivity.<br />
In this study, the machine learning models i.e. support vector machine and neural networks were applied<br />
to identify, classify weeds and locate its positions on color images. The results of the identification<br />
process could be used as the input information for the potential automatic equipment to suitably spray<br />
herbicides for each type of grasses without affecting the crop.<br />
Keywords: machine learning, multi-layer perceptron, precision agriculture, object recognization,<br />
support vector machine<br />
<br />
<br />
1. Đặt vấn đề trồng và phải xác định được vị trí của cỏ<br />
Để hạn chế tình trạng phun thuốc diệt dại nhằm làm dữ liệu cho hệ thống tự động<br />
cỏ một cách tràn lan, thiếu chính xác, phun thuốc diệt cỏ hoặc hệ thống bón phân<br />
không hiệu quả và có thể gây tác hại cho tự động tại vị trí cây trồng.<br />
môi trường cần phải xây dựng được một hệ Đến thời điểm hiện tại, đã có một số<br />
thống phân biệt đâu là cỏ dại, đâu là cây sản phẩm nghiên cứu có thể nhận dạng và<br />
<br />
Email: nguyentatbaothien@gmail.com 56<br />
NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br />
<br />
<br />
cho biết định danh của một số loại cỏ dại bắp non hoặc là cây cỏ dại. Tập huấn luyện<br />
thường gặp, hoặc ở mức độ cao hơn là xác gồm 40 ảnh về cây bắp non, 40 ảnh vể cây<br />
định được vị trí của cây trồng, chẳng hạn, cỏ dại và 20 ảnh mẫu được dùng để kiểm<br />
một nghiên cứu được thực hiện vào năm tra. Kết quả thực nghiệm cho thấy, ANN<br />
2013, [2], bằng việc phát triển hệ thống thị nhận dạng cây bắp non đạt đến tỷ lệ cao<br />
giác máy tính, hệ thống đã xác định được nhất 100% và cỏ dại là 80%. Điều này chấp<br />
vị trí của cây trồng, tính toán được vùng là nhận được do lượng dữ liệu cho việc huấn<br />
che phủ để thẩm định chất lượng cây trồng. luyện ANN là ít và do hạn chế của phần<br />
Một phương pháp nghiên cứu khác cứng máy tính trong thời gian đó.<br />
cũng được đánh giá cao đó là phương pháp Việc nhận dạng lá tập trung vào 2<br />
Chain code. Phương pháp này sử dụng kỹ nhóm đặc trưng là vân lá và hình dạng lá<br />
thuật Computer-Aided Plant Species với phương pháp Fast Fourier Transform<br />
Identification Technique (CAPSI) để đối (FFT) cũng đã được sử dụng và cho kết<br />
sánh hình dạng của lá [8]. Đầu tiên, ảnh quả khá tốt [3]. Có tất cả 21 đặc trưng của<br />
tiền xử lý được chuyển từ ảnh màu sang lá được rút trích cho việc nhận dạng bao<br />
ảnh xám. Thao tác Sobel được áp dụng trên gồm 10 đặc trưng đầu tiên được rút trích<br />
ảnh nhị phân để xác định các cạnh trên ảnh dựa vào khoảng cách giữa đường viền và<br />
trước khi làm mỏng các cạnh. Quá trình rút đường gân chính của lá, 10 đặc trưng tiếp<br />
trích các tính năng của lá gồm hình dạng, theo được rút trích bằng cách sử dụng các<br />
kích thước, kết cấu và cách sắp xếp của lá hình thái kỹ thuật số với 4 dạng hình học<br />
trên 1 cành dựa trên phương pháp Chain cơ bản, 5 dạng vân lá và 1 đặc trưng cuối<br />
code. Cuối cùng là nhận dạng tính năng cùng được rút trích bằng cách sử dụng kỹ<br />
của lá bằng cách áp dụng kỹ thuật so sánh thuật Convex hull. Kết quả thực nghiệm<br />
tuyến tính. Tuy tỷ lệ nhận dạng cao nhưng của việc sử dụng 1907 ảnh lá cho 32 loại<br />
lại có một số khó khăn trong quá trình thực cây trồng cho thấy tỷ lệ nhận dạng trung<br />
hiện như độ sáng, độ nét của ảnh. Do nhận bình 97.19%<br />
dạng cỏ dại dựa trên các đặc trưng của lá Từ thực tế đó, chúng tôi đề xuất thực<br />
nên có một số nghiên cứu gặp khó khăn hiện đề tài “Nhận dạng và xác định vị trí cỏ<br />
trong trường hợp các lá xếp chồng lên dại lẫn trên luống hoa màu”. Đề tài tuy chỉ<br />
nhau. dừng lại ở việc nhận dạng và xác định vị trí<br />
Trên thế giới đã có rất nhiều tài liệu của cây cỏ dại nhưng đầu ra của hệ thống<br />
nghiên cứu về vấn đề “Nông nghiệp công nhận dạng của chúng tôi sẽ là dữ liệu cho<br />
nghệ cao”. Mỗi tài liệu trình bày một khía các hệ thống tự động với các hoạt động tiếp<br />
cạnh khác nhau của vấn đề. Năm 2000, các theo như phun thuốc diệt cỏ chính xác tại vị<br />
nhà nghiên cứu [1] đã phát triển hệ thống trí đã được xác định hoặc bón phân tại gốc<br />
mạng nơ-ron lan truyền ngược để nhận cây trồng.<br />
dạng cỏ dại trong luống bắp non. Một ảnh 2. Máy học véc tơ hỗ trợ và mạng<br />
kích thước 756x504 pixel được chụp trên nơ-ron nhân tạo<br />
luống bắp, sau đó ảnh được cắt ra thành các 2.1. Máy học véc tơ hỗ trợ<br />
ảnh có kích thước 100x100 pixel sao cho SVM – Support Vectors Machine là<br />
trên ảnh chỉ còn 1 đối tượng hoặc là cây một mô hình học có giám sát, trong lĩnh<br />
<br />
<br />
57<br />
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br />
<br />
<br />
vực máy học [6]. SVM thường được sử nghiên cứu về trí tuệ nhân tạo [9]. Khi các<br />
dụng để phân lớp dữ liệu (classification), hệ thống máy tính được kết nối lại với<br />
hoặc phân tích hồi quy (regression nhau, chúng có thể giải quyết những vấn đề<br />
annalysis). Ý tưởng chính của phương khó khăn hơn. Và quan trọng nhất, khi áp<br />
pháp SVM là cho trước một tập huấn dụng đúng thuật toán, người ta có thể “dạy<br />
luyện, được biểu diễn trong không gian học” cho máy tính. Về bản chất, “học”<br />
vector, trong đó mỗi mẫu là một điểm. chính là quá trình hiệu chỉnh trọng số liên<br />
Phương pháp này tìm ra một siêu phẳng kết giữa các nơ-ron sao cho giá trị hàm lỗi<br />
quyết định tốt nhất có thể chia các điểm là nhỏ nhất. Có ba phương pháp học phổ<br />
trên không gian này thành hai lớp riêng biến là học có giám sát, học không giám<br />
biệt tương ứng là lớp (+) và lớp (-). Chất sát và học tăng cường.<br />
lượng của siêu phẳng này được quyết định Đơn vị xử lý của mạng nơ-ron gọi là<br />
bởi khoảng cách của điểm dữ liệu gần nhất một nơ-ron hay một nút (node) thực hiện<br />
của mỗi lớp đến mặt phẳng này. Khi đó, một công việc rất đơn giản; nó nhận tín<br />
khoảng cách biên càng lớn thì mặt phẳng hiệu vào từ các đơn vị phía trước hay một<br />
có chất lượng càng tốt, đồng thời việc phân nguồn bên ngoài và sử dụng chúng để tính<br />
loại sẽ càng chính xác. Kiến trúc phân loại tín hiệu ra sẽ được lan truyền sang các đơn<br />
SVM được định nghĩa như sau: vị khác.<br />
f(x) = sign(wTx + b)<br />
Trong đó sign(z) = +1 nếu z ≥ 0,<br />
sign(z) = -1 nếu z < 0. Nếu f(x) = +1 thì x<br />
thuộc về lớp dương (lĩnh vực được quan<br />
tâm), và ngược lại, nếu f(x) = -1 thì x thuộc<br />
về lớp âm (các lĩnh vực khác). Điều này<br />
được minh họa trong Hình 1.<br />
Hình 2: Minh họa dữ liệu đầu vào<br />
và đầu ra của một nơ-ron<br />
Trong đó:<br />
xi: các đầu vào<br />
wji: các trọng số tương ứng các đầu vào<br />
θj: độ lệch (bias)<br />
aj: đầu vào mạng (net-input)<br />
zj: đầu ra của nơ-ron<br />
g(x) : hàm chuyển (hàm kích hoạt)<br />
Kiến trúc mạng nơ-ron tích chập được<br />
sử dụng vào năm 2012 được cộng đồng<br />
nghiên cứu gọi với tên gọi là AlexNet do<br />
Hình 1: Minh họa việc xác định siêu tác giả chính của nhóm nghiên cứu là Alex<br />
phẳng phân chia 2 lớp đối tượng Krizhevsky [5]. Vào năm 2017, Nhóm<br />
2.2. Mạng nơ-ron nhân tạo SuperVision gồm các thành viên Alex<br />
Khái niệm về mạng nơ-ron đã có từ Krizhevsky, Ilya Sutskever và Geoff<br />
những năm 1950 với sự ra đời của ngành<br />
<br />
58<br />
NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br />
<br />
<br />
Hinton cùng mạng AlexNet của họ đã đạt 4. Mô hình nhận dạng và xác định vị<br />
được kết quả đáng kinh ngạc với độ chính trí cỏ dại trên luống hoa màu<br />
xác chênh lệch đến hơn 10% (15,31% và Mô hình nhận dạng và định vị cỏ dại<br />
26,17%) [5]. Điều đặc biệt là mạng huấn trên luống hoa màu được mô phỏng dựa<br />
luyện này chỉ nhận dữ liệu đầu vào là các trên sự kết hợp của Máy học véc tơ hỗ trợ<br />
giá trị điểm ảnh thô và không hề áp dụng và Mạng nơ-ron nhân tạo (Hình 3).<br />
bất kỳ phương pháp trích chọn đặc trưng - Dữ liệu đầu vào là tập ảnh màu có độ<br />
nào. Thiết kế kiến trúc mạng huấn luyện phân giải 3264x2448.<br />
gần như một hộp đen với khả năng tự học - Dữ liệu đầu ra là kết quả nhận dạng<br />
thông qua các lớp ẩn, đã khiến CNN nói loại cỏ và vị trí của các cây cỏ có trên ảnh.<br />
riêng cùng học sâu nói chung trở thành giải<br />
pháp mạnh mẽ nhất cho bài toán nhận dạng<br />
và phân loại. Đó cũng chính là lý do, chúng<br />
tôi chọn mạng huấn luyện AlexNet đảm<br />
nhận vai trò nhận dạng loại cỏ có trong ảnh<br />
đầu vào.<br />
3. Tập dữ liệu<br />
Đối tượng hoa màu trong nghiên cứu<br />
này là cây bắp non 2 - 3 tuần tuổi. Chúng<br />
tôi thu thập dữ liệu gồm có:<br />
- 100 ảnh cây bắp non<br />
- 100 ảnh cây cỏ mần trầu<br />
- 100 ảnh cây cỏ rau sam<br />
- 100 ảnh cây bắp có lẫn 1 hoặc 2 loại Hình 3: Mô hình phân loại và xác định vị<br />
cỏ trên. trí cỏ dại trên luống hoa màu<br />
Việc thu thập dữ liệu ảnh được thực - Thế mạnh của SVM là một thuật toán<br />
hiện trên các thửa ruộng bắp ở miền Đông phân loại nhị phân [9], rất thích hợp cho<br />
Nam Bộ bằng camera điện thoại với ảnh ở việc phân lớp bước đầu để biết ảnh đưa vào<br />
chế độ phân giải 3264x2448. Với mục đích là ảnh có cỏ dại hay không.<br />
mô phỏng hệ thống và kiểm tra các giải - Đối với mạng nơ-ron nhân tạo, sau<br />
thuật nhận dạng, đầu tiên chúng tôi thu khi được huấn luyện bằng phương pháp<br />
thập và xử lý trên ảnh tĩnh. Trong trường học có giám sát với tập đặc trưng về lá của<br />
hợp triển khai hệ thống thực tế, trên diện nhiều loại cỏ dại khác nhau, việc nhận<br />
tích lớn, chúng tôi dự định sẽ tiến hành lắp dạng loại cỏ dại sẽ đạt hiệu quả cao hơn.<br />
đặt 1 dãy các camera trên 1 thanh ngang, - Việc kết hợp SVM và mạng nơ-ron<br />
khoảng cách giữa 2 camera bằng khoảng nhân tạo làm cho hệ thống đạt hiệu quả<br />
cách giữa 2 luống bắp, mỗi camera sẽ làm cao, góp phần giúp cho sản xuất nông<br />
nhiệm vụ quét 1 luống. Thanh ngang này nghiệp tiến đến gần khái niệm “nông<br />
sẽ tích hợp thêm đầu phun thuốc và được nghiệp công nghệ cao”.<br />
gắn cố định vào robot; robot sẽ di chuyển 4.1. Tiền xử lý ảnh<br />
giữa 2 luống bắp. Quá trình tiền xử lý ảnh nhằm mục<br />
<br />
59<br />
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br />
<br />
<br />
đích rút trích các đặc trưng của các đối<br />
tượng được thực hiện qua các bước sau:<br />
- Hiệu chỉnh kích thước: ảnh được<br />
hiệu chỉnh về kích thước 1306x980.<br />
<br />
<br />
<br />
<br />
Hình 6: Ảnh sau khi đã loại bỏ nhiễu và<br />
các đối tượng cắt biên ảnh<br />
- Dùng hàm imfill để làm “mịn” đối<br />
Hình 4: Ảnh cây bắp non trước và sau khi tượng trong ảnh bằng cách tô trắng các<br />
hiệu chỉnh kích thước “holes” có trên đối tượng nhằm hỗ trợ cho<br />
việc nhận dạng đối tượng.<br />
- Sau khi tách các kênh màu trên ảnh,<br />
chúng tôi chuyển ảnh màu thành ảnh nhị<br />
phân với ngưỡng Ostu [11], [12].<br />
<br />
<br />
<br />
<br />
Hình 7: Ảnh nhị phân sau khi làm “mịn”<br />
4.2. Rút trích đặc trưng<br />
Để đạt được tỷ lệ nhận dạng chính xác<br />
Hình 5: Ảnh cây bắp sau khi phân đoạn<br />
cao thì bước quan trọng nhất là rút trích<br />
ảnh dựa trên ngưỡng Ostu<br />
đặc trưng và đây là kỹ thuật sử dụng các<br />
- Dùng thuật toán mở, xóa nền của ảnh thuật toán để lấy ra những thông tin mang<br />
và loại bỏ các đối tượng cắt biên ảnh nhằm những đặc điểm riêng biệt của đối tượng có<br />
thu được trọn vẹn đối tượng cần xét. Thực trong ảnh.<br />
hiện xóa nhiễu trên ảnh bằng cách loại bỏ Để xây dựng tập đặc trưng huấn luyện<br />
các đối tượng ảnh có diện tích nhỏ hơn 1 cho kiến trúc SVM, chúng tôi sử dụng kỹ<br />
ngưỡng diện tích xác định. thuật SURF (Speed Up Robust Feature)<br />
<br />
<br />
60<br />
NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br />
<br />
<br />
[7], sau đó sử dụng kỹ thuật 4.3. Kiến trúc SVM - Support Vector<br />
K-Mean [4] để phân nhóm đối tượng có Machine<br />
trong ảnh. Vì SVM là một mô hình học có giám<br />
Đối với mạng AlexNet, tập đặc trưng sát nên ta cần xây phân loại ảnh đầu vào<br />
để huấn luyện cho mạng này được xây thành 2 nhóm cơ bản: nhóm 1: ảnh là cây<br />
dựng trực tiếp một cách tự động dựa trên bắp non; nhóm 2: ảnh là cây cỏ và ảnh là<br />
ảnh màu. cây bắp non lẫn cỏ.<br />
<br />
Bảng 1: Phân loại dữ liệu thành 2 nhóm<br />
<br />
<br />
<br />
<br />
Hình chỉ có cây bắp Hình có cả bắp lẫn cỏ<br />
<br />
Việc rút trích đặc trưng trên một ảnh Số bộ lọc: 96<br />
xám được thực hiện dựa trên thuật toán Kích thước bộ lọc: 11 x 11 x 3<br />
SURF. Chúng tôi xây dựng tập đặc trưng Bước trượt (Stride): 4<br />
cho 1 đối tượng trên ảnh. Với tập dữ liệu Đầu ra: (224/4) x (224/4) x 96 = 55<br />
thu được, chúng tôi sử dụng thuật toán K- x 55 x 96, chia đều cho hai GPU<br />
Mean để gom nhóm phân loại đối tượng Lớp chuyển tiếp sang lớp 2 (Lấy<br />
trong ảnh. mẫu tối đa).<br />
Khi một ảnh màu được đưa vào, ảnh sẽ Đầu vào: 55 x 55 x 96<br />
được tiền xử lý để thu được ảnh nhị phân Đầu ra: (55/2) x (55/2) x 96 = 27 x<br />
để chuyển vào kiến trúc SVM. Tại đây ảnh 27 x 96<br />
được phân loại: nếu là cây bắp thì hệ thống - Lớp 2 (Tích chập):<br />
sẽ xuất ra thông báo; ngược lại ảnh sẽ được Đầu vào: 27 x 27 x 96<br />
chuyển sang kiến trúc AlexNet. Số bộ lọc: 256<br />
4.4. Kiến trúc mạng AlexNet Kích thước bộ lọc: 5 x 5 x 48<br />
AlexNet bao gồm 5 lớp tích chập và 3 Đầu ra: 27 x 27 x 256, chia đều cho<br />
lớp kết nối đầy đủ: hai GPU.<br />
- Lớp 1 (Tích chập): - Lớp 3, 4, 5:<br />
Đầu vào: Ảnh với kích thước 224 x Tương tự như với lớp 1 và lớp 2 với<br />
224 x 3 (3 là con số tương ứng với 3 màu các kích thước bộ lọc lần lượt là 3 x 3 x<br />
đỏ, xanh lục, xanh lam trong hệ màu RGB 256, 3 x 3 x 384 và 3 x 3 x 384. Toàn bộ các<br />
thông thường) lớp tính toán này đều được chia đều cho hai<br />
<br />
61<br />
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br />
<br />
<br />
GPU để tăng tốc độ xử lý. Đầu ra cuối cùng Số nơ-rôn: 4096<br />
qua lớp Tích chập thứ 5 là dữ liệu với kích - Lớp 7 (Kết nối đầy đủ): tương tự lớp<br />
thước 13 x 13 x 128, dữ liệu này sau khi đi 6.<br />
qua một lớp lấy mẫu cuối cùng sẽ được - Lớp 8 (Kết nối đầy đủ): là lớp cuối<br />
dùng làm đầu vào cho các lớp sau đó là các cùng trong mạng AlexNet này có 1000<br />
lớp Kết nối đầy đủ. nơron, tương ứng với 1000 lớp khác nhau<br />
- Lớp 6 (Kết nối đầy đủ): mà bộ huấn luyện cần nhận dạng.<br />
Đầu vào: 6 x 6 x 256<br />
<br />
<br />
<br />
<br />
Hình 8: Mô phỏng cấu trúc mạng AlexNet [13]<br />
<br />
Mỗi lớp tích chập đều có Feature Map, Dựa vào kết quả đánh giá sau khi huấn<br />
ReLU, LRN (Local Response Normalized) luyện trên tập ảnh thu thập được, chúng tôi<br />
và Overlap max pooling. nhận được tỷ lệ nhận dạng cao. Mặc dù,<br />
Với tập ảnh gồm 3 thư mục con (cây mỗi lần hệ thống thực thi thì số ảnh được<br />
bắp non lẫn cỏ, cỏ rau sam và cỏ mần trầu), chọn làm tập huấn luyện và tập đánh giá là<br />
với số ảnh màu trong mỗi thư mục là tùy ý, ngẫu nhiên nhưng tỷ lệ chính xác chúng tôi<br />
ở đây, chúng tôi sử dụng: thu được luôn cao hơn 90%.<br />
- Thư mục cây bắp non lẫn cỏ: 37 ảnh 5. Kết quả thực nghiệm<br />
- Thư mục Cỏ mần trầu: 55 ảnh Hệ thống thực nghiệm được mô phỏng<br />
- Thư mục Cỏ rau sam: 93 ảnh trong môi trường Matlab 2018a<br />
Mạng huấn luyện AlexNet sẽ chia Ảnh sau khi được tiền xử lý sẽ được<br />
ngẫu nhiên thành 2 tập: ở đây, chúng tôi rút trích đặc trưng và tiến hành so sánh với<br />
chọn ngẫu nhiên 70% số ảnh cho tập huấn các đặc trưng có trong tập huấn luyện của<br />
luyện và 30% số ảnh cho tập SVM để đưa ra kết quả là ảnh của bắp hay<br />
đánh giá. không.<br />
Với mô hình AlexNet, ảnh màu được - Nếu là ảnh của bắp sẽ xuất ra thông<br />
chuẩn hóa kích thước 227x227x3 trước khi báo.<br />
đưa vào mạng AlexNet. Sau khi đi qua các - Nếu không, ảnh sẽ được sử dụng lại<br />
lớp tích chập, mỗi ảnh màu sẽ được trích ra tên để tìm lại ảnh gốc ban đầu và chuyển<br />
4096 đặc trưng làm đầu vào cho lớp kết nối sang mạng AlexNet để phân loại. Mạng<br />
đầy đủ đầu tiên. AlexNet phân loại chính xác các đối tượng<br />
<br />
62<br />
NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br />
<br />
<br />
có trong ảnh sau đó chuyển đối tượng ảnh Nếu ảnh đầu vào là 1 trong 2 loại cỏ:<br />
vào đúng khung phân loại nếu trên ảnh là 1<br />
trong 2 loại cỏ trên hoặc ảnh có cả bắp lẫn<br />
cỏ. Đối với trường hợp trong ảnh có cả bắp<br />
lẫn cỏ thì chúng tôi cũng gán nhãn chính<br />
xác được cho các đối tượng có trong ảnh.<br />
- Với tập ảnh gồm 35 ảnh nhị phân là<br />
cây bắp non và 35 ảnh nhị phân gồm có<br />
ảnh của 2 loại cỏ và ảnh có cả bắp lẫn cỏ.<br />
Để huấn luyện cho SVM, trong bài toán Hình 10: Thông báo của hệ thống nếu ảnh<br />
này, chúng tôi chọn ra ngẫu nhiên 40% ảnh chỉ có cây cỏ mần trầu<br />
trong mỗi tập và 60% ảnh còn lại để đánh Nếu ảnh đầu vào là ảnh có cả cỏ lẫn<br />
giá. Việc rút trích đặc trưng dựa trên thuật bắp: ảnh sẽ được phân vùng các đối tượng<br />
toán SURF và trích ra 20 đặc trưng mạnh và tiến hành gán nhãn cho từng đối tượng<br />
nhất có trên mỗi ảnh để huấn luyện. Sau sau khi được tách ra riêng biệt.<br />
đó, thuật toán gom nhóm K-Mean có vai<br />
trò trả về kết quả ảnh đầu ra là bắp hoặc<br />
không. Trên cùng một tập huấn luyện<br />
nhưng mỗi lần thực thi hệ thống chọn ra<br />
một tập ảnh ngẫu nhiên nên độ chính xác<br />
của thuật toán luôn biến động, song qua<br />
nhiều lần thực thi chúng tôi nhận được kết<br />
quả nhận dạng của kiến trúc SVM là đáng<br />
tin cậy trên 80%.<br />
Với mạng AlexNet, chúng tôi có 3 loại<br />
nhãn để lựa chọn gán cho 1 ảnh: 1, ảnh cỏ<br />
mần trầu; 2, ảnh cỏ rau sam; 3, ảnh có cả<br />
Hình 11: Ảnh được phân vùng các đối<br />
bắp lẫn cỏ. Ảnh để huấn luyện cho mạng<br />
tượng trên ảnh<br />
AlexNet là ảnh màu chưa qua bất kỳ giai<br />
Các đối tượng trong ảnh ở trường hợp<br />
đoạn tiền xử lý nào. Các kết quả có thể thu<br />
có cả bắp lẫn cỏ sau khi phân vùng sẽ được<br />
được khi có 1 ảnh đưa vào kiểm tra:<br />
cắt thành các đối tượng riêng biệt và một<br />
Nếu ảnh đầu vào là bắp: xuất ra thông<br />
lần nữa đưa vào AlexNet để được gán<br />
báo:<br />
nhãn:<br />
<br />
<br />
<br />
<br />
Hình 9: Thông báo của hệ thống nếu ảnh Hình 12: Các đối tượng riêng biệt đã được<br />
chỉ có cây bắp gán nhãn<br />
<br />
<br />
63<br />
SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br />
<br />
<br />
6. Kết luận và hướng nghiên cứu<br />
tiếp theo<br />
Với tập ảnh thu thập được, sau tiền xử<br />
lý tập ảnh để xây dựng tập đặc trưng huấn<br />
luyện cho SVM, chúng tôi có được kết quả<br />
nhận dạng với tỷ lệ chính xác chấp nhận Hình 13: Kết quả tỷ lệ nhận dạng chính<br />
được: xác của kiến trúc SVM<br />
<br />
<br />
<br />
<br />
Hình 14: Tiến trình huấn luyện và tỷ lệ chính xác của mạng AlexNet<br />
<br />
<br />
Đối với ảnh chỉ có 1 loại cỏ, hệ thống nhãn cũng không thực hiện được.<br />
đã nhận dạng đúng và xác định được vị trí Hướng nghiên cứu sắp tới:<br />
của cỏ trên ảnh. Riêng với ảnh có cả bắp - Xử lý tốt trường hợp ảnh có bắp và<br />
lẫn cỏ trong trường hợp không chồng lắp cỏ chồng lắp lên nhau.<br />
thì hệ thống đã tách ra và gán nhãn đúng - Xác định được vị trí của các đối<br />
cho các đối tượng có trong ảnh nhưng vẫn tượng trong trường hợp trên ảnh có cả bắp<br />
chưa xác định vị trí của cỏ có trong ảnh. lẫn cỏ.<br />
Riêng trường hợp ảnh có bắp lẫn cỏ - Xây dựng hệ thống tự động phun<br />
dại bị chồng lắp lên nhau việc cắt rời các thuốc diệt cỏ dựa và xử lý vấn đề thời<br />
đối tượng gặp lỗi nên dẫn đến việc gán gian thực.<br />
<br />
<br />
LỜI CẢM ƠN<br />
Chúng tôi xin chân thành cám ơn Học Viện Công Nghệ Bưu Chính Viễn Thông và Trường<br />
Đại Học Công Nghệ Thông Tin tạo điều kiện cho chúng tôi hoàn thành bài báo này.<br />
<br />
<br />
<br />
64<br />
NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br />
<br />
<br />
TÀI LIỆU THAM KHẢO<br />
[1] C.-C. Yang, S.O. Prasher, J.-A. Landry, H.S. Ramaswamy, A. Ditommaso,<br />
“Application of artificial neural networks in image recognition and classification of crop<br />
and weeds”, Canadian Agricultural Engineering, Vol. 42., No.3, pp 147-152, 2000.<br />
[2] Michael Weyrich, Yongheng Wang, Matthias Scharf, “Quality assessment of row<br />
Crop plants by using a machine vision system”, IECON 2013 - 39th Annual<br />
Conference of the IEEE Industrial Electronics Society, pp 2466-2471, 2013.<br />
[3] Kue-Bum Lee and Kwang-Seok Hong, “An Implementation of Leaf Recognition<br />
System using Leaf Vein And Shape”, International Journal of Bio-Science and Bio-<br />
Technology, Vol. 5, No. 2, April 2013.<br />
[4] Oyelade, O. J, Oladipupo, O. O, Obagbuwa, I. C, “Application of k-Means Clustering<br />
algorithm for prediction of Students’ Academic Performance”, International Journal<br />
of Computer Science and Information Security, Vol. 7, No.1, 2010.<br />
[5] Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, “ImageNet classification with deep<br />
convolutional neural networks”, Communications of the ACM, Vol.60, No.6, June 2017.<br />
[6] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin, “A Practical Guide to Support<br />
Vector Classification”, Technical report, Department of Computer Science, National<br />
Taiwan University. July, 2003.<br />
[7] Herbert Bay, Tinne Tuytelaars, and Luc Van Gool1, “SURF: Speeded Up Robust<br />
Features”, Computer Vision – ECCV 2006: 9th European Conference on Computer<br />
Vision, Graz, Austria, May 7-13, 2006. Proceedings, Part I (pp.404-417).<br />
[8] Miss. Pande Ankita V. , Prof. Shandilya V.K, “Digital Image Processing Approach for<br />
Fruit and Flower Leaf Identification and Recognition”, International Journal Of<br />
Engineering And Computer Science, Vol. 2, No. 4, pp. 1280-1285, 2013.<br />
[9] Awad M., Khanna R, “Support Vector Machines for Classification”, Efficient<br />
Learning Machines, pp 39-66, 2015, Apress, Berkeley, CA<br />
[10] “A Comprehensive Study of Artificial Neural Networks”, International Journal of<br />
Advanced Research in Computer Science and Software Engineering, Vol. 2, No. 10,<br />
pp.278-284, 2012.<br />
[11] Hongzhi Wang, Ying Dong “An Improved Ostu Method for Image Segmentation”,<br />
Proceedings of SPIE - The International Society for Optical Engineering, Beijing,<br />
March 2008.<br />
[12] Ostu N., “A threshold selection method from gray-level histogram”, IEEE<br />
Transaction on Systems, Man, and Cybernetics, Vol. 9, No. 1, pp 62-66, 1979.<br />
[13] Rakshith Vasudev. (2019, Feb). [Online] HYPERLINK https://towardsdatascience.com/<br />
understanding-and-calculating-the-number-of-parameters-in-convolution-neural-networks<br />
-cnns-fc88790d530d<br />
<br />
Ngày nhận bài: 07/4/2019 Biên tập xong: 15/5/2019 Duyệt đăng: 20/5/2019<br />
<br />
65<br />