intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Nhận dạng và xác định vị trí cỏ dại trên luống hoa màu dùng máy véc tơ hỗ trợ và mạng nơ ron

Chia sẻ: ViVatican2711 ViVatican2711 | Ngày: | Loại File: PDF | Số trang:10

24
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nông nghiệp công nghệ cao ứng dụng hệ thần kinh nhân tạo cũng theo xu thế đó, đây là hệ thống sản xuất nhằm đáp ứng chính xác yêu cầu của cây trồng, ngăn việc sử dụng phân bón hữu cơ, phân bón hóa học, thuốc diệt cỏ một cách lãng phí, qua đó không những góp phần bảo vệ môi trường, tiết kiệm được sức lao động của con người mà còn làm tăng năng suất của cây trồng.

Chủ đề:
Lưu

Nội dung Text: Nhận dạng và xác định vị trí cỏ dại trên luống hoa màu dùng máy véc tơ hỗ trợ và mạng nơ ron

TRƯỜNG ĐẠI HỌC SÀI GÒN SAIGON UNIVERSITY<br /> TẠP CHÍ KHOA HỌC SCIENTIFIC JOURNAL<br /> ĐẠI HỌC SÀI GÒN OF SAIGON UNIVERSITY<br /> Số 65 (5/2019) No. 65 (5/2019)<br /> Email: tcdhsg@sgu.edu.vn ; Website: https://tapchikhoahoc.sgu.edu.vn<br /> <br /> <br /> NHẬN DẠNG VÀ XÁC ĐỊNH VỊ TRÍ CỎ DẠI TRÊN LUỐNG HOA<br /> MÀU DÙNG MÁY VÉC TƠ HỖ TRỢ VÀ MẠNG NƠ-RON<br /> Weed detection in vegetable garden using support-vector<br /> machine and neural networks<br /> <br /> TS. Nguyễn Tất Bảo Thiện(1), Nguyễn Thị Cẩm Tú(2)<br /> Học viện Công nghệ Bưu chính Viễn thông, Cơ sở tại TP.HCM<br /> (1)<br /> <br /> Trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM<br /> (2)<br /> <br /> <br /> TÓM TẮT<br /> Ngày nay, trí tuệ nhân tạo được ứng dụng trong hầu hết trên mọi lĩnh vực. Nông nghiệp công nghệ cao<br /> ứng dụng hệ thần kinh nhân tạo cũng theo xu thế đó, đây là hệ thống sản xuất nhằm đáp ứng chính xác<br /> yêu cầu của cây trồng, ngăn việc sử dụng phân bón hữu cơ, phân bón hóa học, thuốc diệt cỏ một cách<br /> lãng phí, qua đó không những góp phần bảo vệ môi trường, tiết kiệm được sức lao động của con người<br /> mà còn làm tăng năng suất của cây trồng. Trong nghiên cứu này, các mô hình máy học như vectơ hỗ trợ<br /> và mạng nơ-ron được ứng dụng nhằm huấn luyện, nhận dạng và phân loại đồng thời định vị cỏ dại trên<br /> ảnh màu. Kết quả của quá trình phân loại và định vị cỏ dại sẽ được dùng làm thông tin đầu vào cho thiết<br /> bị điều khiển phun thuốc diệt cỏ phù hợp cho từng loại cỏ mà không gây ảnh hưởng đến cây trồng.<br /> Từ khóa: máy học, mạng nơ-ron nhiều lớp, nông nghiệp công nghệ cao, nhận dạng lá cây, support-<br /> vector machine - SVM<br /> ABSTRACT<br /> Nowadays, artificial intelligence is present in almost every fields. Precision agriculture is following the<br /> trend, which is a production system that accurately meets the requirements of plants and prevents<br /> excessive use of organic fertilizers, chemical fertilizers or herbicides. Thereby, it does not only<br /> contribute to protect the environment and save the human labor but also increase the crop productivity.<br /> In this study, the machine learning models i.e. support vector machine and neural networks were applied<br /> to identify, classify weeds and locate its positions on color images. The results of the identification<br /> process could be used as the input information for the potential automatic equipment to suitably spray<br /> herbicides for each type of grasses without affecting the crop.<br /> Keywords: machine learning, multi-layer perceptron, precision agriculture, object recognization,<br /> support vector machine<br /> <br /> <br /> 1. Đặt vấn đề trồng và phải xác định được vị trí của cỏ<br /> Để hạn chế tình trạng phun thuốc diệt dại nhằm làm dữ liệu cho hệ thống tự động<br /> cỏ một cách tràn lan, thiếu chính xác, phun thuốc diệt cỏ hoặc hệ thống bón phân<br /> không hiệu quả và có thể gây tác hại cho tự động tại vị trí cây trồng.<br /> môi trường cần phải xây dựng được một hệ Đến thời điểm hiện tại, đã có một số<br /> thống phân biệt đâu là cỏ dại, đâu là cây sản phẩm nghiên cứu có thể nhận dạng và<br /> <br /> Email: nguyentatbaothien@gmail.com 56<br /> NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br /> <br /> <br /> cho biết định danh của một số loại cỏ dại bắp non hoặc là cây cỏ dại. Tập huấn luyện<br /> thường gặp, hoặc ở mức độ cao hơn là xác gồm 40 ảnh về cây bắp non, 40 ảnh vể cây<br /> định được vị trí của cây trồng, chẳng hạn, cỏ dại và 20 ảnh mẫu được dùng để kiểm<br /> một nghiên cứu được thực hiện vào năm tra. Kết quả thực nghiệm cho thấy, ANN<br /> 2013, [2], bằng việc phát triển hệ thống thị nhận dạng cây bắp non đạt đến tỷ lệ cao<br /> giác máy tính, hệ thống đã xác định được nhất 100% và cỏ dại là 80%. Điều này chấp<br /> vị trí của cây trồng, tính toán được vùng là nhận được do lượng dữ liệu cho việc huấn<br /> che phủ để thẩm định chất lượng cây trồng. luyện ANN là ít và do hạn chế của phần<br /> Một phương pháp nghiên cứu khác cứng máy tính trong thời gian đó.<br /> cũng được đánh giá cao đó là phương pháp Việc nhận dạng lá tập trung vào 2<br /> Chain code. Phương pháp này sử dụng kỹ nhóm đặc trưng là vân lá và hình dạng lá<br /> thuật Computer-Aided Plant Species với phương pháp Fast Fourier Transform<br /> Identification Technique (CAPSI) để đối (FFT) cũng đã được sử dụng và cho kết<br /> sánh hình dạng của lá [8]. Đầu tiên, ảnh quả khá tốt [3]. Có tất cả 21 đặc trưng của<br /> tiền xử lý được chuyển từ ảnh màu sang lá được rút trích cho việc nhận dạng bao<br /> ảnh xám. Thao tác Sobel được áp dụng trên gồm 10 đặc trưng đầu tiên được rút trích<br /> ảnh nhị phân để xác định các cạnh trên ảnh dựa vào khoảng cách giữa đường viền và<br /> trước khi làm mỏng các cạnh. Quá trình rút đường gân chính của lá, 10 đặc trưng tiếp<br /> trích các tính năng của lá gồm hình dạng, theo được rút trích bằng cách sử dụng các<br /> kích thước, kết cấu và cách sắp xếp của lá hình thái kỹ thuật số với 4 dạng hình học<br /> trên 1 cành dựa trên phương pháp Chain cơ bản, 5 dạng vân lá và 1 đặc trưng cuối<br /> code. Cuối cùng là nhận dạng tính năng cùng được rút trích bằng cách sử dụng kỹ<br /> của lá bằng cách áp dụng kỹ thuật so sánh thuật Convex hull. Kết quả thực nghiệm<br /> tuyến tính. Tuy tỷ lệ nhận dạng cao nhưng của việc sử dụng 1907 ảnh lá cho 32 loại<br /> lại có một số khó khăn trong quá trình thực cây trồng cho thấy tỷ lệ nhận dạng trung<br /> hiện như độ sáng, độ nét của ảnh. Do nhận bình 97.19%<br /> dạng cỏ dại dựa trên các đặc trưng của lá Từ thực tế đó, chúng tôi đề xuất thực<br /> nên có một số nghiên cứu gặp khó khăn hiện đề tài “Nhận dạng và xác định vị trí cỏ<br /> trong trường hợp các lá xếp chồng lên dại lẫn trên luống hoa màu”. Đề tài tuy chỉ<br /> nhau. dừng lại ở việc nhận dạng và xác định vị trí<br /> Trên thế giới đã có rất nhiều tài liệu của cây cỏ dại nhưng đầu ra của hệ thống<br /> nghiên cứu về vấn đề “Nông nghiệp công nhận dạng của chúng tôi sẽ là dữ liệu cho<br /> nghệ cao”. Mỗi tài liệu trình bày một khía các hệ thống tự động với các hoạt động tiếp<br /> cạnh khác nhau của vấn đề. Năm 2000, các theo như phun thuốc diệt cỏ chính xác tại vị<br /> nhà nghiên cứu [1] đã phát triển hệ thống trí đã được xác định hoặc bón phân tại gốc<br /> mạng nơ-ron lan truyền ngược để nhận cây trồng.<br /> dạng cỏ dại trong luống bắp non. Một ảnh 2. Máy học véc tơ hỗ trợ và mạng<br /> kích thước 756x504 pixel được chụp trên nơ-ron nhân tạo<br /> luống bắp, sau đó ảnh được cắt ra thành các 2.1. Máy học véc tơ hỗ trợ<br /> ảnh có kích thước 100x100 pixel sao cho SVM – Support Vectors Machine là<br /> trên ảnh chỉ còn 1 đối tượng hoặc là cây một mô hình học có giám sát, trong lĩnh<br /> <br /> <br /> 57<br /> SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br /> <br /> <br /> vực máy học [6]. SVM thường được sử nghiên cứu về trí tuệ nhân tạo [9]. Khi các<br /> dụng để phân lớp dữ liệu (classification), hệ thống máy tính được kết nối lại với<br /> hoặc phân tích hồi quy (regression nhau, chúng có thể giải quyết những vấn đề<br /> annalysis). Ý tưởng chính của phương khó khăn hơn. Và quan trọng nhất, khi áp<br /> pháp SVM là cho trước một tập huấn dụng đúng thuật toán, người ta có thể “dạy<br /> luyện, được biểu diễn trong không gian học” cho máy tính. Về bản chất, “học”<br /> vector, trong đó mỗi mẫu là một điểm. chính là quá trình hiệu chỉnh trọng số liên<br /> Phương pháp này tìm ra một siêu phẳng kết giữa các nơ-ron sao cho giá trị hàm lỗi<br /> quyết định tốt nhất có thể chia các điểm là nhỏ nhất. Có ba phương pháp học phổ<br /> trên không gian này thành hai lớp riêng biến là học có giám sát, học không giám<br /> biệt tương ứng là lớp (+) và lớp (-). Chất sát và học tăng cường.<br /> lượng của siêu phẳng này được quyết định Đơn vị xử lý của mạng nơ-ron gọi là<br /> bởi khoảng cách của điểm dữ liệu gần nhất một nơ-ron hay một nút (node) thực hiện<br /> của mỗi lớp đến mặt phẳng này. Khi đó, một công việc rất đơn giản; nó nhận tín<br /> khoảng cách biên càng lớn thì mặt phẳng hiệu vào từ các đơn vị phía trước hay một<br /> có chất lượng càng tốt, đồng thời việc phân nguồn bên ngoài và sử dụng chúng để tính<br /> loại sẽ càng chính xác. Kiến trúc phân loại tín hiệu ra sẽ được lan truyền sang các đơn<br /> SVM được định nghĩa như sau: vị khác.<br /> f(x) = sign(wTx + b)<br /> Trong đó sign(z) = +1 nếu z ≥ 0,<br /> sign(z) = -1 nếu z < 0. Nếu f(x) = +1 thì x<br /> thuộc về lớp dương (lĩnh vực được quan<br /> tâm), và ngược lại, nếu f(x) = -1 thì x thuộc<br /> về lớp âm (các lĩnh vực khác). Điều này<br /> được minh họa trong Hình 1.<br /> Hình 2: Minh họa dữ liệu đầu vào<br /> và đầu ra của một nơ-ron<br /> Trong đó:<br /> xi: các đầu vào<br /> wji: các trọng số tương ứng các đầu vào<br /> θj: độ lệch (bias)<br /> aj: đầu vào mạng (net-input)<br /> zj: đầu ra của nơ-ron<br /> g(x) : hàm chuyển (hàm kích hoạt)<br /> Kiến trúc mạng nơ-ron tích chập được<br /> sử dụng vào năm 2012 được cộng đồng<br /> nghiên cứu gọi với tên gọi là AlexNet do<br /> Hình 1: Minh họa việc xác định siêu tác giả chính của nhóm nghiên cứu là Alex<br /> phẳng phân chia 2 lớp đối tượng Krizhevsky [5]. Vào năm 2017, Nhóm<br /> 2.2. Mạng nơ-ron nhân tạo SuperVision gồm các thành viên Alex<br /> Khái niệm về mạng nơ-ron đã có từ Krizhevsky, Ilya Sutskever và Geoff<br /> những năm 1950 với sự ra đời của ngành<br /> <br /> 58<br /> NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br /> <br /> <br /> Hinton cùng mạng AlexNet của họ đã đạt 4. Mô hình nhận dạng và xác định vị<br /> được kết quả đáng kinh ngạc với độ chính trí cỏ dại trên luống hoa màu<br /> xác chênh lệch đến hơn 10% (15,31% và Mô hình nhận dạng và định vị cỏ dại<br /> 26,17%) [5]. Điều đặc biệt là mạng huấn trên luống hoa màu được mô phỏng dựa<br /> luyện này chỉ nhận dữ liệu đầu vào là các trên sự kết hợp của Máy học véc tơ hỗ trợ<br /> giá trị điểm ảnh thô và không hề áp dụng và Mạng nơ-ron nhân tạo (Hình 3).<br /> bất kỳ phương pháp trích chọn đặc trưng - Dữ liệu đầu vào là tập ảnh màu có độ<br /> nào. Thiết kế kiến trúc mạng huấn luyện phân giải 3264x2448.<br /> gần như một hộp đen với khả năng tự học - Dữ liệu đầu ra là kết quả nhận dạng<br /> thông qua các lớp ẩn, đã khiến CNN nói loại cỏ và vị trí của các cây cỏ có trên ảnh.<br /> riêng cùng học sâu nói chung trở thành giải<br /> pháp mạnh mẽ nhất cho bài toán nhận dạng<br /> và phân loại. Đó cũng chính là lý do, chúng<br /> tôi chọn mạng huấn luyện AlexNet đảm<br /> nhận vai trò nhận dạng loại cỏ có trong ảnh<br /> đầu vào.<br /> 3. Tập dữ liệu<br /> Đối tượng hoa màu trong nghiên cứu<br /> này là cây bắp non 2 - 3 tuần tuổi. Chúng<br /> tôi thu thập dữ liệu gồm có:<br /> - 100 ảnh cây bắp non<br /> - 100 ảnh cây cỏ mần trầu<br /> - 100 ảnh cây cỏ rau sam<br /> - 100 ảnh cây bắp có lẫn 1 hoặc 2 loại Hình 3: Mô hình phân loại và xác định vị<br /> cỏ trên. trí cỏ dại trên luống hoa màu<br /> Việc thu thập dữ liệu ảnh được thực - Thế mạnh của SVM là một thuật toán<br /> hiện trên các thửa ruộng bắp ở miền Đông phân loại nhị phân [9], rất thích hợp cho<br /> Nam Bộ bằng camera điện thoại với ảnh ở việc phân lớp bước đầu để biết ảnh đưa vào<br /> chế độ phân giải 3264x2448. Với mục đích là ảnh có cỏ dại hay không.<br /> mô phỏng hệ thống và kiểm tra các giải - Đối với mạng nơ-ron nhân tạo, sau<br /> thuật nhận dạng, đầu tiên chúng tôi thu khi được huấn luyện bằng phương pháp<br /> thập và xử lý trên ảnh tĩnh. Trong trường học có giám sát với tập đặc trưng về lá của<br /> hợp triển khai hệ thống thực tế, trên diện nhiều loại cỏ dại khác nhau, việc nhận<br /> tích lớn, chúng tôi dự định sẽ tiến hành lắp dạng loại cỏ dại sẽ đạt hiệu quả cao hơn.<br /> đặt 1 dãy các camera trên 1 thanh ngang, - Việc kết hợp SVM và mạng nơ-ron<br /> khoảng cách giữa 2 camera bằng khoảng nhân tạo làm cho hệ thống đạt hiệu quả<br /> cách giữa 2 luống bắp, mỗi camera sẽ làm cao, góp phần giúp cho sản xuất nông<br /> nhiệm vụ quét 1 luống. Thanh ngang này nghiệp tiến đến gần khái niệm “nông<br /> sẽ tích hợp thêm đầu phun thuốc và được nghiệp công nghệ cao”.<br /> gắn cố định vào robot; robot sẽ di chuyển 4.1. Tiền xử lý ảnh<br /> giữa 2 luống bắp. Quá trình tiền xử lý ảnh nhằm mục<br /> <br /> 59<br /> SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br /> <br /> <br /> đích rút trích các đặc trưng của các đối<br /> tượng được thực hiện qua các bước sau:<br /> - Hiệu chỉnh kích thước: ảnh được<br /> hiệu chỉnh về kích thước 1306x980.<br /> <br /> <br /> <br /> <br /> Hình 6: Ảnh sau khi đã loại bỏ nhiễu và<br /> các đối tượng cắt biên ảnh<br /> - Dùng hàm imfill để làm “mịn” đối<br /> Hình 4: Ảnh cây bắp non trước và sau khi tượng trong ảnh bằng cách tô trắng các<br /> hiệu chỉnh kích thước “holes” có trên đối tượng nhằm hỗ trợ cho<br /> việc nhận dạng đối tượng.<br /> - Sau khi tách các kênh màu trên ảnh,<br /> chúng tôi chuyển ảnh màu thành ảnh nhị<br /> phân với ngưỡng Ostu [11], [12].<br /> <br /> <br /> <br /> <br /> Hình 7: Ảnh nhị phân sau khi làm “mịn”<br /> 4.2. Rút trích đặc trưng<br /> Để đạt được tỷ lệ nhận dạng chính xác<br /> Hình 5: Ảnh cây bắp sau khi phân đoạn<br /> cao thì bước quan trọng nhất là rút trích<br /> ảnh dựa trên ngưỡng Ostu<br /> đặc trưng và đây là kỹ thuật sử dụng các<br /> - Dùng thuật toán mở, xóa nền của ảnh thuật toán để lấy ra những thông tin mang<br /> và loại bỏ các đối tượng cắt biên ảnh nhằm những đặc điểm riêng biệt của đối tượng có<br /> thu được trọn vẹn đối tượng cần xét. Thực trong ảnh.<br /> hiện xóa nhiễu trên ảnh bằng cách loại bỏ Để xây dựng tập đặc trưng huấn luyện<br /> các đối tượng ảnh có diện tích nhỏ hơn 1 cho kiến trúc SVM, chúng tôi sử dụng kỹ<br /> ngưỡng diện tích xác định. thuật SURF (Speed Up Robust Feature)<br /> <br /> <br /> 60<br /> NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br /> <br /> <br /> [7], sau đó sử dụng kỹ thuật 4.3. Kiến trúc SVM - Support Vector<br /> K-Mean [4] để phân nhóm đối tượng có Machine<br /> trong ảnh. Vì SVM là một mô hình học có giám<br /> Đối với mạng AlexNet, tập đặc trưng sát nên ta cần xây phân loại ảnh đầu vào<br /> để huấn luyện cho mạng này được xây thành 2 nhóm cơ bản: nhóm 1: ảnh là cây<br /> dựng trực tiếp một cách tự động dựa trên bắp non; nhóm 2: ảnh là cây cỏ và ảnh là<br /> ảnh màu. cây bắp non lẫn cỏ.<br /> <br /> Bảng 1: Phân loại dữ liệu thành 2 nhóm<br /> <br /> <br /> <br /> <br /> Hình chỉ có cây bắp Hình có cả bắp lẫn cỏ<br /> <br /> Việc rút trích đặc trưng trên một ảnh  Số bộ lọc: 96<br /> xám được thực hiện dựa trên thuật toán  Kích thước bộ lọc: 11 x 11 x 3<br /> SURF. Chúng tôi xây dựng tập đặc trưng  Bước trượt (Stride): 4<br /> cho 1 đối tượng trên ảnh. Với tập dữ liệu  Đầu ra: (224/4) x (224/4) x 96 = 55<br /> thu được, chúng tôi sử dụng thuật toán K- x 55 x 96, chia đều cho hai GPU<br /> Mean để gom nhóm phân loại đối tượng  Lớp chuyển tiếp sang lớp 2 (Lấy<br /> trong ảnh. mẫu tối đa).<br /> Khi một ảnh màu được đưa vào, ảnh sẽ  Đầu vào: 55 x 55 x 96<br /> được tiền xử lý để thu được ảnh nhị phân  Đầu ra: (55/2) x (55/2) x 96 = 27 x<br /> để chuyển vào kiến trúc SVM. Tại đây ảnh 27 x 96<br /> được phân loại: nếu là cây bắp thì hệ thống - Lớp 2 (Tích chập):<br /> sẽ xuất ra thông báo; ngược lại ảnh sẽ được  Đầu vào: 27 x 27 x 96<br /> chuyển sang kiến trúc AlexNet.  Số bộ lọc: 256<br /> 4.4. Kiến trúc mạng AlexNet  Kích thước bộ lọc: 5 x 5 x 48<br /> AlexNet bao gồm 5 lớp tích chập và 3  Đầu ra: 27 x 27 x 256, chia đều cho<br /> lớp kết nối đầy đủ: hai GPU.<br /> - Lớp 1 (Tích chập): - Lớp 3, 4, 5:<br />  Đầu vào: Ảnh với kích thước 224 x Tương tự như với lớp 1 và lớp 2 với<br /> 224 x 3 (3 là con số tương ứng với 3 màu các kích thước bộ lọc lần lượt là 3 x 3 x<br /> đỏ, xanh lục, xanh lam trong hệ màu RGB 256, 3 x 3 x 384 và 3 x 3 x 384. Toàn bộ các<br /> thông thường) lớp tính toán này đều được chia đều cho hai<br /> <br /> 61<br /> SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br /> <br /> <br /> GPU để tăng tốc độ xử lý. Đầu ra cuối cùng  Số nơ-rôn: 4096<br /> qua lớp Tích chập thứ 5 là dữ liệu với kích - Lớp 7 (Kết nối đầy đủ): tương tự lớp<br /> thước 13 x 13 x 128, dữ liệu này sau khi đi 6.<br /> qua một lớp lấy mẫu cuối cùng sẽ được - Lớp 8 (Kết nối đầy đủ): là lớp cuối<br /> dùng làm đầu vào cho các lớp sau đó là các cùng trong mạng AlexNet này có 1000<br /> lớp Kết nối đầy đủ. nơron, tương ứng với 1000 lớp khác nhau<br /> - Lớp 6 (Kết nối đầy đủ): mà bộ huấn luyện cần nhận dạng.<br />  Đầu vào: 6 x 6 x 256<br /> <br /> <br /> <br /> <br /> Hình 8: Mô phỏng cấu trúc mạng AlexNet [13]<br /> <br /> Mỗi lớp tích chập đều có Feature Map, Dựa vào kết quả đánh giá sau khi huấn<br /> ReLU, LRN (Local Response Normalized) luyện trên tập ảnh thu thập được, chúng tôi<br /> và Overlap max pooling. nhận được tỷ lệ nhận dạng cao. Mặc dù,<br /> Với tập ảnh gồm 3 thư mục con (cây mỗi lần hệ thống thực thi thì số ảnh được<br /> bắp non lẫn cỏ, cỏ rau sam và cỏ mần trầu), chọn làm tập huấn luyện và tập đánh giá là<br /> với số ảnh màu trong mỗi thư mục là tùy ý, ngẫu nhiên nhưng tỷ lệ chính xác chúng tôi<br /> ở đây, chúng tôi sử dụng: thu được luôn cao hơn 90%.<br /> - Thư mục cây bắp non lẫn cỏ: 37 ảnh 5. Kết quả thực nghiệm<br /> - Thư mục Cỏ mần trầu: 55 ảnh Hệ thống thực nghiệm được mô phỏng<br /> - Thư mục Cỏ rau sam: 93 ảnh trong môi trường Matlab 2018a<br /> Mạng huấn luyện AlexNet sẽ chia Ảnh sau khi được tiền xử lý sẽ được<br /> ngẫu nhiên thành 2 tập: ở đây, chúng tôi rút trích đặc trưng và tiến hành so sánh với<br /> chọn ngẫu nhiên 70% số ảnh cho tập huấn các đặc trưng có trong tập huấn luyện của<br /> luyện và 30% số ảnh cho tập SVM để đưa ra kết quả là ảnh của bắp hay<br /> đánh giá. không.<br /> Với mô hình AlexNet, ảnh màu được - Nếu là ảnh của bắp sẽ xuất ra thông<br /> chuẩn hóa kích thước 227x227x3 trước khi báo.<br /> đưa vào mạng AlexNet. Sau khi đi qua các - Nếu không, ảnh sẽ được sử dụng lại<br /> lớp tích chập, mỗi ảnh màu sẽ được trích ra tên để tìm lại ảnh gốc ban đầu và chuyển<br /> 4096 đặc trưng làm đầu vào cho lớp kết nối sang mạng AlexNet để phân loại. Mạng<br /> đầy đủ đầu tiên. AlexNet phân loại chính xác các đối tượng<br /> <br /> 62<br /> NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br /> <br /> <br /> có trong ảnh sau đó chuyển đối tượng ảnh Nếu ảnh đầu vào là 1 trong 2 loại cỏ:<br /> vào đúng khung phân loại nếu trên ảnh là 1<br /> trong 2 loại cỏ trên hoặc ảnh có cả bắp lẫn<br /> cỏ. Đối với trường hợp trong ảnh có cả bắp<br /> lẫn cỏ thì chúng tôi cũng gán nhãn chính<br /> xác được cho các đối tượng có trong ảnh.<br /> - Với tập ảnh gồm 35 ảnh nhị phân là<br /> cây bắp non và 35 ảnh nhị phân gồm có<br /> ảnh của 2 loại cỏ và ảnh có cả bắp lẫn cỏ.<br /> Để huấn luyện cho SVM, trong bài toán Hình 10: Thông báo của hệ thống nếu ảnh<br /> này, chúng tôi chọn ra ngẫu nhiên 40% ảnh chỉ có cây cỏ mần trầu<br /> trong mỗi tập và 60% ảnh còn lại để đánh Nếu ảnh đầu vào là ảnh có cả cỏ lẫn<br /> giá. Việc rút trích đặc trưng dựa trên thuật bắp: ảnh sẽ được phân vùng các đối tượng<br /> toán SURF và trích ra 20 đặc trưng mạnh và tiến hành gán nhãn cho từng đối tượng<br /> nhất có trên mỗi ảnh để huấn luyện. Sau sau khi được tách ra riêng biệt.<br /> đó, thuật toán gom nhóm K-Mean có vai<br /> trò trả về kết quả ảnh đầu ra là bắp hoặc<br /> không. Trên cùng một tập huấn luyện<br /> nhưng mỗi lần thực thi hệ thống chọn ra<br /> một tập ảnh ngẫu nhiên nên độ chính xác<br /> của thuật toán luôn biến động, song qua<br /> nhiều lần thực thi chúng tôi nhận được kết<br /> quả nhận dạng của kiến trúc SVM là đáng<br /> tin cậy trên 80%.<br /> Với mạng AlexNet, chúng tôi có 3 loại<br /> nhãn để lựa chọn gán cho 1 ảnh: 1, ảnh cỏ<br /> mần trầu; 2, ảnh cỏ rau sam; 3, ảnh có cả<br /> Hình 11: Ảnh được phân vùng các đối<br /> bắp lẫn cỏ. Ảnh để huấn luyện cho mạng<br /> tượng trên ảnh<br /> AlexNet là ảnh màu chưa qua bất kỳ giai<br /> Các đối tượng trong ảnh ở trường hợp<br /> đoạn tiền xử lý nào. Các kết quả có thể thu<br /> có cả bắp lẫn cỏ sau khi phân vùng sẽ được<br /> được khi có 1 ảnh đưa vào kiểm tra:<br /> cắt thành các đối tượng riêng biệt và một<br /> Nếu ảnh đầu vào là bắp: xuất ra thông<br /> lần nữa đưa vào AlexNet để được gán<br /> báo:<br /> nhãn:<br /> <br /> <br /> <br /> <br /> Hình 9: Thông báo của hệ thống nếu ảnh Hình 12: Các đối tượng riêng biệt đã được<br /> chỉ có cây bắp gán nhãn<br /> <br /> <br /> 63<br /> SCIENTIFIC JOURNAL OF SAIGON UNIVERSITY No. 65 (5/2019)<br /> <br /> <br /> 6. Kết luận và hướng nghiên cứu<br /> tiếp theo<br /> Với tập ảnh thu thập được, sau tiền xử<br /> lý tập ảnh để xây dựng tập đặc trưng huấn<br /> luyện cho SVM, chúng tôi có được kết quả<br /> nhận dạng với tỷ lệ chính xác chấp nhận Hình 13: Kết quả tỷ lệ nhận dạng chính<br /> được: xác của kiến trúc SVM<br /> <br /> <br /> <br /> <br /> Hình 14: Tiến trình huấn luyện và tỷ lệ chính xác của mạng AlexNet<br /> <br /> <br /> Đối với ảnh chỉ có 1 loại cỏ, hệ thống nhãn cũng không thực hiện được.<br /> đã nhận dạng đúng và xác định được vị trí Hướng nghiên cứu sắp tới:<br /> của cỏ trên ảnh. Riêng với ảnh có cả bắp - Xử lý tốt trường hợp ảnh có bắp và<br /> lẫn cỏ trong trường hợp không chồng lắp cỏ chồng lắp lên nhau.<br /> thì hệ thống đã tách ra và gán nhãn đúng - Xác định được vị trí của các đối<br /> cho các đối tượng có trong ảnh nhưng vẫn tượng trong trường hợp trên ảnh có cả bắp<br /> chưa xác định vị trí của cỏ có trong ảnh. lẫn cỏ.<br /> Riêng trường hợp ảnh có bắp lẫn cỏ - Xây dựng hệ thống tự động phun<br /> dại bị chồng lắp lên nhau việc cắt rời các thuốc diệt cỏ dựa và xử lý vấn đề thời<br /> đối tượng gặp lỗi nên dẫn đến việc gán gian thực.<br /> <br /> <br /> LỜI CẢM ƠN<br /> Chúng tôi xin chân thành cám ơn Học Viện Công Nghệ Bưu Chính Viễn Thông và Trường<br /> Đại Học Công Nghệ Thông Tin tạo điều kiện cho chúng tôi hoàn thành bài báo này.<br /> <br /> <br /> <br /> 64<br /> NGUYỄN TẤT BẢO THIỆN - NGUYỄN THỊ CẨM TÚ TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN<br /> <br /> <br /> TÀI LIỆU THAM KHẢO<br /> [1] C.-C. Yang, S.O. Prasher, J.-A. Landry, H.S. Ramaswamy, A. Ditommaso,<br /> “Application of artificial neural networks in image recognition and classification of crop<br /> and weeds”, Canadian Agricultural Engineering, Vol. 42., No.3, pp 147-152, 2000.<br /> [2] Michael Weyrich, Yongheng Wang, Matthias Scharf, “Quality assessment of row<br /> Crop plants by using a machine vision system”, IECON 2013 - 39th Annual<br /> Conference of the IEEE Industrial Electronics Society, pp 2466-2471, 2013.<br /> [3] Kue-Bum Lee and Kwang-Seok Hong, “An Implementation of Leaf Recognition<br /> System using Leaf Vein And Shape”, International Journal of Bio-Science and Bio-<br /> Technology, Vol. 5, No. 2, April 2013.<br /> [4] Oyelade, O. J, Oladipupo, O. O, Obagbuwa, I. C, “Application of k-Means Clustering<br /> algorithm for prediction of Students’ Academic Performance”, International Journal<br /> of Computer Science and Information Security, Vol. 7, No.1, 2010.<br /> [5] Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, “ImageNet classification with deep<br /> convolutional neural networks”, Communications of the ACM, Vol.60, No.6, June 2017.<br /> [6] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin, “A Practical Guide to Support<br /> Vector Classification”, Technical report, Department of Computer Science, National<br /> Taiwan University. July, 2003.<br /> [7] Herbert Bay, Tinne Tuytelaars, and Luc Van Gool1, “SURF: Speeded Up Robust<br /> Features”, Computer Vision – ECCV 2006: 9th European Conference on Computer<br /> Vision, Graz, Austria, May 7-13, 2006. Proceedings, Part I (pp.404-417).<br /> [8] Miss. Pande Ankita V. , Prof. Shandilya V.K, “Digital Image Processing Approach for<br /> Fruit and Flower Leaf Identification and Recognition”, International Journal Of<br /> Engineering And Computer Science, Vol. 2, No. 4, pp. 1280-1285, 2013.<br /> [9] Awad M., Khanna R, “Support Vector Machines for Classification”, Efficient<br /> Learning Machines, pp 39-66, 2015, Apress, Berkeley, CA<br /> [10] “A Comprehensive Study of Artificial Neural Networks”, International Journal of<br /> Advanced Research in Computer Science and Software Engineering, Vol. 2, No. 10,<br /> pp.278-284, 2012.<br /> [11] Hongzhi Wang, Ying Dong “An Improved Ostu Method for Image Segmentation”,<br /> Proceedings of SPIE - The International Society for Optical Engineering, Beijing,<br /> March 2008.<br /> [12] Ostu N., “A threshold selection method from gray-level histogram”, IEEE<br /> Transaction on Systems, Man, and Cybernetics, Vol. 9, No. 1, pp 62-66, 1979.<br /> [13] Rakshith Vasudev. (2019, Feb). [Online] HYPERLINK https://towardsdatascience.com/<br /> understanding-and-calculating-the-number-of-parameters-in-convolution-neural-networks<br /> -cnns-fc88790d530d<br /> <br /> Ngày nhận bài: 07/4/2019 Biên tập xong: 15/5/2019 Duyệt đăng: 20/5/2019<br /> <br /> 65<br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
7=>1