
CÔNG NGHỆ Tập san SINH VIÊN NGHIÊN CỨU KHOA HỌC ● Số 13.2023
168
KHOA H
ỌC
NGHIÊN CỨU MẠNG UNET VÀ ỨNG DỤNG CHO PHÂN VÙNG ẢNH
RESEARCH UNET NETWORK AND APPLICATION OF SEGMENTATION Trần Danh Quang1,*, Nguyễn Văn Động1, Đỗ Ngọc Sơn2 TÓM TẮT Sự thành công c
ủa việc huấn luyện các mạng học sâu, có một sự nhất trí
lớn rằng chúng phụ thuộc vào dữ liệu. Càng nhiều dữ liệu được gán nh
ãn, mô
hình càng càng có sức học mạnh hơn và có thể dự đoán chính xác h
ơn. Ngoài
việc tự thu thập dữ liệu, việc tự sinh dữ liệu cũng là một cách để tạo thêm d
ữ
liệu cho mô hình. Trong bài báo này, chúng tôi tìm hiểu và
ứng dụng mạng
Unet vào bài toán phân vùng ảnh - m
ột loại mạng có khả năng tăng sử dụng
mạnh mẽ công cụ dữ liệu, qua đó sử dụng các mẫu chú thích có sẵn hi
ệu quả
hơn. Mạng bao gồm một đường đi xuống bên trái có tác d
ụng nắm bắt bối cảnh
của ảnh. Và một đường đối xứng bên ph
ải có tác dụng bản địa hóa chính xác
ảnh. Việc sử dụng ít dữ liệu hơn, giúp cho Unet đư
ợc ứng dụng nhiều trong các
lĩnh vực khó thu thập dữ liệu như y học,… Ngoài ra t
ốc độ mạng cũng rất
nhanh, thực nghiệm cho thấy, việc phân đoạn ảnh 512x512 chưa m
ất đến một
giây trên GPU. Từ khóa: Unet, phân vùng ảnh, y học. ABSTRACT
The success of training deep learning networks, there is a great consensus
that they depend on the data. The more data that is labeled, the more powerful
the model has to learn and the more accurate it can predict. In addition to self-collecting data, auto-
generating is also a way to generate more data for the
model.In this paper, we learn and apply Unet network to the problem of image
segmentation -
a type of network capable of increasing the use of powerful data
tools, there by using available annotation
templates more effectively.The network
consists of a left downlink that captures the image's context. And a line of
symmetry on the right has the effect of accurately localizing the image. The use of
less data makes Unet more applicable in difficult areas
of data collection such as
medicine, etc. In addition, the network speed is also very fast, experimentally
showing
that the 512x512 image segmentation has not been lost. up to one
second on the GPU. Keywords: Unet, segmentation, gestures brain tumor. 1Lớp Khoa học Máy tính 01 - K14, Khoa Công nghệ thông tin, Trường Đ
ại học Công
nghiệp Hà Nội 2Khoa Công nghệ thông tin, Trường Đại học Công nghiệp Hà Nội *Email: songtu362k1@gmail.com 1. GIỚI THIỆU Phân vùng ảnh là một phương pháp trong xử lý ảnh. Mà mục tiêu của phương pháp này là chia ảnh kỹ thuật số thành nhiều vùng nhỏ hơn được gọi là các segments. Qua đó, làm giảm độ phức tạp của ảnh, giúp cho việc xử lý chúng dễ hơn. Kết thúc quá trình phân vùng ảnh, ta thu được một bức ảnh mà các pixel của nó đều được gán nhãn. Phân vùng ảnh có thể xác định các đối tượng cùng một nhãn (instance segmentation) hoặc không xác định (semantic segmentation), tùy vào mục đích của người thiết kế mô hình. Có nhiều cách tiếp cận với bài toán phân đoạn ảnh. Trong đó có hai phương pháp chính: tiếp cận tương đồng, tức là dựa vào sự tương đồng của các pixel hình ảnh, qua đó phân đoạn dựa theo ngưỡng. Các thuật toán học máy như phân cụm thường tiếp cận theo cách này. Cách tiếp cận thứ hai là tiếp cận gián đoạn. Cách này cố gắng tìm ra đường phân vùng trung gian dựa trên các gián đoạn của đường pixel trong ảnh. Kết quả này được xử lý để tìm ra phân vùng cuối cùng. Một số kỹ thuật phân vùng đã được áp dụng cho bài toán phân vùng ảnh như: phân vùng dựa trên ngưỡng, phân vùng dựa trên cạnh, phân vùng dựa trên khu vực, phân vùng dựa trên kỹ thuật phân cụm, phân vùng dựa trên mạng noron nhân tạo. Trong đó phân vùng dựa trên mạng noron nhân tạo, có tính khái quát cao trong nhiều trường hợp. Trong bài báo này, các tác giả trình bày về thuật toán Unet trong ứng dụng phân vùng ảnh và bài toán cụ thể là phát hiện khối u não sử dụng mạng Unet. 2. CƠ SỞ LÝ THUYẾT VÀ CÁC PHƯƠNG PHÁP THỰC HIỆN Mạng Unet sử dụng khối encoder để giảm chiều dài và chiều rộng của ảnh bằng các lớp convolution và pooling. Trong đó phần decoder, sử dụng những thông tin của khối encoder để phục hồi lại ảnh. Phần encode có cấu trúc giống với các mạng CNN cuối cùng nhưng bị khuyết những layer fully connected cuối cùng. Chúng ta có thể tự xây dựng hoặc sử dụng lại các cấu trúc có sẵn như VGG16, Alexnet trong phần encode. Phần decoder, ngoài việc sử dụng thuật toán upsampling để tăng kích thước, còn kết nối đối xứng với các layer phần encoder cho đến tận layer cuối cùng. Việc này nằm đảm bảo cho thông tin của ảnh không bị mất.

SCIENCE - TECHNOLOGY Số 13.2023 ● Tập san SINH VIÊN NGHIÊN CỨU KHOA HỌC 169
Hình 1. Cấu trúc một khối encoder Hình 2. Cấu trúc một khối decoder Hình 3. Mô hình mạng Unet đơn giản 3. KẾT QUẢ ĐẠT ĐƯỢC Bài toán phát hiện u não với Unet Bộ dữ liệu được sử dụng: dữ liệu LGG. Bộ dữ liệu này chứa hình ảnh MR não cùng với mặt nạ phân đoạn bất thường FLAIR thủ công. Các hình ảnh được lấy từ Kho lưu trữ hình ảnh ung thư (TCIA). Chúng tương ứng với 110 bệnh nhân được bao gồm trong bộ sưu tập u thần kinh đệm cấp thấp hơn của The Cancer Genome Atlas (TCGA) với ít nhất trình tự phục hồi đảo ngược suy giảm chất lỏng (FLAIR) và dữ liệu cụm gen có sẵn. Các cụm gen khối u và dữ liệu bệnh nhân được cung cấp trong data.csv Hình 4. Một số hình ảnh trong bộ dữ liệu Kết quả thu được được thể hiện trên hình 5. Hình 5. Một số kết quả khi kiểm tra u não Một số kết quả sau khi test thể hiện trên hình 6. Hình 6. Kết quả khi test

CÔNG NGHỆ Tập san SINH VIÊN NGHIÊN CỨU KHOA HỌC ● Số 13.2023
170
KHOA H
ỌC
Dựa vào kết quả cho thấy, mô hình có sự chính Dice coefficient ở mức cao khoảng 77%. 4. KẾT LUẬN Bài báo đã trình bày về nghiên cứu, áp dụng được mạng Unet cho bài toán phân vùng ảnh. Nhóm thực hiện đã chạy thực nghiệm cho bài toán phát hiện khối u não bằng Unet. Kết quả cho thấy, mô hình có sự chính Dice coefficient ở mức cao khoảng 77%. TÀI LIỆU THAM KHẢO [1]. Olaf Ronneberger, Philipp Fischer, Thomas Brox. U-net: Convolutional networks for biomedical image segmentation (arXiv:1505.04597) [2]. Deep to Learning, https://d2l.aivivn.com) [2]. Nguyễn Tuấn, 2019. Transfer learning và data augmentation, https://nttuan8.com/bai-9-transfer-learning-va-data-augmentation [4]. Vũ Hữu Tiệp, 2018. Machine Learning cơ bản. https://machinelearningcoban.com [5]. https://phamdinhkhanh.github.io/2020/06/20/Unet.html.

