CÔNG NGHỆ Tập san SINH VIÊN NGHIÊN CỨU KHOA HỌC Số 13.2023
168
KHOA H
ỌC
NGHIÊN CỨU MẠNG UNET VÀ ỨNG DỤNG CHO PHÂN VÙNG ẢNH
RESEARCH UNET NETWORK AND APPLICATION OF SEGMENTATION Trần Danh Quang1,*, Nguyễn Văn Động1, Đỗ Ngọc Sơn2 TÓM TẮT Sự thành công c
ủa vic huấn luyện c mạng học sâu, một sự nht trí
lớn rằng chúng ph thuộc o dữ liu. Càng nhiều dliệu được gán nh
ãn,
nh càng càng có sức học mạnh hơn thể dự đoán chính xác h
ơn. Ngoài
việc tthu thập dliệu, việc tsinh d liệu cũng là một ch đtạo thêm d
liệu cho hình. Trong i báo này, cng tôi tìm hiểu và
ứng dng mng
Unet vào bài toán phân vùng nh - m
mạnh mẽ công c dliệu, qua đó s dụng các mẫu chú thích sẵn hi
ệu quả
n. Mạng bao gồm một đường đi xuống bên trái có tác d
ụng nắm bắt bối cảnh
của ảnh. một đường đối xứng n ph
ải có c dụng bản địa hóa chính xác
ảnh. Vic sử dng ít dliệun, giúp cho Unet đư
ợc ứng dụng nhiu trong c
lĩnh vực khó thu thp dliệu như y học,Ngoài ra t
c độ mạng cũng rất
nhanh, thc nghim cho thấy, việc phân đon ảnh 512x512 chưa m
ất đến một
giây trên GPU. Từ khóa: Unet, phân vùng ảnh, y học. ABSTRACT
The success of training deep learning networks, there is a great consensus
that they depend on the data. The more data that is labeled, the more powerful
the model has to learn and the more accurate it can predict. In addition to self-collecting data, auto-
generating is also a way to generate more data for the
model.In this paper, we learn and apply Unet network to the problem of image
segmentation -
a type of network capable of increasing the use of powerful data
tools, there by using available annotation
templates more effectively.The network
consists of a left downlink that captures the image's context. And a line of
symmetry on the right has the effect of accurately localizing the image. The use of
less data makes Unet more applicable in difficult areas
of data collection such as
medicine, etc. In addition, the network speed is also very fast, experimentally
showing
that the 512x512 image segmentation has not been lost. up to one
second on the GPU. Keywords: Unet, segmentation, gestures brain tumor. 1Lớp Khoa học Máy tính 01 - K14, Khoa Công nghệ thông tin, Trường Đ
ại học Công
nghiệp Hà Nội 2Khoa Công nghệ thông tin, Trường Đại học Công nghiệp Hà Nội *Email: songtu362k1@gmail.com 1. GIỚI THIỆU Phân vùng ảnh là một phương pháp trong xử lý ảnh. mục tiêu của phương pháp này là chia ảnh kỹ thuật số thành nhiều vùng nhỏ hơn được gọi các segments. Qua đó, làm giảm độ phức tạp của nh, giúp cho việc xử lý chúng dễ hơn. Kết thúc quá trình phân vùng ảnh, ta thu được một bức ảnh các pixel của đều được gán nhãn. Phân vùng ảnh thể xác định các đối tượng cùng một nhãn (instance segmentation) hoặc không xác định (semantic segmentation), tùy vào mục đích của người thiết kế hình. nhiều cách tiếp cận với bài toán phân đoạn ảnh. Trong đó hai phương pháp chính: tiếp cận tương đồng, tức là dựa vào sự tương đồng của các pixel hình ảnh, qua đó phân đoạn dựa theo ngưỡng. Các thuật toán học máy như phân cụm thường tiếp cận theo cách này. Cách tiếp cận thhai tiếp cận gián đoạn. Cách này cố gắng tìm ra đường phân vùng trung gian dựa trên các gián đoạn của đường pixel trong ảnh. Kết quả này được xử lý để tìm ra phân vùng cuối cùng. Một số kỹ thuật phân ng đã được áp dụng cho i toán phân vùng ảnh như: phân vùng dựa trên ngưỡng, phân ng dựa trên cạnh, phân ng dựa trên khu vực, pn ng dựa trên kỹ thuật phân cụm, phân ng dựa trên mạng noron nhân tạo. Trong đó pn ng dựa trên mạng noron nhân tạo, tính khái quát cao trong nhiều trường hợp. Trong bài báo này, các tác giả trình bày về thuật toán Unet trong ứng dụng phân vùng ảnh bài toán cụ thể phát hiện khối u não sử dụng mạng Unet. 2. CƠ SỞ LÝ THUYẾT VÀ CÁC PHƯƠNG PHÁP THỰC HIỆN Mạng Unet sử dụng khối encoder để giảm chiều dài chiều rộng của ảnh bằng các lớp convolution pooling. Trong đó phần decoder, sử dụng những thông tin của khối encoder để phục hồi lại ảnh. Phần encode có cấu trúc giống với các mạng CNN cuối cùng nhưng bị khuyết những layer fully connected cuối cùng. Chúng ta có thể tự xây dựng hoặc sử dụng lại các cấu trúc sẵn như VGG16, Alexnet trong phần encode. Phần decoder, ngoài việc sử dụng thuật toán upsampling để tăng kích thước, còn kết nối đối xứng với các layer phần encoder cho đến tận layer cuối cùng. Việc này nằm đảm bảo cho thông tin của ảnh không bị mất.
SCIENCE - TECHNOLOGY Số 13.2023 Tập san SINH VIÊN NGHIÊN CỨU KHOA HỌC 169
Hình 1. Cấu trúc một khối encoder Hình 2. Cấu trúc một khối decoder Hình 3. Mô hình mạng Unet đơn giản 3. KẾT QUẢ ĐẠT ĐƯỢC Bài toán phát hiện u não với Unet Bộ dữ liệu được sử dụng: dữ liệu LGG. Bộ dữ liệu này chứa hình ảnh MR não cùng với mặt nạ phân đoạn bất thường FLAIR thủ công. Các hình ảnh được lấy từ Kho lưu trữ hình ảnh ung thư (TCIA). Chúng tương ứng với 110 bệnh nhân được bao gồm trong bộ sưu tập u thần kinh đệm cấp thấp hơn của The Cancer Genome Atlas (TCGA) với ít nhất trình tự phục hồi đảo ngược suy giảm chất lỏng (FLAIR) và dữ liệu cụm gen sẵn. Các cụm gen khối u và dữ liệu bệnh nhân được cung cấp trong data.csv Hình 4. Một số hình ảnh trong bộ dữ liệu Kết quả thu được được thể hiện trên hình 5. Hình 5. Một số kết quả khi kiểm tra u não Một số kết quả sau khi test thể hiện trên hình 6. Hình 6. Kết quả khi test
CÔNG NGHỆ Tập san SINH VIÊN NGHIÊN CỨU KHOA HỌC Số 13.2023
170
KHOA H
ỌC
Dựa vào kết quả cho thấy, mô hình có sự chính Dice coefficient ở mức cao khoảng 77%. 4. KẾT LUẬN Bài báo đã trình bày về nghiên cứu, áp dụng được mạng Unet cho bài toán phân vùng ảnh. Nhóm thực hiện đã chạy thực nghiệm cho bài toán phát hiện khối u não bằng Unet. Kết quả cho thấy, hình sự chính Dice coefficient ở mức cao khoảng 77%. TÀI LIỆU THAM KHẢO [1]. Olaf Ronneberger, Philipp Fischer, Thomas Brox. U-net: Convolutional networks for biomedical image segmentation (arXiv:1505.04597) [2]. Deep to Learning, https://d2l.aivivn.com) [2]. Nguyễn Tuấn, 2019. Transfer learning data augmentation, https://nttuan8.com/bai-9-transfer-learning-va-data-augmentation [4]. Hữu Tiệp, 2018. Machine Learning bản. https://machinelearningcoban.com [5]. https://phamdinhkhanh.github.io/2020/06/20/Unet.html.