intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Cải tiến phương pháp học sâu cho tác vụ phân loại ảnh và ứng dụng cho bài toán chẩn đoán ung thư da

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

29
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Cải tiến phương pháp học sâu cho tác vụ phân loại ảnh và ứng dụng cho bài toán chẩn đoán ung thư da đưa ra các phương pháp cải tiến độ chính xác của mô hình học sâu sử dụng mạng nơ-ron tích chập, ứng dụng cho bài toán phân loại ảnh trẩn đoán ung thư da.

Chủ đề:
Lưu

Nội dung Text: Cải tiến phương pháp học sâu cho tác vụ phân loại ảnh và ứng dụng cho bài toán chẩn đoán ung thư da

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2020. ISBN: 978-604-82-3869-8 CẢI TIẾN PHƯƠNG PHÁP HỌC SÂU CHO TÁC VỤ PHÂN LOẠI ẢNH VÀ ỨNG DỤNG CHO BÀI TOÁN CHẨN ĐOÁN UNG THƯ DA Nguyễn Trung Hiếu1, Đỗ Văn Hải2 1 Trung tâm Không gian Mạng Viettel, 2Khoa CNTT, Trường Đại học Thủy lợi 1. GIỚI THIỆU CHUNG 2. PHƯƠNG PHÁP NGHIÊN CỨU Ung thư da là một vấn đề sức khỏe cộng 2.1. Xây dựng hệ thống đồng lớn, với hơn 5.000.000 trường hợp Hệ thống trẩn đoán ung thư da được xây mới được chẩn đoán ở Hoa Kỳ mỗi năm. dựng như các bài toán phân loại ảnh khác: Ung thư hắc tố (melanoma cancer) là dạng ảnh đầu vào được đưa vào các lớp trích chọn ung thư da nguy hiểm nhất, chịu trách đặc trưng của mạng tích chập để trích xuất ra nhiệm cho phần lớn các ca tử vong do ung véc-tơ đặc trưng, véc-tơ này được đưa qua thư da. Năm 2015, tỷ lệ mắc u ác tính toàn một mạng nơ-ron nhiều lớp với số đầu ra cầu được ước tính là hơn 350.000 trường được định nghĩa trước, ví dụ: bệnh A, bệnh hợp, với gần 60.000 ca tử vong. Mặc dù tỷ B, hoặc không bị bệnh. lệ tử vong là đáng kể, nhưng khi được phát 2.2. Tăng cường số lượng và đa dạng hiện sớm, tỷ lệ sống của khối u ác tính vượt hoá dữ liệu quá 95%. Tuy nhiên chi phí và thời gian Một mô hình học sâu nhiều tầng-lớp cần đào tạo các y bác sĩ có đủ chuyên môn cho rất nhiều dữ liệu để được huấn luyện hiệu công việc trẩn đoán ung thư da là rất lớn, quả, cho độ chính xác cao. Hơn nữa ảnh chụp không thể đáp ứng nhu cầu thực tế. da để trẩn đoán có thể được chụp trong Phân loại hình ảnh là một bài toán có rất những điều kiện tối-sáng, tương phản, màu nhiều ứng dụng thực tiễn trong các ngành da, góc chụp khác nhau, nên trong nghiên công nghiệp, nông nghiệp,… Đặc biệt trong cứu này, chúng tôi sử dụng các phương pháp y tế, phân loại ảnh có thể góp phần giải tăng cường dữ liệu ảnh sau để nâng cao tính quyết bài toán trẩn đoán ung thư qua ảnh tổng quát của mô hình: chụp X quang, chụp da liễu. Trong những  Chỉnh độ sáng, độ tương phản năm gần đây, các mô hình học sâu sử dụng  Xoay góc chụp, lật ngược ảnh mạng nơ-ron tích chập được sử dụng rất  Thay đổi màu da, thêm long trên da một rộng rãi và thành công cho nhiều bài toán cách ngẫu nhiên. phân loại ảnh. Nhưng để ứng dụng trong bài toán trẩn đoán ung thư da, các mô hình 2.3. Tăng tần số lấy mẫu này phải cực kì chính xác để đưa ra hỗ trợ Trong các bài toán học giám sát nói chung hay thậm chí thay thế các bác sĩ. và phân loại ảnh nói riêng, phân bố dữ liệu Trong nghiên cứu này, chúng tôi đưa ra qua các lớp đóng vai trò rất quan trọng trong các phương pháp cải tiến độ chính xác của hiệu quả huấn luyện mô hình. Việc lượng dữ mô hình học sâu sử dụng mạng nơ-ron tích liệu học của một lớp nào đó áp đảo các lớp chập, ứng dụng cho bài toán phân loại ảnh còn lại sẽ khiến mô hình bị thiên kiến, trẩn đoán ung thư da. thường sẽ cho kết quả phân loại lên lớp đó. 111
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN: 978-604-82-3869-8 Để khắc phục việc mất cân bằng dữ liệu, 3.3. Phương pháp đánh giá chúng tôi sử dụng một phương pháp lấy mẫu Phương pháp đánh giá được sử dụng là sao cho tần số xuất hiện trong mỗi vòng lặp AUC (Area Under the Curve) - cũng chính là huấn luyện của từng lớp là như nhau. tiêu chuẩn đánh giá được sử dụng trong cuộc 3. KẾT QUẢ NGHIÊN CỨU thi ISIC 2017. 3.1. Phân tích và chuẩn hoá dữ liệu 3.4. Kết quả thí nghiệm Dữ liệu được sử dụng trong nghiên cứu Kết quả thí nghiệm được so sánh trực tiếp này là tập ISIC 2017, gồm 3 lớp Melanoma, với top 1 và top 5 bảng xếp hạng của cuộc thi Seborrheic Keratosis và Nevus. Tập dữ liệu ISIC 2017: này gồm 2000 ảnh cho tập huấn luyện Kết quả thí Top1 ISIC Top5 ISIC (training set), 150 ảnh cho tập phát triển nghiệm 2017 2017 (development set) và 600 ảnh cho tập kiểm Melanoma 0.848 0.874 0.836 thử (test set). AUC Seborrheic 0.953 0.965 0.935 Keratosis AUC AUC 0.900 0.911 0.886 trung bình Lưu ý: các đội trong cuộc thi ISIC 2017 Hình 1. Một số mẫu dữ liệu được phép sử dụng các nguồn dữ liệu khác. Cụ thể hơn, tập ISIC bị mất cân bằng Một số mẫu dữ liệu cùng kết quả do mô trong phân bố dữ liệu ở cả 3 tập con, khi hình dự đoán: nhãn Nevus áp đảo 2 nhãn còn lại: Tất cả dữ liệu được tiền xử lý bằng cách đưa về kích thước 224x224, sau đó chuẩn hoá bằng trung bình và độ lệch chuẩn của tập ImageNet. 3.2. Cài đặt tham số hệ thống  Mô hình: ImageNet pretrained EfficientNetB7  Hàm mất mát: Cross Entropy  Số epoch: 20  Hàm tối ưu: AdamW Confusion matrix trên tập kiểm thử:  Tốc độ học khởi điểm: 1e-3 Dự đoán  Điều chỉnh tốc độ học: 1cycle policy M NV SK  Tấn suất đánh giá tập phát triển: sau mỗi M 60 41 16 vòng lặp huấn luyện  Các cài đặt khác: batchsize 16, weight Nhãn đúng NV 33 380 30 decay 1e-2 SK 2 12 26 112
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2020. ISBN: 978-604-82-3869-8 4. KẾT LUẬN learning," in Advances in Neural Information Processing Systems, 2017. Trong phạm vi của nghiên cứ này, chúng [9] wikipedia, "Rectifier (neural networks)," tôi đã nghiên cứu sử dụng phương pháp [Online]. Available: tăng cường dữ liệu cùng kĩ thuật tăng tần số https://en.wikipedia.org/wiki/Rectifier_(neu lấy mẫu để huấn luyện mô hình ral_networks). EfficientNetB7 cho bài toán trẩn đoán ung [10] T. H. Vũ, Machine Learning cơ bản, Nhà thư da trong cuộc thi ISIC 2017, với tài xuất bản Khoa học và Kỹ thuật, 2018. nguyên tính toán hạn chế (1 session 12h [11] M. Tan, B. Chen, R. Pang, V. Vasudevan trên Google Colaboratory) và không sử and Q. V. Le, "MnasNet: Platform-Aware dụng các nguồn dữ liệu ngoài cuộc thi Neural Architecture Search for Mobile," nhưng kết quả cho được là rất khả quan. CoRR, vol. abs/1807.11626, 2018. [12] M. Tan and Q. V. Le, "EfficientNet: Trong tương lai, chúng tôi sẽ tiếp tục cải Rethinking Model Scaling for tiến phương pháp huấn luyện, sử dụng các kĩ Convolutional Neural Networks," CoRR, thuậtn tiên tiến khác cùng các mô hình mạng vol. abs/1905.11946, 2019. nơ-ron tích chập hiện đại để giải quyết bài [13] C. Szegedy, S. Ioffe and V. Vanhoucke, toán vô cùng thiết thực này. "Inception-v4, Inception-ResNet and the Impact of Residual Connections on 5. TÀI LIỆU THAM KHẢO Learning," CoRR, vol. abs/1602.07261, 2016. [1] K. He, X. Zhang, S. Ren and J. Sun, "Deep [14] L. N. Smith and N. Topin, "Super- Residual Learning for Image Recognition," Convergence: Very Fast Training of CoRR, vol. abs/1512.03385, 2015. Residual Networks Using Large Learning [2] J. Hu, L. Shen and G. Sun, "Squeeze-and- Rates," CoRR, vol. abs/1708.07120, 2017. Excitation Networks," CoRR, vol. [15] L. N. Smith, "No More Pesky Learning abs/1709.01507, 2017. Rate Guessing Games," CoRR, vol. [3] D. P. Kingma and J. L. Ba, "Adam: A abs/1506.01186, 2015. method for stochastic optimization," in 3rd [16] K. Simonyan and A. Zisserman, "Very deep International Conference on Learning convolutional networks for large-scale Representations, ICLR 2015 - Conference image recognition," in 3rd International Track Proceedings, 2015. Conference on Learning Representations, [4] A. Krizhevsky, I. Sutskever and G. E. ICLR 2015 - Conference Track Hinton, "ImageNet classification with deep Proceedings, 2015. convolutional neural networks," in [17] M. Sandler, A. G. Howard, M. Zhu, A. Advances in Neural Information Processing Zhmoginov and L.-C. Chen, "Inverted Systems, 2012. Residuals and Linear Bottlenecks: Mobile [5] B. Zoph and Q. V. Le, "Neural Architecture Networks for Classification, Detection and Search with Reinforcement Learning," Segmentation," CoRR, vol. CoRR, vol. abs/1611.01578, 2016. abs/1801.04381, 2018. [6] M. D. Zeiler, "ADADELTA: An Adaptive [18] NVIDIA, "What’s the Difference Between Learning Rate Method," CoRR, vol. Artificial Intelligence, Machine Learning abs/1212.5701, 2012. and Deep Learning?," [Online]. Available: [7] S. Xie, R. B. Girshick, P. Dollár, Z. Tu and https://blogs.nvidia.com/blog/2016/07/29/w K. He, "Aggregated Residual hats-difference-artificial-intelligence- Transformations for Deep Neural Networks," machine-learning-deep-learning-ai/. CoRR, vol. abs/1611.05431, 2016. [8] A. C. Wilson, R. Roelofs, M. Stern, N. Srebro and B. Recht, "The marginal value of adaptive gradient methods in machine 113
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2