YOMEDIA
ADSENSE
Một tiếp cận xử lý dữ liệu lớn trong phát hiện các tổn thương gan dựa trên chỉ số hounsfield
15
lượt xem 2
download
lượt xem 2
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Bệnh ung thư gan là một bệnh phổ biến hiện nay trên thế giới nói chung và ở nước ta nói riêng. Bài viết đề xuất phương pháp phát hiện tổn thương gan trên ảnh CT dựa trên chỉ số Hounsfield ứng dụng mô hình xử lý song song trong môi trường Spark để cải tiến độ chính xác và thời gian xử lý.
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Một tiếp cận xử lý dữ liệu lớn trong phát hiện các tổn thương gan dựa trên chỉ số hounsfield
- Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), TP. HCM, ngày 23-24/12/2021 DOI: 10.15625/vap.2021.0056 MỘT TIẾP CẬN XỬ LÝ DỮ LIỆU LỚN TRONG PHÁT HIỆN CÁC TỔN THƯƠNG GAN DỰA TRÊN CHỈ SỐ HOUNSFIELD Phan Anh Cang1, Nguyễn Thị Kim Luông2, Phan Thượng Cang3 1 Khoa Công nghệ thông tin, Trường Đại học Sư phạm Kỹ thuật Vĩnh Long 2 Trường THPT Phạm Thành Trung, Cái Bè, Tiền Giang 3 Khoa Công nghệ thông tin và Truyền thông, Trường Đại học Cần Thơ cangpa@vlute.edu.vn, kimluongptt@gmail.com, ptcang@cit.ctu.edu.vn TÓM TẮT: Bệnh ung thư gan là một bệnh phổ biến hiện nay trên thế giới nói chung và ở nước ta nói riêng. Theo thống kê của WHO năm 2018 Việt Nam thuộc nhóm nước có tỉ lệ ung thư cao nhất trên thế giới và ung thư gan chiếm tỉ lệ cao nhất trong tất cả các bệnh ung thư. Để chẩn đoán và phát hiện bệnh ung thư gan, các bác sĩ mất nhiều thời gian, công sức để xem xét các ảnh CT chụp cắt lớp gan. Tuy nhiên, công việc này đòi hỏi các bác sĩ phải có nhiều kinh nghiệm và xem xét một lượng lớn các ảnh CT thu được qua các thì chụp trước và sau khi tiêm thuốc cản quang để theo dõi sự thay đổi đậm độ Hounsfield. Hầu hết các nghiên cứu trước đây tập trung vào các kỹ thuật rút trích đặc trưng và phân loại mà không quan tâm đến sự thay đổi đậm độ Hounsfield qua các thì chụp trong khi các chuyên gia y khoa rất quan tâm đến yếu tố này trên thực tế. Để giải quyết vấn đề trên, trong bài báo này chúng tôi đề xuất phương pháp phát hiện tổn thương gan trên ảnh CT dựa trên chỉ số Hounsfield ứng dụng mô hình xử lý song song trong môi trường Spark để cải tiến độ chính xác và thời gian xử lý. Dựa vào mạng nơron Single Short Multibox Detector (SSD), chúng tôi cài đặt phương pháp đề xuất trong môi trường Spark cho việc huấn luyện và phân loại tổn thương gan. Kết quả cho thấy phương pháp đề xuất có độ chính xác cao với độ đo mAP là 82%, trong khi thời gian xử lý nhanh hơn trường hợp không xử lý trong môi trường Spark. Kết quả nghiên cứu hỗ trợ các bác sĩ phát hiện và phân loại tự động các bệnh về gan một cách chính xác, nhanh chóng giúp điều trị bệnh nhân kịp thời. Từ khóa: Xử lý dữ liệu lớn, Spark, SSD, chỉ số Houndsfield, tổn thương gan. I. GIỚI THIỆU Theo báo cáo của GLOBOCAN 2018 [1] về thực trạng ung thư thế giới có 18,1 triệu ca mắc mới và 9,6 triệu ca tử vong do ung thư trong năm 2018, Việt Nam thuộc nhóm nước có tỉ lệ ung thư cao nhất. Việt Nam với dân số gần 96,5 triệu người (có 164.671 ca mắc mới, 114.871 ca tử vong do ung thư). Điều này báo động về tỷ lệ mắc ung thư gan ở nước ta hiện nay. Ung thư gan khó sàng lọc vì giai đoạn sớm của bệnh thường không rõ ràng do đó cần có các chiến lược phát hiện, phân loại sớm để đưa ra phương pháp điều trị nhằm kiểm soát căn bệnh này. Tuy nhiên bên cạnh độ chính xác do số lượng ảnh CT thu được khi phát hiện tổn thương gan ở các thì chụp trước và sau khi tiêm thuốc cản quang là rất lớn. Bên cạnh đó việc lưu trữ và quản lý kho dữ liệu ảnh về bệnh lý gan là một thách thức lớn cho lĩnh vực y khoa. Để cải thiện điều này, trong những năm gần đây đã có rất nhiều nhà nghiên cứu đưa ra các phương pháp phân đoạn và phát hiện tổn thương ở gan. Nghiên cứu phân loại tự động các tổn thương gan khu trú dựa trên hình ảnh DCE- MRI và T2W trên lâm sàng [2] phương pháp của họ thực hiện trên hình ảnh MR tăng cường tương phản động T2W và DCE được sử dụng để xác định năm loại tổn thương là u tuyến, u nang, u máu, HCC, di căn; thử nghiệm trên 43 bệnh nhân kết quả đạt là 74%. Phương pháp HOG-SVM [3] tự động phát hiện ung thư gan từ hình ảnh CT bụng và phân loại, thử nghiệm trên 27 bệnh nhân ung thư gan phân biệt hai loại là HCC và bệnh ung thư gan ác tính, độ chính xác đạt 94%. Nghiên cứu [4] cải thiện đào tạo CNN bằng cách sử dụng Disentangement để phân loại tổn thương gan trong ảnh CT với tập dữ liệu gồm 239 ảnh CT 2-D cho phân loại bốn trường hợp u nang, di căn, u máu, nhu mô lành tính với độ chính xác đạt 75%. Nghiên cứu tiếp theo [5] phân loại các tổn thương gan khu trú bằng cách sử dụng học sâu với Fine- Tuning (transfer learning) phân loại tổn thương trên 388 hình ảnh CT đa pha với bốn loại u nang, FNH, HCC, HEM với độ chính xác đạt 91.22%. Từ các nghiên cứu trên cho thấy các tác giả đề xuất trên nhiều phương pháp khác nhau cho việc phân đoạn và phát hiện các tổn thương ở gan. Tuy nhiên, hầu hết các nghiên cứu trước đây tập trung vào các kỹ thuật rút trích đặc trưng và phân loại mà không quan tâm đến sự thay đổi đậm độ Hounsfield qua các thì chụp trong khi các chuyên gia y khoa rất quan tâm đến yếu tố này trên thực tế. Bên cạnh đó, để chẩn đoán các tổn thương gan, bác sĩ phải theo dõi sự thay đổi đậm độ Hounsfield bằng cách xem xét một lượng lớn các ảnh CT thu được qua các thì chụp trước và sau khi tiêm thuốc cản quang. Để giải quyết các vấn đề này, chúng tôi đề xuất phương pháp phát hiện các tổn thương gan trên ảnh CT dựa trên chỉ số Hounsfield theo hướng tiếp cận xử lý dữ liệu lớn. Chúng tôi áp dụng kỹ thuật học sâu trong môi trường xử lý song song với Spark để cải tiến tốc độ huấn luyện và phân loại bệnh, đồng thời sử dụng chỉ số Hounsfield là giá trị độ đậm để hỗ trợ cho việc phát hiện chính xác các vùng tổn thương gan. Đây cũng chính là những đóng góp mới của nghiên cứu này. II. CÔNG VIỆC LIÊN QUAN A. Giới thiệu một số bệnh gan thường gặp Trong bài viết này chúng tôi tập trung nghiên cứu 3 loại bệnh cơ bản là nang gan (NAN), u máu trong gan (HEM), ung thư tế bào gan nguyên phát (HCC). Theo tài liệu [6][7][8] tổng quát về một số bệnh gan như sau: Nang gan là một bệnh lý hay gặp có 1-5% các trường hợp khám siêu âm gan mật với tần số tăng lên ở người có tuổi, thường
- Phan Anh Cang, Nguyễn Thị Kim Luông, Phan Thượng Cang 167 được phát hiện một cách tình cờ trên siêu âm mà không có triệu chứng lâm sàng, có thể là nang đơn độc hoặc nhiều nang, kích thước của nang thường không tăng hoặc tăng lên rất chậm theo tuổi. U máu trong gan rất hay gặp, chiếm khoảng 4-7% dân cư, gặp ở mọi lứa tuổi, thường từ 30-50, chiếm ưu thế ở nữ, không có triệu chứng lâm sàng, phát hiện tình cờ trên siêu âm hoặc chụp cắt lớp vi tính, biểu hiện lâm sàng: đau hạ sườn phải, gan to hoặc khối ổ bụng, biến chứng là chảy máu trong khối u hoặc khối u vỡ chảy máu trong ổ bụng, thường gặp do chấn thương hoặc sau chọc sinh thiết. Ung thư tế bào gan nguyên phát là bệnh ác tính phổ biến khởi phát từ gan, khác với ung thư gan thứ phát các tế bào ung thư từ các bộ phận khác của cơ thể di căn đến, chiếm khoảng 9̣ 0% ung thư gan, thường xảy ra ở những người mắc bệnh mạn tính như xơ gan do viêm gan B hoặc C. B. Chỉ số Hounsfield Unit (HU) và sự biến thiên đậm độ 1. Xác định chỉ số Hounsfield Unit (HU): HU là đơn vị đo độ hấp thụ tia X trong kỹ thuật CT scanner. Các bác sĩ thường dựa trên chỉ số HU phân vùng gan và dự đoán tổn thương gan dựa trên sự biến thiên chỉ số HU khác nhau của các tổn thương. Đậm độ của các mô trong ảnh CT thường được biểu diễn bằng đơn vị HU (bảng 1). Đậm độ thường có giá trị nằm trong khoảng từ -1000 đến +1000, trong khi màn hình máy tính chỉ hiển thị được 256 giá trị mức xám trong hình ảnh CT. Điều này gây ra sự mất mát thông tin đáng kể trong việc chẩn đoán được biểu diễn ở hình 1. Vì vậy, chúng ta cần biến đổi đậm độ sang giá trị có đơn vị tính HU [9] bởi công thức tuyến tính (1). Bảng 1. Độ hấp thu tia X trên ảnh CT dựa trên chỉ số HU [10] Loại Đậm độ -1000 +1000 Nước 0 Mật độ xám của HU Không khí -1000 255 0 Mỡ -100 đến -50 Mất thông tin Mật độ xám hiển thị trên máy tính Mất thông tin Thận 20 đến 40 Lách 35 đến 55 Gan 45 đến 65 Hình 1. Minh họa các giá trị đậm độ (HU) và giá trị mức Xương 700 đến 3000 xám có thể hiển thị trên màn hình máy tính HU được tính toán dễ dàng và nhanh chóng từ các giá trị của Rescale Intercept và Rescale Slope có sẵn trong tệp hình ảnh y tế có định dạng DICOM bằng công thức (1) với Pixel Value là giá trị pixel của từng điểm ảnh. Rescale Slope và Rescale Intercept là các giá trị lưu trữ trong ảnh chuẩn DICOM. HU = Pixel Value x Rescale Slope + Rescale Intercept (1) 2. Sự biến thiên đậm độ trước và sau khi tiêm thuốc cản quang a. Sự biến thiên đậm độ trước khi tiêm thuốc cản quang: Dựa trên kết quả ở bảng 1 tiếp tục xử lý phát hiện đánh dấu các dạng tổn thương ở gan dựa vào sự biến thiên đậm độ được xác định như bảng 2. Nếu đậm độ cao hơn gan nghĩa là HU > 65 sẽ là bệnh U gan. Nếu đậm độ tương đồng với gan có nghĩa 45 ≤ HU ≤ 65 là bệnh U gan (khó phân biệt bằng mắt thường). Nếu đậm độ thấp hơn gan tương ứng HU < 45 sẽ là các bệnh như: Nang gan/áp xe/u gan. Bảng 2. Phân loại tổn thương gan dựa vào đậm độ [10] [11][12][13][14] Đậm độ của tổn thương Phân loại Đậm độ thấp hơn gan Nang gan / Áp xe/ U gan Đậm độ cao hơn gan U gan Đậm độ tương đồng với gan U gan (khó phân biệt bằng mắt thường) b. Sự biến thiên đậm độ sau khi tiêm thuốc cản quang: Khi căn cứ ở bảng 2 chưa thể đạt độ chính xác vì trường hợp đậm độ thấp hơn gan có thể là bệnh nang gan, áp xe hoặc u gan. Vì thế trong y học can thiệp thêm một kỹ thuật chụp CT Dynamic có tiêm thuốc cản quang dựa vào đặc tính bắt thuốc và thay đổi độ phản quang bao gồm 3 giai đoạn sau đó chia ra 3 ảnh kết quả: thì động mạch sau khi tiêm thuốc 28 đến 33 giây; thì tĩnh mạch sau khi tiêm thuốc 60 đến 80 giây; thì muộn sau khi tiêm thuốc 180 đến 300 giây. Nghiên cứu phân tích sự biến thiên của đậm độ đầu tiên đọc ảnh ở thì động mạch dựa vào đậm độ để ghi nhận sự bất thường nếu cần thiết sẽ đọc ảnh ở 2 thì còn lại như bảng 3. Bảng 3. Phân loại tổn thương gan dựa vào đậm độ sau khi tiêm thuốc cản quang [10][11][12][13][14] Thì tĩnh mạch Thì động mạch (Arterial) Thì muộn (Delay) Phân loại (Venous) Không tăng quang Không tăng quang Không tăng quang Nang gan (NAN) U máu trong gan Tăng quang dạng nốt ở thành Tăng quang đồng nhất Tăng quang đồng nhất (HEM) Tăng quang nhẹ do Đậm độ sẽ trở nên thấp hơn mô gan Ung thư tế bào gan Tăng quang rất mạnh thải thuốc do tổn thương thải thuốc hoàn toàn nguyên phát (HCC) C. Mạng DNN (Deep Neural Network): Deep Learning [15] là kỹ thuật máy học giúp máy có thể học như con người đạt được độ chính xác cao, vượt qua khả năng con người. Hầu hết phương pháp Deep Learning đều sử dụng kiến trúc Neural Network, vì thế Deep Learning gọi là Deep Neural Network. Deep Neural có thể chứa tới 150 lớp và có thể nhiều hơn. Thường có 3 lớp cơ bản: tầng đầu vào (Input layer), tầng đầu ra (Ouput layer), tầng ẩn (Hidden layer).
- 168 MỘT TIẾP CẬN XỬ LÝ DỮ LIỆU LỚN TRONG PHÁT HIỆN CÁC TỔN THƯƠNG GAN DỰA TRÊN… Mạng Single Shot Multibox Detector (SSD): Trong nhiều bài toán phát hiện đối tượng, một trong những thuật toán nhanh nhất là Single Short Multibox Detector (SSD) sử dụng mạng nơron tích chập để phát hiện các đối tượng [16]. Mặc dù SSD có tốc độ nhanh nhưng độ chính xác là chưa hoàn hảo. Chính vì vậy để cải thiện thuật toán tăng độ chính xác trong bài toán phân loại mà không ảnh hưởng tới tốc độ của nó, người ta sử dụng khối Inception thay thế các lớp bổ sung trong SSD và phương pháp này gọi là Inception SSD (I-SSD)[17]. Mạng này có thể nắm bắt nhiều thông tin hơn mà không làm tăng độ phức tạp. Trong I-SSD sử dụng cấu chuẩn hóa hàng loạt residual structure (BN) và giữ lại một số kiến trúc của SSD. Thuật toán I-SSD vượt trội hơn SSD trong khi vẫn duy trì hiệu suất thời gian của nó, giúp cân bằng giữa hiệu suất và tốc độ bằng cách tăng loại nhân chập, tăng độ nhạy đối với các đối tượng nhỏ. Loss Function [17] được tính là tổng của loss_confidence (Lconf ) và loss location (Lloc), với N là số hộp mặc định phù hợp, nếu N=0 nghĩa là ước đặt loss=0, số hạng trọng lượng ∝ được đặt thành 1 bởi xác nhận chéo và hàm Loss được tính như công thức (2): 1 𝐿(𝑥, 𝑐, 𝑙, 𝑔) = �𝐿𝑐𝑜𝑛𝑓 (𝑥, 𝑐)+∝ 𝐿𝑙𝑜𝑐 (𝑥, 𝑙, 𝑔)� (2) 𝑁 Trong đó: Lloc ước lượng sự sai lệch thực tế của hộp giới hạn so với tập dữ liệu mẫu để đánh giá việc phát hiện. Lloc là tổn thất SmoothL1 giữa các tham số của hộp dự đoán (l) và hộp thật sự (g), được quy hồi về hiệu số cho tâm (cx, cy) của hộp giới hạn mặt định, chiều rộng (w) và chiều cao (h) của nó, tính theo công thức (3): 𝐿𝑙𝑜𝑐 (𝑥, 𝑙, 𝑔) = ∑𝑁 𝑘 𝑚 �𝑗𝑚 � 𝑖∈𝑃𝑜𝑠 𝑚∈{𝑐𝑥,𝑐𝑦,𝑤,ℎ} 𝑥𝑖,𝑗 𝑠𝑚𝑜𝑜𝑡ℎ𝐿1 �𝑙𝑖 − 𝑔 (3) 𝑐𝑦 𝑐𝑦 �𝑔𝑗𝑐𝑥 − 𝑑𝑖𝑐𝑥 � 𝑐𝑦 𝑔𝑗 − 𝑑𝑖 𝑔𝑗𝑤 𝑔𝑗ℎ 𝑣ớ𝑖 𝑔�𝑗𝑐𝑥 = ; 𝑔�𝑗 = ; 𝑔�𝑗𝑤 = 𝑙𝑜𝑔 � � ; 𝑔�𝑗ℎ = 𝑙𝑜𝑔 � � ; 𝑑𝑖𝑤 ℎ 𝑑𝑖 𝑑𝑖𝑤 𝑑𝑖ℎ Với Lconf tính toán tỉ lệ rơi vào lớp mà hộp giới hạn được tính toán để đánh giá việc phân lớp đối tượng. Lconf là 𝑝 một mất mát lớn nhất với nhiều lớp (c) với 𝑥𝑖,𝑗 ={1,0} ứng với hộp mặc định thứ (i) khớp với hộp thật sự thứ (j) của (p) tính bằng công thức (4): 𝑝 𝑝 𝑝 𝑝 exp(𝑐𝑖 ) 𝐿𝑐𝑜𝑛𝑓 (𝑥, 𝑐) = − ∑𝑁 𝑁 0 𝑖∈𝑃𝑜𝑠 𝑥𝑖,𝑗 𝑙𝑜𝑔 �𝑐̂𝑖 � − ∑𝑖∈𝑁𝑒𝑔 𝑙𝑜𝑔 (𝑐̂𝑖 ) 𝑣ớ𝑖 𝑐̂𝑖 = ∑ 𝑝 (4) 𝑝 exp(𝑐𝑖 ) D. Đánh giá mô hình phát hiện đối tượng Để kiểm tra AP, mAP của mô hình ta phải xác định hai giá trị: Recall/ Sensitivity/ True Positive Rate (TPR) và Precision/Positive predictive value (PPV). Với TPR là độ nhạy tính bằng tỉ lệ phân loại Positive đúng - TP (True Positive) trên tổng số các trường hợp TP với FN (False Negative) - dự đoán bỏ sót [18] tính bằng công thức (5). Với PPV là dự đoán chính xác tính bằng tỉ lệ phân loại Positive đúng - TP trên tổng các trường hợp dự đoán TP với FP (False Positive) - dự đoán sai [18] tính bằng công thức (6): TP TP TP Recall = TPR = Sensitivity = = ∑ 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒 (5) Precision = PPV = (6) TP+FN TP+FP Do TPR, PPV là hai khái niệm khác nhau, nên ta sử dụng chỉ số F1_score đánh giá trung bình giữa TPR và PPV [18], F1_score là thước đo chính xác hơn bởi nó tính đến dự đoán sai và loại trừ nhầm, tính bằng công thức (7): Precision∗Recall F1_Score = 2 (7) Precision+Recall Độ đo AP (Average Precision) là giá trị đo lường độ chính xác trong phân lớp được tính bằng công thức (8) thực hiện phép nội suy 11 điểm tóm tắt hình dạng đường cong của Precision x Recall bằng cách lấy trung bình độ chính xác tại một tập hợp gồm 11 điểm cách đều nhau [0,0.1, 0.2,...,1] với 𝜌 (𝑟̃ ) là độ chính xác đo được trên 𝑟̃ [19]. Độ chính xác mAP (mean Average Precision) tính độ chính xác trung bình của tất cả các lớp sau khi tính được AP với Q là số lượng lớp đối tượng có trong tập dữ liệu, tính bằng công thức (9): 1 max 𝜌 (𝑟̃ ) 𝐴𝑃(𝑞) 𝐴𝑃 = ∑𝑟 ∈{0,0.1,…,1} 𝜌𝑖𝑛𝑡𝑒𝑟𝑝(𝑟) với 𝜌𝑖𝑛𝑡𝑒𝑟𝑝(𝑟) = (8) mAP = ∑𝑄𝑞=1 (9) 11 𝑟: � 𝑟̃ ≥ 𝑟 𝑄 Chỉ số IoU (Intesection Over Union) [20] là tỉ lệ diện tích giao nhau (Area of Overlap) trên diện tích chồng chập (Area of Union), nó là chỉ số đánh giá được sử dụng để đo độ chính xác cho các kỹ thuật phát hiện đối tượng trong ảnh trên một tập dữ liệu cụ thể. Nếu giá trị IOU >= 0.5 được xem là dự đoán chính xác và ngược lại nếu giá trị IoU < 0.5 dự đoán được xem là chưa chính xác với công thức (10): 𝐴𝑟𝑒𝑎 𝑜𝑓 𝑂𝑣𝑒𝑟𝑙𝑎𝑝 IoU = (10) 𝐴𝑟𝑒𝑎 𝑜𝑓 𝑈𝑛𝑖𝑜𝑛 E. Mô hình MapReduce và xử lý song song với Apache Spark 1. Mô hình MapReduce: MapReduce là một mô hình lập trình thực hiện quá tình xử lý tập dữ liệu lớn, chạy trên lượng lớn cỡ hàng ngàn máy tính và dữ liệu lên đến mức Terabytes [21]. Gồm 2 kỳ: Map và Reduce. Map: Nhận dữ liệu được phân chia từ cơ sở dữ liệu tiến hành xử lý cặp (key, value) để sinh ra cặp (keyI, valueI) trung gian, dữ liệu này là dữ liệu đầu vào của giai đoạn Reduce. Reduce: Tiếp nhận các (keyI, valueI) và trộn các cặp (keyI, valueI) trung gian, lấy ra các valueI có cùng keyI và lưu vào HDFS (Hadoop Distributed File System).
- Phan Anh Cang, Nguyễn Thị Kim Luông, Phan Thượng Cang 169 2. Xử lý song song và phân tán với Apache Spark: Apache Spark [22] là một công cụ xử lý dữ liệu song song và phân tán có khả năng mở rộng, nhanh so với nhiều khung xử lý dữ liệu khác. Nó bao gồm một số thư viện để giúp xây dựng các ứng dụng cho máy học (MLlib), xử lý luồng (Spark Streaming) và xử lý đồ thị (GraphX),.... Spark dựa trên ý tưởng của mô hình MapReduce nhưng khác biệt chính với Hadoop ở cách tiếp cận xử lý: Spark có thể tính toán và ghi dữ liệu tạm thời ở bộ nhớ trong, trong khi Hadoop phải đọc và ghi vào bộ nhớ ngoài. Do đó, tốc độ xử lý của Spark có thể nhanh hơn gấp 10 đến 100 so với Hahoop. Nó khắc phục được một số hạn chế của Hadoop như: các phép toán đều thực hiện trên đĩa cứng thời gian chậm, không hỗ trợ thời gian thực; hỗ trợ nhiều thư viện MLlib, BigDL,... Tận dụng những ưu điểm trên nên trong nghiên cứu này chúng tôi cài đặt và sử dụng thư viện BigDL trên môi trường Spark để huấn luyện, so sánh về thời gian và độ chính xác giữa hai kịch bản đề ra. III. PHƯƠNG PHÁP ĐỀ XUẤT Trong nghiên cứu này chúng tôi tiến hành thực nghiệm để so sánh về thời gian huấn luyện và độ chính xác của mô hình mạng SSD (Single Shot Multibox Detector) trên hai kịch bản: Kịch bản 1 sử dụng mạng SSD thực hiện trên máy tính đơn để rút trích đặc trưng và huấn luyện; kịch bản 2 sử dụng mạng SSD xử lý song song trong môi trường Spark với mô hình đề xuất tổng quát như hình 2. Trong phương pháp đề xuất được thực hiện gồm 3 giai đoạn chính sau: Giai đoạn 1- Tiền xử lý dữ liệu: Ở giai đoạn này chúng tôi tiến hành thu thập dữ liệu ảnh CT chuẩn DICOM của các bệnh nhân có bệnh lý về bệnh gan tại một bệnh viện gồm 2000 ảnh. Sau đó tiến hành chuyển đổi tập dữ liệu này sang ảnh lưu trữ dưới dạng ảnh số (*.png) bằng công cụ RadiAnt DICOM Viewer để làm đầu vào cho mô hình mạng trong quá trình huấn luyện. Tiếp theo, một giai đoạn khó khăn và tốn nhiều thời gian là giai đoạn khoanh vùng và gán nhãn các tổn thương, do đó cần có sự tham gia của các bác sĩ chuyên môn để đạt được độ chính xác tuyệt đối trong việc phân loại bệnh, đây là giai đoạn quan trọng ảnh hưởng đến kết quả đầu ra của nghiên cứu. Đầu tiên các chuyên gia sẽ bắt đầu đọc ảnh DICOM và dựa vào chỉ số HU để xác định vùng và phân loại tổn thương trên ảnh như trình bày ở bảng 2 và bảng 3. Từ đó tiến hành khoanh vùng và gán nhãn tập dữ liệu bằng công cụ LabelImg. Các vùng tổn thương sẽ được gán nhãn thành một trong ba lớp với các ký hiệu là NAN (Nang gan), HEM (U mạch máu trong gan), HCC (Ung thư tế bào gan nguyên phát). Để đánh giá chính xác và giảm thiểu lỗi việc khoanh vùng, gán nhãn cho tập dữ liệu được thực hiện nhờ sự hỗ trợ của ba bác sĩ chẩn đoán hình ảnh với các vai trò khác nhau: bác sĩ thứ nhất khoanh vùng đánh nhãn, bác sĩ thứ hai kiểm tra, bác sĩ thứ ba trò giám sát, nếu có sự bất đồng ý kiến sẽ hội ý để đưa ra quyết định sau cùng. Bên cạnh đó, chỉ số HU cũng được sử dụng để làm tăng độ sáng của ảnh làm rõ các tổn thương hơn. Tập dữ liệu này sẽ được sử dụng cho quá trình huấn luyện mô hình mạng ở giai đoạn 2. Giai đoạn 2 - Giai đoạn huấn luyện mô hình mạng: Sử dụng tập dữ liệu đã được tiền xử lý ở giai đoạn 1 để thực hiện huấn luyện, chúng tôi áp dụng phương pháp Transfer learning sử dụng bộ trọng số đã được huấn luyện trước đó trên tập dữ liệu COCO Dataset và tiếp tục huấn luyện trên tập dữ liệu thu thập về bệnh gan, điều này giúp mô hình mạng trong phương pháp đề xuất rút ngắn thời gian huấn luyện, dữ liệu huấn luyện sẽ được lưu vào HDFS. Để đánh giá mô hình chúng tôi đồng thời trích xuất một số biểu đồ: Loss, mAP, AP, IoU (hình 3). Giai đoạn 3 - Giai đoạn kiểm thử mô hình mạng: Quá trình kiểm thử sẽ sử dụng tập dữ liệu kiểm thử đã được trích chọn từ giai đoạn 1, chúng tôi sử dụng độ đo AP và mAP kết hợp với độ đo IoU để có thể đánh giá so sánh độ chính xác trong 2 kịch bản xử lý. Ảnh test được tiền xử lý sau đó rút trích đặc trưng để làm đầu vào cho bộ phân loại. SSD model on Spark environment Evaluation Loss mAP Plain AP Arterial IoU Venous Delay Image ① preprocessing Feature extraction Training ② Bounding box mAP DATA Extraction and Classification PROCESSING Classification (HCC, HEM, NAN) Test Image ③ Hình 2. Mô hình đề xuất tổng quát của nghiên cứu A. Kịch bản 1 Việc chẩn đoán các tổn thương gan được các y bác sĩ thực hiện lần lượt trên bốn thì (trình bày ở Phần B Mục 2), dựa vào những bất thường trên ảnh CT, bác sĩ sẽ đưa ra những chẩn đoán bệnh, dựa trên thực tế đó chúng tôi đề xuất phương pháp huấn luyện mô hình mạng SSD thực hiện tuần tự trên bốn thì, sau đó tổng hợp kết quả từ mỗi mô hình mạng để đưa ra được kết quả cuối cùng. Trong thực nghiệm này, chúng tôi sử dụng mô hình mạng SSD kết hợp với thư viện Tensorflow để huấn luyện trên tập dữ liệu. Với Stage 1: Tập ảnh trước khi tiêm thuốc cản quang chúng tôi tiến hành huấn luyện bằng mô hình SSD cho ra result 1. Stage 2, Stage 3, Stage 4: Tập ảnh sau khi tiêm thuốc cản quang, tiến hành huấn luyện bằng mô hình SSD cho ra kết quả tương ứng result 2, result 3, result 4. Sau đó tổng hợp result 1,
- 170 MỘT TIẾP CẬN XỬ LÝ DỮ LIỆU LỚN TRONG PHÁT HIỆN CÁC TỔN THƯƠNG GAN DỰA TRÊN… result 2, result 3, result 4 và đưa ra kết quả cuối cùng bao gồm phân vùng và phân loại, lưu vào HDFS được biểu diễn như hình 3. Việc huấn luyện trên máy tính đơn sẽ thực hiện tuần tự qua từng thì, điều này làm tăng thời gian huấn luyện cũng như việc phát hiện những tổn thương trên gan. Stage 1 Bounding box (Plain) (xmin, ymin, xmax, ymax) Stage 2 mAP Sequence (Arterial) Classification HCC Stage 3 HEM (Venous) NAN Stage 4 (Delay) Input Image Flatten Fullly connected Softmax Activation Function Feature Extraction layer layer (Probabilistic distribution) Output 512x512 Classification Hình 3. Mô hình phân loại bệnh sử dụng mạng SSD với kịch bản 1 B. Kịch bản 2 Ở kịch bản 2 tương tự như kịch bản 1 nhưng cả bốn kỳ này sẽ được xử lý song song trong môi trường Spark. Tại đây chúng tôi tiến hành cài đặt sử dụng một Master và ba Cluster với mô hình rút trích đặc trưng với mạng SSD trong môi trường Spark như mô phỏng ở hình 4. Trong đó, Input là tập dữ liệu ảnh CT của các bệnh nhân có bệnh lý về gan được chụp ở bốn thì trước và sau khi tiêm thuốc cản quang. Ở các thì Plain, Arterial, Venous, Delay, ta lần lượt gọi: P(1,1), P(1,2), P(1,3), P(1,4) là tập ảnh của bệnh nhân 1;...; P(i,1), P(i,2), P(i,3), P(i,4) là tập ảnh của bệnh nhân i. Gọi value(1,1), value(1,2), value(1,3), value(1,4) là các giá trị phân vùng, phân loại của bệnh nhân 1;...; value(i,1), value(i,2), value(i,3), value(i,4) là các giá trị phân vùng, phân loại của bệnh nhân i. Giai đoạn Map: Các ảnh đầu vào sẽ được phân chia một cách ngẫu nhiên cho các Map sau đó rút trích đặc trưng, trộn và sắp xếp, tiến hành tổng hợp các value theo từng bệnh nhân nghĩa là các ảnh ở các thì chụp theo từng bệnh nhân. Giai đoạn Reduce: sẽ nhận danh sách kết quả trả về lưu vào HDFS. Trong mô hình minh họa ở hình 5 mô tả việc huấn luyện với mạng SSD trong môi trường xử lý song song và phân tán Spark, đầu tiên tập dữ liệu ảnh sẽ được phân chia ngẫu nhiên cho các worker với W1,...,Wn là các trọng số mạng được liên kết với từng worker 1,..., worker n. W là trung bình trọng số (Global Parameter Vecto W) được thu thập bởi các worker tại máy chủ tham số. Sau khi việc tính trung bình các trọng số được thực hiện các worker 1,..., worker n sẽ được phân bổ 𝑊 � 𝑛 tương ứng với phần cục bộ mạng. Mỗi worker sẽ thực thi huấn luyện � 1,...,𝑊 cùng lúc song song nhau. Việc cập nhật trọng số làm giảm thời gian huấn luyện cho mô hình. Công việc này được thực hiện với từng thì tương ứng với bốn thì chụp Plain, Arterial, Venous, Delay. Các kết quả thử nghiệm cũng đã xác nhận rằng đào tạo phân tán có thể giảm thời gian cần thiết để thực hiện toàn bộ quá trình đào tạo. Map Pharse SSD Shuffle and Merge Reduce Pharse P(1,1),value(1,1) P(1,1),value(1,1) P(2,2),value(2,2) P(1,3),value(1,3) Map 1 P1 value 1 P(1,3),value(1,3) P(1,4),value(1,4) P(2,1),value(2,1) P(1,2),value(1,2) P(1,4),value(1,4) P(2,2),value(2,2) P(1,2),value(1,2) P(2,1),value(2,1) Map 2 P2 value 2 P(2,3),value(2,3) P(2,3),value(2,3) P(2,4),value(2,4) P(2,4),value(2,4) ... ... ... ... ... Input Data is split P(i,1),value(i,1) P(i,1),value(i,1) Output into batches as inputs to P(i,2),value(i,2) P(i,2),value(i,2) map Map n Pi value i P(i,3),value(i,3) P(i,3),value(i,3) P(i,1),value(i,1) P(i,1),value(i,1) Hình 4. Mô hình rút trích đặc trưng sử dụng mạng SSD trong môi trường xử lý song song với Spark
- Phan Anh Cang, Nguyễn Thị Kim Luông, Phan Thượng Cang 171 SPARK Cluster Model Worker 1 Data (Slave) Model Cluster Manager HDFS Image (Feature Database (Master) Data ... Data is split Database) into batches Model as inputs to workers Data Worker n Global Parameter Vector W Hình 5. Mô hình huấn luyện với mạng SSD trong môi trường xử lý song song và phân tán Spark IV. KẾT QUẢ THỰC NGHIỆM Trong nghiên cứu này chúng tôi tiến hành thực nghiệm giữa hai kịch bản như đã trình bày trong phương pháp đề xuất để so sánh thời gian huấn luyện, độ chính xác với môi trường cài đặt và tập huấn luyện được trình bày ở Phần 1. A. Môi trường cài đặt và tập dữ huấn luyện 1. Mô tả tập dữ liệu huấn luyện Tập dữ liệu gồm 2000 ảnh chụp CT có chẩn đoán NAN, HEM, HCC gồm 80% ảnh huấn luyện và 20% ảnh kiểm thử của một bệnh viện đã được bác sĩ gán nhãn dựa trên chỉ số HU và đã được tiền xử lý và trích xuất từ ảnh DICOM cho ra tập ảnh có phần mở rộng *.png. Mỗi lát cắt bao gồm 4 ảnh tương ứng với từng thì Plain, Arterial, Venous, Delay. Mỗi thì gồm 500 ảnh (400 ảnh làm tập huấn luyện, 100 ảnh cho tập kiểm thử). Trong đó gồm 1600 tổng số lượng vùng tổn thương trên tập huấn luyện phân bố như sau: HCC (948), HEM (396), NAN (256) và 400 tổng số lượng vùng tổn thương trên tập kiểm thử phân bố như sau: HCC (232), HEM (108), NAN (60) được biểu diễn ở hình 6. Tập dữ liệu huấn luyện được sử dụng trong giai đoạn huấn luyện và tập dữ liệu kiểm thử được sử dụng cho kiểm thử độ chính xác và được sử dụng chung cho cả hai kịch bản. Hình 6. Biểu đồ phân bố số lượng vùng tổn thương trên tập dữ liệu huấn luyện và tập kiểm thử 2. Môi trường cài đặt: Để có thể thực hiện được hai kịch bản như đã đề ra chúng tôi thực hiện trong môi trường của hai kịch bản như sau: Bảng 4. Bảng môi trường huấn luyện của hai kịch bản Kịch bản Môi trường Cấu hình máy Môi trường cài đặt Tensorflow GPU 1.15, 1 Google Colab CPU: Xeon, RAM 32 GB, GPU Nvidia Tesla P100 Python 3.0 Master+HDFS: 2 Core VCPU, 4GB RAM; Cluster 1: 2 Apache Spark 2.3; BigDL 2 Apache Spark Core VCPU, 8GB RAM; Cluster 2: 2 Core VCPU, 8GB 0.12; Java JDK 8 RAM; Cluster 3: 2 Core VCPU, 8GB RAM B. Tham số huấn luyện mô hình mạng SSD: Các tham số này được trình bày cụ thể ở bảng 5. Bảng 5. Bảng tham số huấn luyện của mô hình mạng SSD cho các kịch bản Kịch bản 1 Num_clas Score Learning_rate Batch size Scales Num_step IoU Image size ses converter 0.004 12 3 [0.2; 0.95] Sigmoid 400.000 0.5 512x512 Kịch bản 2 Num_clas Learning_rate Batch size Score converter Epoch Image size ses 0.0001 04 3 Softmax 500 300x300 C. Kết quả thực nghiệm 1. Đánh giá mô hình Để xác định chỉ số mất mát (Loss_value) chúng tôi dựa vào Total_Loss của bốn thì (hình 7). Ở kịch bản 1 thể hiện ở hình a, b, c, d, ta thấy giá trị Total_Loss tối thiểu khi tăng đến 400.000 lần cụ thể thì Plain với Loss_value=0.24,
- 172 MỘT TIẾP CẬN XỬ LÝ DỮ LIỆU LỚN TRONG PHÁT HIỆN CÁC TỔN THƯƠNG GAN DỰA TRÊN… Arterial với Loss_value=0.23, Venous với Loss_value=0.22, Delay với Loss_value=0.24. Ở kịch bản 2 (hình e, f, g, h) thì Plain với Loss_value= 1.70, Arterial với Loss_value=1.37, Venous với Loss_value=1.23, Delay với Loss_value=1.31. Từ kết quả thực nghiệm trên cho thấy khi thực hiện ở kịch bản 2 xử lý song song trong môi trường Spark thì dữ liệu bị phân chia cho các node, dữ liệu ít đi trong quá trình huấn luyện do đó độ chính xác giảm đi kéo theo Loss_value sẽ tăng. (a) Plain (b) Arterial (c) Venous (d) Delay (g) Venous (h) Delay (e) Plain (f) Arterial Hình 7. Biểu đồ Total_Loss của các thì ở hai kịch bản với kịch bản 1 (hình a, b, c, d), kịch bản 2 (hình e, f, g, h) Với bài toán phân lớp ta cần đánh giá về độ chính xác phân lớp qua hai độ đo AP và mAP. Kết quả thực nghiệm cho thấy độ tin cậy của phương pháp đề xuất tương đối cao và hiệu quả. Cụ thể, ở kịch bản 1 độ chính xác phân lớp của HCC=99%, HEM=99%, NAN=95%; ở kịch bản 2 của HCC=88%, HEM=93%, NAN=65% và được thể hiện ở hình 8. Ta cũng thấy được độ tin cậy của phân loại ở kịch bản 1 cao hơn với kịch bản 2, với kịch bản 1 mAP = 97%, ở kịch bản 2 mAP = 82% (hình 9). Mặc dù, độ chính xác của phân loại bệnh ở kịch bản 2 thấp hơn kịch bản 1 nhưng vẫn tương đối cao và hiệu quả đối với trường hợp xử lý trên tập dữ liệu lớn vì thời gian thực hiện được cải thiện đáng kể giảm gần 10 lần (hình 10). Hình 9. Biểu đồ thể hiện độ chính xác trung bình mAP của Hình 8. Biểu đồ thể hiện độ chính xác AP phân loại từng lớp của phân loại hai kịch bản đề xuất hai kịch bản đề xuất 2. Phân vùng và phân loại tổn thương gan: Kết quả kiểm thử khi thực hiện lấy ngẫu nhiên ảnh trong tập dữ liệu test cho nhận dạng ba loại bệnh với tỉ lệ AP ở kịch bản 1: NAN (99%), HEM (96%), HCC (95%); kịch bản 2 với NAN (74%), HEM (91%), HCC (87%). Từ kết quả kiểm thử trên cho thấy đạt tỉ lệ tốt, hiển thị khoanh vùng và phân loại được bệnh đạt được mục đích đề ra của nghiên cứu. Bên cạnh đó, cũng có một số hình ảnh do tổn thương quá nhỏ hoặc không rõ vùng tổn thương làm cho tỉ lệ nhận dạng thấp. Trong công việc nghiên cứu sắp tới để triển khai đề tài mang tính ứng dụng thực tiễn cao chúng tôi sẽ cần thêm sự hỗ trợ đánh giá của bác sĩ chuyên ngành về độ chính xác phân loại trong hai kịch bản này. Loại bệnh Nang gan U máu trong gan Ung thư tế bào gan nguyên phát Kịch bản 1 Kịch bản 2
- Phan Anh Cang, Nguyễn Thị Kim Luông, Phan Thượng Cang 173 3. So sánh và đánh giá thời gian xử lý Mục đích của nghiên cứu là cung cấp thời gian huấn luyện để so sánh với các kịch bản đồng thời cung cấp mở rộng cho các nghiên cứu sau này nên có sự đánh đổi về thời gian và độ chính xác trong kết quả thực nghiệm. Sau khi đánh giá về độ chính xác chúng tôi tiến hành so sánh thời gian thực hiện của hai kịch bản ở bốn thì với chi tiết kết quả thực nghiệm đối ở kịch bản 1 như sau: Plain (2700 phút), Arterial (2000 phút), Venous (2600 phút), Delay (2593 phút); ở kịch bản 2 khi thực hiện trên 3 node như sau: Plain (313 phút), Arterial (297 phút), Venous (654 phút), Delay (688 phút), thời gian này được thể hiện trong hình 10. Ta thấy thời gian huấn luyện ở kịch bản 2 giảm ở từng thì chụp so với kịch bản 1 và thời gian trung bình được rút ngắn 68%. Điều này cho thấy khi thực hiện kịch bản 1 trên máy đơn với dữ liệu càng nhiều độ chính xác càng cao, tuy nhiên thách thức thời gian thực hiện cũng tăng cao. Trong khi đó, kịch bản 2 khi phân chia dữ liệu để xử lý song song và phân tán trên các node (hoặc cluster) thời gian thực hiện sẽ được rút ngắn hơn gần 10 lần so với kịch bản 1 mặc dù độ chính xác thấp hơn nhưng có thể chấp nhận được. Hình 10. Biểu đồ so sánh thời gian thực hiện của hai kịch bản đề xuất V. KẾT LUẬN Trong nghiên cứu này, chúng tôi trình bày và sử dụng phương pháp Deep Neural Network cụ thể với kịch bản 1 là kiến trúc mạng SSD thực hiện trên máy tính đơn và kịch bản 2 là đề xuất kiến trúc mạng SSD xử lý song song trong môi trường Spark thực hiện trên ba node. Ta thấy được trong cả hai kịch bản đề ra đều đạt độ chính xác tương đối tốt cho việc phát hiện và phân loại tổn thương gan với kịch bản 1 đạt độ chính xác mAP=97% và ở kịch bản 2 mAP= 82%. Độ chính xác ở kịch bản 2 giảm đi so với kịch bản 1. Dễ thấy rằng việc sử dụng Deep Learning để giải quyết bài toán có một thách thức nếu dữ liệu càng nhiều, độ chính xác sẽ càng cao, kéo theo thời gian sẽ càng cao. Mục đích của nghiên cứu thực hiện chủ yếu để cải thiện về thời gian huấn luyện và tận dụng các tài nguyên hiện có của máy tính với mô hình xử lý dữ liệu song song và phân tán. Như chúng ta đã biết, các ảnh y khoa có số lượng và dung lượng lớn đòi hỏi tài nguyên tính toán lớn như bộ nhớ trong và CPU để tạo ra mô hình huấn luyện và nhận dạng. Vì vậy việc nghiên cứu áp dụng mô hình xử lý dữ liệu song song và phân tán Spark để huấn luyện các mô hình mạng học sâu là cần thiết hiện nay, từ đó rút ngắn được thời gian xử lý của hệ thống, giải quyết được các bài toán cho hệ thống xử lý dữ liệu lớn. Tuy nhiên, môi trường huấn luyện phân tán trên sẽ làm giảm bớt độ chính xác của mô hình SSD so với việc dùng một máy đơn (standalone) truyền thống vì dữ liệu bị phân chia nhỏ trên các node đồng nghĩa với việc làm độ chính xác sẽ giảm đi do quá trình học. Để khắc phục điều này, trong hướng phát triển của nghiên cứu chúng tôi sẽ tăng cường tập dữ liệu huấn luyện với các kỹ thuật khác nhau và tiếp cận học chuyển tiếp để đạt độ chính xác tốt hơn. TÀI LIỆU THAM KHẢO [1] F. Bray, J. Ferlay, I. Soerjomataram, R. L. Siegel, L. A. Torre, and A. Jemal, “Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries”, CA. Cancer J. Clin., vol. 68, No. 6, 2018, doi: 10.3322/caac.21492. [2] M. J. A. Jansen, H. J. Kuijf, and J. P. W. Pluim, “Automatic classification of focal liver lesions based on clinical DCE-MR and T2-weighted images: A feasibility study”, in Proceedings - International Symposium on Biomedical Imaging, 2018, vol. 2018- April, doi: 10.1109/ISBI.2018.8363565. [3] Z. Al Sadeque, T. I. Khan, Q. D. Hossain, and M. Y. Turaba, “Automated detection and classification of liver cancer from CT Images using HOG-SVM model”, 2019, doi: 10.1109/ICAEE48663.2019.8975602. [4] A. Ben-Cohen, R. Mechrez, N. Yedidia, and H. Greenspan, “Improving CNN Training using Disentanglement for Liver Lesion Classification in CT”, 2019, doi: 10.1109/EMBC.2019.8857465. [5] W. Wang et al., “Classification of focal liver lesions using deep learning with fine-tuning”, 2018, doi: 10.1145/3299852.3299860. [6] S. Shimano, M. Tsuda, S. Fuyuno, Y. Arimura, and F. Nanishi, “Liver cyst infection after colon endoscopic mucosal resection in a patient with autosomal dominant polycystic kidney disease on maintenance hemodialysis”, Intern. Med., vol. 57, No. 2, 2018, doi: 10.2169/internalmedicine.8784-16. [7] Z. Zhu et al., “Neonatal giant hepatic hemangioma A case report”, Med. (United States), vol. 97, No. 42, 2018, doi: 10.1097/MD.0000000000012863. [8] S. Kobayashi, K. Kozaka, T. Gabata, O. Matsui, and T. Minami, “Intraarterial and intravenous contrast enhanced CT and MR imaging of multi-step hepatocarcinogenesis defining the early stage of hepatocellular carcinoma development”, Hepatoma Res., vol. 2020, 2020, doi: 10.20517/2394-5079.2020.24. [9] D. W. Fanning, “Converting CT Data to Hounsfield Units”, Guid. to IDL Program., 2006. [10] Wolfgang Dähnert, “Radiology Review Manual”, 7th ed, Philadelphia, PA Lippincott Williams Wilkins, 1264 pp, ISBN 978- 1609139438, 2011.
- 174 MỘT TIẾP CẬN XỬ LÝ DỮ LIỆU LỚN TRONG PHÁT HIỆN CÁC TỔN THƯƠNG GAN DỰA TRÊN… [11] A. Adam and A. K. Dixon, “Grainger & Allison’s Radiology”, Churchill Livingstone, ISBN 978-0702042959, 2015. [12] M. P. Federle and S. P. Raman, “Diagnostic Imaging: Gastrointestinal”, 3rd, Elsevier, ISBN 978-0323377553, 2015. [13] William E. Bran, “Fundamentals of Diagnostic Radiology”, 4th, Lippincott Williams Wilkin, ISBN 978-1608319121, 2012. [14] Michael P. Federle and Siva P. Raman, “Imaging Anatomy: Chest, Abdomen, Pelvis”, 2nd, Amirsys Elsevier, ISBN 978- 0323477819, 2016. [15] J. J. Dai et al., “BigDL: A Distributed Deep Learning Framework for Big Data”, 2019, doi: 10.1145/3357223.3362707. [16] W. Liu et al., “SSD: Single shot multibox detector”, in Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 2016, vol. 9905 LNCS, doi: 10.1007/978-3-319-46448-0_2. [17] C. Ning, H. Zhou, Y. Song, and J. Tang, “Inception Single Shot MultiBox Detector for object detection”, 2017, doi: 10.1109/ICMEW.2017.8026312. [18] Soner and Yıldırım, “How to Best Evaluate a Classification Model”, https://towardsdatascience.com/how-to-best-evaluate-a- classification-model-2edb12bcc587, 2020. . [19] M. Everingham, L. Van Gool, C. K. I. Williams, J. Winn, and A. Zisserman, “The pascal visual object classes (VOC) challenge”, Int. J. Comput. Vis., vol. 88, No. 2, 2010, doi: 10.1007/s11263-009-0275-4. [20] Adrian Rosebrock, “Intersection over Union (IoU) for object detection”, Pyimagesearch, 2016. [21] C. Kavitha and X. Anita, “Task failure resilience technique for improving the performance of MapReduce in Hadoop”, ETRI J., vol. 42, No. 5, 2020, doi: 10.4218/etrij.2018-0265. [22] Z. Han and Y. Zhang, “Spark: A Big Data Processing Platform Based on Memory Computing”, in Proceedings - International Symposium on Parallel Architectures, Algorithms and Programming, PAAP, 2016, vol. 2016-January, doi: 10.1109/PAAP.2015.41. A LARGE-SCALE APPROACH FOR THE CLASSIFICATION OF LIVER LESIONS BASED ON HOUNSFIELD UNITS Phan Anh Cang, Nguyen Thi Kim Luong, Phan Thuong Cang ABSTRACT: Liver cancer is a common disease in the world in general and in our country in particular. According to WHO statistics in 2018, Vietnam belongs to the group of countries with the highest cancer rate in the world and liver cancer accounts for the highest rate of all cancers. To diagnose and detect liver cancer, doctors spend a lot of time and effort looking at CT scans of the liver. However, this work requires physicians to be experienced and review a large number of CT images obtained during the periods before and after contrast injection to monitor changes in Hounsfield attenuation. Most of the previous studies focused on feature extraction and classification techniques without taking into account the variation of Hounsfield attenuation across imaging phases while medical professionals paid great attention to this factor on reality. To solve this problem, in this paper, we propose a method to detect liver lesions on CT images based on Hounsfield Units, applying parallel processing model in Spark environment to improve accuracy and consuming time. Based on the Single Short Multibox Detector (SSD) neural network, we implement the proposed method in Spark environment for training and classifying liver lesions. The results show that the proposed method has high accuracy with mAP measurement of 82%, while the consuming time is 10 times faster than the case without processing in Spark environment. Research results support doctors to detect and automatically classify liver diseases accurately and quickly, helping to treat patients in time.
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn