intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Phân loại hạch ung thư phổi bằng mô hình 3D-CNN

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:6

20
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết trình bày việc đề xuất sử dụng mô hình Convolutional Neural Network với dữ liệu đầu vào là ảnh chụp cắt lớp có cấu trúc 3D nhằm tận dụng cấu trúc, đặc trưng hình thái học của dữ liệu dựa trên kiến trúc mạng Resnet kết hợp với một số kỹ thuật học sâu nhằm tối ưu tính hiệu quả phân loại bệnh trên tập dữ liệu.

Chủ đề:
Lưu

Nội dung Text: Phân loại hạch ung thư phổi bằng mô hình 3D-CNN

  1. Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020 DOI: 10.15625/vap.2020.00198 PHÂN LOẠI HẠCH UNG THƯ PHỔI BẰNG MÔ HÌNH 3D-CNN Trần Văn Quang1, Trần Đình Toàn2, Lê Mậu Long3, Lê Minh Hưng1 1 Trường Đại học Công nghệ thông tin, ĐHQG TP. HCM 2 Trường Đại học Công nghiệp thực phẩm TP. HCM 3 Trường Đại học Nguyễn Tất Thành 16521004@gm.uit.edu.vn, toantd@hufi.edu.vn, lmlong@ntt.edu.vn, hunglm@uit.edu.vn TÓM TẮT: Bệnh ung thư phổi là căn bệnh có tỉ lệ tử vong cao ở tất cả mọi giới và mọi lứa tuổi, việc chẩn đoán để sàng lọc bệnh bằng ảnh cắt lớp (CT) là biện pháp tiềm năng có thể giảm tỉ lệ tử vong. Nhưng quá trình chẩn đoán bệnh thường tốn khá nhiều thời gian của bác sỹ và bệnh nhân. Việc xây dựng một hệ thống hỗ trợ chẩn đoán dấu hiệu ung thư tự động là cần thiết và đã có nhiều cách tiếp cận được sử dụng cho bài toán phân loại bệnh đã được đề xuất. Một cách tiếp cận thông thường trước đây là việc sử dụng các đặc trưng thiết kế thủ công, sau đó sử dụng các thuật toán máy học để phân loại việc này các đặc trưng đã trích xuất dẫn đến hệ thống không đạt hiệu quả cao. Xu hướng hiện nay là sử dụng mô hình học sâu, cụ thể là mạng nơron tích chập (Convolutional Neural Network - CNN) đang được đề xuất đã mang lại nhiều kết quả tốt. Tuy nhiên, có hai vấn đề phải xem xét khi sử dụng một mô hình học sâu trên dữ liệu ảnh 3D. Thứ nhất, cấu trúc dữ liệu đầu vào thông thường là ảnh 2D, điều đó sẽ làm mất mát một số đặc trưng có giá trị của dữ liệu do ảnh chụp cắt lớp có cấu trúc 3D. Thứ hai, trong lĩnh vực y tế, các bộ dữ liệu thường có số lượng tương đối nhỏ, trong khi để có thể huấn luyện mô hình học sâu thì yêu cầu dữ liệu rất lớn. Trong bài báo này, chúng tôi đề xuất sử dụng mô hình Convolutional Neural Network với dữ liệu đầu vào là ảnh chụp cắt lớp có cấu trúc 3D nhằm tận dụng cấu trúc, đặc trưng hình thái học của dữ liệu dựa trên kiến trúc mạng Resnet kết hợp với một số kỹ thuật học sâu nhằm tối ưu tính hiệu quả phân loại bệnh trên tập dữ liệu. Chúng tôi tiến hành 05 thực nghiệm trên bộ dữ liệu LNDb (Lung Nodule Database) với hai kiến trúc mạng 3D Restnet-18 và 3D Restnet-10 kết hợp với các phương pháp cân bằng dữ liệu khác nhau. Từ khóa: Deep learning, lung nodule, 3D Convolutional Neural Network, Resnet. I. GIỚI THIỆU Ung thư phổi là căn bệnh gây tử vong cao trên thế giới [1]. Tuy nhiên, ung thư phổi có thể được chữa khỏi một cách hiệu quả nếu bệnh nhân có thể được chẩn đoán sớm ở giai đoạn đầu, trước khi bệnh bước vào giai đoạn phát triển. Do đó, quá trình điều trị sẽ phụ thuộc rất lớn vào việc có thể phát hiện được ung thư phổi, hay phát hiện hạch phổi. Theo một nghiên cứu của NLST [2], việc sử dụng ảnh chụp cắt lớp liều thấp (LDCT) là phương pháp hiệu quả trong việc phát hiện ung thư phổi ở giai đoạn đầu, có tiềm năng lớn khi có thể giảm tỉ lệ tử vong được 20 %. Khi chẩn đoán các dấu hiệu ung thư thông qua quan sát ảnh LDCT (Low-dose computed tomography) phổi của bệnh nhân, một bác sĩ X-quang sẽ dựa trên các tiêu chuẩn về dấu hiệu của một tổn thương trên ảnh phổi bao gồm: kích thước, tính chất, sự hình thành gai và vị trí xuất hiện. Công việc này đòi hỏi tiêu tốn nhiều chi phí cả về thời gian và tiền bạc của bác sĩ và bệnh nhân. Bởi vì hình dáng và kết cấu của một tổn thương phổi có được xem như là một hạch ung thư hay không là rất đa dạng và khó xác định đối với bác sĩ chẩn đoán. Ngoài ra, sự tương tự nhau của các dấu hiệu tại một vị trí quan sát nhằm xác định đó là ung thư hay không ung thư cũng ảnh hưởng rất nhiều và làm giảm hiệu quả của việc chẩn đoán sớm. Đã có nhiều nghiên cứu với mục đích xây dựng các hệ thống hỗ trợ chẩn đoán trên ảnh LDCT, đặc biệt là các nghiên cứu sử dụng mô hình học sâu CNN (Convolutional Neural Network) đang đem lại nhiều kết quả tích cực trong hỗ trợ phát hiện và chấn đoán bệnh. Nhưng cần chú ý rằng, các mô hình học sâu thường phụ thuộc vào các bộ dữ liệu lớn và có độ tin cậy cao đối với sự chính xác trong các nhãn được gán bởi bác sĩ, do đó, các bộ dữ liệu lớn, công khai mang một ý nghĩa rất lớn trong các nghiên cứu, ví dụ như bộ dữ liệu LIDC-IDRI [3]. Do đó, việc tìm kiếm, sử dụng bộ dữ liệu thích hợp cho việc phát triển hệ thống hỗ trợ chẩn đoán bệnh là một trong những yếu tố tiên quyết. Bên cạnh đó, có nhiều nghiên cứu liên quan đến bài toán phân loại nốt sần (hạch) phổi. Trước đây, các hệ thống phân loại hạch phổi thường sử dụng phương pháp trích xuất đặc trưng phân biệt dựa trên cấu trúc hình học về kích thước, tính chất, sự hình thành gai, tính tăng trưởng và vị trí xuất hiện. Các thuộc tính được trích xuất sẽ được đưa vào các thuật toán máy học để phân loại và đánh giá tính hiệu quả của mô hình thông qua độ chính xác, tốc độ và mức độ tự động hóa của hệ thống. Trong đó, việc trích xuất các đặc trưng là tương đối thủ công, phụ thuộc khá nhiều vào người trích xuất. Do đó, nếu cần cải tiến, nâng cấp hệ thống thì sẽ gặp khá nhiều khó khăn và bị giới hạn. Gần đây, các mô hình học sâu “deep learning” đang được nhiều sự chú ý và áp dụng đối với các nghiên cứu liên quan đến bài toán nốt sần phổi. Hiệu quả mang đến của các phương pháp này tương đối khả quan, khi dùng mô hình này có thể tự trích xuất các đặc trưng từ tập dữ liệu mà không phụ thuộc nhiều vào người trích xuất đặc trưng thủ công. Đặc biệt, mô hình có thể học được các đặc trưng tổng quá hơn mà con người không nhận ra hay khó có thể phân biệt được, kết quả áp dụng vào bài toán phân loại nốt sần phổi cũng đã cho ra các kết quả tốt. Cụ thể, Chen và các cộng sự đã đề xuất áp dụng mô hình mạng neural kết hợp cho bộ phân lớp với 3 đối tượng: lành tính, không chắc chắn và có thể ác tính, mô hình áp dụng xử lý trên từng lát cắt của ảnh chụp cắt lớp (lát cắt 2D) với độ chính xác là 94,4 % [7]. Hussein và đồng sự đề xuất mô hình mạng Multi-View CNN sử dụng nhiều lát cắt từ ảnh chụp CT kết hợp, đầu ra của mô hình sử dụng Gaussian process để đánh giá, phân loại hạch ác tính với độ chính xác đạt được 82,47 % [8]. Một hướng nghiên cứu khác, với dữ liệu đầu vào là một khối 3D trích xuất từ ảnh CT cũng đạt kết quả cao mà Dey và đồng sự đề xuất sử dụng mô hình 3D Dense Net kết hợp với Multi-Output network với độ chính xác đạt được là 90,4 % [9]. Trong các nghiên
  2. 444 PHÂN LOẠI HẠCH UNG THƯ PHỔI BẰNG MÔ HÌNH 3D-CNN cứu gần đây, việc sử dụng các mô hình học sâu sử dụng kiến trúc của mạng CNN và được thiết kết cho kiến trúc đầu vào 3D đối với bài toán phân loại hạch ung thư phổi là xu hướng với khả năng trích xuất đặc trưng tốt và bảo toàn cấu trúc 3 chiều của dữ liệu. Kết quả đạt được khả quan, hướng tiếp cận này mang nhiều kì vọng phát triển đồng thời cũng mang những ý nghĩa trong việc áp dụng, đánh giá đối với việc phát hiện, chẩn đoán lâm sàng. Trong nghiên cứu này, nhằm đảm bảo tính bảo toàn cấu trúc 3 chiều của dữ liệu, mô hình 3D CNN (3D Convolutional neural network) được đề xuất để xây dựng mô hình phân loại chẩn đoán vị trí tổn thương có mang dấu hiệu của hạch ung thư. Những đóng góp chính của bài báo này, bao gồm: Xây dựng mô hình phân loại bệnh phổi sử dụng mô hình 3D Convolutional Neural Network với dữ liệu 3 chiều đầu vào đạt được kết quả tốt. Tiến hành nhiều thực nghiệm liên quan đến hai kiến trúc mạng 3D Resnet-18 và 3D Resnet-10 dựa trên bộ dữ liệu LNDb cho nhiều kết quả tốt. Sử dụng 2 hàm tối ưu Adam Optimizer và Stochastic Gradient Descent với Momentum trong mô hình kết hợp 2 kiến trúc mạng 3D Resnet-18 và 3D Resnet-10 đạt nhiều kết quả tốt. Sử dụng các phương pháp cân bằng dữ liệu như Over Sampling và Change Weight Class trong quá trình thực nghiệm đã có nhiều cải thiện hiệu suất đáng kể cho hệ thống. Bài báo của chúng tôi trình bày gồm phần 1 giới thiệu và các công việc liên quan, các phương pháp được sử dụng trong nghiên cứu này được thể hiện trong phần 2. Thực nghiệm và đánh giá được trình bày trong phần 3, phần 4 là phần kết luận và hướng phát triển trong tương lai. II. PHƯƠNG PHÁP Một cách tổng quan, 3 vấn đề chính cần giải quyết liên quan đến hạch phổi là: phát hiện (detection), phân vùng (segmentation) và phân loại (classification) [6]. Trong đó, detection có mục địch xác định vị trí chính xác của hạch ở vị trí nào bên trong phổi. Segmentation mục đích là làm thế nào để phân vùng phạm vi của hạch trên ảnh chụp cắt lớp (ảnh CT) và classification có mục đích xác định chính xác hạch là lành tính hay ác tính hoặc có hay không có dấu hiệu của hạch ung thư. Bài toán được thực hiện trong nghiên cứu này là bài toán phân loại (classification), nhằm xác định xem vị trí được chỉ định thuộc hạch lành tính hay ác tính. Cụ thể hơn, bài toán phân lớp sẽ tập trung vào việc phân loại đối tượng dữ liệu thuộc lớp nào trong 2 lớp là non-nodule (không có hạch ung thư phổi) và nodule (có hạch ung thư phổi). Hình 1. Mô tả đối tượng phân loại trong bài toán. Phía trên thuộc lớp non-nodule, phía dưới thuộc lớp nodule 2.1. Bộ dữ liệu LNDb (A Lung Nodule Database on Computed) là tập dữ liệu chứa 294 bản quét CT được thu thập tại Centro Hospitalar e Universitário de São João (CHUSJ) ở Porto, Bồ Đào Nha từ 2016 - 2018. Tất cả dữ liệu đã được thu thập dưới sự chấp thuận từ ủy ban y đức của CHUSJ và được ẩn danh trước khi phân tích để xóa thông tin cá nhân ngoại trừ năm sinh và giới tính của bệnh nhân. Tập dữ liệu được xây dựng theo phương pháp tiếp cận về cách chú thích và gán nhãn tương tự như tập dữ liệu LIDC-IDRI. Bộ dữ liệu hướng đến mục tiêu giải quyết các vấn đề phát sinh, trong đó với việc áp dụng vào các hệ thống hỗ trợ phát hiện và chẩn đoán bệnh thực tế, dữ liệu được thực hiện kĩ với các yêu cầu
  3. Trần Văn Quang, Trần Đình Toàn, Lê Mậu Long, Lê Minh Hưng 445 tiêu chuẩn trong lựa chọn bệnh nhân và ghi chú bởi các bác sĩ có kinh nghiệm. Ngoài ra, một kỹ thuật được gọi là “Eye tracking” [4] được thực hiện trong suốt quá trình bác sĩ tiến hành gán nhãn và ghi chú bộ dữ liệu, từ đó có thể kết hợp với kết quả đầu ra của hệ thống hỗ trợ phát hiện và chẩn đoán bệnh để đảm bảo được rằng, các đề xuất của hệ thống có thể đem lại hiệu quả ứng dụng vào thực tế. 2.2. Mô hình phân loại Bảng 1. Kiến trúc mô hình mạng Resnet-18 (dùng basic block) và Resnet-10 (dùng bottleneck block) Resnet-18 Resnet-10 convolution 1 7 , 64, stride = 2, padding = 3 convolution 2 [ ] [ ] convolution 3 [ ] [ ] convolution 4 [ ] [ ] convolution 5 [ ] [ ] Mô hình phân loại 3D Resnet được lựa chọn để xây dựng hệ thống dự đoán trong nghiên cứu này dựa trên kiến trúc mô hình mạng Resnet [10]. Mạng Resnet có kiến trúc khá tương tự mạng VGG Net với các tầng convolution tượng tự xếp cạnh nhau. Tuy nhiên, khác với VGG Net, mô hình mạng Resnet có thể cho phép làm kiến trúc sâu hơn với số tầng lớn hơn. Về mặt thiết kế, Resnet sử dụng kiến trúc dùng nhiều residual block trong các residual block, ta sẽ thiết kế một skip connect bằng cách cộng kết quả đầu ra với kết quả đầu vào trước đó. Sẽ có hai thiết kết là Basic block và Bottleneck block được sử dụng để xây dựng mô hình. Về kiến trúc chung, mô hình sẽ sử dụng kiến trúc mạng phân loại đã được thiết kết trên đối tượng dữ liệu video [11]. Kiến trúc này có thể áp dụng với sự tương tự về mặt không gian 3 chiều của dữ liệu. Nghiên cứu này, áp dụng 2 kiến trúc 3D Resnet-18 sử dụng Basic block và 3D Resnet-10 sử dụng bottleneck block cho quá trình thực nghiệm để tiến hành so sánh kết quả. III. THỰC NGHIỆM VÀ ĐÁNH GIÁ 3.1. Thực nghiệm Quá trình huấn luyện sử dụng hai phương pháp tối ưu Adam Optimizer và Stochastic Gradient Descent với Momentum cho quá trình cập nhật trọng số của mô hình. Dữ liệu đầu vào được trích xuất từ các vị trí tổn thương được đánh dấu bởi bác sĩ trên ảnh chụp CT của bệnh nhân. Phần trích xuất có kích thước 64x64x64 được đề xuất sẽ bao quanh vị trí tổn thương, đảm bảo mô hình có thể học được tốt các đặc trưng về mặt hình thái của hạch ung thư hỗ trợ tốt cho việc phân loại. Hàm mất mát Cross Entropy được sử dụng làm hàm mục tiêu cho quá trình huấn luyện mô hình trên tập dữ liệu. Learning Rate được cài đặt trong thực nghiệm sẽ được thay đổi thông qua quan sát biểu hiện trên kết quả đạt được trong quá trình huấn luyện, cụ thể các giá trị bao gồm {10-3,10-4,10-5,10-6}. Giá trị của weight decay là 0,001 và 0,9 cho Momentum. Mô hình học sâu phụ thuộc rất lớn vào lượng dữ liệu được sử dụng cho quá trình huấn luyện. Do đó, dữ liệu sẽ được tăng cường nhằm đảm bảo số lượng dữ liệu đủ cho quá trình cập nhật trọng số của mô hình. Phương pháp tăng cường dữ liệu sẽ được tiến hành bằng cách: Thay đổi vị trí các trụ của khối lập phương, hay thay đổi góc nhìn theo 6 mặt từ đó tăng số lượng dữ liệu từ một điểm lên 6 lần. Đổi vị trí trọng tâm của khối lập phương so với vị trí chỉ định ban đầu của bác sĩ 10 đơn vị pixel tiến về các mặt của khối lập phương nhưng vẫn giữ kích thước cố định là 64 64 64, đạt được 6 điểm dữ liệu có vị trí khác nhau. Đồng thời kết hợp cả hai phương pháp tăng cường dữ liệu lại với nhau để tăng thêm số lượng dữ liệu. Đối với sự phân bố không đồng đều giữa hai lớp phân loại nodule và non-nodule trên tập dữ liệu, nghiên cứu này tiếp cận theo hai cách. Với cách thứ nhất, tiếp cận đổi theo hướng dữ liệu, được thực hiện bằng cách sử dụng kỹ thuật Over Sampling thông qua việc lặp lại số lượng điểm dữ liệu trong lớp có số lượng ít hơn bằng với số lượng trong
  4. 446 PHÂN LOẠI HẠCH UNG THƯ PHỔI BẰNG MÔ HÌNH 3D-CNN lớp còn lại. Cách thứ hai sẽ được thực hiện thông qua tiếp cận thay đổi trên hàm mục tiêu, phương pháp này còn gọi là kỹ thuật gán trọng số, được thực hiện bằng cách đánh trọng số đối với kết quả phân loại cụ thể theo từng lớp. Đối với lớp có số lượng ít sẽ được gán trọng số lớn hơn so với lớp còn lại, từ đó điều chỉnh lại phân bố xác suất của mô hình dự đoán. 3.2. Kết quả Thực nghiệm đầu tiên tiến hành trên mô hình Resnet-18 được huấn luyện từ đầu trên tập dữ liệu được tăng cường, có áp dụng biện pháp cân bằng dữ liệu bằng Over Sampling. Mô hình được tiến hành tối ưu dựa trên thuật toán Adam Optimizer với learning rate ban đầu là 10-3. Kết quả đạt được (thực nghiệm 1 ở bảng 2) độ chính xác 72,35 % trên bộ dữ liệu kiểm thử. Tuy nhiên, hiện tượng Overfitting đã xảy ra khi tiến hành trên mô hình Resnet-18. Giả thiết đặt ra là: do số lượng dữ liệu đưa vào là nhỏ so với độ phức tạp của mô hình, hay số lượng tham số mô hình quá lớn dẫn đến Overfitting. Bảng 2. Kết quả thực nghiệm tiến hành trên mô hình Resnet-18 (thực nghiệm 1, 2) và Resnet-10 (thực nghiệm 3, 4, 5) Non-nodule Nodule Thực nghiệm Precision Recall F1-score Precision Recall F1-score Accuracy 1 0,68 0,48 0,56 0,74 0,86 0,8 72,35 % 2 0,58 0,35 0,44 0,69 0,85 0,76 66,67 % 3 0,51 0,4 0,44 0,69 0,77 0,73 63,41 % 4 0,69 0,24 0,36 0,68 0,94 0,79 67,89 % 5 0,48 0,42 0,45 0,68 0,74 0,71 61,79 % Để xác nhận lại vấn đề, thực nghiệm tiếp theo được tiến hành trên thuật toán tối ưu Stochastic Gradient Descent với Momentum và learning rate là nhằm đảm bảo tính ổn định của mô hình. Kết quả (thực nghiệm 2 ở Bảng 2) đạt được độ chính xác 66,67 %. Hiện tượng Overfitting vẫn xảy ra, do đó, tại các thực nghiệm tiếp theo, nghiên cứu này chúng tôi sử dụng mô hình mạng Resnet-10 có số lượng tham số ít hơn Resnet-18 nhằm giảm bớt độ phức tạp của mô hình. Hình 2. Mô tả hàm mất mát của thực nghiệm 1 (hình bên trái) thực nghiệm 2 (hình bên phải) Tiến hành trên mô hình Resnet-10, đồng thời so sánh tính hiệu quả của phương pháp cân bằng dữ liệu, nghiên cứu này đã thực nghiệm huấn luyện trên tập dữ liệu được tăng cường sử dụng và không sử dụng phương pháp cân bằng dữ liệu Over Sampling. Kết quả đạt được độ chính xác 63,41 % trên thực nghiệm tiến hành Over Sampling (thực nghiệm 3 ở bảng 2) và 67,89 % trên thực nghiệm tiến hành không sử dụng Over Sampling (thực nghiệm 4 ở Bảng 2). Nhưng khi xét trên các độ đo precision, recall và F1-score, giá trị huấn luyện của mô hình có sử dụng biện pháp Over Sampling có sự cân bằng hơn so với thực nghiệm không sử dụng phương pháp Over Sampling. Qua quan sát, hiện tượng Overfitting khi huấn luyện trên mô hình 3D Resnet-10 xuất hiện muộn hơn so với trên mô hình 3D Resnet-18. Đối với cách huấn luyện mô hình sử dụng phương pháp cân bằng dữ liệu tiếp cận theo hướng đánh trọng số giá trị các lớp trong hàm mục tiêu với hệ số [1.35238095, 0.79329609] theo thứ tự lớp là Non-nodule và nodule. Kết quả trả về khá tốt, khi hàm mất mát đã giảm tương đối trong quá trình huấn luyện với độ chính xác đạt 61,79 % (thực nghiệm 5 ở Bảng 2). Tỉ lệ dự đoán cân bằng giữa các lớp trên độ đo precision, recall và F1-score cho kết quả tốt hơn so với không sử dụng phương pháp cân bằng giữa các lớp.
  5. Trần Văn Quang, Trần Đình Toàn, Lê Mậu Long, Lê Minh Hưng 447 Hình 3. Mô tả hàm mất mát của thực nghiệm 3, 4, 5 theo thứ tự từ trái sang phải IV. KẾT LUẬN Trong nghiên cứu này, chúng tôi đã xây dựng hệ thống hỗ trợ chẩn đoán ung thư phổi sử dụng mô hình mạng 3D CNN dựa trên hai kiến trúc mạng 3D Resnet-18, 3D Resnet-10 cùng với sử dụng các thuật toán tối ưu Adam Optimizer, Stochastic Gradient Descent và các phương pháp cân bằng dữ liệu trên hàm mất mát. Đồng thời, thực hiện các thực nghiệm dựa trên ảnh CT của bộ dữ liệu LNDb (A Lung Nodule Database on Computed). Với kết quả các thực nghiệm đã thực hiện có thể rút ra một số vấn đề như: (i) Sự ảnh hưởng độ phức tạp mô hình khi huấn luyện trên bộ dữ liệu LNDb. (ii) Các phương pháp cân bằng dữ liệu như Over Sampling và kỹ thuật gán trọng số đã đem lại kết quả tốt, có tác động đến khả năng dự đoán của mô hình. Trong tương lai, việc cải thiện độ phức tạp của mô hình cho phù hợp với bộ dữ liệu và các phương pháp huấn luyện cho bộ dữ liệu nhỏ sẽ là hướng tiếp cận cho các nghiên cứu tiếp theo. V. LỜI CẢM ƠN Bài báo được hoàn thành dưới sự hỗ trợ của Đề tài VAST-1.03/19-20 của Viện Hàn lâm Khoa học và Công nghệ Việt Nam. TÀI LIỆU THAM KHẢO [1] Siegel, Rebecca L., Kimberly D. Miller, Ahmedin Jemal, "Cancer statistics, 2019", CA: a cancer journal for clinicians 69.1: 7-34, 2019. [2] National Lung Screening Trial Research Team, "Reduced lung-cancer mortality with low-dose computed tomographic screening", New England Journal of Medicine 365.5: 395-409, 2011. [3] Armato III, Samuel G., "The lung image database consortium (LIDC) and image database resource initiative (IDRI): a completed reference database of lung nodules on CT scans", Medical physics 38.2: 915-931, 2011. [4] Pedrosa, João, "LNDB: A lung nodule database on computed tomography", arXiv preprint arXiv:1911.08434, 2019. [5] Machado, Marlene, "Radiologists' Gaze Characterization During Lung Nodule Search in Thoracic CT", 2018 International Conference on Graphics and Interaction (ICGI). IEEE, 2018. [6] Wu, Jianrong, Tianyi Qian, "A survey of pulmonary nodule detection, segmentation and classification in computed tomography with deep learning techniques", J. Med. Artif. Intell 2: 2-8, 2019. [7] Cheng, Jie-Zhi, "Computer-aided diagnosis with deep learning architecture: applications to breast lesions in US images and pulmonary nodules in CT scans", Scientific reports 6.1: 1-13, 2016. [8] Hussein, Sarfaraz, "Tumornet: Lung nodule characterization using multi-view convolutional neural network with gaussian process", 2017 IEEE 14th International Symposium on Biomedical Imaging (ISBI 2017). IEEE, 2017. [9] Dey, Raunak, Zhongjie Lu, Yi Hong, "Diagnostic classification of lung nodules using 3D neural networks", 2018 IEEE 15th International Symposium on Biomedical Imaging (ISBI 2018). IEEE, 2018. [10] He, Kaiming, "Deep residual learning for image recognition", Proceedings of the IEEE conference on computer vision and pattern recognition, 2016. [11] Hara, Kensho, Hirokatsu Kataoka, Yutaka Satoh, "Can spatiotemporal 3D CNNs retrace the history of 2D CNNs and imagenet?", Proceedings of the IEEE conference on Computer Vision and Pattern Recognition, 2018.
  6. 448 PHÂN LOẠI HẠCH UNG THƯ PHỔI BẰNG MÔ HÌNH 3D-CNN CLASSIFICATION OF LUNG CANCER NODULES WITH 3D-CNN MODEL Tran Van Quang, Tran Dinh Toan, Le Mau Long, Le Minh Hung ABSTRACT: Lung cancer is a disease with high mortality rates of all sexes and ages, and diagnostic screening by tomography (CT) is a potential measure that can reduce mortality. But the process of diagnosis usually takes a lot of time for doctors and patients. It is necessary to build an automatic cancer marker support system and many approaches are used for the disease classification problem that has been proposed. A common approach in the past was to use manual design features, then use machine learning algorithms to classify these extracted features that resulted in a highly inefficient system. The current approach is to use a deep learning model, Convolutional Neural Network (CNN), which is being proposed, and good results. However, there are two issues to consider when using a deep learning model on 3D image data. First, the input data structure is usually a 2D image, which will lose some of the valuable features of the data due to the 3D structured tomography. Second, in the medical field, datasets are often small, while to be able to train the deep learning model requires very large data. In this paper, we propose to use the Convolutional Neural Network model with the input data as 3D structured tomography to take advantage of the structure and morphological feature of the data based on the ResNet architecture and combining with deep learning techniques to optimize the effectiveness of disease classification on the dataset. We conducted 5 experiments on LNDb (Lung Nodule Database) dataset with two 3D Restnet-18 and 3D Restnet-10 network architectures combined with different data balance methods.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2