BỘ GIÁO DỤC VÀ ĐÀO TẠO<br />
<br />
VIỆN HÀN LÂM KHOA HỌC<br />
VÀ CÔNG NGHỆ VIỆT NAM<br />
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ<br />
<br />
……..….***…………<br />
<br />
TRẦN MẠNH TUẤN<br />
<br />
NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP PHÂN CỤM BÁN<br />
GIÁM SÁT MỜ TRONG PHÂN ĐOẠN ẢNH NHA KHOA<br />
<br />
Chuyên ngành: Cơ sở toán học cho tin học<br />
Mã số: 62 46 01 10<br />
<br />
TÓM TÁT LUẬN ÁN TIẾN SĨ TOÁN HỌC<br />
<br />
HÀ NỘI – 2016<br />
<br />
Công trình đƣợc hoàn thành tại: Học viện Khoa học và Công nghệ Viện Hàn lâm Khoa học và Công nghệ Việt Nam<br />
<br />
Ngƣời hƣớng dẫn khoa học 1: PGS.TS. LÊ BÁ DŨNG<br />
Ngƣời hƣớng dẫn khoa học 2: TS. VŨ NHƢ LÂN<br />
<br />
Phản biện 1: PGS.TS. Trần Đình Khang<br />
Phản biện 2: PGS.TS. Ngô Thành Long<br />
Phản biện 3: TS. Phạm Thanh Hà<br />
<br />
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp<br />
tại Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học<br />
và Công nghệ Việt Nam vào hồi giờ ngày<br />
tháng năm<br />
<br />
Có thể tìm hiểu luận án tại:<br />
- Thư viện Học viện Khoa học và Công nghệ<br />
- Thư viện Quốc gia Việt Nam<br />
<br />
MỞ ĐẦU<br />
Phân đoạn ảnh là chia nhỏ một ảnh thành các vùng đông nhất cấu tạo nên ảnh hoặc các đối<br />
tượng [17], [52]. Phân đoạn ảnh thường được sử dụng để xác định: vị trí đối tượng (chẳng hạn như<br />
các loại cây trồng, khu vực đô thị, rừng của một hình ảnh vệ tinh, v.v.) và các đường biên, ranh giới<br />
(đường thẳng, đường cong, v.v.) trong ảnh. Với ảnh nha khoa thì mục đích của phân đoạn ảnh nha<br />
khoa là bước xử lý quan trọng trong nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán một cách<br />
hiệu quả các bệnh quanh răng.<br />
Ảnh X-quang nha khoa gồm 3 phần chính [54]: i) Phần răng: phần có độ xám cao và là phần<br />
ta nhìn thấy rõ nhất trên ảnh; ii) Phần cấu trúc răng: là phần có độ xám trung bình gồm lợi răng,<br />
xương, phần khác (tủy, xi măng v.v.); iii) Phần nền: là phần có giá trị độ xám nhỏ nhất là nền tảng<br />
của cấu trúc răng. Với cấu trúc của ảnh X-quang nha khoa thì việc phân đoạn ảnh phức tạp hơn<br />
phân đoạn ảnh thông thường [70].<br />
Bài toán phân đoạn ảnh nha khoa đã được sử dụng để hỗ trợ việc chẩn đoán bệnh nha khoa<br />
và dự đoán tuổi nha khoa [51]. Đồng thời, phân đoạn ảnh nha khoa mang lại những thông tin có giá<br />
trị cho những nha sĩ trong quá trình phân tích các thông tin từ một hình ảnh [51]. Liên quan đến độ<br />
chính xác của phân đoạn ảnh nha khoa, cần có các phương pháp học máy khác nhau được áp dụng<br />
[30], [35]. Kết quả phân đoạn ảnh nha khoa còn cung cấp thêm các thông tin cho các nha sỹ trong<br />
quá trình chẩn đoán bệnh, giúp các nha sỹ chẩn đoán bệnh chính xác và hiệu quả hơn.<br />
Với bài toán phân đoạn ảnh nha khoa, các nghiên cứu trước đây đã đưa ra các kỹ thuật phân<br />
đoạn như phân đoạn ảnh dựa trên phân ngưỡng [21], [27], phân đoạn ảnh dựa trên phân cụm [44],<br />
[70]. Tuy nhiên các phương pháp này thường gặp vấn đề khi xác định tham số ngưỡng hay biên<br />
chung của các mẫu răng và phương pháp phân cụm mờ được cho là xử lý tốt hơn [59].<br />
Trong phân cụm rõ, dữ liệu được chia vào các nhóm, trong đó mỗi điểm dữ liệu thuộc vào<br />
chính xác một cụm [10]. Trong phân cụm mờ, mỗi điểm dữ liệu có thể thuộc vào nhiều hơn một<br />
cụm với độ thuộc tương ứng [10]. Khi đó, tương ứng với các điểm dữ liệu là ma trận độ thuộc, với<br />
giá trị của các phần tử trong ma trận chỉ ra mức độ các điểm dữ liệu thuộc vào các cụm khác nhau<br />
[10]. Các phương pháp phân cụm mờ được sử dụng nhiều trong các bài toán nhận dạng mẫu, phát<br />
hiện tri thức từ các cơ sở dữ liệu, đánh giá rủi ro và nó có ứng dụng nhiều trong phân đoạn ảnh.<br />
Trong các nghiên cứu gần đây việc sử dụng các thông tin bổ trợ cung cấp bởi người dùng được gắn<br />
với đầu vào trong phân cụm mờ để hướng dẫn, giám sát và điều khiển quá trình phân cụm. Các<br />
thuật toán phân cụm mờ kết hợp với các thông tin bổ trợ do người dùng xác định trước hình thành<br />
lên nhóm các thuật toán phân cụm bán giám sát mờ [23].<br />
Một số nghiên cứu gần đây cho thấy các thuật toán phân cụm bán giám sát mờ rất hiệu quả<br />
trong nhiều lĩnh vực như xử lý ảnh [16], [31], [49], nhận dạng mẫu, nhận dạng khuôn mặt [5], [33],<br />
đánh giá rủi ro [15], dự báo phá sản [36]. Đặc biệt là trong xử lý ảnh với các ảnh màu và ảnh y học.<br />
Cũng đã có một số kết quả được đưa ra cho bài toán phân đoạn ảnh nha khoa như sử dụng các đặc<br />
trưng của ảnh nha khoa như cấu trúc ảnh, màu sắc, hình dáng trong quá trình phân đoạn gồm<br />
phương pháp lấy ngưỡng [21], [27], phương pháp phân cụm [70]. Tuy nhiên nghiên cứu này, chưa<br />
có kết quả nào của phân cụm bán giám sát mờ được áp dụng cho các ảnh X-quang nói chung và ảnh<br />
X-quang nha khoa nói riêng, mà chủ yếu các nghiên cứu trước cũng đã sử dụng phân cụm mờ và<br />
đồng thời đã sử dụng các đặc trưng của ảnh nha khoa nhưng chưa sử dụng thông tin không gian.<br />
Nội dung nghiên cứu chính của luận án tập trung vào việc đề xuất, cải tiến các kỹ thuật phân<br />
đoạn ảnh bằng thuật toán phân cụm bán giám sát mờ. Trong quá trình phân đoạn ảnh nha khoa, các<br />
kỹ thuật phân cụm mờ (FCM) [10], phân cụm bán giám sát mờ (eSFCM) [67] và kỹ thuật tách<br />
ngưỡng Otsu [43] là các kỹ thuật cơ bản làm tiền đề cho các phương pháp mới được đề xuất trong<br />
luận án. Trong các phương pháp mới trình bày trong luận án, thông tin bổ trợ được xác định là ma<br />
trận độ thuộc của thuật toán phân cụm mờ FCM kết hợp với các thông tin đặc trưng của ảnh nha<br />
khoa. Đây là một cách tiếp cận mới mà các phương pháp trước đó chưa đề cập đến. Đồng thời, luận<br />
án trình bày một số cách xác định thông tin bổ trợ phù hợp ứng với từng đối tượng đầu vào khác<br />
nhau. Từ đó thực hiện việc cài đặt và đánh giá các đề xuất trên máy tính.<br />
Mục tiêu nghiên cứu: Nghiên cứu các thuật toán phân cụm bán giám sát mờ vào phân đoạn<br />
ảnh. Phát triển các nghiên cứu đề xuất cải tiến các phương pháp phân cụm bán giám sát mờ cho<br />
<br />
phân đoạn ảnh nha khoa. Các thuật toán cải tiến được đề xuất dựa trên các thông tin không gian đặc<br />
trưng của ảnh nha khoa nhằm mục đích nâng cao chất lượng phân cụm của các thuật toán phân cụm<br />
bán giám sát mờ áp dụng với bài toán phân đoạn ảnh nha khoa.<br />
Với mục tiêu nghiên cứu ở trên luận án đã thu đƣợc một số đóng góp mới nhƣ sau:<br />
Luận án đã nghiên cứu phát triển các thuật toán phân cụm bán giám sát mờ trong phân<br />
đoạn ảnh nha khoa, cụ thể:<br />
- Đề xuất các phương pháp phân đoạn ảnh nha khoa dựa trên phân cụm bán giám sát mờ lai<br />
ghép. (Lai ghép giữa phân cụm bán giám sát mờ với phân cụm mờ và phương pháp tách ngưỡng<br />
Otsu).<br />
- Đề xuất phân cụm bán giám sát mờ có sử dụng đặc trưng không gian ảnh nha khoa vào bài<br />
toán phân đoạn ảnh;<br />
- Vận dụng các phương pháp giải tối ưu đa mục tiêu để giải bài toán tối ưu đa mục tiêu của<br />
phân cụm bán giám sát mờ, từ đó đưa ra các mệnh đề, định lý và tính chất nghiệm của bài toán;<br />
- Xây dựng kho dữ liệu các hàm xác định thông tin bổ trợ cho phân cụm bán giám sát mờ,<br />
từ đó lựa chọn hàm thông tin bổ trợ phù hợp với từng ảnh đầu vào để chất lượng cụm được tốt hơn.<br />
Cài đặt thực nghiệm các thuật toán cải tiến dựa trên thu thập và phân tích dữ liệu ảnh về<br />
các mẫu bệnh nha khoa. Ứng dụng phân đoạn ảnh trong hệ hỗ trợ chẩn đoán nha khoa.<br />
Ngoài phần phần mở đầu và kết luận, luận án được cấu trúc thành ba chương:<br />
Chương 1 trình bày về tổng quan về phân cụm bán giám sát mờ trong bài toán phân đoạn ảnh.<br />
Đồng thời trình bày các lý thuyết cơ sở sử dụng trong quá trình học tập và nghiên cứu. Thông qua<br />
chương này, luận án đưa ra được cái nhìn tổng quan về bài toán nghiên cứu, các khái niệm và thuật<br />
toán cơ bản sử dụng trong nghiên cứu của luận án.<br />
Các đóng góp chính của luận án lần lượt được trình bày trong chương 2, chương 3.<br />
Chương 2 trình bày kết quả nghiên cứu các phương pháp phân cụm bán giám sát mờ sử dụng<br />
cho phân đoạn ảnh nha khoa. Trong chương này trình bày về phân cụm bán giám sát mờ lai ghép. Đặc<br />
biệt luận án còn trình bày đề xuất phát triển của phân cụm bán giám mờ có sử dụng thông tin đặc<br />
trưng không gian sử dụng phương pháp nhân tử Lagrange và thỏa dụng mờ giải bài toán tối ưu đa<br />
mục tiêu. Đồng thời, trong chương 2, luận án xây dựng cách xác định thông tin bổ trợ phù hợp từng<br />
ảnh đầu vào để có được kết quả phù hợp nhất.<br />
Chương 3 trình bày các kết quả thực nghiệm thu được khi cài đặt các thuật toán phân cụm bán<br />
giám sát mờ đề xuất ở chương 2 trên bộ dữ liệu ảnh X-quang nha khoa. Trong đó có phân tích dữ liệu<br />
sử dụng và các tiêu chí đánh giá thông qua các độ đo, từ đó xác định các kết quả này được sử dụng để<br />
đánh giá hiệu năng các thuật toán đề xuất và so sánh với các thuật toán khác đã được nghiên cứu gần<br />
đây cho các bài toán tương tự. Ứng dụng của phân đoạn ảnh trong thiết kế hệ hỗ trợ chẩn đoán bệnh.<br />
Cuối cùng, kết luận nêu những đóng góp, hướng phát triển, những vấn đề quan tâm và các<br />
công trình đã được công bố của luận án.<br />
CHƢƠNG 1. TỔNG QUAN VỀ PHÂN CỤM BÁN GIÁM SÁT MỜ TRONG PHÂN<br />
ĐOẠN ẢNH NHA KHOA<br />
Trong chương này, luận án đã nêu ra bài toán nghiên cứu trong thời gian vừa qua. Qua đó có<br />
được cái nhìn tổng quan về bài toán nghiên cứu trong luận án, cụ thể là bài toán phân đoạn ảnh nha<br />
khoa và bài toán chẩn đoán bệnh nha khoa. Luận án đã trình bày các kết quả nghiên cứu liên quan<br />
được đề xuất gần đây. Đồng thời trong chương này, luận án đã trình bày lý thuyết về tập mờ, phân<br />
cụm, phương pháp giải tối ưu và hệ suy diễn mờ. Các kiến thức này là nền tảng để giải quyết các<br />
bài toán phân đoạn ảnh và chẩn đoán nha khoa mà luận án đang hướng tới.<br />
1.1 Bài toán phân đoạn ảnh nha khoa<br />
1.1.1 Khái niệm<br />
Phân đoạn ảnh chia nhỏ một ảnh thành các vùng cấu thành nên nó hoặc các đối tượng [17],<br />
[52]. Phân đoạn ảnh thường được sử dụng để xác định vị trí đối tượng (chẳng hạn như các loại cây<br />
trồng, khu vực đô thị, rừng của một hình ảnh vệ tinh, v.v.) và các đường biên/ranh giới (đường<br />
thẳng, đường cong, v.v.) trong ảnh. Chính xác hơn, phân đoạn ảnh là quá trình gán nhãn cho mọi<br />
pixel trong ảnh mà những pixel có cùng nhãn thì có chung một số đặc điểm nhất định nào đó.<br />
2<br />
<br />
1.1.2 Ảnh X-quang nha khoa<br />
Cơ quan của răng bao gồm răng và nha chu quanh răng, là đơn vị hình thái và chức năng của<br />
bộ răng. Răng là bộ phận trực tiếp nhai nghiền thức ăn, nha chu là bộ phận giữ và nâng đỡ răng<br />
đồng thời là bộ phận nhận cảm, tiếp nhận và dẫn truyền lực nhai. Răng gồm men, ngà (mô cứng) và<br />
tủy (mô mềm). Nha chu gồm xương chân răng, men chân răng, dây chằng, xương ổ răng, nướu<br />
(lợi), xương. Bộ răng là một thể thống nhất thuộc hệ thống nhai tạo thành bởi sự sắp xếp có tổ chức<br />
của các cơ quan răng [2].<br />
1.1.3 Nhu cầu và ứng dụng trong y học<br />
Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai trò rất quan trọng<br />
[14, 20] trong quá trình này. Khi đó, phân đoạn ảnh nha khoa là bước xử lý then chốt trong nha<br />
khoa nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệu quả các bệnh về răng như viêm chân răng, bệnh<br />
nha chu, viêm túi răng [55, 56]. Khi đó ứng dụng đầu tiên của phân đoạn ảnh là chẩn đoán bệnh nha<br />
khoa.<br />
Một trong những ứng dụng thú vị của phân đoạn ảnh nha khoa từ hình ảnh X-quang là giám<br />
định pháp y [23], [50], việc giám định pháp y thường sử dụng các công nghệ khoa học để phân tích<br />
(trong đó có phân tích răng) trong việc xác định con người, Do đó, nó trở nên quan trọng để đưa ra<br />
quyết định xác định hình thái mặt của con người dựa trên các đặc tính: kích thước răng, khoảng<br />
cách giữa các răng và các mẫu xoang, xương trên mặt v.v. [50]. Bên cạnh việc giám định pháp y,<br />
phân đoạn ảnh nha khoa còn có một số ứng dụng khác: xác định số răng [35], ước lượng tuổi nha<br />
khoa [65], phân đoạn ảnh nha khoa có thể phân tích các mảng bám răng [24], v.v.<br />
1.2 Tổng quan về các nghiên cứu liên quan<br />
Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai trò rất quan trọng<br />
[32, 49]. Phân đoạn ảnh cũng là công việc khó khăn nhất của xử lý ảnh. Trong đó, phân đoạn ảnh<br />
nha khoa là bước xử lý then chốt nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệu quả các bệnh về răng<br />
như viêm chân răng, bệnh nha chu, viêm túi răng [42], [43]. Khi đó quá trình phân đoạn ảnh là một<br />
trong các bước quan trọng và cần thiết để phân tích ảnh X-quang nha khoa cho các quá trình xử lý<br />
sau này như: hỗ trợ chẩn đoán [50], xác định các thành phần khác nhau trong ảnh (răng, lợi, tủy<br />
v.v.) [51].<br />
<br />
(a)<br />
<br />
(b)<br />
Hình 1.1. Ảnh nha khoa<br />
(a) Ảnh X-quang nha khoa; (b) Lỗ trống răng bị thiếu<br />
Ảnh X-quang nha khoa gồm 3 phần chính (hình 1.1 a) [54]: i) Phần răng: phần có độ xám<br />
cao và là phần ta nhìn thấy rõ nhất trên ảnh; ii) Phần cấu trúc răng: là phần có độ xám trung bình<br />
gồm lợi răng, xương, phần khác (tủy, xi măng v.v.); iii) Phần nền: là phần có giá trị độ xám nhỏ<br />
nhất là nền tảng của cấu trúc răng. Với cấu trúc của ảnh X-quang nha khoa thì việc phân đoạn ảnh<br />
phức tạp hơn phân đoạn ảnh thông thường [71]. Nói cách khác, sự kết nối giữa các phần khác nhau<br />
của một hình ảnh nha khoa X-quang và chất lượng thấp của hình ảnh do tạp chất, độ tương phản<br />
thấp, sai sót về chức năng quét hình ảnh, v.v. làm giảm hiệu suất phân đoạn. Ví dụ, các lỗ trống<br />
trong răng bị mất trong (hình 1.1 b) không thể được xử lý bằng kỹ thuật xử lý ảnh dựa trên ngưỡng<br />
thông thường [26]. Vì vậy, phương pháp khai phá dữ liệu phân đoạn ảnh X-quang nha khoa đã được<br />
nghiên cứu để đạt được độ chính xác cao của phân đoạn [40].<br />
3<br />
<br />