BỘ GIÁO DỤC VÀ ĐÀO TO
TRƯỜNG ĐẠI HỌC CH KHOA NỘI
BÙI THỊ THANH XUÂN
MỘT SỐ PHƯƠNG PHÁP NGẪU NHIÊN CHO
BÀI TOÁN CỰC ĐẠI A C SUẤT HẬU NGHIỆM
KHÔNG LỒI TRONG HỌC Y
TÓM TT LUẬN ÁN TIẾN HỆ THỐNG THÔNG TIN
NỘI2020
Công trình đưc hoàn thành tại:
Trường Đại học Bách khoa Nội
Người ớng dẫn khoa học:
HD1: PGS.TS. Thân Quang Khoát
HD2: TS. Nguyễn Thị Oanh
Phản biện 1: PGS.TS. Nguyễn Phương Thái
Phản biện 2: PGS.TS. Lương Thế Dũng
Phản biện 3: PGS.TS. Nguyễn Long Giang
Luận án được bảo v tại Hội đồng đánh giá luận án tiến cấp Trường họp tại
Trường Đại học Bách khoa Nội.
Vào hồi .... giờ, ngày .... tháng .... năm ......
thể tìm hiểu luận án tại:
1. Thư viện T Quang Bửu - Trường ĐHBK Nội
2. Thư viện Quốc gia Việt Nam.
MỞ ĐU
1. Bối cảnh nghiên cứu
Nghiên cứu v học máy, chúng tôi nhận thấy quá trình giải một bài toán trong học máy thường
gồm ba bước chính: bước hình hóa, bước học và bước suy diễn. Trong đó, hình a tìm
một hình thích hợp cho bài toán cần giải quyết, học quá trình tối ưu các tham số của
hình và suy diễn bước dự đoán kết quả đầu ra của hình dựa trên các tham số đã huấn luyện.
hiệu x tập các tham số của hình, khi đó bước học chính quá trình ước lượng tham số,
tức tìm tham số xsao cho dữ liệu sẵn và hình khớp với nhau nhất. Việc tối ưu tham số,
hay còn gọi quá trình học tham số, ý tưởng chính của các bài toán học máy nhằm tìm được
mối tương quan giữa các đầu vào và đầu ra dựa trên dữ liệu huấn luyện. Một phương pháp ước
lượng tham số thông dụng được sử dụng trong học máy thống kê chính phương pháp ước lượng
hợp cực đại Maximum Likelihood Estimation (MLE). Tuy nhiên, phương pháp MLE được biết
đến với xu hướng phù hợp với dữ liệu, nên hiện tượng quá khớp thể trở nên nghiêm trọng hơn
đối với các hình phức tạp liên quan đến dữ liệu trong thế giới thực với số chiều lớn như dữ liệu
hình ảnh, tiếng nói và văn bản. MLE thường làm việc không hiệu quả trong trường hợp quá ít
dữ liệu huấn luyện. Khắc phục nhược điểm của MLE, chúng tôi sử dụng phương pháp cực đại hóa
ước lượng xác suất hậu nghiệm Maximum A Posteriori Estimation (MAP). Khác với MLE, MAP
không chỉ dựa trên dữ liệu huấn luyện còn dựa trên những thông tin đã biết của tham số. Ước
lượng MAP chính tối ưu tham số xtheo xác suất điều kiện:
x= arg max
xP(x|D)
|{z }
Posterior
(0.3)
trong đó xác suất P(x|D)được gọi xác suất hậu nghiệm (posterior) của tham số x. Thông
thường, hàm tối ưu trong (0.3) khó xác định trực tiếp. vy, để giải bài toán MAP, chúng ta
thường sử dụng quy tắc Bayes và đưa bài toán MAP (0.3) v dạng:
x= arg max
x[P(D|x)×P(x)] (0.4)
trong đó xác suất P(x)gọi xác suất tiên nghiệm (prior) của tham số x. Tận dụng tính chất đơn
điệu tăng của hàm logarit, người ta thường lấy logarit hàm mục tiêu của (0.4) và viết lại bài toán
MAP (0.4) dưới dạng:
x= arg max
x[log P(D|x) + log P(x)] (0.5)
Theo hiểu biết của chúng tôi, ước lượng MAP được sử dụng nhiều trong hình đồ thị xác suất.
nhiều cách tiếp cận để giải bài toán MAP như suy diễn biến phân hay phương pháp lấy mẫu
MCMC,... Một hướng tiếp cận khác xem xét bài toán MAP (0.5) dưới góc nhìn của bài toán tối
ưu toán học:
x= arg max
x[f(x) = log P(D|x) + log P(x)] (0.6)
trong đó hàm mục tiêu dạng f(x) = log P(D|x) + log P(x). Mức độ khó giải của bài toán (0.6)
ph thuộc vào đặc điểm của hàm mục tiêu f(x). Trong thực tế, làm việc với các hình học máy
thống kê, hàm mục tiêu f(x)thường phức tạp, khó phân tích và hàm không lồi, thể tốn kém
v mặt tính toán. Mặc ước lượng MAP nhiều ưu thế so với MLE trên các phương diện như:
làm việc với dữ liệu huấn luyện ít, khả năng hiệu chỉnh, tuy nhiên, tìm đến các phương pháp
hiệu quả giải bài toán MAP việc khó khăn. Nguyên nhân chính dẫn đến khó khăn của bài toán
MAP nằm chỗ hàm mục tiêu f(x) = log P(D|x) + log P(x)trong nhiều trường hợp hàm
không lồi, khó tìm được cực đại, dẫn đến giải trực tiếp bài toán MAP không khả thi. Chúng ta
phải đối mặt với thách thức lớn: Làm thế nào để giải hiệu quả bài toán MAP trong các hình đồ
thị xác suất khi hàm mục tiêu không lồi? Do vy, đề xuất ra các thuật toán hiệu quả đảm bảo
1
2
v thuyết và thực nghiệm để giải bài toán MAP không lồi thu hút sự quan tâm đồng thời cũng
thách thức của học máy thống kê.
2. Động lực thúc đẩy
Nghiên cứu sinh đặt ra bài toán cần nghiên cứu của mình là: Nghiên cứu đề xuất các thuật toán
ngẫu nhiên hiệu quả giải bài toán MAP không lồi xuất hiện trong các hình đồ thị xác suất được
cho dưới dạng
x= arg max
x[f(x) = log P(D|x) + log P(x)]
trong đó hàm mục tiêu f(x) hàm nhiều chiều, không lồi trên miền ràng buộc . Khó khăn của
bài toán đặt ra đây chính hàm mục tiêu f(x)không lồi thể xuất hiện nhiều điểm cực trị
địa phương/điểm yên ngựa, đồng thời f(x) hàm nhiều biến số chiều lớn, thể gặp khó khăn
trong việc tính trực tiếp đạo hàm các cấp, do đó bài toán MAP không lồi thể trở thành khó giải.
Nghiên cứu sinh đặt ra mục tiêu đề xuất được một số thuật toán tối ưu ngẫu nhiên để giải
hiệu quả bài toán MAP không lồi đảm bảo các tiêu c như sau:
(i) Các thuật toán ngẫu nhiên đảm bảo chất lượng v thuyết và thực nghiệm,
(ii) Các thuật toán tốc độ hội tụ nhanh,
(iii) Các thuật toán tính linh hoạt, tính tổng quát và khả năng hiệu chỉnh tốt. Từ đó thể áp
dụng các thuật toán đó rộng rãi trong nhiều hình trong học máy.
Để triển khai được các mục tiêu đặt ra, nghiên cứu sinh đã lựa chọn đề tài "Một số phương pháp
ngẫu nhiên cho bài toán cực đại a xác suất hậu nghiệm không lồi trong học máy" cho luận án
của mình. Sự thành công của đề tài góp phần giải quyết tốt hơn bài toán ước lượng MAP không
lồi, đồng thời thể mở rộng áp dụng để giải tốt các bài toán tối ưu không lồi thường xuất hiện
trong nhiều hình học y.
3. Các đóng góp chính của luận án
Với mục tiêu triển khai thành công đề tài, các nghiên cứu của luận án tập trung chính vào các
đề xuất sau đây:
Đề xuất bốn thuật toán tối ưu ngẫu nhiên OPE1, OPE2, OPE3 và OPE4 giải bài toán suy
diễn hậu nghiệm trong hình ch đề bản chất bài toán tối ưu không lồi thông qua
việc sử dụng phân phối xác suất đều kết hợp với dùng hai chuỗi biên ngẫu nhiên xấp xỉ cho
hàm mục tiêu ban đầu, trong đó các đề xuất đảm bảo về sở thuyết và thực nghiệm.
Đề xuất thuật toán tối ưu ngẫu nhiên GOPE giải bài toán MAP không lồi trong hình chủ
đề thông qua sử dụng phân phối Bernoulli với tham số p(0,1) thích hợp. Từ đó, chúng
tôi áp dụng GOPE để thiết kế thuật toán ngẫu nhiên Online-GOPE học hình ch đề hiệu
quả.
Sử dụng ngẫu nhiên Bernoulli với tham số p(0,1) thích hợp, kết hợp với dùng hai biên
ngẫu nhiên và nguyên tham lam, chúng tôi đề xuất BOPE giải bài toán MAP không lồi
tổng quát đảm bảo các tiêu c quan trọng: tốc độ hội tụ nhanh, tính linh hoạt, tính
hiệu chỉnh. Chúng tôi đã áp dụng thành công BOPE vào bài toán phân tích văn bản và hệ
gợi ý.
4. Bố cục của luận án
Kết cấu thành 4 chương, luận án đã trình y trọn vẹn các thuật toán đề xuất giải bài toán
MAP không lồi trong học máy. Như vậy, các nội dung trong luận án đã đáp ứng được các mục tiêu
chúng i đã đề ra.
Chương 1
MỘT SỐ KIẾN THỨC NỀN TẢNG
1.1. Tối ưu không lồi
1.1.1. Bài toán tối ưu tổng quát
Giả sử tập hợp các tham số hình được hiệu bằng x, hàm đánh giá của hình thường
được hiệu f(x). Bài toán tìm tham số "tốt nhất" được đưa về bài toán tối ưu dạng
minxf(x)hoặc maxxf(x). Như vy, học một hình học máy chính giải một bài toán tối ưu
toán. Do đó, tối ưu toán học, đặc biệt tối ưu không lồi đã trở thành trung tâm của học y. Xét
bài toán tối ưu tổng quát
min
xf(x)(1.1)
trong đó hàm mục tiêu f(x) hàm trơn và không lồi trên miền đóng . Bài toán tối ưu trong học
y thường hay sử dụng các phương pháp ngẫu nhiên bậc nhất, đảm bảo đủ đơn giản và độ chính
xác cần thiết.
1.1.2. Tối ưu ngẫu nhiên
1.2. hình đồ thị xác suất
1.2.1. Giới thiệu
hình đồ thị xác suất sử dụng đồ thị để biểu diễn ph thuộc điều kiện giữa các biến ngẫu
nhiên một cách trực quan, trong đó các đỉnh các biến ngẫu nhiên, các cạnh biểu diễn sự ph
thuộc lẫn nhau của các biến ngẫu nhiên, cả đồ thị biểu diễn một phân phối đồng thời của tất cả
các biến ngẫu nhiên đó. hình đồ thị xác suất một công cụ mạnh mẽ nhiều ứng dụng trong
học y, thị giác máy tính, xử ngôn ngữ t nhiên và tin sinh học.
1.2.2. Một số phương pháp suy diễn
a. Phương pháp suy diễn biến phân
b. Phương pháp Markov Chain Monte Carlo (MCMC)
c. Phương pháp Gibbs Sampling
1.3. Bài toán cực đại hóa xác suất hậu nghiệm
1.3.1. Giới thiệu bài toán MAP
Bài toán MAP thể được xem xét dưới dạng bài toán tối ưu toán học:
x= arg max
x[f(x) = log P(D|x) + log P(x)] (1.18)
Khó khăn của bài toán MAP chính hàm mục tiêu f(x) = log P(D|x) + log P(x) hàm không
lồi, thể gặp khó khăn khi tìm cực đại, dẫn đến giải trực tiếp bài toán MAP không khả thi.
1.3.2. Một số phương pháp tiếp cận
Theo hiểu biết của chúng tôi, một số cách tiếp cận để giải bài toán MAP như sau:
Thông qua các phép phân tích, khi mốt của phân phối hậu nghiệm được cho dưới dạng
"close-form" và đây trường hợp prior liên hợp.
Thông qua các phương pháp số như phương pháp gradient hoặc phương pháp Newton. Tuy
nhiên, chúng thường yêu cầu các đạo hàm bậc nhất hoặc bậc hai phải tìm được bằng phương
pháp giải tích hoặc bằng phương pháp số.
3