Trang chủ » Luận Văn - Báo Cáo » Thạc sĩ - Tiến sĩ - Cao học

27 trang

100 lượt xem

Tóm tắt luận án Tiến sĩ Hệ thống thông tin: Một số phương pháp ngẫu nhiên cho bài toán cực đại hóa xác suất hậu nghiệm không lồi trong học máy

Luận án với mục tiêu đề xuất bốn thuật toán tối ưu ngẫu nhiên OPE1, OPE2, OPE3 và OPE4 giải bài toán suy diễn hậu nghiệm trong mô hình chủ đề có bản chất là bài toán tối ưu không lồi thông qua việc sử dụng phân phối xác suất đều kết hợp với dùng hai chuỗi biên ngẫu nhiên xấp xỉ cho hàm mục tiêu ban đầu, trong đó các đề xuất có đảm bảo về cơ sở lý thuyết và thực nghiệm. Thuật toán tối ưu ngẫu nhiên GOPE giải bài toán MAP không lồi trong mô hình chủ đề thông qua sử dụng phân phối Bernoulli với tham số p ∈ (0, 1) thích hợp. Từ đó, chúng tôi áp dụng GOPE để thiết kế thuật toán ngẫu nhiên Online-GOPE học mô hình chủ đề hiệu quả.

gaocaolon6

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

BÙI THỊ THANH XUÂN

MỘT SỐ PHƯƠNG PHÁP NGẪU NHIÊN CHO

BÀI TOÁN CỰC ĐẠI HÓA XÁC SUẤT HẬU NGHIỆM

KHÔNG LỒI TRONG HỌC MÁY

TÓM TẮT LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN

HÀ NỘI−2020

Công trình được hoàn thành tại:

Trường Đại học Bách khoa Hà Nội

Người hướng dẫn khoa học:

HD1: PGS.TS. Thân Quang Khoát

HD2: TS. Nguyễn Thị Oanh

Phản biện 1: PGS.TS. Nguyễn Phương Thái

Phản biện 2: PGS.TS. Lương Thế Dũng

Phản biện 3: PGS.TS. Nguyễn Long Giang

Luận án được bảo vệ tại Hội đồng đánh giá luận án tiến sĩ cấp Trường họp tại

Trường Đại học Bách khoa Hà Nội.

Vào hồi .... giờ, ngày .... tháng .... năm ......

Có thể tìm hiểu luận án tại:

1. Thư viện Tạ Quang Bửu - Trường ĐHBK Hà Nội

2. Thư viện Quốc gia Việt Nam.

MỞ ĐẦU

1. Bối cảnh nghiên cứu

Nghiên cứu về học máy, chúng tôi nhận thấy quá trình giải một bài toán trong học máy thường

gồm ba bước chính: bước mô hình hóa, bước học và bước suy diễn. Trong đó, mô hình hóa là tìm

một mô hình thích hợp cho bài toán cần giải quyết, học là quá trình tối ưu các tham số của mô

hình và suy diễn là bước dự đoán kết quả đầu ra của mô hình dựa trên các tham số đã huấn luyện.

Ký hiệu xlà tập các tham số của mô hình, khi đó bước học chính là quá trình ước lượng tham số,

tức là tìm tham số xsao cho dữ liệu sẵn có và mô hình khớp với nhau nhất. Việc tối ưu tham số,

hay còn gọi là quá trình học tham số, là ý tưởng chính của các bài toán học máy nhằm tìm được

mối tương quan giữa các đầu vào và đầu ra dựa trên dữ liệu huấn luyện. Một phương pháp ước

lượng tham số thông dụng được sử dụng trong học máy thống kê chính là phương pháp ước lượng

hợp lý cực đại Maximum Likelihood Estimation (MLE). Tuy nhiên, phương pháp MLE được biết

đến với xu hướng phù hợp với dữ liệu, nên hiện tượng quá khớp có thể trở nên nghiêm trọng hơn

đối với các mô hình phức tạp liên quan đến dữ liệu trong thế giới thực với số chiều lớn như dữ liệu

hình ảnh, tiếng nói và văn bản. MLE thường làm việc không hiệu quả trong trường hợp có quá ít

dữ liệu huấn luyện. Khắc phục nhược điểm của MLE, chúng tôi sử dụng phương pháp cực đại hóa

ước lượng xác suất hậu nghiệm Maximum A Posteriori Estimation (MAP). Khác với MLE, MAP

không chỉ dựa trên dữ liệu huấn luyện mà còn dựa trên những thông tin đã biết của tham số. Ước

lượng MAP chính là tối ưu tham số xtheo xác suất có điều kiện:

x∗= arg max

xP(x|D)

|{z }

Posterior

(0.3)

trong đó xác suất P(x|D)được gọi là xác suất hậu nghiệm (posterior) của tham số x. Thông

thường, hàm tối ưu trong (0.3) khó xác định trực tiếp. Vì vậy, để giải bài toán MAP, chúng ta

thường sử dụng quy tắc Bayes và đưa bài toán MAP (0.3) về dạng:

x∗= arg max

x[P(D|x)×P(x)] (0.4)

trong đó xác suất P(x)gọi là xác suất tiên nghiệm (prior) của tham số x. Tận dụng tính chất đơn

điệu tăng của hàm logarit, người ta thường lấy logarit hàm mục tiêu của (0.4) và viết lại bài toán

MAP (0.4) dưới dạng:

x∗= arg max

x[log P(D|x) + log P(x)] (0.5)

Theo hiểu biết của chúng tôi, ước lượng MAP được sử dụng nhiều trong mô hình đồ thị xác suất.

Có nhiều cách tiếp cận để giải bài toán MAP như suy diễn biến phân hay phương pháp lấy mẫu

MCMC,... Một hướng tiếp cận khác là xem xét bài toán MAP (0.5) dưới góc nhìn của bài toán tối

ưu toán học:

x∗= arg max

x[f(x) = log P(D|x) + log P(x)] (0.6)

trong đó hàm mục tiêu có dạng f(x) = log P(D|x) + log P(x). Mức độ khó giải của bài toán (0.6)

phụ thuộc vào đặc điểm của hàm mục tiêu f(x). Trong thực tế, làm việc với các mô hình học máy

thống kê, hàm mục tiêu f(x)thường phức tạp, khó phân tích và là hàm không lồi, có thể tốn kém

về mặt tính toán. Mặc dù ước lượng MAP có nhiều ưu thế so với MLE trên các phương diện như:

làm việc với dữ liệu huấn luyện ít, có khả năng hiệu chỉnh, tuy nhiên, tìm đến các phương pháp

hiệu quả giải bài toán MAP là việc khó khăn. Nguyên nhân chính dẫn đến khó khăn của bài toán

MAP nằm ở chỗ hàm mục tiêu f(x) = log P(D|x) + log P(x)trong nhiều trường hợp là hàm

không lồi, khó tìm được cực đại, dẫn đến giải trực tiếp bài toán MAP không khả thi. Chúng ta

phải đối mặt với thách thức lớn: Làm thế nào để giải hiệu quả bài toán MAP trong các mô hình đồ

thị xác suất khi hàm mục tiêu là không lồi? Do vậy, đề xuất ra các thuật toán hiệu quả đảm bảo

về lý thuyết và thực nghiệm để giải bài toán MAP không lồi thu hút sự quan tâm đồng thời cũng

là thách thức của học máy thống kê.

2. Động lực thúc đẩy

Nghiên cứu sinh đặt ra bài toán cần nghiên cứu của mình là: Nghiên cứu đề xuất các thuật toán

ngẫu nhiên hiệu quả giải bài toán MAP không lồi xuất hiện trong các mô hình đồ thị xác suất được

cho dưới dạng

x∗= arg max

x[f(x) = log P(D|x) + log P(x)]

trong đó hàm mục tiêu f(x)là hàm nhiều chiều, không lồi trên miền ràng buộc Ω. Khó khăn của

bài toán đặt ra ở đây chính là hàm mục tiêu f(x)không lồi có thể xuất hiện nhiều điểm cực trị

địa phương/điểm yên ngựa, đồng thời f(x)là hàm nhiều biến có số chiều lớn, có thể gặp khó khăn

trong việc tính trực tiếp đạo hàm các cấp, do đó bài toán MAP không lồi có thể trở thành khó giải.

Nghiên cứu sinh đặt ra mục tiêu là đề xuất được một số thuật toán tối ưu ngẫu nhiên để giải

hiệu quả bài toán MAP không lồi đảm bảo các tiêu chí như sau:

(i) Các thuật toán ngẫu nhiên đảm bảo chất lượng về lý thuyết và thực nghiệm,

(ii) Các thuật toán có tốc độ hội tụ nhanh,

(iii) Các thuật toán có tính linh hoạt, tính tổng quát và khả năng hiệu chỉnh tốt. Từ đó có thể áp

dụng các thuật toán đó rộng rãi trong nhiều mô hình trong học máy.

Để triển khai được các mục tiêu đặt ra, nghiên cứu sinh đã lựa chọn đề tài "Một số phương pháp

ngẫu nhiên cho bài toán cực đại hóa xác suất hậu nghiệm không lồi trong học máy" cho luận án

của mình. Sự thành công của đề tài góp phần giải quyết tốt hơn bài toán ước lượng MAP không

lồi, đồng thời có thể mở rộng áp dụng để giải tốt các bài toán tối ưu không lồi thường xuất hiện

trong nhiều mô hình học máy.

3. Các đóng góp chính của luận án

Với mục tiêu triển khai thành công đề tài, các nghiên cứu của luận án tập trung chính vào các

đề xuất sau đây:

•Đề xuất bốn thuật toán tối ưu ngẫu nhiên OPE1, OPE2, OPE3 và OPE4 giải bài toán suy

diễn hậu nghiệm trong mô hình chủ đề có bản chất là bài toán tối ưu không lồi thông qua

việc sử dụng phân phối xác suất đều kết hợp với dùng hai chuỗi biên ngẫu nhiên xấp xỉ cho

hàm mục tiêu ban đầu, trong đó các đề xuất có đảm bảo về cơ sở lý thuyết và thực nghiệm.

•Đề xuất thuật toán tối ưu ngẫu nhiên GOPE giải bài toán MAP không lồi trong mô hình chủ

đề thông qua sử dụng phân phối Bernoulli với tham số p∈(0,1) thích hợp. Từ đó, chúng

tôi áp dụng GOPE để thiết kế thuật toán ngẫu nhiên Online-GOPE học mô hình chủ đề hiệu

quả.

•Sử dụng ngẫu nhiên Bernoulli với tham số p∈(0,1) thích hợp, kết hợp với dùng hai biên

ngẫu nhiên và nguyên lý tham lam, chúng tôi đề xuất BOPE giải bài toán MAP không lồi

tổng quát đảm bảo các tiêu chí quan trọng: tốc độ hội tụ nhanh, có tính linh hoạt, có tính

hiệu chỉnh. Chúng tôi đã áp dụng thành công BOPE vào bài toán phân tích văn bản và hệ

gợi ý.

4. Bố cục của luận án

Kết cấu thành 4 chương, luận án đã trình bày trọn vẹn các thuật toán đề xuất giải bài toán

MAP không lồi trong học máy. Như vậy, các nội dung trong luận án đã đáp ứng được các mục tiêu

mà chúng tôi đã đề ra.

Chương 1

MỘT SỐ KIẾN THỨC NỀN TẢNG

1.1. Tối ưu không lồi

1.1.1. Bài toán tối ưu tổng quát

Giả sử tập hợp các tham số mô hình được ký hiệu bằng x, hàm đánh giá của mô hình thường

được ký hiệu là f(x). Bài toán tìm tham số "tốt nhất" được đưa về bài toán tối ưu có dạng

minxf(x)hoặc maxxf(x). Như vậy, học một mô hình học máy chính là giải một bài toán tối ưu

toán. Do đó, tối ưu toán học, đặc biệt là tối ưu không lồi đã trở thành trung tâm của học máy. Xét

bài toán tối ưu tổng quát

min

x∈Ωf(x)(1.1)

trong đó hàm mục tiêu f(x)là hàm trơn và không lồi trên miền đóng Ω. Bài toán tối ưu trong học

máy thường hay sử dụng các phương pháp ngẫu nhiên bậc nhất, đảm bảo đủ đơn giản và độ chính

xác cần thiết.

1.1.2. Tối ưu ngẫu nhiên

1.2. Mô hình đồ thị xác suất

1.2.1. Giới thiệu

Mô hình đồ thị xác suất sử dụng đồ thị để biểu diễn phụ thuộc có điều kiện giữa các biến ngẫu

nhiên một cách trực quan, trong đó có các đỉnh là các biến ngẫu nhiên, các cạnh biểu diễn sự phụ

thuộc lẫn nhau của các biến ngẫu nhiên, cả đồ thị biểu diễn một phân phối đồng thời của tất cả

các biến ngẫu nhiên đó. Mô hình đồ thị xác suất là một công cụ mạnh mẽ có nhiều ứng dụng trong

học máy, thị giác máy tính, xử lý ngôn ngữ tự nhiên và tin sinh học.

1.2.2. Một số phương pháp suy diễn

a. Phương pháp suy diễn biến phân

b. Phương pháp Markov Chain Monte Carlo (MCMC)

c. Phương pháp Gibbs Sampling

1.3. Bài toán cực đại hóa xác suất hậu nghiệm

1.3.1. Giới thiệu bài toán MAP

Bài toán MAP có thể được xem xét dưới dạng bài toán tối ưu toán học:

x∗= arg max

x[f(x) = log P(D|x) + log P(x)] (1.18)

Khó khăn của bài toán MAP chính là hàm mục tiêu f(x) = log P(D|x) + log P(x)là hàm không

lồi, có thể gặp khó khăn khi tìm cực đại, dẫn đến giải trực tiếp bài toán MAP không khả thi.

1.3.2. Một số phương pháp tiếp cận

Theo hiểu biết của chúng tôi, có một số cách tiếp cận để giải bài toán MAP như sau:

•Thông qua các phép phân tích, khi mốt của phân phối hậu nghiệm được cho dưới dạng

"close-form" và đây là trường hợp prior liên hợp.

•Thông qua các phương pháp số như phương pháp gradient hoặc phương pháp Newton. Tuy

nhiên, chúng thường yêu cầu các đạo hàm bậc nhất hoặc bậc hai phải tìm được bằng phương

pháp giải tích hoặc bằng phương pháp số.

Tài liêu mới

Luận án Tiến sĩ: Nghiên cứu xây dựng thuật toán thích nghi và học tăng cường cấu trúc Actor - Critic điều khiển bám quỹ đạo cho robot di động đa hướng mecanum

Luận án Tiến sĩ: Cơ cấu bệnh tim mạch và chất lượng cuộc sống của người cao tuổi mắc suy tim, rung nhĩ điều trị tại Bệnh viện Thống Nhất, thành phố Hồ Chí Minh

Tóm tắt Luận án Tiến sĩ: Nghiên cứu hiện tượng nứt dăm đê sông vùng đồng bằng sông Hồng và dự báo khả năng bị nứt của một số đoạn đê

Tóm tắt Luận án Tiến sĩ: Nghiên cứu xây dựng giải pháp đảm bảo an toàn thông tin cho quá trình học liên kết dựa trên mật mã

Tóm tắt Luận án Tiến sĩ: Phát triển năng lực đánh giá công nghệ cho học sinh trong dạy học môn Công nghệ 11 ở trường trung học phổ thông

Tóm tắt Luận án Tiến sĩ: Nghiên cứu phân loại chi cầu diệp – Bulbophyllum Thouars (Orchidaceae) ở vùng Tây Nguyên bằng phương pháp hình thái và phân tử

Tóm tắt Luận án Tiến sĩ: Nghiên cứu đặc điểm phân bố và dinh dưỡng của các loài lưỡng cư ở Vườn Quốc gia Bến En và Khu bảo tồn thiên nhiên Pù Luông, tỉnh Thanh Hóa

Luận án Tiến sĩ: Tổng hợp luật dẫn và điều khiển cho một lớp tên lửa đối hải trên cơ sở ứng dụng mạng nơ ron và hệ mờ

Luận án Tiến sĩ: Nghiên cứu tổng hợp hệ điều khiển góc Pitch tua bin gió trong điều kiện có nhiễu tác động

Luận án Tiến sĩ: Nghiên cứu hóa học lipid của hai loài san hô thủy tức Millepora dichotoma và Millepora platyphylla ở Việt Nam

Luận án Tiến sĩ: Nghiên cứu kiểm soát phân phối công suất kéo trên cầu chủ động của ô tô con bằng ABS

Luận án Tiến sĩ: Ứng dụng phản ứng Domino vào tổng hợp các dẫn xuất Podophyllotoxin, Pyrimidine và đánh giá hoạt tính sinh học của các chất tổng hợp được

Tóm tắt luận án Tiến sĩ Hệ thống thông tin: Một số phương pháp ngẫu nhiên cho bài toán cực đại hóa xác suất hậu nghiệm không lồi trong học máy

Có thể bạn quan tâm

Tóm tắt Luận án Tiến sĩ: Nghiên cứu các yếu tố ảnh hưởng đến sự phát triển nguồn nhân lực du lịch trong các cơ sở lưu trú tại Hà Nội

Tóm tắt Luận án Tiến sĩ: Giáo dục đạo đức sinh thái cho sinh viên các trường đại học tại Thành phố Hồ Chí Minh hiện nay

Tóm tắt Luận án Tiến sĩ: Hành vi nguy cơ ảnh hưởng đến sức khỏe tâm thần của học sinh trung học phổ thông tại Hà Nội hiện nay

Tóm tắt Luận án Tiến sĩ: Đảng bộ tỉnh Đồng Nai lãnh đạo công tác bảo tồn và phát huy giá trị các di tích lịch sử - văn hóa từ năm 1996 đến năm 2015

Tóm tắt Luận án Tiến sĩ: Thực hiện Pháp lệnh thực hiện dân chủ ở xã, phường, thị trấn vùng dân tộc thiểu số tỉnh Quảng Nam hiện nay

Tóm tắt Luận án Tiến sĩ: Công tác hoằng pháp và hoạt động của đạo tràng Phật giáo tỉnh Lào Cai hiện nay

Tóm tắt Luận án Tiến sĩ: Kiểm soát nội bộ tại Tập đoàn xăng dầu Việt Nam

Tóm tắt Luận án Tiến sĩ: Tác động của mạng xã hội, tính hiệu quả kinh tế và nâng suất của các thực hành nông nghiệp thích ứng khí hậu: Bằng chứng từ kỹ thuật san phẳng mặt ruộng bằng tia laser trong sản xuất lúa tại Việt Nam

Tóm tắt Luận án Tiến sĩ: Năng lực cạnh tranh của doanh nghiệp nhỏ và vừa trên địa bàn tỉnh Phú Thọ

Tóm tắt Luận án Tiến sĩ: Ảnh hưởng của chính sách thuế đến phát triển bền vững doanh nghiệp nhỏ và vừa tại Việt Nam

Tóm tắt Luận án Tiến sĩ: Các yếu tố ảnh hưởng đến quyết định sử dụng dịch vụ logistics chuỗi lạnh: trường hợp doanh nghiệp nông sản tại vùng Đông Nam Bộ

Tóm tắt Luận án Tiến sĩ: Nghiên cứu giải pháp phát triển trung tâm logistics quốc tế cho khu vực kinh tế trọng điểm phía bắc

Tóm tắt Luận án Tiến sĩ: Nghiên cứu mối liên kết trường đại học – doanh nghiệp ở khu vực miền Bắc Việt Nam

Tóm tắt Luận án Tiến sĩ: Nghiên cứu các yếu tố ảnh hưởng tới sự thành công trong khởi sự kinh doanh của phụ nữ khu vực miền Bắc

Tóm tắt Luận án Tiến sĩ: Quản trị rủi ro trong đào tạo nghề tại các trường cao đẳng thuộc Bộ Công thương

Tóm tắt Luận án Tiến sĩ: Nghiên cứu nâng cao năng lực quản trị ở doanh nghiệp lữ hành tại thành phố Hà Nội

Tóm tắt Luận án Tiến sĩ: Đối chiếu danh ngữ tiếng Nhật với danh ngữ tiếng Việt

Tóm tắt Luận án Tiến sĩ: Phát triển nông nghiệp sạch ở một số nước Châu Á và bài học kinh nghiệm cho Việt Nam

Tóm tắt Luận án Tiến sĩ: Bảo vệ quyền sở hữu trí tuệ đối với nhãn hiệu theo pháp luật Việt Nam hiện nay

Tóm tắt luận án Tiến sĩ: Phân tích đối chiếu ẩn dụ ý niệm đa phương thức trong quảng cáo ẩm thực tiếng Việt và tiếng Anh

Tài liêu mới

Luận án Tiến sĩ: Nghiên cứu xây dựng thuật toán thích nghi và học tăng cường cấu trúc Actor - Critic điều khiển bám quỹ đạo cho robot di động đa hướng mecanum

Luận án Tiến sĩ: Cơ cấu bệnh tim mạch và chất lượng cuộc sống của người cao tuổi mắc suy tim, rung nhĩ điều trị tại Bệnh viện Thống Nhất, thành phố Hồ Chí Minh

Tóm tắt Luận án Tiến sĩ: Nghiên cứu hiện tượng nứt dăm đê sông vùng đồng bằng sông Hồng và dự báo khả năng bị nứt của một số đoạn đê

Tóm tắt Luận án Tiến sĩ: Nghiên cứu xây dựng giải pháp đảm bảo an toàn thông tin cho quá trình học liên kết dựa trên mật mã

Tóm tắt Luận án Tiến sĩ: Phát triển năng lực đánh giá công nghệ cho học sinh trong dạy học môn Công nghệ 11 ở trường trung học phổ thông

Tóm tắt Luận án Tiến sĩ: Nghiên cứu phân loại chi cầu diệp – Bulbophyllum Thouars (Orchidaceae) ở vùng Tây Nguyên bằng phương pháp hình thái và phân tử

Tóm tắt Luận án Tiến sĩ: Nghiên cứu đặc điểm phân bố và dinh dưỡng của các loài lưỡng cư ở Vườn Quốc gia Bến En và Khu bảo tồn thiên nhiên Pù Luông, tỉnh Thanh Hóa

Luận án Tiến sĩ: Tổng hợp luật dẫn và điều khiển cho một lớp tên lửa đối hải trên cơ sở ứng dụng mạng nơ ron và hệ mờ

Luận án Tiến sĩ: Nghiên cứu tổng hợp hệ điều khiển góc Pitch tua bin gió trong điều kiện có nhiễu tác động

Luận án Tiến sĩ: Nghiên cứu hóa học lipid của hai loài san hô thủy tức Millepora dichotoma và Millepora platyphylla ở Việt Nam

Luận án Tiến sĩ: Nghiên cứu kiểm soát phân phối công suất kéo trên cầu chủ động của ô tô con bằng ABS

Luận án Tiến sĩ: Ứng dụng phản ứng Domino vào tổng hợp các dẫn xuất Podophyllotoxin, Pyrimidine và đánh giá hoạt tính sinh học của các chất tổng hợp được

Luận án Tiến sĩ: Nghiên cứu thành phần hóa học và một số hoạt tính sinh học của cây chùm ngây (Moringa oleifera)

Tóm tắt Luận án Tiến sĩ: Nghiên cứu thành phần hóa học và ứng dụng ức chế ăn mòn cho thép của cao chiết xuất từ cây Lộc vừng thuộc họ Lecythidaceae

Luận án Tiến sĩ: Nghiên cứu hiện tượng nứt dăm đê sông vùng đồng bằng sông Hồng và dự báo khả năng bị nứt của một số đoạn đê

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

093 303 0098

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok