ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
HOÀNG VĂN TIẾN<br />
<br />
KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG TRONG<br />
Y TẾ DỰ PHÒNG<br />
<br />
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN<br />
<br />
GIÁO VIÊN HƯỚNG DẪN<br />
<br />
Đặng Thanh Hải<br />
<br />
Hà Nội - 2018<br />
<br />
ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
HOÀNG VĂN TIẾN<br />
<br />
KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG TRONG<br />
Y TẾ DỰ PHÒNG<br />
<br />
Ngành: Công nghệ thông tin<br />
Chuyên ngành: Quản lý Hệ thống thông tin<br />
Mã số: 8480205.01<br />
<br />
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN<br />
<br />
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. ĐẶNG THANH HẢI<br />
<br />
Hà Nội - 2018<br />
<br />
LỜI CAM ĐOAN<br />
Luận văn “Khai phá dữ liệu và ứng dụng trong y tế dự phòng” đánh dấu cho<br />
những thành quả, kiến thức của tôi đã tiếp thu được trong quá trình rèn luyện, học tập<br />
và nghiên cứu tại Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội. Tôi xin cam<br />
đoan các nội dung được trình bày trong luận văn này được xây dựng, hoàn thành bằng<br />
chính quá trình nghiên cứu của bản thân và dưới sự hướng dẫn của thầy giáo TS. Đặng<br />
Thanh Hải.<br />
Trong quá trình làm luận văn này, tôi đã tham khảo một số tài liệu từ nhiều<br />
nguồn khác nhau, các nội dung tham khảo đều được trích dẫn rõ ràng. Nếu có điều gì<br />
không trung thực, tôi xin chịu mọi hình thức kỷ luật theo đúng quy định.<br />
Hà Nội, ngày 02 tháng 10 năm 2018<br />
Học viên<br />
<br />
Hoàng Văn Tiến<br />
<br />
xi<br />
<br />
LỜI CÁM ƠN<br />
Lời đầu tiên, tôi xin gửi lời cám ơn đến Thầy Cô giáo tại trường Đại học Công<br />
nghệ - Đại học Quốc gia Hà Nội nói chung và Thầy Cô giáo trong bộ môn Hệ thống<br />
thông tin và Khoa Công nghệ thông tin - Trường Đại học Công nghệ - Đại học Quốc<br />
gia Hà Nội đã nhiệt tình giảng dạy, truyền đạt những kiến thức, kinh nghiệm quý báu<br />
trong suốt thời gian tôi học tập tại trường.<br />
Đặc biệt, tôi xin gửi lời cám ơn chân thành nhất đến TS. Đặng Thanh Hải,<br />
người đã hướng dẫn tôi trong suốt quá trình thực hiện luận văn này. Nhờ sự hướng dẫn<br />
và chỉ bảo tận tình của Thầy, tôi đã có được những kiến thức và kinh nghiệm quý báu<br />
về cách xác định vấn đề nghiên cứu, phương pháp nghiên cứu, trình bày kết quả và<br />
hoàn thành luận văn của mình.<br />
Cuối cùng, tôi xin gửi lời cám ơn tới toàn thể gia đình, bạn bè và đồng nghiệp<br />
đã luôn quan tâm, ủng hộ và động viên, giúp tôi có nghị lực phấn đấu để hoàn thành<br />
tốt luận văn.<br />
Hà Nội, ngày 02 tháng 10 năm 2018<br />
Học viên<br />
<br />
Hoàng Văn Tiến<br />
<br />
xii<br />
<br />
TÓM TẮT NỘI DUNG<br />
Phân tích và dự báo từ lâu đã được ứng dụng trong mọi lĩnh vực nhằm đưa ra<br />
những định hướng, chiến lược phát triển trong tương lai. Ngành Y tế không đứng<br />
ngoài xu thế đó, đặc biệt là dự báo dịch bệnh truyền nhiễm từ lâu đã được các nhà<br />
khoa học quan tâm nghiên cứu và ngày càng phát triển. Phân tích và dự báo dịch bệnh<br />
truyền nhiễm được quan tâm vì những lợi ích rất lớn nó mang lại trong công tác phòng<br />
ngừa dịch bệnh. Phân tích và dự báo diễn biến của dịch bệnh giúp chúng ta chủ động<br />
trong công tác phòng ngừa, nhằm giảm thiểu những tổn hại do dịch bệnh gây ra. Việc<br />
xác định được chu kỳ diễn biến của dịch bệnh truyền nhiễm dựa trên các yếu tố thời<br />
gian, khí hậu và vùng địa lý rất được quan tâm. Nắm bắt chu kỳ diễn biến của dịch<br />
bệnh, đưa ra dự báo và lên phương án ứng phó, khoanh vùng, dập dịch nhanh, không<br />
để lây lan là hết sức quan trọng góp phần hạn chế tối đa hậu quả của dịch bệnh gây ra<br />
cho con người.<br />
Đề tài nghiên cứu trước hết tìm hiểu kiến thức nền tảng về khai phá dữ liệu, sau<br />
đó tìm hiểu sâu các kỹ thuật khai phá dữ liệu tiên tiến đang nhận được nhiều sự quan<br />
tâm của cộng đồng nghiên cứu trên thế giới, qua đó đề xuất vận dụng phương pháp và<br />
công cụ khai phá dữ liệu phù hợp với tập dữ liệu dịch cúm do Google Flu Trends công<br />
bố. Google Flu Trends là dịch vụ của Tập đoàn Google, cung cấp số liệu ước tính về<br />
dịch cúm tại hơn 25 quốc gia, thông qua việc tổng hợp các truy vấn tìm kiếm trên<br />
www.google.com, thông qua đó cố gắng đưa ra dự báo chính xác về dịch cúm. Năm<br />
2008, Google Flu Trends được Google.org lần đầu tiên đưa ra để giúp dự báo sự bùng<br />
phát dịch cúm của 25 nước trên thế giới.<br />
Đề xuất lựa chọn phương pháp khai phá dữ liệu phù hợp trên tập dữ liệu dịch<br />
bệnh cúm do Google Flu Trends công bố, tìm ra chu kỳ diễn biến của dịch, đưa ra các<br />
dự báo và hỗ trợ định hướng hoạt động y tế dự phòng theo từng thời điểm trong năm,<br />
nhằm có những chính sách và biện pháp phù hợp để hạn chế thiệt hại của dịch bệnh<br />
gây ra.<br />
<br />
xiii<br />
<br />