
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phạm Thanh Bình
MỘT MÔ HÌNH HỌC MÁY XÁC ĐỊNH
TÍNH CHẤT MODIFICATION CỦA CÁC SỰ KIỆN
Y SINH VỀ BỆNH UNG THƯ DI TRUYỀN
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
HÀ NỘI - 2013

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phạm Thanh Bình
MỘT MÔ HÌNH HỌC MÁY XÁC ĐỊNH
TÍNH CHẤT MODIFICATION CỦA CÁC SỰ KIỆN
Y SINH VỀ BỆNH UNG THƯ DI TRUYỀN
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hướng dẫn: TS. Phan Xuân Hiếu
Cán bộ đồng hướng dẫn: ThS. Trần Mai Vũ

VIETNAM NATIONAL UNIVERSITY, HANOI
UNIVERSITY OF ENGINEERING AND TECHNOLOGY
Pham Thanh Binh
A MACHINE LEARNING MODEL FOR BIOMEDICAL
EVENT MODIFICATION IDENTIFICATION ON
CANCER GENETICS DATASET
Major: Information Techlonogy
Supervisor: Dr. Phan Xuan Hieu
Co-Supervisor: MSc. Tran Mai Vu
HA NOI - 2013

i
Lời cảm ơn
Trước tiên, em xin bày tỏ lời cảm ơn sâu sắc tới Phó Giáo sư Tiến sĩ Hà Quang
Thụy, Phó Giáo sư Tiến sĩ Nigel H. Collier (Viện Tin học Qu c gia Nhật ản (NII
Tiến sĩ Phan Xuân Hiếu đã tận tình chỉ bảo, hướng dẫn em trong quá trình tìm hiểu,
nghiên cứu để hoàn thành khóa luận t t nghiệp này.
Đặc biệt, em xin gửi lời cảm ơn chân thành nhất tới Thạc sĩ Trần Mai Vũ - người
đã tận tình hỗ trợ về kiến thức chuyên môn giúp đỡ em rất nhiều để hoàn thành khóa
luận.
Đồng thời, em xin cảm ơn các thầy, các anh chị và các bạn trong Phòng Thí
nghiệm Công nghệ Tri thức (KT-Lab đã chia sẻ những kinh nghiệm, kiến thức quý
báu cho em trong quá trình nghiên cứu.
Em cũng xin gửi lời cảm ơn tới nhà trường thầy cô đã tạo cho em điều kiện
thuận lợi trong su t thời gian hoàn thành khóa luận t t nghiệp tại trường Đại Học
Công Nghệ - Đại Học Qu c Gia Hà Nội.
Lời cu i cùng, em mu n cảm ơn gia đình và bạn bè - nguồn cổ vũ động viên tinh
thần lớn nhất giúp em vượt qua những khó khăn trong su t quá trình thực hiện khóa
luận t t nghiệp.
Em xin chân thành cảm ơn!
Hà Nội, ngày 15 tháng 5 năm 2013
Sinh viên
Phạm Thanh Bình

ii
MỘT MÔ HÌNH HỌC MÁY XÁC ĐỊNH TÍNH CHẤT MODIFICATION
CỦA CÁC SỰ KIỆN Y SINH VỀ BỆNH UNG THƯ DI TRUYỀN
Phạm Thanh Bình
Khóa QH-2009-I/CQ, ngành Công nghệ thông tin
Tóm tắt Khóa luận tốt nghiệp
Bài toán trích xuất sự kiện y sinh đang nhận được sự quan tâm rất lớn của cộng đồng
nghiên cứu nhằm tìm ra những m i quan hệ giữa các thực thể y sinh và hoạt động của chúng.
Bài toán bổ sung của bài toán trích xuất sự kiện y sinh tại BioNLP Shared Task là bài toán
xác định tính chất Modification của sự kiện y sinh cũng giữ một vai trò vô cùng quan trọng.
Mục đích của bài toán này là xác định sự kiện y sinh mang thông tin có thật, không chắc chắn
hay phủ định. Hiện nay, có nhiều hướng tiếp cận cho bài toán này như dựa trên luật hay học
giám sát, tuy vậy kết quả thu được chưa được cao, với độ đo F1 nhỏ hơn 60%.
Thấy được sự cần thiết và quan trọng của bài toán xác định tính chất Modification của
các sự kiện y sinh, tác giả đã nghiên cứu, tìm hiểu bài toán này trên miền dữ liệu ung thư di
truyền. Khóa luận “MỘT MÔ HÌNH HỌC MÁY XÁC ĐỊNH TÍNH CHẤT
MODIFICATION CỦA CÁC SỰ KIỆN Y SINH VỀ BỆNH UNG THƯ DI TRUYỀN”
mu n giới thiệu một mô hình học máy giải quyết bài toán. Nội dung của khóa luận tập trung
vào trình bày một s thách thức của bài toán, phân tích và so sánh một s hướng tiếp cận, từ
cơ sở đó xây dựng một mô hình học máy giám sát cho bài toán trích chọn sự kiện
Modification. Mô hình gồm hai thành phần: (1) Trích chọn sự kiện; (2) Trích chọn sự kiện
Modification. Khi tiến hành thực nghiệm trên tập dữ liệu chuẩn được cung cấp bởi ioNLP-
ST 2013, mô hình đề xuất đạt kết quả 59.47% trên độ đo F1.
Từ khóa: sự kiện, Modification, bệnh ung thư di truyền.

