intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận án Tiến sĩ Kỹ thuật: Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:178

11
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận án Tiến sĩ Kỹ thuật "Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm" trình bày các nội dung chính sau: Đề xuất các phương pháp kết hợp trong tính toán mềm để dự đoán cấu trúc bậc hai phân tử sinh học; Áp dụng tính toán mềm cho bài toán dự đoán cấu trúc bậc hai RNA.

Chủ đề:
Lưu

Nội dung Text: Luận án Tiến sĩ Kỹ thuật: Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm

  1. ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐOÀN DUY BÌNH DỰ ĐOÁN CẤU TRÚC BẬC HAI CỦA PHÂN TỬ SINH HỌC TRÊN CƠ SỞ KẾT HỢP MỘT SỐ KỸ THUẬT TÍNH TOÁN MỀM LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng – 2023
  2. ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐOÀN DUY BÌNH DỰ ĐOÁN CẤU TRÚC BẬC HAI CỦA PHÂN TỬ SINH HỌC TRÊN CƠ SỞ KẾT HỢP MỘT SỐ KỸ THUẬT TÍNH TOÁN MỀM Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 9.48.01.01 Người hướng dẫn khoa học: TS. Phạm Minh Tuấn TS. Đặng Đức Long LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng – 2023
  3. LỜI CẢM ƠN Trước khi trình bày nội dung chính của luận án, để có được thành quả ngày hôm nay, trong suốt thời gian thực hiện luận án này, tôi đã nhận được sự quan tâm giúp đỡ, hỗ trợ nhiệt tình và những lời động viên chân thành, quý báu từ quý Thầy Cô cùng người thân, bạn bè. Với lòng biết ơn sâu sắc, trước tiên tôi xin gởi lời cảm ơn chân thành đến những người thân trong gia đình – họ đã không ngại khó khăn, gian nan vất vả để tạo điều kiện thuận lợi cho tôi trong suốt thời gian học tập, là người tiếp thêm sức mạnh hỗ trợ tôi vượt qua khó khăn để hoàn thành luận án này. Tôi xin bày tỏ lòng biết ơn sâu sắc tới Tiến sỹ Phạm Minh Tuấn, Tiến sỹ Đặng Đức Long người đã tận tình quan tâm, động viên, giúp đỡ và trực tiếp hướng dẫn tôi trong suốt thời gian học tập cũng như trong quá trình nghiên cứu để tôi hoàn thành luận án này. Tôi cũng xin bày tỏ lòng biết ơn chân thành tới toàn thể Thầy Cô, Cán bộ Nhân viên của khoa Công nghệ Thông tin và các Phòng Ban chức năng của trường Đại học Bách Khoa, Đại Học Đà Nẵng đã tận tình hướng dẫn, cung cấp tài liệu, động viên củng cố niềm tin và ý chí cho tôi vượt qua các chặng đường khó khăn trong suốt quá trình nghiên cứu tại khoa và tại trường. Tôi xin chân thành cảm ơn tới toàn thể các đồng nghiệp trong khoa Tin học của trường Đại học Sư Phạm, Đại học Đà Nẵng đã luôn tạo điều kiện cho tôi về mặt thời gian để tôi hoàn thành luận án này. Tôi cũng xin chân thành cảm ơn đến trường Đại học Sư phạm, Đại học Đà Nẵng luôn tạo điều kiện về mọi mặt trong quá trình tôi học tập, nghiên cứu và hoàn thành luận án. i
  4. Nhân dịp này tôi cũng xin được gửi lời cảm ơn chân thành tới toàn thể gia đình, bạn bè và anh chị em NCS của khoa Công nghệ Thông tin đã luôn bên tôi, cổ vũ, động viên, giúp đỡ tôi trong suốt quá trình học tập tại trường. Đà Nẵng, ngày tháng năm 2023 Nghiên cứu sinh Đoàn Duy Bình ii
  5. Mục lục Chương 1. Tổng quan về RNA, cấu trúc bậc hai RNA và tính toán mềm . . . . . 7 1.1. Công nghệ sinh học . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2. Tin sinh học . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3. Cấu trúc Ribonucleic Acid (RNA) và các khái niệm liên quan . . . . . . . 11 1.3.1. Cấu trúc RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.3.2. Các khái niệm liên quan đến RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.3.3. Dự đoán cấu trúc RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.3.4. Các cách biểu diễn cấu trúc bậc hai RNA . . . . . . . . . . . . . . . . . . . . . . . 19 1.3.5. Các phương pháp dự đoán cấu trúc bậc hai RNA, những tồn tại và hướng nghiên cứu phát triển . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.4. Tính toán mềm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.4.1. Thuật toán Di truyền - (Genetic Algorithm - GA) . . . . . . . . . . . . . . . . 25 1.4.2. Logic mờ và các đặc trưng của tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.4.3. Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) . . . . . . . . 33 1.4.4. Mạng nơ-ron hồi quy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 1.4.5. Mạng nơ-ron dài ngắn hạn (Long Short-Term Memory - LSTM) . . 35 1.5. Kết luận Chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Chương 2. Đề xuất các phương pháp kết hợp trong tính toán mềm để dự đoán cấu trúc bậc hai phân tử sinh học . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.1. Bài toán dự đoán cấu trúc bậc hai của phân tử sinh học . . . . . . . . . . . . . 39 iii
  6. MỤC LỤC MỤC LỤC 2.2. Các tham số nhiệt động học. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.2.1. Năng lượng tự do cho những vòng xếp chồng (Stack loop): . . . . . . . 41 2.2.2. Những năng lượng gây mất ổn định theo kích thước vòng: . . . . . . . . 41 2.2.3. Năng lượng tự do cho các vòng kẹp tóc (hairpin loops) tổng quát: . 42 2.2.4. Năng lượng tự do cho vòng kẹp tóc (hairpin loops) với chiều dài là 4: . . 43 2.2.5. Năng lượng tự do cho vòng lặp trong (internal loops) tổng quát: . . . 43 2.2.6. Năng lượng tự do cho vòng lặp trong (internal loops) đối xứng với kích thước 2: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.2.7. Năng lượng tự do cho vòng lặp trong (internal loops) không đối xứng có kích thước 3: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.2.8. Năng lượng tự do cho vòng lặp trong (internal loops) đối xứng với kích thước 4: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.2.9. Năng lượng tự do cho những điểm bên ngoài (External):. . . . . . . . . . 44 2.2.10. Các quy tắc năng lượng tự do hổn hợp: . . . . . . . . . . . . . . . . . . . . . . . . 45 2.3. Tính toán năng lượng tự do của một cấu trúc bậc hai . . . . . . . . . . . . . . . 47 2.3.1. Những hàm tổng quát . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.3.2. Tính năng lượng tự do cho vòng xếp chồng . . . . . . . . . . . . . . . . . . . . . . 49 2.3.3. Tính toán năng lượng tự do cho vòng kẹp tóc . . . . . . . . . . . . . . . . . . . . 49 2.3.4. Tính toán năng lượng tự do cho vòng lặp trong . . . . . . . . . . . . . . . . . . 51 2.3.5. Tính năng lượng tự do cho vòng nhiều nhánh . . . . . . . . . . . . . . . . . . . . 53 2.3.6. Tính toán năng lượng tự do cho cấu trúc nhiều miền . . . . . . . . . . . . . 54 iv
  7. MỤC LỤC MỤC LỤC 2.4. Các phương pháp đề xuất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.4.1. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.4.2. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . 66 2.4.3. Kết hợp thuật toán di truyền với mạng nơ-ron nhân tạo, cụ thể là mạng LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 2.5. Kết luận Chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Chương 3. Áp dụng tính toán mềm cho bài toán dự đoán cấu trúc bậc hai RNA . 81 3.1. Cơ sở dữ liệu RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.2. Bộ dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.3. Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.4. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.4.1. Khởi tạo các tham số cho thuật toán di truyền . . . . . . . . . . . . . . . . . . . 86 3.4.2. Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 3.4.3. So sánh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 3.5. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . 93 3.5.1. Khởi tạo các tham số cho thuật toán di truyền kết hợp với logic mờ 93 3.5.2. Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 3.5.3. So sánh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 3.6. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . 98 3.6.1. Mô hình kết hợp GA với LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 3.6.2. Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 v
  8. MỤC LỤC MỤC LỤC 3.6.3. So sánh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 3.7. Kết luận Chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 ................................................................ i I. SARS-CoV-2 - 88 Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 1. Thông tin chuỗi (Bảng 13 ): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . iii 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . . . iii II. Virus E.Coli với chiều dài 221 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . iv 1. Thông tin chuỗi (Bảng 17) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . v 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . . . vii III. Virus Bmori với chiều dài 498 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . vii 1. Thông tin chuỗi (Bảng :21 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . ix 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . . . . x IV. Schizosaccharomyces pombe với chiều dài 119 nucleotides . . . . . . . . . . . xi 1. Thông tin chuỗi (Bảng 25 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . xiii vi
  9. MỤC LỤC MỤC LỤC 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . . xiv V. Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides xv 1. Thông tin chuỗi (Bảng 29 ):. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvi 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . xvi 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . . xvii VI. Mycoplasma capricolum với chiều dài 865 nucleotides . . . . . . . . . . . . xviii 1. Thông tin chuỗi (Bảng 33 ): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . xx 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . . . xx VII.Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides . . . xxi 1. Thông tin chuỗi (Bảng 37 ): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . xxiv 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . xxvi VIII. Bạch hầu - Corynebacterium diphtheriae với chiều dài 176 nucleotides . . . xxvii 1. Thông tin chuỗi (Bảng 41 ): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxvii 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxvii 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . xxviii 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . . xxix vii
  10. MỤC LỤC MỤC LỤC IX. Tay chân miệng (loại ít gây ra các biến chứng về thần kinh)- Coxsackie A16 với chiều dài 252 nucleotides. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxx 1. Thông tin chuỗi (Bảng 45 ): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxx 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxx 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . xxxi 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . xxxiii X. Tay chân miệng (loại gây ra các biến chứng nguy hiểm)- Enterovirus A71 với chiều dài 252 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxiv 1. Thông tin chuỗi (Bảng 49): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxiv 2. Thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxv 3. Kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . . . . . . . . . . . xxxvi 4. Phương pháp kết hợp thuật toán di truyền với mạng LSTM . . . . . . . . xxxvi viii
  11. Danh sách hình vẽ 1.1 Mối quan hệ giữa DNA, RNA và Protein . . . . . . . . . . . . . . . . . . 11 1.2 Các nucleotide chuẩn của RNA và sự kết cặp của chúng . . . . . . . . . . 13 1.3 Ba cấp của cấu trúc RNA. a) Cấu trúc bậc 1. b) Cấu trúc bậc 2. c) Cấu trúc bậc 3 [63] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.4 Các cặp nucleotide chính tắc [33] . . . . . . . . . . . . . . . . . . . . . . 16 1.5 Cấu trúc bậc hai RNA không có có các cặp nucleotide bắt liên kết chéo nhau (pseudoknot free) [60] . . . . . . . . . . . . . . . . . . . . . . 16 1.6 Cấu trúc bậc hai RNA có các cặp nucleotide bắt liên kết chéo nhau (pseudoknotted)[51] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.7 Các cách biểu diễn cấu trúc bậc hai RNA [45] . . . . . . . . . . . . . . . 19 1.8 Lưu đồ thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.9 Các tập mờ tam giác. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 1.10 Tập mờ hình thang. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 1.11 Tập mờ L. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.12 Tập mờ Gamma tuyến tính. . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.13 Một phần của mạng nơ-ron hồi quy, A nhìn vào đầu vào Xt và xuất ra một giá trị ht . Các vòng truyền thông tin từ bước này sang bước khác của mạng. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 1.14 Cấu trúc mạng LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.1 Các cấu trúc thành phần tạo nên cấu trúc bậc hai RNA [60] . . . . . . . . 40 ix
  12. DANH SÁCH HÌNH VẼ DANH SÁCH HÌNH VẼ 2.2 (a) Bảng năng lượng cho vòng lặp trong với cặp bazơ đóng là (G,C). Đây là kiểu được hiển thị trong hình (b). (c) là ví dụ mà ở đó có giá trị được tìm thấy trong bảng ở hình (a), ở đó a = G, b = C và c = G, d = C . 42 2.3 (a) Năng lượng tự do cho từng vòng với kích thước cụ thể. (b) Một ví dụ của vòng lặp trong có chiều dài là 4 . . . . . . . . . . . . . . . . . . . 42 2.4 (a). Bảng năng lượng tự do cho vòng kẹp tóc của kiểu trong (b). (c) là một ví dụ, trong đó c = G và d = A. . . . . . . . . . . . . . . . . . . . . 42 2.5 (a) Ví dụ của giá trị năng lượng cho vòng kẹp tóc có độ dài 4. (b) một ví dụ cụ thể cho những vòng kẹp tóc. . . . . . . . . . . . . . . . . . . . . 43 2.6 (a) Bảng năng lượng cho vòng lặp trong với cặp bazơ đóng là (C, G). Đây là kiểu được hiển thị trong hình (b), (c) là ví dụ mà ở đó có giá trị được tìm thấy trong bảng ở hình (a), ở đó c = G, d = A và c = A, d = G 43 2.7 (a) Năng lượng tự do cho vòng lặp trong đối xứng với kích thước 2, và có kiểu được hiển thị ở (b). Năng lượng cho ví dụ với vòng lặp trong, trong đó c = G và d = A, được hiển thị ở (c). . . . . . . . . . . . . . . . . 44 2.8 (a) Năng lượng tự do cho vòng lặp trong không đối xứng với kích thước 3, với kiểu thể hiện ở (b), năng lượng tương ứng cho ví dụ ở (c), với c = C, d = A và e = C ; (d) Năng lượng tự do cho vòng lặp trong không đối xứng với kích thước 3, với kiểu thể hiện ở (e), năng lượng tương ứng cho ví dụ ở (f), với x = A, y = C và e = G. . . . . . . . . . . . 45 2.9 (a) Giả sử một phần của bảng năng lượng tự do cho vòng lặp trong đối xứng với kích thước 4, kiểu vòng thể hiện là (b). Năng lượng cho ví dụ là (c), với v = A, w = A và c = G, d = G. . . . . . . . . . . . . . . . 45 x
  13. DANH SÁCH HÌNH VẼ DANH SÁCH HÌNH VẼ 2.10 (a) Năng lượng tự do cho những điểm cuối lủng lẳng với chiều kết thúc là 3’, với kiểu là (b), tương ứng năng lượng cho vi dụ là (c); (d) Năng lượng tự do cho những điểm cuối lủng lẳng với chiều kết thúc là 5’, với kiểu là (e), tương ứng năng lượng cho vi dụ là (f). . . . . . . . . 46 2.11 Các quy tắc năng lượng tự do hổn hợp. . . . . . . . . . . . . . . . . . . . 47 2.12 Các bazơ lơ lững giữa các miền. . . . . . . . . . . . . . . . . . . . . . . 54 2.13 Hình a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.14 Hình b. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.15 Quá trình tạo helix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.16 Lưu đồ kết hợp thuật toán di truyền với logic mờ . . . . . . . . . . . . . . 67 2.17 Đồ thị của hàm thành viên µ(i) . . . . . . . . . . . . . . . . . . . . . . . 75 2.18 Sơ đồ kết hợp GA và LSTM cho bài toán dự đoán cấu trúc bậc hai RNA. . 77 3.1 Cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 nucleotides khi áp dụng thuật toán GA vợi bộ tham số cho trong bảng 3.4 . . . . . . . 88 3.2 Cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 Nucleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . . . . . . . . . 91 3.3 Cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 Nucleotides với thuật toán di truyền vợi bộ tham số cho trong bảng 3.4 . . . . . . . . . 92 3.4 Cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 Nucleotides với thuật toán GA có kết hợp logic mờ . . . . . . . . . . . . . . . . . . . 95 3.5 Cấu trúc của chuỗi SARS-CoV-2 - 88 Nucleotides khi áp dụng mô hình GA-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 6 Cấu trúc của chuỗi SARS-CoV-2 - 88 Bases với thuật toán quy hoạch động ii 7 Cấu trúc của chuỗi SARS-CoV-2 - 88 Bases với thuật toán di truyền . . . ii xi
  14. DANH SÁCH HÌNH VẼ DANH SÁCH HÌNH VẼ 8 Cấu trúc của chuỗi SARS-CoV-2 - 88 Bases với thuật toán GA có kết hợp logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii 9 Cấu trúc của chuỗi SARS-CoV-2 - 88 Bases với thuật toán GA có kết hợp LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv 10 Cấu trúc của chuỗi E.Coli với chiều dài 221 nucleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v 11 Cấu trúc của chuỗi E.Coli với chiều dài 221 nucleotides với thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi 12 Cấu trúc của chuỗi E.Coli có chiều dài 221 nucleotides áp dụng thuật toán di truyền kết hợp với Logic mờ . . . . . . . . . . . . . . . . . . . . vii 13 Cấu trúc của chuỗi E.Coli có chiều dài 221 nucleotides áp dụng thuật toán di truyền kết hợp với LSTM . . . . . . . . . . . . . . . . . . . . . . viii 14 Cấu trúc của chuỗi Bmori 498 nucleotides với quy hoạch động . . . . . . viii 15 Cấu trúc của chuỗi Bmori với chiều dài 498 nucleotides với thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x 16 Cấu trúc của chuỗi Bmori với chiều dài 498 nucleotides với thuật toán di truyền kết hợp với logic mờ . . . . . . . . . . . . . . . . . . . . . . . xi 17 Cấu trúc của chuỗi Bmori với chiều dài 498 nucleotides với thuật toán di truyền kết hợp với LSTM . . . . . . . . . . . . . . . . . . . . . . . . . xii 18 Cấu trúc của chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . . . xiii 19 Cấu trúc của chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotides với thuật toán GA . . . . . . . . . . . . . . . . . . . . . . . . xiii 20 Cấu trúc của chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotides với thuật toán GA kết hợp với logic mờ . . . . . . . . . . . . xiv xii
  15. DANH SÁCH HÌNH VẼ DANH SÁCH HÌNH VẼ 21 Cấu trúc của chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotides với thuật toán GA kết hợp với LSTM . . . . . . . . . . . . . xv 22 Cấu trúc của chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides với thuật toán quy hoạch động . . . . . . . . . xvi 23 Cấu trúc của chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides với thuật toán GA . . . . . . . . . . . . . . . . xvii 24 Cấu trúc của chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides với thuật toán GA kết hợp với logic mờ . . . . . xviii 25 Cấu trúc của chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides với thuật toán GA kết hợp với LSTM . . . . . . xix 26 Cấu trúc của chuỗi Mycoplasma capricolum với chiều dài 865 nu- cleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . . . . xxi 27 Cấu trúc của chuỗi Mycoplasma capricolum với chiều dài 865 nu- cleotides với thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . xxii 28 Cấu trúc của chuỗi Mycoplasma capricolum với chiều dài 865 nu- cleotides với thuật toán di truyền kết hợp với logic mờ . . . . . . . . . . . xxiii 29 Cấu trúc của chuỗi Mycoplasma capricolum với chiều dài 865 nu- cleotides với thuật toán di truyền kết hợp với LSTM . . . . . . . . . . . . xxiv 30 Cấu trúc của chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . xxv 31 Cấu trúc của chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán di truyền . . . . . . . . . . . . . . . . . . xxvi 32 Cấu trúc của chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán di truyền kết hợp với logic mờ . . . . . . . xxvi xiii
  16. DANH SÁCH HÌNH VẼ DANH SÁCH HÌNH VẼ 33 Cấu trúc của chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán di truyền kết hợp với LSTM . . . . . . . . xxvii 34 Cấu trúc của chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . . . xxix 35 Cấu trúc của chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán GA . . . . . . . . . . . . . . . . . . . . . . . . xxix 36 Cấu trúc của chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán di truyền kết hợp logic mờ . . . . . . . . . . . xxx 37 Cấu trúc của chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán di truyền kết hợp LSTM . . . . . . . . . . . . . xxxi 38 Cấu trúc của chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . . . . . . . . . . . xxxii 39 Cấu trúc của chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán di truyền . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxiii 40 Cấu trúc của chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán di truyền kết hợp logic mờ . . . . . . . . . . . . . . . . . . . . xxxiii 41 Cấu trúc của chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán di truyền kết hợp LSTM . . . . . . . . . . . . . . . . . . . . . xxxiv 42 Cấu trúc của chuỗi Enterovirus A71 với chiều dài 252 nucleotides với thuật toán quy hoạch động . . . . . . . . . . . . . . . . . . . . . . . . . xxxvi 43 Cấu trúc của chuỗi Enterovirus A71 - 252 nucleotides với thuật toán GA . xxxvi 44 Cấu trúc của chuỗi Enterovirus A71 - 252 nucleotides với thuật toán GA kết hợp logic mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxvii 45 Cấu trúc của chuỗi Enterovirus A71 - 252 nucleotides với thuật toán GA kết hợp LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxviii xiv
  17. Danh sách bảng 2.1 Tham số và các toán tử cho thuật toán di truyền . . . . . . . . . . . . . . 66 3.1 Các chuỗi thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 3.2 Kết quả thực nghiệm các phương pháp đề xuất ứng với các chuỗi thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 3.3 Thông tin chuỗi Ichthyosporidium sp. với chiều dài 1352 Nucleotides . . . 85 3.4 Giá trị các tham số cho thuật toán di truyền áp dụng cho bài toán dự đoán cấu trúc bậc hai RNA . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.5 Năng lượng và cấu trúc của chuỗi chuỗi Ichthyosporidium sp. với chiều dài 1352 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . 87 3.6 Năng lượng và cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.7 Giá trị các tham số cho thuật toán di truyền kết hợp với logic mờ áp dụng cho bài toán dự đoán cấu trúc bậc hai RNA . . . . . . . . . . . . . 93 3.8 Năng lượng và cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 Nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 3.9 Năng lượng và cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 Nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.10 Bộ tham số Q có được sau quá trình huấn luyện . . . . . . . . . . . . . . 99 3.11 Năng lượng và cấu trúc của chuỗi SARS-CoV-2 - 88 Nucleotides . . . . . 100 3.12 Năng lượng và cấu trúc của chuỗi Ichthyosporidium sp. với chiều dài 1352 Nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 13 Thông tin chuỗi SARS-CoV-2 - 88 Bases . . . . . . . . . . . . . . . . . i xv
  18. DANH SÁCH BẢNG DANH SÁCH BẢNG 14 Năng lượng và cấu trúc của chuỗi SARS-CoV-2 - 88 Bases . . . . . . . . i 15 Năng lượng và cấu trúc của chuỗi SARS-CoV-2 - 88 Bases . . . . . . . . iii 16 Năng lượng và cấu trúc của chuỗi SARS-CoV-2 - 88 Bases . . . . . . . . iv 17 Thông tin chuỗi E.Coli 221 nucleotides . . . . . . . . . . . . . . . . . . v 18 Năng lượng và cấu trúc của chuỗi Virus E.Coli với chiều dài 221 nucleotidesv 19 Năng lượng và cấu trúc của chuỗi Virus E.Coli với chiều dài 221 nucleotidesvi 20 Năng lượng và cấu trúc của chuỗi Virus E.Coli với chiều dài 221 nucleotidesvii 21 Thông tin chuỗi Virus Bmori với chiều dài 498 nucleotides . . . . . . . . ix 22 Năng lượng và cấu trúc của chuỗi Virus Bmori với chiều dài 498 nucleotidesix 23 Năng lượng và cấu trúc của chuỗi Virus Bmori với chiều dài 498 nucleotidesx 24 Năng lượng và cấu trúc của chuỗi Virus Bmori với chiều dài 498 nucleotidesxi 25 Thông tin chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotidesxii 26 Năng lượng và cấu trúc của chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . xii 27 Năng lượng và cấu trúc của chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . xiv 28 Năng lượng và cấu trúc của chuỗi Schizosaccharomyces pombe với chiều dài 119 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . xiv 29 Thông tin chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . xv 30 Năng lượng và cấu trúc của chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides . . . . . . . . . . . . . . . . . . . . . xvi 31 Năng lượng và cấu trúc của chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides . . . . . . . . . . . . . . . . . . . . . xvii xvi
  19. DANH SÁCH BẢNG DANH SÁCH BẢNG 32 Năng lượng và cấu trúc của chuỗi Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides . . . . . . . . . . . . . . . . . . . . . xviii 33 Thông tin chuỗi Mycoplasma capricolum với chiều dài 865 nucleotides . . xx 34 Năng lượng và cấu trúc của chuỗi Mycoplasma capricolum với chiều dài 865 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi 35 Năng lượng và cấu trúc của chuỗi Mycoplasma capricolum với chiều dài 865 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii 36 Năng lượng và cấu trúc của chuỗi Mycoplasma capricolum với chiều dài 865 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxiii 37 Thông tin chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxiv 38 Năng lượng và cấu trúc của chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . xxv 39 Năng lượng và cấu trúc của chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . xxv 40 Năng lượng và cấu trúc của chuỗi Cúm mùa ở Mỹ - Influenza A virus với chiều dài 543 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . xxvii 41 Thông tin chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotidesxxviii 42 Năng lượng và cấu trúc của chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . xxviii 43 Năng lượng và cấu trúc của chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . xxviii 44 Năng lượng và cấu trúc của chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . xxx 45 Thông tin chuỗi Coxsackie A16 với chiều dài 252 nucleotides . . . . . . . xxxi xvii
  20. DANH SÁCH BẢNG DANH SÁCH BẢNG 46 Năng lượng và cấu trúc của chuỗi Coxsackie A16 với chiều dài 252 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxii 47 Năng lượng và cấu trúc của chuỗi Coxsackie A16 với chiều dài 252 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxii 48 Năng lượng và cấu trúc của chuỗi Coxsackie A16 với chiều dài 252 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxiv 49 Thông tin chuỗi Enterovirus A71 với chiều dài 252 nucleotides . . . . . . xxxv 50 Năng lượng và cấu trúc của chuỗi Enterovirus A71 với chiều dài 252 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxv 51 Năng lượng và cấu trúc của chuỗi Enterovirus A71 với chiều dài 252 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxvii 52 Năng lượng và cấu trúc của chuỗi Enterovirus A71 với chiều dài 252 nucleotides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxvii xviii
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0