intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Sinh học thực nghiệm: Nghiên cứu tính đa hình và tần suất các alen của 27 locus STR trên nhiễm sắc thể thường bằng bộ kit ForenSeq ứng dụng trong giám định ADN hình sự tại Việt Nam

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:109

31
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục tiêu cụ thể của đề tài là xác định tần suất các alen và đánh giá tính đa hình của 27 locus STR trên nhiễm sắc thể thường thuộc bộ kit ForenSeqTM DNA Signature Prep - Mix A từ 200 cá thể người dân tộc Kinh tại Việt Nam, từ đó đề xuất khả năng ứng dụng của bộ kit ForenSeqTM DNA Signature Prep - Mix A trong lĩnh vực giám định ADN tại Việt Nam.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Sinh học thực nghiệm: Nghiên cứu tính đa hình và tần suất các alen của 27 locus STR trên nhiễm sắc thể thường bằng bộ kit ForenSeq ứng dụng trong giám định ADN hình sự tại Việt Nam

  1. BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ------------- Phạm Ngọc Sơn NGHIÊN CỨU TÍNH ĐA HÌNH VÀ TẦN SUẤT CÁC ALEN CỦA 27 LOCUS STR TRÊN NHIỄM SẮC THỂ THƯỜNG BẰNG BỘ KIT FORENSEQ ỨNG DỤNG TRONG GIÁM ĐỊNH ADN HÌNH SỰ TẠI VIỆT NAM LUẬN VĂN THẠC SĨ: SINH HỌC THỰC NGHIỆM Hà Nội - 2020
  2. BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ------------ Phạm Ngọc Sơn NGHIÊN CỨU TÍNH ĐA HÌNH VÀ TẦN SUẤT CÁC ALEN CỦA 27 LOCUS STR TRÊN NHIỄM SẮC THỂ THƯỜNG BẰNG BỘ KIT FORENSEQ ỨNG DỤNG TRONG GIÁM ĐỊNH ADN HÌNH SỰ TẠI VIỆT NAM Chuyên ngành: Sinh học thực nghiệm Mã số: 8420114 LUẬN VĂN THẠC SĨ SINH HỌC THỰC NGHIỆM NGƯỜI HƯỚNG DẪN KHOA HỌC Hướng dẫn 1: PGS. TS. Phí Quyết Tiến Hướng dẫn 2: PGS. TS. Nguyễn Văn Hà Hà Nội - 2020
  3. i Lời cam đoan Tôi xin cam đoan những nội dung viết trong luận văn là do sự tìm tòi, học hỏi của bản thân với sự hướng dẫn tận tình của PGS. TS. Phí Quyết Tiến, PGS. TS. Nguyễn Văn Hà và các đồng nghiệp tại Trung tâm Giám định sinh học, Viện Khoa học hình sự và Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam. Mọi kết quả nghiên cứu cũng như ý tưởng của tác giả khác, nếu có đều được trích dẫn cụ thể. Đề tài luận văn này cho đến nay chưa được bảo vệ tại bất kỳ một hội đồng bảo vệ luận văn thạc sĩ nào và cũng chưa hề được công bố trên bất kỳ một phương tiện nào. Tôi xin chịu trách nhiệm về những lời cam đoan trên. Hà Nội, ngày tháng 8 năm 2020 Người cam đoan Phạm Ngọc Sơn
  4. ii Lời cảm ơn Để hoàn thành được Luận văn cao học này, tôi xin bày tỏ lời cảm ơn sâu sắc tới PGS. TS. Phí Quyết Tiến và PGS. TS. Nguyễn Văn Hà đã trực tiếp định hướng, tận tình hướng dẫn tôi. Tôi xin cảm ơn tập thể lãnh đạo Viện Khoa học hình sự, lãnh đạo và cán bộ Phòng Tham mưu và Trung tâm giám định Sinh học - Viện Khoa học hình sự đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập và làm nghiên cứu đề tài. Tôi xin trân trọng gửi lời cảm ơn tới ban lãnh đạo cùng các thầy cô giáo Khoa Công nghệ sinh học, Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã truyền đạt kiến thức và giúp đỡ tôi trong suốt quá trình học tập và thực hiện luận văn. Cuối cùng tôi xin bày tỏ lòng biết ơn đến gia đình, người thân, bạn bè và đồng nghiệp - những người đã luôn động viên, tạo điều kiện cho tôi hoàn thành khóa học này./. Học viên Phạm Ngọc Sơn
  5. iii Danh mục các ký hiệu và chữ viết tắt Chữ viết tắt Nội dung ADN Axít deoxyribonucleic bp Base pair (cặp bazơ) CE Capillary Electrophoresis (Điện di mao dẫn) FSA ForenSeqTM DNA Signature Prep - Mix A (tên bộ kít phân tích ADN của hãng Illumina) FTA Tên riêng của một loại giấy thu mẫu máu (dạng thẻ) ID IdentifilerTM (tên bộ kít phân tích ADN của hãng Thermo Fisher) NST Nhiễm sắc thể PCR Polymerase Chain Reaction (Phản ứng chuỗi polymerase) SNP Single Nucleotide Polymorphism (Đa hình đơn nucleotit) STR Short Tandem Repeat (Các trình tự lặp ngắn) VNTR Variable Number of Tandem Repeat (Các trình tự lặp trung bình)
  6. iv Danh mục các bảng Bảng 1.1: Tần suất tối thiểu của một alen thay đổi tương ứng với số lượng mẫu khảo sát .................................................................................................... 11 Bảng 1.2: Các locus STR trên nhiễm sắc thể thường có trong bộ kit ForenSeq DNA Signature Prep - Mix A [25] ................................................................. 14 Bảng 3.1. Kết quả định lượng ADN bằng phương pháp Realtime PCR ........35 Bảng 3.2. So sánh tần suất alen (%) của locus D8S1179 ............................... 43 Bảng 3.3. So sánh tần suất alen (%) của locus D21S11 ................................. 44 Bảng 3.4. So sánh tần suất alen (%) của locus D7S820 ................................. 45 Bảng 3.5. So sánh tần suất alen (%) của locus CSF1PO ................................ 45 Bảng 3.6. So sánh tần suất alen (%) của locus D3S1358 .............................. 46 Bảng 3.7. So sánh tần suất alen (%) của locus TH01 ..................................... 47 Bảng 3.8. So sánh tần suất alen (%) của locus D13S317 ............................... 47 Bảng 3.9. So sánh tần suất alen (%) của locus D16S539 ............................... 48 Bảng 3.10. So sánh tần suất alen (%) của locus D2S1338 ............................. 49 Bảng 3.11. So sánh tần suất alen (%) của locus D19S433 ............................. 50 Bảng 3.12. So sánh tần suất alen (%) của locus vWA .................................... 50 Bảng 3.13. So sánh tần suất alen (%) của locus TPOX .................................. 51 Bảng 3.14. So sánh tần suất alen (%) của locus D18S51 ............................... 52 Bảng 3.15. So sánh tần suất alen (%) của locus D5S818 ............................... 53 Bảng 3.16. So sánh tần suất alen (%) của locus FGA..................................... 54 Bảng 3.17. So sánh tần suất alen (%) của locus D1S1656 ............................. 56 Bảng 3.18. So sánh tần suất alen (%) của locus D2S411 ............................... 57 Bảng 3.19. So sánh tần suất alen (%) của locus D4S2408 ............................. 57 Bảng 3.20. So sánh tần suất alen (%) của locus D6S1043 ............................. 58
  7. v Bảng 3.21. So sánh tần suất alen (%) của locus D9S1122 ............................. 59 Bảng 3.22. So sánh tần suất alen (%) của locus D10S1248 ........................... 59 Bảng 3.23. So sánh tần suất alen (%) của locus D12S391 ............................. 60 Bảng 3.24. So sánh tần suất alen (%) của locus PentaE ................................. 61 Bảng 3.25. So sánh tần suất alen (%) của locus D17S1301 ........................... 62 Bảng 3.26. So sánh tần suất alen (%) của locus D20S482 ............................. 63 Bảng 3.27. So sánh tần suất alen (%) của locus PentaD ................................. 64 Bảng 3.28. So sánh tần suất alen (%) của locus D22S1045 ........................... 65 Bảng 3.29. Tổng hợp và so sánh các chỉ số đánh giá bảng tần suất ............... 71
  8. vi Danh mục các hình ảnh Hình 1.1. Vị trí một số locus trên nhiễm sắc thể sử dụng trong giám định ADN của một số bộ kít phổ biến hiện nay ........................................................ 6 Hình 1.2. Hình ảnh máy điện di mao quản ABI 3130xl ................................. 16 Hình 1.3. Quy trình giải trình tự thế hệ mới của Illumina .............................. 17 Hình 1.4. Hình ảnh máy giải trình tự thế hệ mới MiSeq FGxTM .................... 24 Hình 2.1. Sơ đồ nghiên cứu............................................................................. 26 Hình 2.2. Thẻ FTA dùng để thu mẫu máu ...................................................... 27 Hình 2.3. Danh bản ghi thông tin cá nhân ...................................................... 28 Hình 2.4. Hình ảnh mô tả quá trình chuẩn bị thư viện mẫu............................ 31 Hình 3.1. Mẫu máu được thu vào giấy FTA và thông tin cá nhân ................. 36 Hình 3.2. Hình ảnh báo cáo kết quả phân tích mẫu đối chứng dương............ 37 Hình 3.3. Hình ảnh báo cáo kết quả phân tích mẫu M001 ............................. 38 Hình 3.4. Hình ảnh báo cáo chi tiết kiểu gen mẫu đối chứng dương ............. 39 Hình 3.5. Hình ảnh báo cáo chi tiết kiểu gen mẫu M001 ............................... 40 Hình 3.6. Biểu đồ so sánh chỉ số PD............................................................... 66 Hình 3.7. Biểu đồ so sánh chỉ số PE ............................................................... 67 Hình 3.8. Biểu đồ so sánh chỉ số PI ................................................................ 68 Hình 3.9. Biểu đồ so sánh chỉ số PIC ............................................................. 69
  9. vii MỤC LỤC Trang Lời cam đoan ...................................................................................................... i Lời cảm ơn ........................................................................................................ ii Danh mục các ký hiệu và chữ viết tắt .............................................................. iii Danh mục các bảng .......................................................................................... iv Danh mục các hình ảnh .................................................................................... vi MỞ ĐẦU ........................................................................................................... 1 CHƯƠNG 1. TỔNG QUAN TÀI LIỆU ........................................................... 4 1.1. KHÁI NIỆM VỀ CÁC LOCUS TRÌNH TỰ LẶP LẠI NGẮN (SORT TANDEM REPEAT - STR).............................................................................. 4 1.1.1. Khái niệm ................................................................................................ 4 1.1.2. Danh pháp quốc tế của các locus STR ................................................... 6 1.2. CƠ SỞ DỮ LIỆU TẦN SUẤT CÁC ALEN ............................................. 7 1.2.1. Khái niệm cơ sở dữ liệu tần suất các alen ............................................... 7 1.2.2. Tần suất các alen ..................................................................................... 8 1.2.2.1. Alen có tần suất thấp ............................................................................ 8 1.2.2.2. Alen có tần suất cao - Alen phổ biến ................................................... 9 1.2.3. Ý nghĩa của cơ sở dữ liệu tần suất các alen ............................................ 9 1.2.4. Cơ sở khoa học để xác định số lượng cá thể khảo sát...................... 11 1.3. KHÁI QUÁT VỀ BỘ KÍT FORENSEQ DNA SIGNATURE PREP - MIX A ............................................................................................................. 12 1.3.1. Bộ kít ForenSeqTM DNA Signature Prep .............................................. 12 1.3.2. Các locus STR trên nhiễm sắc thể thường trong bộ kít ForenSeqTM DNA Signature Prep-Mix A............................................................................ 13
  10. viii 1.4. CÔNG NGHỆ GIẢI TRÌNH TỰ ỨNG DỤNG TRONG GIÁM ĐỊNH ADN15 1.4.1. Công nghệ điện di mao quản (Capillary electrophoresis - CE) ............ 15 1.4.2. Hệ thống giải trình tự thế hệ mới MiSeq FGxTM của hãng Illumina - Hoa Kỳ ............................................................................................................ 16 1.5. TÌNH HÌNH NGHIÊN CỨU VỀ TẦN SUẤT ALEN CÁC LOCUS STR TRÊN THẾ GIỚI VÀ TRONG NƯỚC .......................................................... 19 1.5.1. Tình hình nghiên cứu trên thế giới ........................................................ 19 1.5.2. Tình hình nghiên cứu trong nước.......................................................... 22 CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU .................. 25 2.1. VẬT LIỆU NGHIÊN CỨU ..................................................................... 25 2.1.1. Đối tượng nghiên cứu............................................................................ 25 2.1.2. Hóa chất, thiết bị và dụng cụ nghiên cứu.............................................. 25 2.1.2.1. Hóa chất.............................................................................................. 25 2.1.2.2. Máy móc, thiết bị và dụng cụ............................................................. 25 2.2. PHƯƠNG PHÁP NGHIÊN CỨU............................................................ 26 2.2.1. Phương pháp thu thập mẫu máu............................................................ 27 2.2.2. Phương pháp tách chiết ADN ............................................................... 28 2.2.3. Tinh sạch ADN ..................................................................................... 29 2.2.4. Định lượng ADN ................................................................................... 29 2.2.5. Chuẩn bị thư viện mẫu và giải trình tự ADN ........................................ 30 2.2.6. Các phương pháp thu thập và xử lý số liệu thống kê ...................... 31 2.2.6.1. Xác định và tính tần suất các alen ...................................................... 32 2.2.6.2. Phương pháp kiểm định giả thiết Khi bình phương ( χ2) .................. 32
  11. ix 2.2.6.3. Các chỉ số kết hợp đánh giá giá trị bảng tần suất alen ....................... 34 CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN .................................................. 35 3.1. KẾT QUẢ XÂY DỰNG CƠ SỞ DỮ LIỆU TẦN SUẤT ALEN ........... 35 3.1.1. Kết quả thu mẫu, tách chiết và tinh sạch ADN ..................................... 35 3.1.2. Kết quả phân tích ADN ......................................................................... 36 3.1.3. Kết quả tính toán và lập bảng tần suất các alen .................................... 41 3.2. ĐÁNH GIÁ TÍNH ĐA HÌNH CỦA CÁC LOCUS ................................. 42 3.2.1. Đánh giá tính đa hình của các locus trùng với hệ Identifiler ................ 42 3.2.2.1. Locus D8S1179 .................................................................................. 42 3.2.2.2. Locus D21S11 .................................................................................... 43 3.2.2.3. Locus D7S820 .................................................................................... 44 3.2.2.4. Locus CSF1PO ................................................................................... 45 3.2.2.5. Locus D3S1358 .................................................................................. 46 3.2.2.6. Locus TH01 ........................................................................................ 46 3.2.2.7. Locus D13S317 .................................................................................. 47 3.2.2.8. Locus D16S539 .................................................................................. 48 3.2.2.9. Locus D2S1338 .................................................................................. 49 3.2.2.10. Locus D19S433 ................................................................................ 49 3.2.2.11. Locus vWA ........................................................................................ 50 3.2.2.12. Locus TPOX ..................................................................................... 51 3.2.2.13. Locus D18S51 .................................................................................. 52 3.2.2.14. Locus D5S818 .................................................................................. 53 3.2.2.15. Locus FGA ....................................................................................... 54 3.2.2. Đánh giá tính đa hình của các locus không có trong hệ Identifiler ...... 55
  12. x 3.2.3.1. Locus D1S1656 .................................................................................. 55 3.2.3.2. Locus D2S411 .................................................................................... 56 3.2.3.4. Locus D6S1043 .................................................................................. 58 3.2.3.5. Locus D9S1122 .................................................................................. 59 3.2.3.6. Locus D10S1248 ................................................................................ 59 3.2.3.7. Locus D12S391 .................................................................................. 60 3.2.3.8. Locus PentaE ..................................................................................... 61 3.2.3.9. Locus D17S1301 ................................................................................ 62 3.2.3.10. Locus D20S482 ................................................................................ 63 3.2.3.11. Locus PentaD ................................................................................... 64 3.2.3.12. Locus D22S1045 .............................................................................. 64 3.2.3. Các chỉ số đánh giá trong giám định ADN hình sự .............................. 66 3.2.4.1. Khả năng phân biệt (PD) ................................................................... 66 3.2.4.2. Khả năng loại trừ (PE) ...................................................................... 67 3.2.4.3. Chỉ số quan hệ huyết thống (PI) ........................................................ 68 3.2.4.4. Chỉ số đa hình (PIC) .......................................................................... 69 3.2.4.5. Các chỉ số kết hợp đánh giá giá trị bảng tần suất alen ....................... 70 3.3. MỘT SỐ VÍ DỤ VỀ ỨNG DỤNG KẾT QUẢ CỦA ĐỀ TÀI ................ 72 CHƯƠNG 4: KẾT LUẬN VÀ KIẾN NGHỊ .................................................. 74 KẾT LUẬN ..................................................................................................... 74 KIẾN NGHỊ .................................................................................................... 75 TÀI LIỆU THAM KHẢO ............................................................................... 76 PHỤ LỤC ....................................................................................................... 80
  13. 1 MỞ ĐẦU Tính cấp thiết của đề tài Giám định ADN là một lĩnh vực nổi bật của ngành Kỹ thuật hình sự với nhiệm vụ quan trọng là phục vụ hoạt động tố tụng. Viện Khoa học hình sự là cơ quan cấp trung ương và là một đơn vị đầu ngành của lực lượng kỹ thuật hình sự, một trung tâm khoa học của ngành Công an Việt Nam. Từ tháng 4 năm 1999, Viện Khoa học hình sự là cơ quan đầu tiên tại Việt Nam triển khai lĩnh vực giám định ADN với toàn bộ quy trình được chuyển giao từ Viện Khoa học hình sự bang Victoria - Australia với bộ kit ban đầu gồm 09 locus STR. Năm 2006 Viện Khoa học hình sự đã đưa vào ứng dụng công nghệ điện di mao dẫn (Capillary Electrophoresis - CE) với hệ thống ABI Prism 3130 Genetic Analyzer, sử dụng bộ kit Identifiler gồm 15 locus STR thay thế hệ thống điện di ABI Prism 377 DNA Sequencer trước đây. Với công nghệ CE được chuẩn hóa, Viện Khoa học hình sự đã đưa ra hàng vạn Kết luận giám định về ADN phục vụ hiệu quả cho các cơ quan điều tra, xét xử. Tuy nhiên, ứng dụng công nghệ CE trong giám định ADN hình sự vẫn tồn tại nhiều hạn chế khi các mẫu án cần phân tích là các mẫu khó như: lượng mẫu ít (vi vết), mẫu bị phân hủy, mẫu hài cốt, mẫu lẫn từ nhiều nguồn... Năm 2015 Viện Khoa học hình sự là cơ quan đầu tiên ở Việt Nam được trang bị hệ thống giải trình tự thế hệ mới của hãng Illumina - hệ thống MiSeq FGx với bộ kit ForenSeqTM DNA Signature Prep - Mix A (gồm 59 locus STR và 95 locus SNP) có khả năng khắc phục những hạn chế của công nghệ điện di mao dẫn trong lĩnh vực giám định ADN hình sự. Trong giám định ADN hình sự, việc xác định khả năng truy nguyên đồng nhất của một hồ sơ ADN để buộc tội một đối tượng nghi vấn là rất quan trọng. Để đánh giá khả năng xác suất trùng hợp ngẫu nhiên hồ sơ ADN của các cá thể khác nhau trong quần thể, các giám định viên phải tính toán dựa trên tần suất alen các locus STR được nghiên cứu, thu thập ngẫu nhiên từ các cá thể trong các quần thể người nhất định. Theo lý thuyết di truyền học, mỗi quần thể người (dân tộc, tộc người) khác nhau có những đặc điểm di truyền
  14. 2 đặc trưng, thể hiện bằng sự phân bố tần suất các alen trong mỗi quần thể là khác nhau và không thể áp dụng cơ sở dữ liệu của quần thể này cho một quần thể khác [1, 2]. Do đó, bắt buộc phải tiến hành khảo sát tần suất các alen của các locus dùng trong giám định ADN hình sự đối với mỗi dân tộc để đảm bảo tính khoa học, chính xác, khách quan trong kết luận giám định. Viện Khoa học hình sự là cơ quan tiên phong ở Việt Nam triển khai ứng dụng công nghệ giải trình tự thế hệ mới MiSeq FGx với bộ kit ForenSeqTM DNA Signature Prep - Mix A trong lĩnh vực giám định ADN. Để ứng dụng công nghệ mới, vấn đề cấp bách đặt ra phải nghiên cứu tính đa hình và xây dựng cơ sở dữ liệu tần suất các alen của các locus STR trên nhiễm sắc thể thường trong bộ kit ForenSeqTM DNA Signature Prep - Mix A, trước mắt với quần thể người dân tộc Kinh, là dân tộc chiếm gần 90% tổng số dân của Việt Nam. Kết quả nghiên cứu sẽ là căn cứ khoa học vững chắc để xây dựng cơ sở pháp lý cho việc ứng dụng công nghệ giải trình tự thế hệ mới trong giám định ADN hình sự tại Việt Nam. Để đáp ứng nhu cầu cấp bách trên, chúng tôi thực hiện đề tài "Nghiên cứu tính đa hình và tần suất các alen của 27 locus STR trên nhiễm sắc thể thường bằng bộ kit ForenSeq ứng dụng trong giám định ADN hình sự tại Việt Nam". Mục tiêu nghiên cứu của đề tài - Mục tiêu tổng quát của đề tài là xây dựng cơ sở dữ liệu tần suất alen của 27 locus STR trên nhiễm sắc thể thường trong bộ kít ForenSeqTM DNA Signature Prep - Mix A đối với quần thể người dân tộc Kinh tại Việt Nam để ứng dụng trong giám định ADN hình sự. - Mục tiêu cụ thể của đề tài là xác định tần suất các alen và đánh giá tính đa hình của 27 locus STR trên nhiễm sắc thể thường thuộc bộ kit ForenSeqTM DNA Signature Prep - Mix A từ 200 cá thể người dân tộc Kinh tại Việt Nam, từ đó đề xuất khả năng ứng dụng của bộ kit ForenSeqTM DNA Signature Prep - Mix A trong lĩnh vực giám định ADN tại Việt Nam.
  15. 3 Phạm vi nghiên cứu của đề tài Đề tài tập trung nghiên cứu, phân tích 27 locus STR trên nhiễm sắc thể thường trong bộ kit ForenSeqTM DNA Signature Prep - Mix A của 200 phạm nhân dân tộc Kinh thuộc dự án “Tàng thư gen tội phạm quốc gia" với các nội dung sau: - Thu ngẫu nhiên 200 mẫu máu của 200 phạm nhân dân tộc Kinh đã thu thập được thuộc dự án “Tàng thư gen tội phạm quốc gia”. - Phân tích ADN bằng bộ kit ForenSeqTM DNA Signature Prep - Mix A trên hệ thống giải trình tự thế hệ mới MiSeq FGx của hãng Illumina từ 200 mẫu máu người dân tộc Kinh. - Thống kê, tính toán tần suất các alen của 27 locus STR trên nhiễm sắc thể thường từ 200 kiểu gen. - Kiểm định kết quả và so sánh với tính đa hình của các bộ kit đang được sử dụng để giám định ADN hình sự tại Việt Nam. Ý nghĩa khoa học và thực tiễn của đề tài Lần đầu tiên tại Việt Nam có nghiên cứu chi tiết trên quần thể người dân tộc Kinh về tính đa hình và đưa ra bảng tần suất các alen của 27 locus STR trên nhiễm sắc thể thường thuộc bộ kit ForenSeqTM DNA Signature Prep - Mix A với số lượng mẫu đủ lớn (200 mẫu). Kết quả của đề tài là căn cứ khoa học để xây dựng cơ sở pháp lý và triển khai ứng dụng công nghệ giải trình tự thế hệ mới với bộ kit ForenSeqTM DNA Signature Prep - Mix A, đưa ra kết luận giám định trong lĩnh vực giám định ADN hình sự tại Việt Nam. Kết quả của đề tài đóng góp cho hệ thống dữ liệu quốc tế về tần suất các alen của người dân tộc Kinh tại Việt Nam.
  16. 4 CHƯƠNG 1. TỔNG QUAN TÀI LIỆU 1.1. KHÁI NIỆM VỀ CÁC LOCUS TRÌNH TỰ LẶP LẠI NGẮN (SORT TANDEM REPEAT - STR) 1.1.1. Khái niệm Cũng như ADN ở sinh vật nhân chuẩn khác, ADN nhân tế bào ở người gồm những trình tự mã hoá (các exon) xen kẽ với những trình tự không mã hoá (các intron) [2, 3]. Tuỳ mức độ hiện diện của chúng trong nhân, các trình tự ADN có thể được phân loại như sau: - Các trình tự duy nhất: là các gen mã hoá cho các protein có trình tự đặc trưng cho từng gen. - Các trình tự có số lần lặp lại trung bình: chiếm khoảng 25 - 40% bộ gen người, chúng có kích thước từ 100 - 1.000 kb, đa dạng hơn các trình tự lặp lại nhiều lần. Các trình tự này không tập trung mà phân tán trên toàn bộ hệ gen. Chúng có thể là những trình tự không mã hoá với chức năng chưa rõ hoặc cũng có thể là những trình tự mã hoá (các gen mã hoá cho ARN riboxom, ARN vận chuyển...). - Các trình tự lặp lại nhiều lần: Chiếm 10 - 15% bộ gen. Đó là những trình tự ADN ngắn (10 - 200 kb), không mã hoá, thường tập trung ở những vùng chuyên biệt trên nhiễm sắc thể (vùng tâm động, vùng đầu nhiễm sắc thể). Các đoạn ADN (locus) được sử dụng trong giám định hình sự là các locus nằm ở vùng không mã hoá (intron) của ADN. Thời kỳ đầu của công nghệ giám định ADN trong nhân tế bào, người ta áp dụng các kỹ thuật phân tích các locus có đoạn lặp trung bình (Variable Number of Tandem Repeat – VNTR hay Minisatellite). Nhưng những kỹ thuật này chỉ áp dụng được với từng locus riêng lẻ (single locus) và phụ thuộc vào thao tác kỹ thuật của người thực hiện nên dễ xảy ra sai sót. Từ năm 1990 cho tới nay các nhà khoa học hình sự sử dụng các kỹ thuật phân tích các đoạn ADN có cấu trúc lặp lại từ 2 bp - 6 bp được gọi là các đoạn lặp lại ngắn (Short Tandem Repeat - STR hay Microsatellite) vì
  17. 5 chúng khá bền vững, có khả năng phân tích đồng thời nhiều locus, ít phụ thuộc vào thao tác kỹ thuật của người thực hiện. Số lần các đoạn lặp có thể khác nhau rất nhiều giữa các cá thể, chính đặc điểm này mang lại giá trị trong truy nguyên cá thể [4, 5]. Các cấu trúc VNTR hay STR đều mang tính bảo thủ cao, được di truyền qua các thế hệ và mang tính đặc trưng cho cá thể. Như vậy, có thể hiểu các locus trình tự lặp lại ngắn ( Short Tandem Repeat - STR) là các đoạn ADN có cấu trúc lặp lại từ 2 bp - 6 bp. Để một locus STR sử dụng trong giám định ADN, với mục đích truy nguyên cá thể và xác định huyết thống, phải thỏa mãn những yêu cầu sau: Thứ nhất, các locus STR phải có tính đa hình và mức độ dị hợp tử cao. Thứ hai, các locus STR có kích thước ngắn từ 100 bp - 500 bp, do các đoạn ADN ngắn sẽ bền vững hơn, ít bị đứt gãy hơn khi có tác động của điều kiện tự nhiên và quá trình nhân bản ADN dễ dàng hơn, có hiệu suất cao hơn đối với các đoạn ADN dài. Đối với những đoạn ADN có tính đa hình cao nhưng kích thước lớn, trong thực tế chỉ có thể thực hiện kỹ thuật PCR cho ra kết quả tốt với những mẫu dấu vết, mẫu so sánh còn mới hoặc được bảo quản trong những điều kiện tốt. Thứ ba, các locus dùng trong giám định ADN hình sự thường phải di truyền độc lập nhau. Như vậy chúng phải nằm trên các nhiễm sắc thể khác nhau, điều này đảm bảo cho tính phân ly độc lập của từng locus dẫn tới tính đa hình kiểu gen trong quần thể [6, 7]. Vì những lý do trên, những trình tự lặp lại chứa các đơn vị lặp lại gồm 4 nucleotit, ví dụ (AGTA)n được ứng dụng nhiều hơn so với các đoạn lặp hình thành từ 2 hoặc 3 nucleotit, ví dụ (CAA)n, (CA)n hoặc những đoạn đa hình hình thành từ các đoạn lặp chứa các đơn vị lặp lại gồm 5 nucleotit ví dụ (CCAAG)n hoặc 6 nucleotit như (CCAACA)n. Ngày nay, nhiều đoạn ADN đa hình có trình tự lặp lại bộ 4 nucleotit đã được nghiên cứu và ứng dụng trong nhận dạng do nó đáp ứng được những yêu cầu của công tác giám định ADN. Một locus STR trong nhân tế bào thường được lựa chọn để sử dụng trong giám định ADN hình sự nếu nó có nhiều alen khác nhau trong quần
  18. 6 thể (nhiều hơn 5 alen) và số các cá thể dị hợp tử trong quần thể lớn hơn 70% [8, 9]. Càng nhiều locus STR được phân tích thì khả năng kết luận mẫu dấu vết có cùng một nguồn gốc cơ thể của một người nào đó càng cao. 1.1.2. Danh pháp quốc tế của các locus STR Tên các locus STR được đặt theo tên của gen nếu locus này nằm một phần hoặc nằm toàn bộ trong gen [10]. Ví dụ locus STR TH01 có nguồn gốc từ tên gen tổng hợp enzym tyrosine hydroxylase của người, nằm trên NST số 11. Chữ "TH" xuất phát từ chữ cái đầu tyrosine hydroxylase. Số "01" của ký hiệu "TH01" xuất phát từ vùng intron 1 của gen tổng hợp enzym này. Đôi khi tiết đầu ngữ HUM (human) được thêm vào đầu tên của locus này để xác định đó là từ hệ gen người. Vì vậy, locus STR này được đặt tên là HUM - TH01 hay TH01. Hình 1.1. Vị trí một số locus trên nhiễm sắc thể sử dụng trong giám định ADN của một số bộ kít phổ biến hiện nay [11] Các trình tự ADN nằm ngoài vùng gen được định tên bằng vị trí của chúng trên NST. Ví dụ, locus D5S818 và D7S820 đó là những tên gọi cho các locus STR không nằm trong vùng gen. Trong trường hợp này chữ D có nghĩa
  19. 7 là ADN. Chữ số tiếp theo là số thứ tự của NST. Chữ "S" là trình tự đơn lẻ (single) của locus ADN. Những số cuối là vị trí trình tự đoạn ADN nằm trên mỗi NST riêng biệt. Chữ số này là duy nhất trong nhận dạng cá thể. Ví dụ, locus ADN D7S820 (Hình 1.1) được giải nghĩa là D: ADN, 7: NST số 7, S: trình tự đơn lẻ (single copy sequence), 820: vị trí thứ 820 xác định trên NST số 7 [8]. 1.2. CƠ SỞ DỮ LIỆU TẦN SUẤT CÁC ALEN 1.2.1. Khái niệm cơ sở dữ liệu tần suất các alen Cơ sở dữ liệu tần suất các alen là bảng tần số tương đối của các alen trên một locus di truyền trong quần thể, thông thường được thể hiện dưới dạng tỷ lệ hoặc tỷ lệ phần trăm. Để phân tích kết quả giám định ADN, một yếu tố quan trọng không thể thiếu là cơ sở dữ liệu tần suất alen trong quần thể (Allele Frequency of Population) đặc trưng cho mỗi quần thể. Việc xác định kiểu gen của tất cả các cá thể (người) sống trên hành tinh là điều không tưởng, do đó cần đến cơ sở dữ liệu thu được từ quá trình khảo sát những mẫu hữu hạn thường là một tập hợp quần thể nhất định để có được số liệu tần suất các alen trong quần thể. Các phòng giám định cần phải thu mẫu ngẫu nhiên (tức không có quan hệ về huyết thống) từ những vùng miền khác nhau có tính đại diện cao, số lượng mẫu đủ lớn tuỳ thuộc vào số lượng dân số của tộc người cần khảo sát [11]. Việc khảo sát bao nhiêu locus tùy thuộc vào từng phòng giám định là sử dụng bộ kit phân tích nào, chẳng hạn bộ kit: Identifiler, Powerplex, hoặc Profiler Plus… Việt Nam có đến 54 tộc người (Ethnic groups), trong đó tộc người Kinh chiếm đến 87,3%, các tộc người khác chỉ chiếm 12,7% còn lại, ví dụ: Tày: 960 nghìn người, Hoa: 930 nghìn người, Khmer: 720 nghìn ngư- ời, Mường: 700 nghìn người, Mông: 441 nghìn người… Các tộc người có số lượng tương đối lớn kể trên đều phải được khảo sát tần suất alen, thậm chí còn nghiên cứu đến cả sự pha tạp giữa các tộc người khác nhau để tìm mối quan hệ giữa chúng biểu hiện thông qua tần suất alen và các chỉ số khác.
  20. 8 1.2.2. Tần suất các alen 1.2.2.1. Alen có tần suất thấp Để xác định chính xác tần suất của một alen, cần phải thu thập được nhiều hơn một giới hạn nhỏ nhất nào đó cho mẫu cá thể mang alen đó. Tần suất alen tối thiểu được quy định để đảm bảo rằng một alen đã được lấy đủ mẫu trong một tập hợp mẫu ngẫu nhiên trong quá trình nghiên cứu. Alen của một locus STR của một tộc người nào đó có thể không có trong bảng tần suất và do vậy, thuật ngữ tần suất alen hiếm đã được sử dụng. Tần suất của alen hiếm được thiết lập ở mức thấp hơn tần suất alen thấp nhất trong cơ sở dữ liệu alen. "Hội đồng Viện Nghiên cứu Quốc gia, Đánh giá Chứng cứ pháp lý ADN" của Mỹ - (The National Research Council, Evaluation of Forensic DNA Evidence) đã đề xuất sử dụng tần suất alen thấp nhất nên điều chỉnh là 5/2N (trong đó N là kích cỡ mẫu của cơ sở dữ liệu). Vì vậy, alen có tần suất thấp có giá trị thấp hơn tần suất alen thấp nhất (5/2N) theo quy ước trong cơ sở dữ liệu. Trong các nghiên cứu trước đây, các alen chưa xuất hiện trong quần thể nghiên cứu được gán cho giá trị 1/2N (N là số cá thể của quần thể nghiên cứu) và được phần mềm xây dựng mã hóa cố định giá trị đó. Trong một số phần mềm tính toán có thể mặc định tần suất cực tiểu là 0,001 [12, 13]. Với các locus STR sử dụng trong khoa học hình sự, tất cả các locus gen đều là những đoạn không mang thông tin di truyền, đại đa số chúng nằm ở những đoạn intron của gen hoặc những vùng trình tự không mang gen. Do đó, khái niệm alen hiếm được sử dụng trong một số trường hợp là không hoàn toàn chính xác. Chúng tôi đưa ra tên gọi là alen có tần suất thấp khi giá trị tần suất tính được thấp hơn giá trị mặc định 0,001 (0,1%). Những alen có tần suất thấp trong các locus STR thường có giá trị truy nguyên cao hơn các alen có tần suất cao (alen phổ biến).
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
9=>0