BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

-------------

Phạm Ngọc Sơn

NGHIÊN CỨU TÍNH ĐA HÌNH VÀ TẦN SUẤT CÁC ALEN CỦA 27 LOCUS STR TRÊN NHIỄM SẮC THỂ THƯỜNG BẰNG BỘ KIT FORENSEQ ỨNG DỤNG TRONG GIÁM ĐỊNH ADN HÌNH SỰ TẠI VIỆT NAM

LUẬN VĂN THẠC SĨ: SINH HỌC THỰC NGHIỆM

Hà Nội - 2020

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

------------

Phạm Ngọc Sơn

NGHIÊN CỨU TÍNH ĐA HÌNH VÀ TẦN SUẤT CÁC ALEN CỦA 27 LOCUS STR TRÊN NHIỄM SẮC THỂ THƯỜNG BẰNG BỘ KIT FORENSEQ ỨNG DỤNG TRONG GIÁM ĐỊNH ADN HÌNH SỰ TẠI VIỆT NAM

Chuyên ngành: Sinh học thực nghiệm

Mã số: 8420114

LUẬN VĂN THẠC SĨ SINH HỌC THỰC NGHIỆM

NGƯỜI HƯỚNG DẪN KHOA HỌC

Hướng dẫn 1: PGS. TS. Phí Quyết Tiến

Hướng dẫn 2: PGS. TS. Nguyễn Văn Hà

Hà Nội - 2020

i

Lời cam đoan

Tôi xin cam đoan những nội dung viết trong luận văn là do sự tìm tòi, học hỏi của bản thân với sự hướng dẫn tận tình của PGS. TS. Phí Quyết Tiến, PGS. TS. Nguyễn Văn Hà và các đồng nghiệp tại Trung tâm Giám định sinh học, Viện Khoa học hình sự và Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Mọi kết quả nghiên cứu cũng như ý tưởng của tác giả khác, nếu có đều được trích dẫn cụ thể. Đề tài luận văn này cho đến nay chưa được bảo vệ tại bất kỳ một hội đồng bảo vệ luận văn thạc sĩ nào và cũng chưa hề được công bố trên bất kỳ một phương tiện nào. Tôi xin chịu trách nhiệm về những lời cam đoan trên.

Hà Nội, ngày tháng 8 năm 2020

Người cam đoan

Phạm Ngọc Sơn

ii

Lời cảm ơn

Để hoàn thành được Luận văn cao học này, tôi xin bày tỏ lời cảm ơn sâu sắc tới PGS. TS. Phí Quyết Tiến và PGS. TS. Nguyễn Văn Hà đã trực tiếp định hướng, tận tình hướng dẫn tôi.

Tôi xin cảm ơn tập thể lãnh đạo Viện Khoa học hình sự, lãnh đạo và cán bộ Phòng Tham mưu và Trung tâm giám định Sinh học - Viện Khoa học hình sự đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập và làm nghiên cứu đề tài.

Tôi xin trân trọng gửi lời cảm ơn tới ban lãnh đạo cùng các thầy cô giáo Khoa Công nghệ sinh học, Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã truyền đạt kiến thức và giúp đỡ tôi trong suốt quá trình học tập và thực hiện luận văn.

Cuối cùng tôi xin bày tỏ lòng biết ơn đến gia đình, người thân, bạn bè và đồng nghiệp - những người đã luôn động viên, tạo điều kiện cho tôi hoàn thành khóa học này./.

Học viên

Phạm Ngọc Sơn

iii

Danh mục các ký hiệu và chữ viết tắt

Chữ viết tắt Nội dung

ADN Axít deoxyribonucleic

Base pair (cặp bazơ) bp

Capillary Electrophoresis (Điện di mao dẫn) CE

FSA

ForenSeqTM DNA Signature Prep - Mix A (tên bộ kít phân tích ADN của hãng Illumina)

Tên riêng của một loại giấy thu mẫu máu (dạng thẻ) FTA

ID

IdentifilerTM (tên bộ kít phân tích ADN của hãng Thermo Fisher)

Nhiễm sắc thể NST

Polymerase Chain Reaction (Phản ứng chuỗi polymerase) PCR

Single Nucleotide Polymorphism (Đa hình đơn nucleotit) SNP

Short Tandem Repeat (Các trình tự lặp ngắn) STR

VNTR

Variable Number of Tandem Repeat (Các trình tự lặp trung bình)

iv

Danh mục các bảng

Bảng 1.1: Tần suất tối thiểu của một alen thay đổi tương ứng với số lượng mẫu khảo sát .................................................................................................... 11

Bảng 1.2: Các locus STR trên nhiễm sắc thể thường có trong bộ kit ForenSeq DNA Signature Prep - Mix A [25] ................................................................. 14

Bảng 3.1. Kết quả định lượng ADN bằng phương pháp Realtime PCR ........35

Bảng 3.2. So sánh tần suất alen (%) của locus D8S1179 ............................... 43

Bảng 3.3. So sánh tần suất alen (%) của locus D21S11 ................................. 44

Bảng 3.4. So sánh tần suất alen (%) của locus D7S820 ................................. 45

Bảng 3.5. So sánh tần suất alen (%) của locus CSF1PO ................................ 45

Bảng 3.6. So sánh tần suất alen (%) của locus D3S1358 .............................. 46

Bảng 3.7. So sánh tần suất alen (%) của locus TH01 ..................................... 47

Bảng 3.8. So sánh tần suất alen (%) của locus D13S317 ............................... 47

Bảng 3.9. So sánh tần suất alen (%) của locus D16S539 ............................... 48

Bảng 3.10. So sánh tần suất alen (%) của locus D2S1338 ............................. 49

Bảng 3.11. So sánh tần suất alen (%) của locus D19S433 ............................. 50

Bảng 3.12. So sánh tần suất alen (%) của locus vWA .................................... 50

Bảng 3.13. So sánh tần suất alen (%) của locus TPOX .................................. 51

Bảng 3.14. So sánh tần suất alen (%) của locus D18S51 ............................... 52

Bảng 3.15. So sánh tần suất alen (%) của locus D5S818 ............................... 53

Bảng 3.16. So sánh tần suất alen (%) của locus FGA..................................... 54

Bảng 3.17. So sánh tần suất alen (%) của locus D1S1656 ............................. 56

Bảng 3.18. So sánh tần suất alen (%) của locus D2S411 ............................... 57

Bảng 3.19. So sánh tần suất alen (%) của locus D4S2408 ............................. 57

Bảng 3.20. So sánh tần suất alen (%) của locus D6S1043 ............................. 58

v

Bảng 3.21. So sánh tần suất alen (%) của locus D9S1122 ............................. 59

Bảng 3.22. So sánh tần suất alen (%) của locus D10S1248 ........................... 59

Bảng 3.23. So sánh tần suất alen (%) của locus D12S391 ............................. 60

Bảng 3.24. So sánh tần suất alen (%) của locus PentaE ................................. 61

Bảng 3.25. So sánh tần suất alen (%) của locus D17S1301 ........................... 62

Bảng 3.26. So sánh tần suất alen (%) của locus D20S482 ............................. 63

Bảng 3.27. So sánh tần suất alen (%) của locus PentaD ................................. 64

Bảng 3.28. So sánh tần suất alen (%) của locus D22S1045 ........................... 65

Bảng 3.29. Tổng hợp và so sánh các chỉ số đánh giá bảng tần suất ............... 71

vi

Danh mục các hình ảnh

Hình 1.1. Vị trí một số locus trên nhiễm sắc thể sử dụng trong giám định ADN của một số bộ kít phổ biến hiện nay ........................................................ 6

Hình 1.2. Hình ảnh máy điện di mao quản ABI 3130xl ................................. 16

Hình 1.3. Quy trình giải trình tự thế hệ mới của Illumina .............................. 17

Hình 1.4. Hình ảnh máy giải trình tự thế hệ mới MiSeq FGxTM .................... 24

Hình 2.1. Sơ đồ nghiên cứu ............................................................................. 26

Hình 2.2. Thẻ FTA dùng để thu mẫu máu ...................................................... 27

Hình 2.3. Danh bản ghi thông tin cá nhân ...................................................... 28

Hình 2.4. Hình ảnh mô tả quá trình chuẩn bị thư viện mẫu ............................ 31

Hình 3.1. Mẫu máu được thu vào giấy FTA và thông tin cá nhân ................. 36

Hình 3.2. Hình ảnh báo cáo kết quả phân tích mẫu đối chứng dương ............ 37

Hình 3.3. Hình ảnh báo cáo kết quả phân tích mẫu M001 ............................. 38

Hình 3.4. Hình ảnh báo cáo chi tiết kiểu gen mẫu đối chứng dương ............. 39

Hình 3.5. Hình ảnh báo cáo chi tiết kiểu gen mẫu M001 ............................... 40

Hình 3.6. Biểu đồ so sánh chỉ số PD ............................................................... 66

Hình 3.7. Biểu đồ so sánh chỉ số PE ............................................................... 67

Hình 3.8. Biểu đồ so sánh chỉ số PI ................................................................ 68

Hình 3.9. Biểu đồ so sánh chỉ số PIC ............................................................. 69

vii

MỤC LỤC

Trang

Lời cam đoan ...................................................................................................... i

Lời cảm ơn ........................................................................................................ ii

Danh mục các ký hiệu và chữ viết tắt .............................................................. iii

Danh mục các bảng .......................................................................................... iv

Danh mục các hình ảnh .................................................................................... vi

MỞ ĐẦU ........................................................................................................... 1

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU ........................................................... 4

1.1. KHÁI NIỆM VỀ CÁC LOCUS TRÌNH TỰ LẶP LẠI NGẮN (SORT

TANDEM REPEAT - STR).............................................................................. 4

1.1.1. Khái niệm ................................................................................................ 4

1.1.2. Danh pháp quốc tế của các locus STR ................................................... 6

1.2. CƠ SỞ DỮ LIỆU TẦN SUẤT CÁC ALEN ............................................. 7

1.2.1. Khái niệm cơ sở dữ liệu tần suất các alen ............................................... 7

1.2.2. Tần suất các alen ..................................................................................... 8

1.2.2.1. Alen có tần suất thấp ............................................................................ 8

1.2.2.2. Alen có tần suất cao - Alen phổ biến ................................................... 9

1.2.3. Ý nghĩa của cơ sở dữ liệu tần suất các alen ............................................ 9

1.2.4. Cơ sở khoa học để xác định số lượng cá thể khảo sát ...................... 11

1.3. KHÁI QUÁT VỀ BỘ KÍT FORENSEQ DNA SIGNATURE PREP -

MIX A ............................................................................................................. 12

1.3.1. Bộ kít ForenSeqTM DNA Signature Prep .............................................. 12

1.3.2. Các locus STR trên nhiễm sắc thể thường trong bộ kít ForenSeqTM

DNA Signature Prep-Mix A............................................................................ 13

viii

1.4. CÔNG NGHỆ GIẢI TRÌNH TỰ ỨNG DỤNG TRONG GIÁM ĐỊNH ADN15

1.4.1. Công nghệ điện di mao quản (Capillary electrophoresis - CE) ............ 15

của hãng Illumina -

1.4.2. Hệ thống giải trình tự thế hệ mới MiSeq FGxTM

Hoa Kỳ ............................................................................................................ 16

1.5. TÌNH HÌNH NGHIÊN CỨU VỀ TẦN SUẤT ALEN CÁC LOCUS STR

TRÊN THẾ GIỚI VÀ TRONG NƯỚC .......................................................... 19

1.5.1. Tình hình nghiên cứu trên thế giới ........................................................ 19

1.5.2. Tình hình nghiên cứu trong nước .......................................................... 22

CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU .................. 25

2.1. VẬT LIỆU NGHIÊN CỨU ..................................................................... 25

2.1.1. Đối tượng nghiên cứu............................................................................ 25

2.1.2. Hóa chất, thiết bị và dụng cụ nghiên cứu .............................................. 25

2.1.2.1. Hóa chất.............................................................................................. 25

2.1.2.2. Máy móc, thiết bị và dụng cụ ............................................................. 25

2.2. PHƯƠNG PHÁP NGHIÊN CỨU ............................................................ 26

2.2.1. Phương pháp thu thập mẫu máu ............................................................ 27

2.2.2. Phương pháp tách chiết ADN ............................................................... 28

2.2.3. Tinh sạch ADN ..................................................................................... 29

2.2.4. Định lượng ADN ................................................................................... 29

2.2.5. Chuẩn bị thư viện mẫu và giải trình tự ADN ........................................ 30

2.2.6. Các phương pháp thu thập và xử lý số liệu thống kê ...................... 31

2.2.6.1. Xác định và tính tần suất các alen ...................................................... 32

2.2.6.2. Phương pháp kiểm định giả thiết Khi bình phương ( χ2) .................. 32

ix

2.2.6.3. Các chỉ số kết hợp đánh giá giá trị bảng tần suất alen ....................... 34

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN .................................................. 35

3.1. KẾT QUẢ XÂY DỰNG CƠ SỞ DỮ LIỆU TẦN SUẤT ALEN ........... 35

3.1.1. Kết quả thu mẫu, tách chiết và tinh sạch ADN ..................................... 35

3.1.2. Kết quả phân tích ADN ......................................................................... 36

3.1.3. Kết quả tính toán và lập bảng tần suất các alen .................................... 41

3.2. ĐÁNH GIÁ TÍNH ĐA HÌNH CỦA CÁC LOCUS ................................. 42

3.2.1. Đánh giá tính đa hình của các locus trùng với hệ Identifiler ................ 42

3.2.2.1. Locus D8S1179 .................................................................................. 42

3.2.2.2. Locus D21S11 .................................................................................... 43

3.2.2.3. Locus D7S820 .................................................................................... 44

3.2.2.4. Locus CSF1PO ................................................................................... 45

3.2.2.5. Locus D3S1358 .................................................................................. 46

3.2.2.6. Locus TH01 ........................................................................................ 46

3.2.2.7. Locus D13S317 .................................................................................. 47

3.2.2.8. Locus D16S539 .................................................................................. 48

3.2.2.9. Locus D2S1338 .................................................................................. 49

3.2.2.10. Locus D19S433 ................................................................................ 49

3.2.2.11. Locus vWA ........................................................................................ 50

3.2.2.12. Locus TPOX ..................................................................................... 51

3.2.2.13. Locus D18S51 .................................................................................. 52

3.2.2.14. Locus D5S818 .................................................................................. 53

3.2.2.15. Locus FGA ....................................................................................... 54

3.2.2. Đánh giá tính đa hình của các locus không có trong hệ Identifiler ...... 55

x

3.2.3.1. Locus D1S1656 .................................................................................. 55

3.2.3.2. Locus D2S411 .................................................................................... 56

3.2.3.4. Locus D6S1043 .................................................................................. 58

3.2.3.5. Locus D9S1122 .................................................................................. 59

3.2.3.6. Locus D10S1248 ................................................................................ 59

3.2.3.7. Locus D12S391 .................................................................................. 60

3.2.3.8. Locus PentaE ..................................................................................... 61

3.2.3.9. Locus D17S1301 ................................................................................ 62

3.2.3.10. Locus D20S482 ................................................................................ 63

3.2.3.11. Locus PentaD ................................................................................... 64

3.2.3.12. Locus D22S1045 .............................................................................. 64

3.2.3. Các chỉ số đánh giá trong giám định ADN hình sự .............................. 66

3.2.4.1. Khả năng phân biệt (PD) ................................................................... 66

3.2.4.2. Khả năng loại trừ (PE) ...................................................................... 67

3.2.4.3. Chỉ số quan hệ huyết thống (PI) ........................................................ 68

3.2.4.4. Chỉ số đa hình (PIC) .......................................................................... 69

3.2.4.5. Các chỉ số kết hợp đánh giá giá trị bảng tần suất alen ....................... 70

3.3. MỘT SỐ VÍ DỤ VỀ ỨNG DỤNG KẾT QUẢ CỦA ĐỀ TÀI ................ 72

CHƯƠNG 4: KẾT LUẬN VÀ KIẾN NGHỊ .................................................. 74

KẾT LUẬN ..................................................................................................... 74

KIẾN NGHỊ .................................................................................................... 75

TÀI LIỆU THAM KHẢO ............................................................................... 76

PHỤ LỤC ....................................................................................................... 80

1

MỞ ĐẦU

Tính cấp thiết của đề tài

Giám định ADN là một lĩnh vực nổi bật của ngành Kỹ thuật hình sự với nhiệm vụ quan trọng là phục vụ hoạt động tố tụng. Viện Khoa học hình sự là cơ quan cấp trung ương và là một đơn vị đầu ngành của lực lượng kỹ thuật hình sự, một trung tâm khoa học của ngành Công an Việt Nam. Từ tháng 4 năm 1999, Viện Khoa học hình sự là cơ quan đầu tiên tại Việt Nam triển khai lĩnh vực giám định ADN với toàn bộ quy trình được chuyển giao từ Viện Khoa học hình sự bang Victoria - Australia với bộ kit ban đầu gồm 09 locus STR.

Năm 2006 Viện Khoa học hình sự đã đưa vào ứng dụng công nghệ điện di mao dẫn (Capillary Electrophoresis - CE) với hệ thống ABI Prism 3130 Genetic Analyzer, sử dụng bộ kit Identifiler gồm 15 locus STR thay thế hệ thống điện di ABI Prism 377 DNA Sequencer trước đây. Với công nghệ CE được chuẩn hóa, Viện Khoa học hình sự đã đưa ra hàng vạn Kết luận giám định về ADN phục vụ hiệu quả cho các cơ quan điều tra, xét xử. Tuy nhiên, ứng dụng công nghệ CE trong giám định ADN hình sự vẫn tồn tại nhiều hạn chế khi các mẫu án cần phân tích là các mẫu khó như: lượng mẫu ít (vi vết), mẫu bị phân hủy, mẫu hài cốt, mẫu lẫn từ nhiều nguồn...

Năm 2015 Viện Khoa học hình sự là cơ quan đầu tiên ở Việt Nam được trang bị hệ thống giải trình tự thế hệ mới của hãng Illumina - hệ thống MiSeq FGx với bộ kit ForenSeqTM DNA Signature Prep - Mix A (gồm 59 locus STR và 95 locus SNP) có khả năng khắc phục những hạn chế của công nghệ điện di mao dẫn trong lĩnh vực giám định ADN hình sự.

Trong giám định ADN hình sự, việc xác định khả năng truy nguyên đồng nhất của một hồ sơ ADN để buộc tội một đối tượng nghi vấn là rất quan trọng. Để đánh giá khả năng xác suất trùng hợp ngẫu nhiên hồ sơ ADN của các cá thể khác nhau trong quần thể, các giám định viên phải tính toán dựa trên tần suất alen các locus STR được nghiên cứu, thu thập ngẫu nhiên từ các cá thể trong các quần thể người nhất định. Theo lý thuyết di truyền học, mỗi quần thể người (dân tộc, tộc người) khác nhau có những đặc điểm di truyền

2

đặc trưng, thể hiện bằng sự phân bố tần suất các alen trong mỗi quần thể là khác nhau và không thể áp dụng cơ sở dữ liệu của quần thể này cho một quần thể khác [1, 2]. Do đó, bắt buộc phải tiến hành khảo sát tần suất các alen của các locus dùng trong giám định ADN hình sự đối với mỗi dân tộc để đảm bảo tính khoa học, chính xác, khách quan trong kết luận giám định.

Viện Khoa học hình sự là cơ quan tiên phong ở Việt Nam triển khai ứng dụng công nghệ giải trình tự thế hệ mới MiSeq FGx với bộ kit ForenSeqTM DNA Signature Prep - Mix A trong lĩnh vực giám định ADN. Để ứng dụng công nghệ mới, vấn đề cấp bách đặt ra phải nghiên cứu tính đa hình và xây dựng cơ sở dữ liệu tần suất các alen của các locus STR trên nhiễm sắc thể thường trong bộ kit ForenSeqTM DNA Signature Prep - Mix A, trước mắt với quần thể người dân tộc Kinh, là dân tộc chiếm gần 90% tổng số dân của Việt Nam. Kết quả nghiên cứu sẽ là căn cứ khoa học vững chắc để xây dựng cơ sở pháp lý cho việc ứng dụng công nghệ giải trình tự thế hệ mới trong giám định ADN hình sự tại Việt Nam.

Để đáp ứng nhu cầu cấp bách trên, chúng tôi thực hiện đề tài "Nghiên cứu tính đa hình và tần suất các alen của 27 locus STR trên nhiễm sắc thể thường bằng bộ kit ForenSeq ứng dụng trong giám định ADN hình sự tại Việt Nam".

Mục tiêu nghiên cứu của đề tài

- Mục tiêu tổng quát của đề tài là xây dựng cơ sở dữ liệu tần suất alen của 27 locus STR trên nhiễm sắc thể thường trong bộ kít ForenSeqTM DNA Signature Prep - Mix A đối với quần thể người dân tộc Kinh tại Việt Nam để ứng dụng trong giám định ADN hình sự.

- Mục tiêu cụ thể của đề tài là xác định tần suất các alen và đánh giá tính đa hình của 27 locus STR trên nhiễm sắc thể thường thuộc bộ kit ForenSeqTM DNA Signature Prep - Mix A từ 200 cá thể người dân tộc Kinh tại Việt Nam, từ đó đề xuất khả năng ứng dụng của bộ kit ForenSeqTM DNA Signature Prep - Mix A trong lĩnh vực giám định ADN tại Việt Nam.

3

Phạm vi nghiên cứu của đề tài

Đề tài tập trung nghiên cứu, phân tích 27 locus STR trên nhiễm sắc thể thường trong bộ kit ForenSeqTM DNA Signature Prep - Mix A của 200 phạm nhân dân tộc Kinh thuộc dự án “Tàng thư gen tội phạm quốc gia" với các nội dung sau:

- Thu ngẫu nhiên 200 mẫu máu của 200 phạm nhân dân tộc Kinh đã thu

thập được thuộc dự án “Tàng thư gen tội phạm quốc gia”.

- Phân tích ADN bằng bộ kit ForenSeqTM DNA Signature Prep - Mix A trên hệ thống giải trình tự thế hệ mới MiSeq FGx của hãng Illumina từ 200 mẫu máu người dân tộc Kinh.

- Thống kê, tính toán tần suất các alen của 27 locus STR trên nhiễm sắc

thể thường từ 200 kiểu gen.

- Kiểm định kết quả và so sánh với tính đa hình của các bộ kit đang

được sử dụng để giám định ADN hình sự tại Việt Nam.

Ý nghĩa khoa học và thực tiễn của đề tài

Lần đầu tiên tại Việt Nam có nghiên cứu chi tiết trên quần thể người dân tộc Kinh về tính đa hình và đưa ra bảng tần suất các alen của 27 locus STR trên nhiễm sắc thể thường thuộc bộ kit ForenSeqTM DNA Signature Prep - Mix A với số lượng mẫu đủ lớn (200 mẫu).

Kết quả của đề tài là căn cứ khoa học để xây dựng cơ sở pháp lý và triển khai ứng dụng công nghệ giải trình tự thế hệ mới với bộ kit ForenSeqTM DNA Signature Prep - Mix A, đưa ra kết luận giám định trong lĩnh vực giám định ADN hình sự tại Việt Nam.

Kết quả của đề tài đóng góp cho hệ thống dữ liệu quốc tế về tần suất

các alen của người dân tộc Kinh tại Việt Nam.

4

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU

1.1. KHÁI NIỆM VỀ CÁC LOCUS TRÌNH TỰ LẶP LẠI NGẮN (SORT TANDEM REPEAT - STR)

1.1.1. Khái niệm

Cũng như ADN ở sinh vật nhân chuẩn khác, ADN nhân tế bào ở người gồm những trình tự mã hoá (các exon) xen kẽ với những trình tự không mã hoá (các intron) [2, 3]. Tuỳ mức độ hiện diện của chúng trong nhân, các trình tự ADN có thể được phân loại như sau:

- Các trình tự duy nhất: là các gen mã hoá cho các protein có trình tự

đặc trưng cho từng gen.

- Các trình tự có số lần lặp lại trung bình: chiếm khoảng 25 - 40% bộ gen người, chúng có kích thước từ 100 - 1.000 kb, đa dạng hơn các trình tự lặp lại nhiều lần. Các trình tự này không tập trung mà phân tán trên toàn bộ hệ gen. Chúng có thể là những trình tự không mã hoá với chức năng chưa rõ hoặc cũng có thể là những trình tự mã hoá (các gen mã hoá cho ARN riboxom, ARN vận chuyển...).

- Các trình tự lặp lại nhiều lần: Chiếm 10 - 15% bộ gen. Đó là những trình tự ADN ngắn (10 - 200 kb), không mã hoá, thường tập trung ở những vùng chuyên biệt trên nhiễm sắc thể (vùng tâm động, vùng đầu nhiễm sắc thể).

Các đoạn ADN (locus) được sử dụng trong giám định hình sự là các locus nằm ở vùng không mã hoá (intron) của ADN. Thời kỳ đầu của công nghệ giám định ADN trong nhân tế bào, người ta áp dụng các kỹ thuật phân tích các locus có đoạn lặp trung bình (Variable Number of Tandem Repeat – VNTR hay Minisatellite). Nhưng những kỹ thuật này chỉ áp dụng được với từng locus riêng lẻ (single locus) và phụ thuộc vào thao tác kỹ thuật của người thực hiện nên dễ xảy ra sai sót.

Từ năm 1990 cho tới nay các nhà khoa học hình sự sử dụng các kỹ thuật phân tích các đoạn ADN có cấu trúc lặp lại từ 2 bp - 6 bp được gọi là các đoạn lặp lại ngắn (Short Tandem Repeat - STR hay Microsatellite) vì

5

chúng khá bền vững, có khả năng phân tích đồng thời nhiều locus, ít phụ thuộc vào thao tác kỹ thuật của người thực hiện. Số lần các đoạn lặp có thể khác nhau rất nhiều giữa các cá thể, chính đặc điểm này mang lại giá trị trong truy nguyên cá thể [4, 5]. Các cấu trúc VNTR hay STR đều mang tính bảo thủ cao, được di truyền qua các thế hệ và mang tính đặc trưng cho cá thể.

Short Tandem Repeat

Như vậy, có thể hiểu các locus trình tự lặp lại ngắn ( - STR) là các đoạn ADN có cấu trúc lặp lại từ 2 bp - 6 bp.

Để một locus STR sử dụng trong giám định ADN, với mục đích truy

nguyên cá thể và xác định huyết thống, phải thỏa mãn những yêu cầu sau:

Thứ nhất, các locus STR phải có tính đa hình và mức độ dị hợp tử cao.

Thứ hai, các locus STR có kích thước ngắn từ 100 bp - 500 bp, do các đoạn ADN ngắn sẽ bền vững hơn, ít bị đứt gãy hơn khi có tác động của điều kiện tự nhiên và quá trình nhân bản ADN dễ dàng hơn, có hiệu suất cao hơn đối với các đoạn ADN dài. Đối với những đoạn ADN có tính đa hình cao nhưng kích thước lớn, trong thực tế chỉ có thể thực hiện kỹ thuật PCR cho ra kết quả tốt với những mẫu dấu vết, mẫu so sánh còn mới hoặc được bảo quản trong những điều kiện tốt.

Thứ ba, các locus dùng trong giám định ADN hình sự thường phải di truyền độc lập nhau. Như vậy chúng phải nằm trên các nhiễm sắc thể khác nhau, điều này đảm bảo cho tính phân ly độc lập của từng locus dẫn tới tính đa hình kiểu gen trong quần thể [6, 7].

Vì những lý do trên, những trình tự lặp lại chứa các đơn vị lặp lại gồm 4 nucleotit, ví dụ (AGTA)n được ứng dụng nhiều hơn so với các đoạn lặp hình thành từ 2 hoặc 3 nucleotit, ví dụ (CAA)n, (CA)n hoặc những đoạn đa hình hình thành từ các đoạn lặp chứa các đơn vị lặp lại gồm 5 nucleotit ví dụ (CCAAG)n hoặc 6 nucleotit như (CCAACA)n. Ngày nay, nhiều đoạn ADN đa hình có trình tự lặp lại bộ 4 nucleotit đã được nghiên cứu và ứng dụng trong nhận dạng do nó đáp ứng được những yêu cầu của công tác giám định ADN.

Một locus STR trong nhân tế bào thường được lựa chọn để sử dụng trong giám định ADN hình sự nếu nó có nhiều alen khác nhau trong quần

6

thể (nhiều hơn 5 alen) và số các cá thể dị hợp tử trong quần thể lớn hơn 70% [8, 9]. Càng nhiều locus STR được phân tích thì khả năng kết luận mẫu dấu vết có cùng một nguồn gốc cơ thể của một người nào đó càng cao.

1.1.2. Danh pháp quốc tế của các locus STR

Tên các locus STR được đặt theo tên của gen nếu locus này nằm một phần hoặc nằm toàn bộ trong gen [10]. Ví dụ locus STR TH01 có nguồn gốc từ tên gen tổng hợp enzym tyrosine hydroxylase của người, nằm trên NST số 11. Chữ "TH" xuất phát từ chữ cái đầu tyrosine hydroxylase. Số "01" của ký hiệu "TH01" xuất phát từ vùng intron 1 của gen tổng hợp enzym này. Đôi khi tiết đầu ngữ HUM (human) được thêm vào đầu tên của locus này để xác định đó là từ hệ gen người. Vì vậy, locus STR này được đặt tên là HUM - TH01 hay TH01.

Hình 1.1. Vị trí một số locus trên nhiễm sắc thể sử dụng trong giám định ADN của một số bộ kít phổ biến hiện nay [11]

Các trình tự ADN nằm ngoài vùng gen được định tên bằng vị trí của chúng trên NST. Ví dụ, locus D5S818 và D7S820 đó là những tên gọi cho các locus STR không nằm trong vùng gen. Trong trường hợp này chữ D có nghĩa

7

là ADN. Chữ số tiếp theo là số thứ tự của NST. Chữ "S" là trình tự đơn lẻ (single) của locus ADN. Những số cuối là vị trí trình tự đoạn ADN nằm trên mỗi NST riêng biệt. Chữ số này là duy nhất trong nhận dạng cá thể. Ví dụ, locus ADN D7S820 (Hình 1.1) được giải nghĩa là D: ADN, 7: NST số 7, S: trình tự đơn lẻ (single copy sequence), 820: vị trí thứ 820 xác định trên NST số 7 [8].

1.2. CƠ SỞ DỮ LIỆU TẦN SUẤT CÁC ALEN

1.2.1. Khái niệm cơ sở dữ liệu tần suất các alen

Cơ sở dữ liệu tần suất các alen là bảng tần số tương đối của các alen trên một locus di truyền trong quần thể, thông thường được thể hiện dưới dạng tỷ lệ hoặc tỷ lệ phần trăm.

Để phân tích kết quả giám định ADN, một yếu tố quan trọng không thể thiếu là cơ sở dữ liệu tần suất alen trong quần thể (Allele Frequency of Population) đặc trưng cho mỗi quần thể. Việc xác định kiểu gen của tất cả các cá thể (người) sống trên hành tinh là điều không tưởng, do đó cần đến cơ sở dữ liệu thu được từ quá trình khảo sát những mẫu hữu hạn thường là một tập hợp quần thể nhất định để có được số liệu tần suất các alen trong quần thể. Các phòng giám định cần phải thu mẫu ngẫu nhiên (tức không có quan hệ về huyết thống) từ những vùng miền khác nhau có tính đại diện cao, số lượng mẫu đủ lớn tuỳ thuộc vào số lượng dân số của tộc người cần khảo sát [11].

Việc khảo sát bao nhiêu locus tùy thuộc vào từng phòng giám định là sử dụng bộ kit phân tích nào, chẳng hạn bộ kit: Identifiler, Powerplex, hoặc Profiler Plus… Việt Nam có đến 54 tộc người (Ethnic groups), trong đó tộc người Kinh chiếm đến 87,3%, các tộc người khác chỉ chiếm 12,7% còn lại, ví dụ: Tày: 960 nghìn người, Hoa: 930 nghìn người, Khmer: 720 nghìn ngư- ời, Mường: 700 nghìn người, Mông: 441 nghìn người… Các tộc người có số lượng tương đối lớn kể trên đều phải được khảo sát tần suất alen, thậm chí còn nghiên cứu đến cả sự pha tạp giữa các tộc người khác nhau để tìm mối quan hệ giữa chúng biểu hiện thông qua tần suất alen và các chỉ số khác.

8

1.2.2. Tần suất các alen

1.2.2.1. Alen có tần suất thấp

Để xác định chính xác tần suất của một alen, cần phải thu thập được nhiều hơn một giới hạn nhỏ nhất nào đó cho mẫu cá thể mang alen đó. Tần suất alen tối thiểu được quy định để đảm bảo rằng một alen đã được lấy đủ mẫu trong một tập hợp mẫu ngẫu nhiên trong quá trình nghiên cứu.

Alen của một locus STR của một tộc người nào đó có thể không có trong bảng tần suất và do vậy, thuật ngữ tần suất alen hiếm đã được sử dụng. Tần suất của alen hiếm được thiết lập ở mức thấp hơn tần suất alen thấp nhất trong cơ sở dữ liệu alen. "Hội đồng Viện Nghiên cứu Quốc gia, Đánh giá Chứng cứ pháp lý ADN" của Mỹ - (The National Research Council, Evaluation of Forensic DNA Evidence) đã đề xuất sử dụng tần suất alen thấp nhất nên điều chỉnh là 5/2N (trong đó N là kích cỡ mẫu của cơ sở dữ liệu). Vì vậy, alen có tần suất thấp có giá trị thấp hơn tần suất alen thấp nhất (5/2N) theo quy ước trong cơ sở dữ liệu. Trong các nghiên cứu trước đây, các alen chưa xuất hiện trong quần thể nghiên cứu được gán cho giá trị 1/2N (N là số cá thể của quần thể nghiên cứu) và được phần mềm xây dựng mã hóa cố định giá trị đó. Trong một số phần mềm tính toán có thể mặc định tần suất cực tiểu là 0,001 [12, 13].

Với các locus STR sử dụng trong khoa học hình sự, tất cả các locus gen đều là những đoạn không mang thông tin di truyền, đại đa số chúng nằm ở những đoạn intron của gen hoặc những vùng trình tự không mang gen. Do đó, khái niệm alen hiếm được sử dụng trong một số trường hợp là không hoàn toàn chính xác. Chúng tôi đưa ra tên gọi là alen có tần suất thấp khi giá trị tần suất tính được thấp hơn giá trị mặc định 0,001 (0,1%).

Những alen có tần suất thấp trong các locus STR thường có giá trị truy

nguyên cao hơn các alen có tần suất cao (alen phổ biến).

9

1.2.2.2. Alen có tần suất cao - Alen phổ biến

Một trong những yêu cầu quan trọng đặt ra đối với các locus ADN - STR được sử dụng trong khoa học hình sự là mức dị hợp tử phải cao (trên 70%).

Muốn vậy, các locus STR phải hội tụ được hai điều kiện sau đây:

- Locus STR phải có tính đa hình cao, đó là số lượng các alen của locus

đó phải lớn.

- Các alen phải phân bố đều trong toàn bộ bảng tần suất.

Tuy nhiên, những nghiên cứu cho thấy, một số alen trong các locus STR có tính phổ biến (tần suất cao) cao hơn các alen còn lại khác. Ví dụ, khi nghiên cứu tần suất các alen trong các quần thể của các tộc người Việt (người Khmer và người Mường), locus D3S1358 có ba alen là 15, 16 và alen 17 chiếm tới 90% tổng số các alen, locus TPOX với hai alen là alen 8 và alen 11 chiếm hơn 80% của tổng số các alen [14, 15].

Hiện nay, các bộ kít thương mại có một số locus STR với khả năng phân biệt (PD) và khả năng loại trừ (PE) đều thấp, locus có giá trị truy nguyên thấp (như TPOX, CSF1PO). Những locus này có số lượng alen trong locus ít, nhưng số alen có tần suất cao lại chiếm đa số, sử dụng những locus dạng này chỉ là một giải pháp có ý nghĩa trong truy nguyên cá thể, ít có ý nghĩa trong việc xác định huyết thống cha con.

1.2.3. Ý nghĩa của cơ sở dữ liệu tần suất các alen

Trong giám định ADN hình sự, việc xác định khả năng truy nguyên đồng nhất của một hồ sơ ADN để buộc tội một đối tượng nghi vấn là rất quan trọng. Có thể xảy ra các trường hợp:

Trường hợp thứ nhất: mẫu ADN của đối tượng nghi vấn hay của nạn nhân (mẫu đã biết) không đồng nhất với hồ sơ ADN phân tích được từ mẫu cần giám định (mẫu chưa biết), trong trường hợp này đối tượng nghi vấn được loại trừ là người để lại dấu vết thu thập được.

10

Trường hợp thứ hai: khi mẫu ADN từ hiện trường vụ án (mẫu chưa biết) và mẫu ADN từ đối tượng nghi vấn (mẫu đã biết) đồng nhất về hồ sơ ADN. Như vậy, dấu vết tại hiện trường là do chính đối tượng nghi vấn đã để lại hay của một đối tượng nào khác trùng hồ sơ ADN?

Muốn đánh giá khả năng có hay không sự trùng hợp ngẫu nhiên hồ sơ ADN của cá thể này với cá thể khác trong quần thể, các giám định viên phải tính toán dựa trên tần suất các alen STR trong dân cư hoặc quần thể gần gũi nhất về di truyền.

Câu hỏi đặt ra là: xác suất liệu có thể có một người khác ngoài nghi can, ngẫu nhiên chọn từ quần thể dân cư có hồ sơ ADN giống với nghi can bằng bao nhiêu? Nếu xác suất này càng nhỏ thì khả năng trùng hợp một cách ngẫu nhiên càng khó xảy ra.

Để trả lời câu hỏi đó, tỷ số khả dĩ (LR) là một thông số để đánh giá hai

mẫu phân tích có phải là của cùng một người không [11].

Giả sử ta xác định được hồ sơ ADN của nghi phạm và dấu vết tại hiện

trường: D13S317 là dị hợp tử hai alen 12/13.

LR= =

Trong đó:

Hp có giá trị là 1 (100% chứng cứ buộc tội cho nghi phạm);

Hd: Xác suất của hồ sơ ADN 12-13 trong quần thể, dựa vào tần suất alen 12 và 13.

Tần suất alen 12 của locus D13S317 ở người Mỹ gốc Phi là 0,429 còn ở

người Mỹ da trắng là 0,283.

Tần suất alen 13 của locus D13S317 ở người Mỹ gốc Phi là 0,152 còn ở

người Mỹ da trắng là 0,104.

LR khi tính với tần suất người Mỹ gốc Phi là:

LR = = = = 7,66

11

LR khi tính với tần suất người Mỹ da trắng là:

LR = = = = 16,99

Điều đó cho thấy sự khác biệt là lớn trong trường hợp với 1 locus của

hồ sơ ADN tính với tần suất alen của các tộc người khác nhau.

Đối với số lượng alen đạt tới 15 hoặc 27 locus ADN, con số khác biệt khi tính toán dựa trên tần suất alen của các tộc người khác nhau còn lớn hơn rất nhiều. Tỷ số khả dĩ (LR) có liên quan đến các alen có tần suất thấp, alen có tần suất cao và phân bố của các alen trong từng tộc người cụ thể.

1.2.4. Cơ sở khoa học để xác định số lượng cá thể khảo sát

Theo báo cáo của "Hội đồng Nghiên cứu Quốc gia, Đánh giá Chứng cứ pháp lý ADN" của Mỹ - (The National Research Council, Evaluation of Forensic DNA Evidence) năm 1996 thì việc ước lượng tần số của một alen nào đó có thể không chính xác nếu alen đó là alen có tuần suất thấp, chỉ xuất hiện một vài lần khi khảo sát và có thể không đại diện cho cả quần thể [13]. Hội đồng Viện nghiên cứu quốc gia Mỹ khuyến cáo rằng mỗi alen nên được tính ít nhất là năm lần để tần suất tính được đáng tin cậy. Do đó tần số thấp nhất của một alen là 5/2N, trong đó N là số lượng mẫu khảo sát từ quần thể và 2N là số lượng nhiễm sắc thể. Với quy ước như thế, số lượng mẫu khảo sát sẽ ảnh hưởng tới tần suất của alen tối thiểu như sau:

Bảng 1.1. Tần suất tối thiểu của một alen thay đổi tương ứng với số lượng mẫu khảo sát

Số lượng mẫu khảo sát (N) Số lượng nhiễm sắc thể (2N) Tần suất tối thiểu của alen (5/2N)

100 200 0.025

200 400 0.0125

500 1000 0.005

1000 2000 0.0025

10000 20000 0.00025

12

Theo John M. Butler, khi khảo sát 302 người Mỹ da trắng, alen 15 của locus D13S317 chỉ xuất hiện 1 lần, do đó tần số quan sát được là 0.00166 [11]. Tuy nhiên tần số tối thiểu sử dụng phải là 5/2N, tức là 5/604 = 0.00828. Nói cách khác, bởi vì alen 15 đã không được quan sát đủ số lần tin cậy để tính giá trị tần suất thực trong quần thể, do đó tần số của nó được ước lượng gấp năm lần giá trị quan sát đảm bảo tính đại diện. Như vậy, số lượng mẫu càng lớn thì xác suất lý thuyết và thực tế càng tiệm cận tới nhau hơn với độ tin cậy cao hơn.

Theo tác giả Chakraborty, số lượng mẫu khảo sát thông thường là 100- 150 mẫu ADN từ các cá thể không có quan hệ huyết thống là đủ cho các locus STR có từ 5 đến 15 alen [16]. Tuy nhiên, các bộ kit ứng dụng trong lĩnh vực giám định ADN hình sự hiện nay gồm những locus có số lượng alen lớn hơn 15. Ví dụ: khi khảo sát tần suất alen của các locus hệ Identifiler, với quần thể người Mỹ gốc Phi khi khảo sát 357 cá thể, locus D18S51 có 18 alen, locus D21S11 là 24 alen, locus FGA là 24 alen [13]. Còn đối với quần thể người Việt (dân tộc Kinh) locus FGA cũng có đến 20 alen khi khảo sát 170 cá thể [17]. Như vậy, số lượng cá thể khảo sát phải lớn hơn 150 để xây dựng cơ sở dữ liệu tần suất các alen.

Theo tác giả John Buckleton, chọn 200 mẫu khảo sát cho mỗi quần thể

là số lượng tiêu chuẩn được lựa chọn phổ biến [18].

Với những cơ sở trên, để kết quả nghiên cứu đảm bảo tính khoa học, bảng tần suất các alen có thể được các cơ quan giám định ADN tại Việt Nam, Interpol và Hiệp hội ADN hình sự Châu Á áp dụng trong việc giám định ADN thì chúng tôi chọn số lượng mẫu nghiên cứu đối với quần thể người dân tộc Kinh tại Việt Nam là 200 người.

1.3. KHÁI QUÁT VỀ BỘ KÍT FORENSEQ DNA SIGNATURE PREP - MIX A

1.3.1. Bộ kít ForenSeqTM DNA Signature Prep

Năm 2015, hãng Illumina đã phát triển hệ thống giải trình tự MiSeq

FGxTM với bộ kit ForenSeqTM DNA Signature Prep với những đặc điểm sau:

13

- Chỉ sử dụng một bộ kít duy nhất phân tích được cả 2 loại chỉ thị trong

giám định ADN hình sự là các locus STR và các locus SNP;

- Bộ kít là tổ hợp của 233 locus STR và SNP, từ đó cung cấp được

lượng thông tin lớn, mang độ tin cậy và chính xác cao;

- Có khả năng dự đoán được kiểu hình và nguồn gốc chủng tộc của cá

thể do có chứa các ancestry SNPs và phenotyping SNPs;

- Số lượng mẫu tối đa có thể thực hiện được là 96 mẫu;

- Lượng ADN khuyến cáo tương đối thấp: 1ng;

- Tất cả mọi hóa chất phải sử dụng đều được gói gọn trong bộ kit.

- Kích thước của các đoạn amplicon sau khi khuếch đại từ 60 - 460bp, có ý nghĩa khi phân tích các mẫu có chất lượng kém, ADN bị phân hủy, đứt gãy như mẫu xương, mẫu đang trong giai đoạn phân hủy...

- Bộ kít được chia thành 2 nhóm:

+ Nhóm Mix A: gồm 59 locus STR (trong đó có 27 locus STR trên nhiễm sắc thể thường và 32 locus STR trên nhiễm sắc thể giới tính) và 94 locus SNP được sử dụng để truy nguyên cá thể và xác định quan hệ huyết thống.

+ Nhóm Mix B: gồm 80 locus SNP xác định kiểu hình (với 24 locus

xác định màu tóc, màu mắt và 56 locus xác định chủng tộc).

Việt Nam với hơn 90% dân số thuộc dân tộc Kinh, còn lại là các dân tộc thiểu số, ít có sự pha trộn với các chủng tộc trên thế giới, về đặc điểm màu tóc và màu mắt cũng không đa dạng. Do đó, trong khuôn khổ của luận văn chúng tôi lựa chọn và nghiên cứu các locus STR trên nhiễm sắc thể thường trong nhóm Mix A và không đề cập các maker liên quan đến kiểu hình thuộc nhóm Mix B.

1.3.2. Các locus STR trên nhiễm sắc thể thường trong bộ kít

ForenSeqTM DNA Signature Prep-Mix A

Bộ kít ForenSeqTM DNA Signature Prep-Mix A được thiết kế có tổ hợp của 27 locus STR trên 21 nhiễm sắc thể thường (không có trên nhiễm sắc thể

14

số 14). Trong đó nhiễm sắc thể số 2, số 3, số 5, số 12, số 20 và số 21 có 2 locus trên mỗi nhiễm sắc thể. Mỗi nhiễm sắc thể còn lại có 01 locus [19].

Bảng 1.2. Các locus STR trên nhiễm sắc thể thường có trong bộ kit ForenSeq DNA Signature Prep - Mix A [19]

STT NST Locus

PentaE

1 D1S1656 2 D2S441 3 TPOX 4 D2S1338 5 D3S1358 6 D4S2408 7 CSF1PO 8 D5S818 9 D6S1043 10 D7S820 11 D8S1179 12 D9S1122 13 D10S1248 14 TH01 15 D12S391 16 vWA 17 D13S317 18 19 D16S539 20 D17S1301 21 D18S51 22 D19S433 23 D20S482 24 D21S11 25 D22S1045 26 27 PentaD FGA Đoạn Amplicon ngắn nhất (bp) 141 144 85 114 138 93 85 102 163 135 86 108 128 100 237 132 138 362 132 114 140 154 125 158 193 209 150 Đoạn Amplicon dài nhất (bp) 189 180 145 182 186 117 129 150 227 179 138 140 172 148 281 192 186 467 180 142 227 212 165 276 229 293 306 1 2 2 3 3 4 5 5 6 7 8 9 10 11 12 12 13 15 16 17 18 19 20 20 21 21 22 Alen của mẫu 2800M Control 12,13 10,14 11 22,25 17,18 9 12 12,12 12,20 8,11 14,15 12 13,15 6,9.3 18,23 16,19 9,11 7,14 9,13 11,12 16,18 13,14 14,15 29,31.2 16 12,13 20,23

15

1.4. CÔNG NGHỆ GIẢI TRÌNH TỰ ỨNG DỤNG TRONG GIÁM ĐỊNH ADN

1.4.1. Công nghệ điện di mao quản (Capillary electrophoresis - CE)

Công nghệ điện di mao quản hiện đang được ứng dụng rộng rãi trong lĩnh vực giám định ADN hình sự [20]. Điện di mao quản là công nghệ sử dụng mao quản được làm bằng thuỷ tinh dẫn điện và thường có đường kính

bên trong từ 50 - 100 m, chiều dài từ 25 - 75 cm cho phép phân tách các

đoạn ADN có kích thước khác nhau.

Gel được bơm đầy trong mao quản và ADN được hút vào và chạy trong mao quản khi tạo điện trường cho gel trong mao quản. Những đoạn có kích thước nhỏ sẽ chạy nhanh hơn những đoạn có kích thước lớn. Trong quá trình chạy trong mao quản, các đoạn ADN sẽ được chiếu laser và phát hiện được nhờ chất màu huỳnh quang khác nhau gắn vào mỗi đoạn ADN. Hệ thống sẽ phát hiện các bước sóng và so sánh với hệ thống thang chuẩn được điện di song song với mẫu. Phần mềm của máy tính sẽ xử lí thông tin và xác định kích thước của các alen khác nhau (với số đơn vị lặp lại khác nhau) [21].

Công nghệ điện di mao quản là một bước đột phá lớn, khắc phục được vấn đề thời gian phân tích, độ chính xác.. so với các công nghệ trước đây như công nghệ điện di nhuộm bạc, điện di trên agarose... Tuy nhiên, điện di mao quản vẫn có một số nhược điểm sau đây:

- Xác định các alen chỉ dựa trên kích thước ADN và không giải trình tự.

- Công suất thấp khi phân tích nhiều chỉ thị, phải sử dụng nhiều bộ kit

khác nhau.

- Gặp nhiều khó khăn trong việc phân tích các mẫu khó từ hiện trường

như các mẫu có chất lượng kém (số lượng ít, bị phân hủy)...

- Không thể xác định được các peak nằm ngoài thang alen chuẩn.

- Trong giám định huyết thống, khó khăn khi gặp các trường hợp trùng

hợp ngẫu nhiên, đột biến, giám định không trực hệ...

16

Hình 1.2. Hình ảnh máy điện di mao quản ABI 3130xl

1.4.2. Hệ thống giải trình tự thế hệ mới MiSeq FGxTM

của hãng

Illumina - Hoa Kỳ

Công nghệ giải trình tự thế hệ mới là một bước đột phá tiếp theo, đang trở thành một công cụ phân tích quan trọng trong lĩnh vực sinh học phân tử nói chung và giám định ADN hình sự nói riêng với những cải tiến ưu việt sau [21]:

- Công nghệ mới không yêu cầu tách dòng các đoạn ADN, mà thay vào

đó là việc chuẩn bị các thư viện NGS.

- Thay vì hàng trăm phản ứng giải trình tự thì công nghệ mới có thể đồng thời thực hiện được hàng triệu phản ứng giải trình tự, do đó hàng triệu hoặc hàng tỉ phân tử ADN có thể được giải trình tự đồng thời.

- Trình tự được đọc trực tiếp mà không cần phải điện di. Số lần đọc của NGS là vô cùng lớn, có thể giải trình tự toàn bộ hệ gen trong thời gian ngắn, do đó có thể ứng dụng rộng rãi trong nhiều lĩnh vực khoa học và đời sống.

17

Chuẩn bị thư viện

Tạo Cluster

Giải trình tự

Hình 1.3. Quy trình giải trình tự thế hệ mới của Illumina [19]

Hệ thống máy giải trình tự của hãng Illumina sử dụng công nghệ giải trình tự theo phương pháp tổng hợp (Sequencing by Synthesis) kết hợp với việc sử dụng các nucleotide có gắn tín hiệu huỳnh quang và khóa dừng thuận nghịch để đọc và nhận biết trình tự một cách trực tiếp. Nguyên tắc của công nghệ cũng giống với giải trình tự bằng điện di mao quản. ADN polymerase xúc tác cho quá trình ghép các deoxyribonucleotide triphosphates được gắn huỳnh quang vào mạch khuôn ADN trong suốt các chu trình tổng hợp. Trong suốt mỗi chu trình, tại nucleotit có sự kết hợp sẽ được phát hiện bằng các bức

18

xạ huỳnh quang. Điểm khác biệt chính là thay vì chỉ giải trình tự trên 1 sợi ADN, công nghệ NGS của hãng Illumina giải trình tự nhiều đoạn ADN cùng một lúc. Công nghệ giải trình tự bằng phương pháp tổng hợp (SBS) sẽ đưa ra kết quả có độ chính xác cao, tăng tỉ lệ đọc được của các đoạn ADN [19].

Hệ thống MiSeq FGx là hệ thống được hãng Illumina phát triển riêng cho giám định ADN hình sự. Hệ thống được ra mắt vào tháng 01 năm 2015 được đánh giá là một giải pháp hoàn chỉnh cho lĩnh vực khoa học hình sự. Với những đặc điểm như:

- Chỉ sử dụng một bộ kit duy nhất nhưng phân tích được cả 2 nhóm chỉ thị ADN trong hình sự là STRs và SNPs. Từ đó cung cấp được lượng thông tin rất lớn, mang độ tin cậy và chính xác cao.

- Kết hợp đồng thời các STR trên nhiễm sắc thể thường (27 locus), nhiễm sắc thể giới tính Y (25 locus) và nhiễm sắc thể giới tính X (7 locus). Bên cạnh đó còn có tổ hợp 94 SNPs mang thông tin giúp phân biệt cá thể.

- Kích thước của các đoạn amplicon sau khi khuếch đại từ 60 – 460bp, do đó có thể phân tích các mẫu ADN bị đứt gãy, các mẫu có chất lượng kém.

- Có khả năng dự đoán được kiểu hình và nguồn gốc chủng tộc của cá

thể do có tổ hợp các ancestry SNPs và phenotyping SNPs.

- Có thể phân tích đồng thời 96 mẫu.

Quy trình giải trình tự gồm có 4 bước chính:

- Bước 1: Chuẩn bị thư viện (Library Preparation)

Bao gồm việc chuẩn bị thực hiện theo quy trình của bộ kit ForenSeq ADN Signature Prep. Mẫu sẽ được khuếch đại những đoạn ADN đặc hiệu và gắn thêm các adapter riêng biệt để có thể phân biệt giữa các mẫu với nhau. Cuối cùng, các mẫu sẽ được trộn lại chung và đưa vào máy giải trình tự.

- Bước 2: Tạo Cluster

Thư viện sau khi được chuẩn bị sẽ được máy đưa tự động lên flow cell - nơi có các đoạn nhỏ oligo nucleotit đã được gắn lên trên bề mặt có sự tương thích với các adapter. Mỗi đoạn sẽ khuếch đại riêng biệt và tách thành từng

19

nhóm cluster thông qua phản ứng khuếch đại đường cầu. Sau quá trình tạo ra các Cluster thì mạch khuôn đã sẵn sàng cho việc giải trình tự.

- Bước 3: Giải trình tự bằng công nghệ tổng hợp. Kết quả có độ chính

xác đến từng base.

- Bước 4: Phân tích kết quả.

Hệ thống có server đi kèm sử dụng phần mềm riêng biệt để phân biệt

và so sánh các mẫu với nhau.

1.5. TÌNH HÌNH NGHIÊN CỨU VỀ TẦN SUẤT ALEN CÁC LOCUS STR TRÊN THẾ GIỚI VÀ TRONG NƯỚC

1.5.1. Tình hình nghiên cứu trên thế giới

Việc ứng dụng các locus STR để truy nguyên cá thể người đã được thực hiện tại những nước phát triển và hiện nay đã được áp dụng ở hầu hết các nước trên thế giới. Vì tính chất bắt buộc, nên tất cả các tộc người có số dân lớn trong một quốc gia đều được khảo sát tần suất các locus STR một cách kỹ lưỡng để áp dụng trong giám định ADN khi biết rõ được nguồn gốc chủng tộc của cá thể có mẫu giám định.

Tại Mỹ, cảnh sát liên bang Mỹ đã khảo sát và sử dụng tần suất dữ liệu ADN theo hệ Identifiler của nhiều chủng tộc người khác nhau: 191 người gốc Mỹ, 290 người Mỹ gốc Tây Ban Nha và Bồ Đào Nha, 349 người Mỹ da trắng và 357 người Mỹ gốc Phi [7].

Với chủng tộc người lai Âu - Á (Eurasia), tại mỗi quốc gia khác nhau lại có những khảo sát khác nhau về tần suất các alen theo hệ Identifiler của cộng đồng người Eurasia tại quốc gia đó: 384 người tại Nga, 300 người tại Hy Lạp, 139 người tại Rumani... [22].

Tại Singapore, Cảnh sát Singapore sử dụng tần suất các alen theo hệ Identifiler của dân tộc người Hoa, dân tộc người Mã Lai, dân tộc người Ấn Độ... để phục vụ công tác giám định [23].

20

Cùng với sự phát triển không ngừng của ngành công nghệ sinh học nói chung, các tập đoàn nghiên cứu khoa học trên thế giới tiếp tục phát triển các bộ kit phân tích mở rộng hơn về số lượng locus (Hãng ABI với bộ kit 24 locus Global Filer; Hãng Promega với bộ kit 20 locus PowerPlex 21, bộ kit 24 locus PowerPlex Fusion; Hãng Illumina với bộ kit ForenSeqTM DNA Signature Prep là tổ hợp của tổng số 233 locus STR và SNP...). Theo đó đã có nhiều quốc gia nghiên cứu khảo sát tần suất các alen của các locus ở các bộ kit mới để đưa vào ứng dụng trong giám định ADN hình sự.

Tại Mỹ, năm 2016 Tamyra R. Moretti và cộng sự đã khảo sát mở rộng hệ CODIS với 23 locus STR từ 11 nhóm quần thể người, ứng dụng trong giám định ADN hình sự của Cục Cảnh sát liên bang Mỹ (FBI), bao gồm: 202 người Mỹ da trắng, 209 người phía Tây Nam Tây Ban Nha, 263 người phía Đông Nam Tây Ban Nha, 209 người Mỹ gốc Phi, 157 người Bahamas, 177 người Jamaica, 79 người Trinidad, 95 người Chàm, 91 người Philipin, 192 người Apache và 143 người Navajo. Theo đó, người Mỹ gốc Phi, người Bahamas và người Jamaica có khoảng cách di truyền nhỏ, có thể gộp thành một nhóm quần thể [24].

Tại Trung Quốc, năm 2017 đã khảo sát tần suất alen 23 locus STR từ 1218 người dân tộc người Duy Ngô Nhĩ (Uyghur) ở vùng Tân Cương, Tây bắc Trung Quốc. Tổng cộng 281 alen của các locus này đã được xác định và tần suất alen của chúng dao động từ 0,0004 đến 0,5390 [25]; năm 2018 đã khảo sát 500 người dân tộc Hán và 100 người dân tộc gốc Mông Cổ [26].

Năm 2015, Stefano Caratti và cộng sự sử dụng hệ thống MiSeq FGxTM với bộ kit ForenSeqTM DNA Signature Prep bao gồm cả Mix A và Mix B để phân tích 78 mẫu (trong đó có 64 mẫu để xác định quan hệ huyết thống và 14 mẫu án hình sự). Trong số các mẫu án hình sự, có 5 mẫu là các dấu vết hiện trường (với 2 mẫu lẫn) và 9 mẫu là hài cốt, móng và răng. Kết quả tất cả các mẫu đều thu được đầy đủ kiểu gen của tất cả các locus STR và SNP, phù hợp với các locus STR đã được phân tích trước đó bằng các bộ kit STR thông dụng chạy điện di bằng hệ thống CE. Tại locus D9S1122 còn phát hiện alen biến thể so với mẫu chứng dương 2800M. Biến thể này rất có giá trị trong

21

việc phân tích dấu vết bị lẫn, đặc biệt khi các mẫu lẫn từ những người có quan hệ huyết thống. Từ những kết quả cho thấy ưu thế vượt trội của hệ thống MiSeq FGxTM so với công nghệ CE [27].

Những năm gần đây, ứng dụng công nghệ giải trình tự thế hệ mới (Next generation sequencing - NGS), hay còn gọi là Massively parallel sequencing - MPS) trong giám định ADN hình sự trên thế giới đang là một xu thế để khắc phục, giải quyết những tồn tại của công nghệ giải trình tự bằng mao quản. Cuộc khảo sát 33 phòng thí nghiệm từ 25 quốc gia ở Châu Âu trong giai đoạn từ năm 2016 - 2019 đã có 17 phòng thí nghiệm trang bị hệ thống giải trình tự thế hệ mới [28].

Vào đầu năm 2016, Giáo sư nổi tiếng về ADN hình sự trên thế giới Bruce Budowle cũng đã công bố trên tạp chí FSI Genetics nghiên cứu đánh giá khả năng ứng dụng bộ kit ForenSeqTM DNA Signature Prep trong giám định ADN hình sự với các thí nghiệm: đánh giá độ nhạy, khả năng phân tích mẫu lẫn với các tỉ lệ khác nhau, các cá thể với các chủng tộc khác nhau và các mẫu khó (mẫu tế bào niêm mạc miệng thu từ 6 năm trước và các mẫu xương). Nghiên cứu đã khẳng định kết quả từ bộ kit ForenSeqTM DNA Signature Prep với hệ thống MiSeq FGxTM là chính xác và tin cậy, có khả năng ứng dụng rất hiệu quả trong giám định ADN hình sự. Số lượng lớn các chỉ thị được phân tích cùng lúc là lợi ích rõ ràng nhất và vẫn phù hợp với các kết quả phân tích trước đây bằng các bộ kit khác nhau. Các phân nhóm STRs trên nhiễm sắc thể thường, trên nhiễm sắc thể X và trên nhiễm sắc thể Y được phân tích đồng thời nên việc truy nguyên cá thể hay xác định quan hệ huyết thống sẽ rất thuận tiện và đảm bảo độ chính xác cao nhất [29].

Anh và Hàn Quốc cũng đã nghiên cứu, khảo sát bộ kit ForenSeqTM DNA Signature Prep từ 200 người gốc Anh, 200 người Anh gốc Trung Quốc và 209 Hàn Quốc, so sánh với các bộ kit sử dụng công nghệ CE. Kết quả đã chỉ ra 26 alen ở các locus STR trên nhiễm sắc thể thường mà các bộ kit sử dụng công nghệ CE không phân biệt được. Điều này đã khẳng định rằng, công nghệ giải trình tự thế hệ mới có thể là một công cụ ứng dụng hiệu quả trong giám định ADN hình sự để tăng khả năng truy nguyên cá thể [30, 31].

22

Năm 2018 Mỹ cũng đã công bố bảng tần suất các alen của 27 locus thuộc bộ kit ForenSeqTM DNA Signature Prep được khảo sát từ tổng số 1036 người Mỹ thuộc 4 nhóm dân tộc: 361 người Mỹ da trắng, 342 người Mỹ gốc Phi, 97 người Mỹ gốc Á và 236 người Mỹ gốc Tây Ban Nha. Locus D3S1353 có tỷ lệ dị hợp tử trong các quần thể lớn nhất (khoảng 10%). Các locus có tỉ lệ dị hợp tử từ 10% đến 5% bao gồm (theo thứ tự giảm dần: D9S1122, D13S317, D8S1179, D21S11, D5S818, D12S391 và D2S441). 19 locus còn lại có tỉ lệ dị hợp tử ít hơn 5%. Bảng tần suất alen từ 1036 cá thể theo khảo sát này được cung cấp để sử dụng trong các phòng thí nghiệm giám định ADN hình sự của Mỹ [32].

1.5.2. Tình hình nghiên cứu trong nước

Ở Việt Nam, giám định gen được triển khai từ tháng 4 năm 1999 tại Viện Khoa học hình sự - Bộ Công an với công nghệ điện di bằng gel polyacrylamide trên hệ thống ABI Prism 377 DNA Sequencer. Năm 2000, đề tài cấp Bộ "Nghiên cứu, khảo sát và xây dựng tần suất các alen của các gen trong hệ NinePlex II (9 locus gen) trên đối tượng người Kinh" được triển khai và năm 2002 được nghiệm thu, kết quả là bảng tần suất các alen của người Kinh được sử dụng để tính toán trong các bản kết luận giám định truy nguyên cá thể, xác định quan hệ huyết thống giúp các cơ quan tố tụng giải quyết có hiệu quả rất nhiều vụ việc [23].

Năm 2004, Việt Nam đã thông báo bảng tần suất các alen của các locus gen hệ Nineplex II trên đối tượng người Kinh cho Interpol, đây là một cột mốc đánh dấu sự phối hợp toàn cầu trong đấu tranh phòng chống tội phạm dựa vào lĩnh vực giám định ADN.

Năm 2006, Viện Khoa học hình sự đưa vào triển khai hệ Identifiler (15 locus: D8S1179, D21S11, D7S820, CSF1PO, D3S1358, THO1, D13S317, D16S539, D2S1338, D19S433, vWA, TPOX, D18S51, D5S818 và FGA) trong giám định ADN với công nghệ điện di mao quản. Với bộ kit và công nghệ điện di mới này, công tác giám định đạt hiệu quả cao hơn so với bộ kit 9 locus Nineplex II. Cũng như các phòng thí nghiệm giám định ADN khác trên

23

thế giới, để có cơ sở pháp lý cho việc ứng dụng hệ Identifiler tại Việt Nam thì phải khảo sát để có tần suất các alen của các dân tộc khác nhau.

Năm 2008, Viện Khoa học hình sự đã triển khai đề tài cấp Bộ " Khảo sát và xây dựng cơ sở dữ liệu tần suất các alen của 15 gen hệ Identifiler trong quần thể người Việt (Kinh) ứng dụng trong giám định gen (ADN) của lực lượng Kỹ thuật hình sự " [17]. Đề tài tiến hành khảo sát số mẫu là 170 cá thể người dân tộc Kinh. Đây là căn cứ khoa học để xây dựng cơ sở pháp lý vững chắc trong việc đưa ra các kết luận giám định về truy nguyên cá thể và xác định huyết thống phục vụ tố tụng hình sự và dân sự đối với những vụ án, vụ việc có liên quan đến người dân tộc Kinh.

Tại Việt Nam quy trình giám định ADN hình sự sử dụng công nghệ điện di mao quản đã được ban hành kèm theo Thông tư số 46/2013/TT-BCA ngày 05/11/2013 của Bộ trưởng Bộ Công an. Năm 2019, Viện Khoa học hình sự đã có các công bố về tần suất phân bố các alen của 15 locus hệ Identifiler từ 9 tộc người có dân số đông ở Việt Nam (người Kinh, Tày, Thái, Mường, Khmer, Hoa, Nùng, H’mông và Dao) [33]. Công nghệ điện di mao quản vẫn tiếp tục được sử dụng trong giám định ADN hình sự với những lợi thế về thời gian phân tích, thao tác đơn giản và chi phí thấp.

Công nghệ giải trình tự thế hệ mới - hệ thống MiSeq FGxTM của hãng Illumina được triển khai tại Viện Khoa học hình sự để giải quyết các vụ án phức tạp với số lượng mẫu lớn, mẫu khó phân tích, các vụ phát hiện hài cốt chưa rõ tung tích, các vụ việc xác định quan hệ huyết thống nhưng ADN bị đột biến mà nếu chỉ sử dụng công nghệ điện di mao quản sẽ không thể kết luận chính xác...

Năm 2016, Viện Khoa học hình sự Bộ Công an kết hợp cùng Công ty Cổ phần phân tích dịch vụ di truyền Gentis đã tiếp nhận chuyển giao công nghệ từ các chuyên gia của hãng Illumina, phân tích thử nghiệm 104 mẫu máu của 104 người Việt không có quan hệ huyết thống và đạt được một số kết quả khả quan, đánh giá tiềm năng ứng dụng hiệu quả của hệ thống MiSeq FGxTM trong lĩnh vực giám định ADN hình sự tại Việt Nam và đã có Luận văn Thạc sỹ khoa học của học viên Nguyễn Thị Hồng Nhung được bảo vệ thành công

24

tại Trường Đại học Khoa học tự nhiên - Đại học Quốc gia Hà Nội với tên đề tài "Đánh giá bộ kit ForenSeq trên hệ thống MiSeq FGx ứng dụng trong định danh cá thể người Việt Nam" [34].

Hình 1.4. Hình ảnh máy giải trình tự thế hệ mới MiSeq FGxTM

Để tần suất của một alen nào đó đủ tin cậy ứng dụng tính xác suất trong lĩnh vực giám định ADN hình sự thì số lượng mẫu khảo sát phải đủ lớn để các alen đó xuất hiện nhiều lần là điều rất quan trọng. Tại Việt Nam cho đến nay chưa có công trình khoa học nào công bố dữ liệu hoàn chỉnh về các alen của 27 locus STR trên nhiễm sắc thể thường thuộc bộ kit ForenSeqTM DNA Signature Prep - Mix A với số lượng mẫu đủ lớn làm cơ sở khoa học và thực tiễn để xây dựng cơ sở pháp lý, ứng dụng trong giám định ADN hình sự.

25

CHƯƠNG 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1. VẬT LIỆU NGHIÊN CỨU

2.1.1. Đối tượng nghiên cứu

Chọn ngẫu nhiên 200 mẫu máu của 200 người dân tộc Kinh trên lãnh thổ Việt Nam, không có quan hệ huyết thống gần gũi được thu trên giấy FTA®, thuộc Dự án “Tàng thư gen tội phạm quốc gia” tại Viện Khoa học hình sự - Bộ Công an.

2.1.2. Hóa chất, thiết bị và dụng cụ nghiên cứu

2.1.2.1. Hóa chất

- Thẻ thu mẫu máu FTA® card (Hãng Applied Biosystems);

- Dung dịch Chelex100 nồng độ 5% (Hãng Sigma - Aldrich);

- Protease K (hãng Epicenter);

- Bộ kit tinh sạch ADN Clean & Concentrator™-5 (Hãng Zymo

Reseach);

- Kít định lượng ADN: Quantifiler™ Human DNA Quantification Kit

(Hãng Applied Biosystems);

- Bộ kít ForenSeqTM DNA Signature Prep - Mix A (Hãng Illumina);

- Các hóa chất khác trong phòng thí nghiệm.

2.1.2.2. Máy móc, thiết bị và dụng cụ

Đề tài nghiên cứu được thực hiện trên các máy móc, thiết bị và dụng cụ tại Phòng thí nghiệm giám định ADN, thuộc Trung tâm Giám định sinh học - Viện Khoa học hình sự, gồm có:

- Máy đục lỗ FTA card: BSD Punching (Hãng Applied Biosystems);

- Máy PCR GeneAmp® PCR System 9700 (Hãng Applied

Biosystems);

- Máy Realtime PCR 7500 (Hãng Applied Biosystems);

- Máy giải trình tự MiSeq FGxTM (Hãng Illumina);

26

- Block nhiệt khô cho ống 1,5ml (1000C) kèm nhiệt kế;

- Máy li tâm;

- Các dụng cụ và vật tư tiêu hao đi kèm.

2.2. PHƯƠNG PHÁP NGHIÊN CỨU

Các bước chính trong quá trình nghiên cứu được thực hiện theo sơ đồ sau:

Thu thập mẫu

Tách chiết ADN (Phương pháp vô cơ)

Tinh sạch ADN (Sử dụng kít tinh sạch)

Định lượng ADN (Phương pháp Real-time PCR)

Chuẩn bị thư viện mẫu (Bộ kít ForenSeqTM DNA Signature Prep - Mix A)

Giải trình tự ADN (Máy MiSeq FGxTM)

Xử lý số liệu thống kê

Hình 2.1. Sơ đồ nghiên cứu

27

2.2.1. Phương pháp thu thập mẫu máu

Mẫu máu của 200 người dân tộc Kinh trên lãnh thổ Việt Nam được thu thập ngẫu nhiên không có quan hệ huyết thống gần gũi. Việc thu thập mẫu phục vụ nghiên cứu được căn cứ theo hồ sơ nhân thân được cung cấp bởi Cơ quan Công an.

Dựa vào danh sách cá nhân được các Cơ quan Công an cung cấp phục vụ triển khai Dự án "Tàng thư gen tội phạm quốc gia" để lựa chọn các mẫu nghiên cứu:

- Thu mẫu ngẫu nhiên ở nhiều địa phương khác nhau;

- Kiểm tra lý lịch trích ngang (chứng minh thư nhân dân, giấy khai sinh, hồ sơ nghiệp vụ Công an Nhân dân...). Hỏi trực tiếp người được thu mẫu để bổ sung thông tin (nếu cần). Ghi chép đầy đủ thông tin bao gồm ngày tháng năm sinh, quê quán, họ tên cha, mẹ, nguồn gốc, địa chỉ thường trú vào danh bản ADN cá nhân (hình 2.3).

- Dùng kim chích đầu ngón tay và thấm trực tiếp vào giấy thẻ FTA®

(Hình 2.2);

- Để khô tự nhiên, đóng gói và bảo quản ở nhiệt độ phòng.

Mẫu đạt tiêu chuẩn là mẫu có đầy đủ thông tin về nhân thân, thông tin về bố và mẹ, đồng thời xác định bố và mẹ đều thuộc dân tộc Kinh. Sàng lọc các mẫu có quan hệ huyết thống với nhau thông qua thông tin cá nhân.

Hình 2.2. Thẻ FTA dùng để thu mẫu máu

28

Hình 2.3. Danh bản ghi thông tin cá nhân

2.2.2. Phương pháp tách chiết ADN

200 mẫu máu người dân tộc Kinh được tách chiết ADN bằng phương

pháp vô cơ, sử dụng dung dịch chelex 5% như sau:

- Đục lỗ nhỏ trên giấy FTA có kích thước đường kính là 1,2 mm bằng

máy đục lỗ BSD Punching, cho vào ống eppendoft sạch;

- Rửa 3 lần bằng diH2O;

- Cho 200 ml chelex 5%, bổ sung 2 µl dung dịch Protease K (50 µg/µl)

ủ ở 560C trong 30 phút;

- Votex, chuyển sang ủ ở 1000C trong 8 phút;

29

- Votex, ly tâm 13000 vòng/phút, hút dịch nổi chứa ADN sang ống mới

để tiến hành các bước phân tích tiếp theo hoặc bảo quản ở -200C.

Quy trình tinh sạch mẫu ADN bằng bộ kít DNA Clean & Concentrator™-5 được thực hiện ở nhiệt độ phòng, thực hiện các bước chính như sau:

2.2.3. Tinh sạch ADN

- Cho 7 thể tích DNA Binding Buffer cho mỗi thể tích mẫu ADN vào

trong ống eppendoft 1,5 ml. Vortex cho dung dịch đồng nhất;

- Chuyển hỗn hợp vào cột Zymo-SpinTM Column 2 và cột chứa;

- Ly tâm ở 13000 vòng/phút ở nhiệt độ thường trong 30 giây. Loại bỏ

dịch qua cột;

- Bổ sung 200 µl DNA Wash Buffer vào cột. Ly tâm ở 13000 vòng/phút ở nhiệt độ thường trong 30 giây. Thực hiện lại bước rửa thêm lần hai;

- Thêm ≥6 µl DNA Elution Buffer hoặc nước deion đã khử trùng trực

tiếp lên màng lọc. Ủ ở nhiệt độ phòng trong khoảng 1 phút;

- Chuyển sang ống eppendoft 1,5 ml mới và ly tâm ở 13000 vòng/phút

ở nhiệt độ thường trong 30 giây để thôi ADN;

- ADN sau khi tinh sạch được sử dụng để tiến hành các bước tiếp theo

hoặc bảo quản ở -200C.

2.2.4. Định lượng ADN

Phương pháp Real-time PCR là phương pháp định lượng chính xác hàm lượng ADN của người được sử dụng trong giám định ADN. Thông thường sau tách chiết, dung dịch tách chiết bao gồm cả ADN của vi sinh vật có trong mẫu vật. Với mồi thiết kế đặc hiệu của bộ kit, sau khi thu nhận được kết quả, tín hiệu luôn là của ADN đặc hiệu của người.

Quy trình định lượng ADN bằng phương pháp Real-time PCR, sử dụng bộ kít Quantifiler™ Human DNA Quantification Kit được tiến hành như sau:

30

- Chuẩn bị ống PCR chuyên dụng cho Real-time PCR;

- Cho 5,25 µl Primer và 6,25 µl Master mix.

- Lấy 1 µl dung dịch ADN cho vào ống PCR đã có thành phần hóa

chất;

- Chuẩn bị các mẫu standard tương tự;

- Chạy trên máy Realtime PCR 7500 với phần mềm phân tích của hãng

Applied Biosystems - Mỹ.

2.2.5. Chuẩn bị thư viện mẫu và giải trình tự ADN

Chuẩn bị thư viện mẫu ADN là bước thực hiện theo quy trình của bộ kit ForenSeqTM ADN Signature Prep - Mix A. Mẫu sẽ được khuếch đại những đoạn ADN đặc hiệu và gắn thêm các adapter riêng biệt để có thể phân biệt giữa các mẫu với nhau. Cuối cùng, các mẫu sẽ được trộn lại chung và đưa vào máy giải trình tự.

Lượng ADN đầu vào theo hướng dẫn của nhà sản xuất là 1 ng ADN tổng số. Một lần thực hiện giải trình tự có thể thực hiện được tối đa là 96 mẫu. Quy trình chuẩn bị thư viện và đưa vào máy giải trình tự gồm có 6 bước chính:

- Bước 1: Khuếch đại và gắn đuôi vào trình tự đích. Giai đoạn này nhằm khuếch đại và gắn trình tự đuôi từ ADN khuôn sử dụng các cặp mồi đặc hiệu trong bộ kít để khuếch đại 27 locus STR.

- Bước 2: Làm giàu đoạn đích. Giai đoạn này nhằm khuếch đại những bản sao trình tự ADN đích đã được gắn đuôi bằng cách bổ sung trình tự index cho hỗn hợp sản phẩm PCR cũng như là các trình tự adapter cần thiết cho quá trình tạo cluster khi giải trình tự. Sản phẩm sau bước này là một trình tự gồm đầy đủ trình tự index-adapter-đuôi ADN với sự kết hợp riêng biệt của trình tự index, cho phép phân biệt từng mẫu sau khi phân tích.

- Bước 3: Tinh sạch thư viện. Sử dụng công nghệ hạt từ SPB (Sample

Purification Beads) để tinh sạch thư viện đã được khuếch đại.

31

- Bước 4: Chuẩn hóa thư viện. Bước này giúp chuẩn bị thư viện ADN cho bước tạo các cluster. Các mẫu có lượng ADN đầu vào khác nhau hoặc loại mẫu khác nhau sẽ đều đạt được mật độ cluster phù hợp để có độ phân giải tối ưu cho từng mẫu riêng biệt khi các mẫu được trộn chung với nhau.

- Bước 5: Trộn thư viện mẫu.

- Bước 6: Biến tính và pha loãng thư viện. Thư viện mẫu được pha loãng trong dung dịch Hybridization buffer (HT1), có bổ sung Human Sequencing Control (HSC) và biến tính bằng nhiệt trước khi đưa mẫu vào máy MiSeq FGxTM.

Hình 2.4. Hình ảnh mô tả quá trình chuẩn bị thư viện mẫu

2.2.6. Các phương pháp thu thập và xử lý số liệu thống kê

Chúng tôi sử dụng phương pháp đếm để thống kê toàn bộ kiểu gen và

số lượng từng alen từ 200 mẫu nghiên cứu.

Để số liệu nghiên cứu về các locus được ứng dụng trong giám định ADN hình sự thì cần thiết phải đánh giá xem mẫu nghiên cứu với các locus được phân tích có đảm bảo rằng cấu trúc di truyền của mẫu (tần số tương đối của các alen và tần số các kiểu gen) có ổn định hay không qua các thế hệ, nghĩa là mẫu có tuân theo định luật Hac đi - Van béc hay không. Do đó, cần

32

kiểm tra sự phù hợp giữa mẫu với quần thể cân bằng lý thuyết thông qua đánh giá chênh lệch giữa tần số quan sát thực tế với phân bố lý thuyết của các kiểu gen của mỗi locus được nghiên cứu có sai khác nhau hay không [1, 35].

Chúng tôi sử dụng phần mềm Exel (Microsoft Office) để xử lý số liệu

thống kê.

2.2.6.1. Xác định và tính tần suất các alen

- Trên cơ sở 200 kiểu gen và số lượng từng alen của 200 cá thể người dân tộc Kinh sau khi phân tích trên hệ thống giải trình tự MiSeqTM FGx thu thập được.

- Tính tần suất các alen của từng locus theo số liệu thu được theo công

thức sau:

Pi =

Trong đó: Pi: Tần suất của alen i

i: alen i quan sát thấy

n: cá thể thứ n

N: Tổng số cá thể (N = 200)

2.2.6.2. Phương pháp kiểm định giả thiết Khi bình phương ( χ2)

Theo định luật Hac đi - Van béc, thành phần kiểu gen và tần số tương

đối các alen của quần thể ngẫu phối được ổn định qua các thế hệ trong những điều kiện nhất định. Với quần thể có đa alen, giả thiết tần suất các alen tương ứng là p, q, r... thì:

(p + q + r +…)2 = 1 hay: p2 + 2pq + q2 + 2qr + r2 + … = 1 [10]

Công thức để tính giá trị χ2 như sau:

χ2 =

Trong đó:

33

O: tần suất alen quan sát được từ thực nghiệm.

E: tần suất quan sát được, tính theo lý thuyết.

k: số alen xác định được.

Giá trị χ2 được xác định tại bảng phân bố χ2 với các bậc tự do tương ứng với các mức xác suất tương ứng. Trong các thí nghiệm sinh học, 3 mức xác suất thường được sử dụng là P = 0,05; P = 0,01 hoặc P = 0,001. Với 200 mẫu nghiên cứu, chúng tôi lựa chọn giá trị P = 0,05 là phù hợp [10, 11, 36, 37].

Nếu khi bình phương tính được nhỏ hơn khi bình phương lý thuyết thì phân bố thực tế phù hợp với phân phối lý thuyết, nghĩa là mẫu phù hợp với quần thể lý thuyết.

2.2.6.2. Phương pháp tính các chỉ số sử dụng trong giám định ADN

Sử dụng phần mềm Microsoft Excel để tính toán tần suất và các chỉ số đánh giá tính đa hình các alen của quần thể đó đồng thời xác định tần suất thu thập được đã có đủ độ tin cậy để sử dụng vào việc xác định cá thể hoặc xác định huyết thống cha, mẹ - con chưa. Các chỉ số được đánh giá gồm [7, 37, 38]:

- Tần suất dị hợp tử quan sát (Observed Heterozygosity - H(ob)) là tổng tần suất các hồ sơ ADN dị hợp tử quan sát được trong toàn bộ mẫu nghiên cứu:

H(ob) = Error!

- Tần suất dị hợp tử lý thuyết - Expected Heterozygosity (Hexp)

Trong đó: h là đồng hợp tử (homozygosity)

- Chỉ số đa hình (Polymorphism information content - PIC), chỉ mức độ

đa hình của một locus:

34

- Khả năng phân biệt (Power of discrimination - PD):

- Khả năng loại trừ (Power of exclusion - PE):

- Chỉ số quan hệ huyết thống (Paternity index - PI):

Trong đó: pi: là tần suất của alen thứ i trong quần thể có n alen;

h = đồng hợp tử;

H = dị hợp tử.

2.2.6.3. Các chỉ số kết hợp đánh giá giá trị bảng tần suất alen

- Chỉ số kết hợp khả năng loại trừ (Combined power of exclusion -

CPE):

CPE = 1 - (1 - PE1)×(1 - PE2)×(1 - PE3)…(1 - PEn)

Trong đó: PEi là khả năng loại trừ của từng locus trong bảng tần suất

- Chỉ số kết hợp khả năng phân biệt (Power of discrimination - CPD)

CPD = 1 - (1 - PD1)×(1 - PD2) × (1 - PD3) ×… × (1 - PDn)

Trong đó: PDi là khả năng phân biệt của từng locus trong bảng tần suất

- Chỉ số kết hợp xác định quan hệ huyết thống đặc trưng (Combined

Paternity index - CPI):

CPI = PI1 × PI2 × PI3 ×…×PIn

35

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN

3.1. KẾT QUẢ XÂY DỰNG CƠ SỞ DỮ LIỆU TẦN SUẤT ALEN

3.1.1. Kết quả thu mẫu, tách chiết và tinh sạch ADN

Căn cứ vào danh sách và thông tin cá nhân của các phạm nhân đang thụ án tại các trại giam thuộc Bộ Công an trên toàn quốc, do Cơ quan Công an cung cấm để phục vụ Dự án "Tàng thư gen tội phạm quốc gia", chúng tôi đã thu được 200 mẫu máu của 200 người dân tộc Kinh ở các địa phương khác nhau trên toàn quốc, không có quan hệ huyết thống với nhau (trong đó có 28 người nữ giới và 172 người nam giới).

Mẫu máu được thấm vào giấy thu mẫu FTA, để khô tự nhiên, đóng gói và bảo quản đảm bảo yêu cầu về số lượng và chất lượng, kèm theo danh bản ghi đầy đủ thông tin cá nhân của người được thu mẫu.

Chúng tôi cũng đã tiến hành tách chiết ADN từ các mẫu máu trên theo phương pháp vô cơ, tinh sạch sản phẩm ADN bằng bộ kít thương mại DNA Clean & Concentrator™-5 của hãng Zymo Research và định lượng ADN theo phương pháp Realtime PCR.

Do điều kiện thu mẫu tương đối tương đồng về các mặt khách quan như cán bộ thu mẫu, vật liệu thu mẫu và thời gian thu - bảo quản mẫu và sử dụng máy đục lỗ (Punching) để lấy mẫu với kích thước giống nhau, sản phẩm ADN sau khi tách chiết được tinh sạch bằng bộ kít thương mại DNA Clean & Concentrator™-5 của hãng Zymo Research nên nồng độ ADN thu được khá đồng đều, đạt độ tinh sạch cao. Chúng tôi chỉ tiến hành định lượng trên 10 mẫu ngẫu nhiên từ 200 mẫu máu thu trên thẻ FTA và cho kết quả như sau:

Bảng 3.1. Kết quả định lượng ADN bằng phương pháp Realtime PCR

Mẫu

M 10

M 19

M 50

M 70

M 92

M 115

M 132

M 150

M 163

M 180

Nồng độ ADN

8,8

10,1

8,9

10,5

9,5

8,7

10

8,3

9,8

9,5

(ng/µl)

36

Như vậy, nồng độ ADN ở các mẫu thu được nằm trong khoảng từ 8,3 đến 10,5 ng/µl (chúng tôi ước tính nồng độ ADN trung bình của các mẫu là 9,4 ng/µl), đạt tiêu chuẩn để thực hiện nghiên cứu tiếp theo.

Hình 3.1. Mẫu máu được thu vào giấy FTA và thông tin cá nhân

3.1.2. Kết quả phân tích ADN

200 mẫu ADN từ 200 mẫu máu được chuẩn bị thư viện và khuếch đại bằng bộ kit ForenSeqTM ADN Signature Prep - Mix A và đưa vào máy giải trình tự MiSeq FGxTM.

Kết quả chi tiết về kiểu gen của từng locus của mẫu đối chứng dương

và mẫu đại diện được minh họa ở Hình 3.2, 3.3, 3.4 và 3.5 sau đây.

37

Hình 3.2. Hình ảnh báo cáo kết quả phân tích mẫu đối chứng dương

38

Hình 3.3. Hình ảnh báo cáo kết quả phân tích mẫu M001

39

Hình 3. 4. Hình ảnh báo cáo chi tiết kiểu gen mẫu đối chứng dương

40

Hình 3.5. Hình ảnh báo cáo chi tiết kiểu gen mẫu M001

41

Kết quả chúng tôi đã thu được bảng tổng hợp 200 kiểu gen khác nhau

của 200 mẫu khảo sát (Phụ lục 1).

Qua quá trình phân tích toàn bộ 200 mẫu của 200 người dân tộc Kinh,

thu được 200 hồ sơ ADN, chúng tôi có một số bàn luận như sau:

Việc thu mẫu trên giấy FTA card đối với mẫu máu là phù hợp với điều kiện Việt Nam, đặc biệt khi thu mẫu máu với số lượng lớn, thời gian thu mẫu kéo dài, di chuyển nhiều địa điểm khác nhau, khó có điều kiện bảo quản tốt.

Việc tách chiết ADN bằng phương pháp vô cơ, tinh sạch ADN bằng bộ kit Concentrator™-5 của hãng Zymo Research cho sản phẩm có hàm lượng ADN cao và độ tinh sạch đảm bảo phân tích ADN trên hệ thống máy giải trình tự thế hệ mới MiSeq FGxTM với bộ kit ForenSeqTM ADN Signature Prep - Mix A.

3.1.3. Kết quả tính toán và lập bảng tần suất các alen

Từ kết quả phân tích 200 hồ sơ ADN của 200 người dân tộc Kinh, chúng tôi đã đếm được tổng số 10.800 alen (không kể các alen của locus Amelogynin), gồm 61 loại alen (từ 5 đến 34.2).

Áp dụng các công thức đã trình bày ở phần phương pháp nghiên cứu, chúng tôi tiến hành xác định tần suất các alen và dựa vào tần suất đó, tính toán các chỉ số bao gồm:

- Chỉ số kiểm định khi bình phương (2) để đánh giá sự phù hợp với

định luật Hac đi - Van béc (HWE);

- Tần suất dị hợp tử quan sát được (H(ob));

- Tần suất dị hợp tử lý thuyết (H(exp));

- Chỉ số đa hình (PIC);

- Khả năng phân biệt (PD);

- Khả năng loại trừ (PE);

- Chỉ số quan hệ huyết thống (PI);

Kết quả tính toán tần suất các alen và các chỉ số được trình bày trong

phần Phụ lục 2 và Phụ lục 3.

42

TT) cho từng locus, tra bảng phân

Tính toán chỉ số khi bình phương (2

lt).

phối 2 theo hệ số tự do (2

tt < 2

Kết quả được tổng hợp trong phần Phụ lục 3 cho thấy, tất cả các locus

đều có giá trị 2 lt tức là giả thiết tần suất phân bố các alen của 27 locus thuộc bộ kít ForenSeqTM ADN Signature Prep - Mix A (sau đây chúng tôi gọi tắt là bộ kít FSA) trong quần thể người dân tộc Kinh tại Việt Nam tuân theo định luật Hac đi - Van béc được chấp nhận với độ tin cậy là 95%.

Như vậy tần suất phân bố các alen của 27 locus trên nhiễm sắc thể thường thuộc bộ kít FSA trong 200 mẫu khảo sát (Phụ lục 2) có thể được ứng dụng để tính toán xác suất trong giám định ADN hình sự.

3.2. ĐÁNH GIÁ TÍNH ĐA HÌNH CỦA CÁC LOCUS

Tần suất của các locus thuộc bộ kít FSA trong nghiên cứu này được

chúng tôi chia thành 2 nhóm:

- Nhóm 1 gồm 15 locus trùng với các locus của hệ Identifiler, là hệ ADN hiện đang được sử dụng phổ biến trong giám định ADN hình sự ở Việt Nam và trên thế giới, được phân tích bằng công nghệ CE;

- Nhóm 2 gồm 12 locus còn lại, không trùng với các locus của hệ

Identifiler.

3.2.1. Đánh giá tính đa hình của các locus trùng với hệ Identifiler

Kết quả thu được trong nghiên cứu của chúng tôi được so sánh với bảng tần suất các alen của 15 locus hệ Identifiler đã được khảo sát từ 170 cá thể người dân tộc Kinh [17] và so sánh với kết quả nghiên cứu của các tác giả khác trên các quần thể khác được công bố tại cơ sở dữ liệu "Short tandem repeat DNA internet Database" do Viện tiêu chuẩn và công nghệ quốc gia Hoa Kỳ (NIST) công bố [32], thể hiện như sau:

3.2.2.1. Locus D8S1179

Theo thang alen chuẩn của bộ kít Identifiler, locus D8S1179 có 12 alen

bao gồm các alen 8, 9 10, 11, 12, 13, 14, 15, 16, 17, 18 và 19 [39].

43

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, chúng tôi thu được 24 cá thể đồng hợp tử và 176 cá thể dị hợp tử, xuất hiện 11 alen (thiếu alen 19 so với thang alen chuẩn của bộ kít Identifiler), nhưng nhiều hơn 1 alen (alen 9) khi khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler. Tuy nhiên, so sánh với kết quả nghiên cứu từ 97 người Mỹ gốc Châu Á cũng với bộ kít FSA thì quần thể người dân tộc Kinh xuất hiện thêm alen 8 và alen 9.

Các alen 10, 11, 12, 13, 14 và 15 là các alen phổ biến, chiếm 90.25% quần thể người dân tộc Kinh, trong đó các alen 10, 11, 13 và 15 phân bố khá đồng đều (khoảng 15% mỗi alen). Phân bố này khác biệt so với người Mỹ gốc Châu Á với alen 13 và 14 là phổ biến với 20.1% mỗi alen.

Bảng 3.2. So sánh tần suất alen (%) của locus D8S1179 [17, 32]

Alen

Dân tộc Kinh (Kít FSA, n = 200) 0.25 0.75 16.25 14.75 12 15.5 15 16.75 7 0.75 1 Dân tộc Kinh (Kít ID, n= 170) 0.59 - 17.06 15.00 14.71 14.71 15.59 11.76 7.06 2.94 0.59 Người Mỹ gốc Châu Á (Kít FSA, n = 97) - - 12.37 11.86 11.86 20.1 20.1 12.89 9.28 1.03 0.52 8 9 10 11 12 13 14 15 16 17 18

3.2.2.2. Locus D21S11

Khi nghiên cứu 200 người dân tộc Kinh bằng bộ kít FSA, chúng tôi thu được 25 cá thể đồng hợp tử và 175 cá thể dị hợp tử locus D21S11, xuất hiện 14 alen (bảng 3.3), ít hơn so với số alen chuẩn của bộ kít Identifiler (14/24) [39], nhưng lại xuất hiện alen 30.3 (với tần suất 0.75%) là alen không có trong thang alen chuẩn của bộ kít Identifiler.

44

Kết quả khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler chỉ thu được 12 alen: thiếu alen 28.2, 30.3, 34, 34.2 nhưng lại có alen 26 và 33 so với kết quả khảo sát 200 người dân tộc Kinh bằng bộ kít FSA. Tuy nhiên, đây đều là các alen có tần suất thấp.

Bảng 3.3. So sánh tần suất alen (%) của locus D21S11 [17, 32]

Alen

26 27 28 28.2 29 30 30.2 30.3 31 31.2 32 32.2 33 33.2 34 34.2 Dân tộc Kinh (Kít FSA, n = 200) - 0.5 5.75 0.5 24 18.75 0.75 0.75 8 11.25 2.5 16.5 - 9.25 0.25 1.25 Dân tộc Kinh (Kít ID, n= 170) 0.294 0.588 5.588 - 27.3 25.00 2.059 - 8.235 5.588 2.353 18.235 0.294 4.706 - - Người Mỹ gốc Châu Á (Kít FSA, n = 97) - - 5.67 0.52 20.1 32.99 0.52 1.03 12.37 3.61 5.67 11.34 1.55 4.64 - -

Từ bảng so sánh tần suất trên cho thấy, đối với quần thể người dân tộc Kinh tại Việt Nam, alen 29 phân bố trong quần thể với tần suất cao nhất. Trong khi đó, người Mỹ gốc Châu Á thì alen 30 mới là tần suất cao nhất, với phân bố gần 1/3 quần thể.

3.2.2.3. Locus D7S820

Từ 200 hồ sơ ADN, chúng tôi đã thống kê được 52 cá thể đồng hợp tử và 148 cá thể dị hợp tử đối với locus D7S820, xuất hiện 9 loại alen. So với số alen chuẩn của bộ kít Identifiler (10 alen), quần thể người dân tộc Kinh thiếu alen 6 và alen 15, nhưng lại xuất hiện alen 9.1 (ở bộ kít Identifiler) và alen 10.1 (ở bộ kít FSA) không có trong thang alen chuẩn của bộ kít Identifiler. Quần thể người Mỹ gốc Châu Á xuất hiện ít nhất, với 7 loại alen.

45

Ở locus D7S820, các alen 8, 10, 11 và 12 phân bố rất phổ biến (khoảng 90%) ở các quần thể với các bộ kít khác nhau, trong đó alen 11 chiếm tần suất lớn nhất với hơn 1/3 quần thể.

Bảng 3.4. So sánh tần suất alen (%) của locus D7S820 [17, 32]

Alen

Dân tộc Kinh (Kít FSA, n = 200) 0.5 13.5 5.25 - 20.75 0.25 38 17.25 4.25 0.25 Dân tộc Kinh (Kít ID, n= 170) 0.882 14.706 5.588 0.294 20.588 - 34.412 20.294 2.353 0.882 Người Mỹ gốc Châu Á (Kít FSA, n = 97) 0.52 13.4 4.64 - 26.29 - 35.05 17.53 2.58 - 7 8 9 9.1 10 10.1 11 12 13 14

3.2.2.4. Locus CSF1PO

Bảng 3.5. So sánh tần suất alen (%) của locus CSF1PO [17, 32]

Alen

Dân tộc Kinh (Kít FSA, n = 200) 1 0.25 1.75 19.75 24.25 44.75 6.25 2 - Dân tộc Kinh (Kít ID, n= 170) 0.588 - 4.706 24.706 25.882 34.706 6.765 2.059 0.588 Người Mỹ gốc Châu Á (Kít FSA, n = 97) 2.06 - 6.7 20.1 21.65 38.66 8.76 1.55 0.52 7 8 9 10 11 12 13 14 15

Khi nghiên cứu 200 người dân tộc Kinh bằng bộ kít FSA, chúng tôi thu được 55 cá thể đồng hợp tử và 145 cá thể dị hợp tử locus CSF1PO, xuất hiện 8 alen (bảng 3.5) thiếu alen 6 và 15 so với thang alen chuẩn của bộ kít Identifiler [39].

46

So với kết quả khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler và 97 người Mỹ gốc Châu Á bằng bộ kít FSA thì số lượng alen xuất hiện giống nhau (đều 8 alen) nhưng khác nhau về loại alen (alen 8 và alen 15).

3.2.2.5. Locus D3S1358

Bảng 3.6. So sánh tần suất alen (%) của locus D3S1358 [17, 32]

Alen

13 14 15 16 17 18 19 20 Dân tộc Kinh (Kít FSA, n = 200) 0.25 5.25 29.5 34.5 22.25 7.75 0.5 - Dân tộc Kinh (Kít ID, n= 170) - 3.824 31.471 35.00 20.294 8.235 0.882 0.294 Người Mỹ gốc Châu Á (Kít FSA, n = 97) - 2.58 36.6 32.99 20.1 6.7 1.03 -

Theo thang alen chuẩn của bộ kít Identifiler thì locus D3S1358 có 8

alen bao gồm các alen số 12, 13, 14, 15, 16, 17, 18 và 19 [39].

Thông qua kết quả phân tích 200 người dân tộc Kinh bằng bộ kít FSA, đã thu được 65 người đồng hợp tử và 135 người dị hợp tử ở locus D3S1358, phát hiện được 7 alen, thiếu alen 12 so với thang alen chuẩn của bộ kít Identifiler.

Các alen 15, 16 và 17 là các alen phổ biến ở các nghiên cứu khác nhau, đều chiếm gần 90% so với toàn bộ các alen xuất hiện. Đây là các alen phổ biến trong locus D3S1358 (bảng 3.6).

Locus D3S1358 trong nghiên cứu là locus có tính đa hình thấp, ít có giá trị trong giám định ADN xác định huyết thống cha - mẹ - con và truy nguyên cá thể.

3.2.2.6. Locus TH01

Từ 200 hồ sơ ADN nghiên cứu, chúng tôi đã thống kê được 54 cá thể đồng hợp tử và 146 cá thể dị hợp tử đối với locus TH01, xuất hiện 6 loại alen, bằng với số alen của người Mỹ gốc Châu Á, nhưng ít hơn alen 11 khi khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler.

47

Bảng 3.7. So sánh tần suất alen (%) của locus TH01 [17, 32]

Alen

6 7 8 9 9.3 10 11 Dân tộc Kinh (Kít FSA, n = 200) 14 37.5 4.25 31.75 6.5 6 - Dân tộc Kinh (Kít ID, n= 170) 14.118 36.176 6.765 32.647 3.824 5.882 0.588 Người Mỹ gốc Châu Á (Kít FSA, n = 97) 17.01 26.8 7.22 44.33 4.12 0.52 -

Với locus TH01, alen 7 và alen 8 rất phổ biến đối với quần thể người dân tộc Kinh tại Việt Nam (mỗi alen chiếm khoảng 1/3 quần thể), trong khi đó đối với người Mỹ gốc Châu Á thì alen 9 là alen phổ biến trong quần thể (chiếm gần 1/2 quần thể), còn alen 7 chỉ chiếm hơn 1/4 quần thể.

Nghiên cứu này cũng cho thấy tính đa hình của locus TH01 rất thấp khi

có đến khoảng 70% quần thể mang alen 7 hoặc alen 8.

3.2.2.7. Locus D13S317

Bảng 3.8. So sánh tần suất alen (%) của locus D13S317 [17, 32]

Alen

7 8 9 10 11 12 13 14 Dân tộc Kinh (Kít FSA, n = 200) 0.5 28.25 13.25 10.75 23.5 18.25 5.0 0.5 Dân tộc Kinh (Kít ID, n= 170) 0.294 34.118 13.235 12.353 22.353 13.529 2.941 1.176 Người Mỹ gốc Châu Á (Kít FSA, n = 97) - 21.65 14.43 10.31 26.8 21.13 5.67 -

Trong nghiên cứu này, ở locus D13S317 chúng tôi đã thu được 42 cá

thể đồng hợp tử và 158 cá thể dị hợp tử.

Theo thang alen chuẩn của bộ kít Identifiler thì locus D13S317 có 8 alen bao gồm các alen số 8, 9, 10, 11, 12, 13, 14 và 15 [39]. Như vậy, số lượng alen phát hiện được ở các nghiên cứu đối với quần thể người dân tộc

48

Kinh ở Việt Nam bằng với số lượng alen theo thang alen chuẩn của bộ kít Identifiler (đều là 8 alen) nhưng khác về loại alen. Quần thể người dân tộc Kinh thiếu alen 15 nhưng lại xuất hiện thêm alen 7 so với thang alen chuẩn. Người Mỹ gốc Châu Á có số lượng alen thấp nhất (chỉ với 6 loại alen).

Mặc dù chỉ xuất hiện 8 loại alen, nhưng locus D13S317 được phân bố

trong quần thể khá đồng đều với các alen 8, 9, 10, 11 và 12.

3.2.2.8. Locus D16S539

Bảng 3.9. So sánh tần suất alen (%) của locus D16S539 [17, 32]

Alen

8 9 10 11 12 13 14 15 Dân tộc Kinh (Kít FSA, n = 200) 0.5 22.5 15.25 24.25 29 6.25 2 0.25 Dân tộc Kinh (Kít ID, n= 170) 0.588 22.059 11.176 29.706 23.235 11.176 2.059 - Người Mỹ gốc Châu Á (Kít FSA, n = 97) - 35.57 16.49 19.07 17.53 9.79 1.55 -

Khi nghiên cứu 200 người dân tộc Kinh bằng bộ kít FSA, chúng tôi thu được 46 cá thể đồng hợp tử và 154 cá thể dị hợp tử ở locus D16S539, xuất hiện 8 alen (thiếu alen 5 so với thang alen chuẩn của bộ kít Identifiler) [39].

Phân bố các alen của locus D16S539 có sự khác biệt giữa các quần thể khác nhau. Kết quả khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler chỉ thu được 7 alen, thiếu alen 15 so với kết quả nghiên cứu 200 người dân tộc Kinh bằng bộ kít FSA. Tuy nhiên tần suất của alen 15 là rất thấp (chỉ 0.25%).

Người dân tộc Kinh ở Việt Nam có tính đa hình cao hơn so với người Mỹ gốc Châu Á (8 alen so với 6 alen) , tần suất của alen 12 là cao nhất (29%), trong khi đó người Mỹ gốc Châu Á có tần suất của alen 9 cao nhất (35.57%) còn alen 12 chỉ có 17.53%.

49

3.2.2.9. Locus D2S1338

Bảng 3.10. So sánh tần suất alen (%) của locus D2S1338 [17, 32]

Alen

16 17 18 19 20 21 22 23 24 25 26 27 Dân tộc Kinh (Kít FSA, n = 200) 2.5 9.75 8.5 16.5 17.5 3.25 4 15.75 15.75 6 0.5 - Dân tộc Kinh (Kít ID, n= 170) 1.176 11.471 7.353 23.529 11.765 4.706 5.00 17.3 13.235 3.824 0.588 - Người Mỹ gốc Châu Á (Kít FSA, n = 97) 2.06 5.67 13.4 18.04 15.98 1.55 5.15 16.49 12.89 4.64 3.61 0.52

Theo thang alen chuẩn của bộ kít Identifiler, locus D2S1338 có 14 alen [39]. Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, chúng tôi thu được 25 cá thể đồng hợp tử và 175 cá thể dị hợp tử.

Kết quả khảo sát người dân tộc Kinh bằng bộ kít FSA và Identifiler đều xuất hiện 11 alen và ít hơn 1 alen so với kết quả nghiên cứu từ 97 người Mỹ gốc Châu Á (alen 27).

Locus D2S1338 có tính đa hình cao khi số lượng alen xuất hiện nhiều,

tần suất các alen phân bố trong các quần thể cũng khá đồng đều.

3.2.2.10. Locus D19S433

Từ 200 hồ sơ ADN nghiên cứu, chúng tôi đã thống kê được 65 cá thể đồng hợp tử và 135 cá thể dị hợp tử đối với locus D19S433, xuất hiện 10 loại alen, ít hơn 5 alen so với thang alen chuẩn của bộ kít Identifiler [39].

Với locus D19S433, khi khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler đã xuất hiện 14 loại alen, nhiều hơn 4 alen (9, 11, 17.2 và 18.2) so với kết quả khảo sát 200 người bằng bộ kít FSA. Tuy nhiên, các alen phân bố với tần suất cao đều tương đồng ở cả 2 kết quả, trong đó alen 13 và alen 14

50

phân bố phổ biến cả quần thể người dân tộc Kinh và người Mỹ gốc Châu Á (mỗi alen chiếm khoảng 1/3 quần thể).

Bảng 3.11. So sánh tần suất alen (%) của locus D19S433 [17, 32]

Alen

9 11 12 12.2 13 13.2 14 14.2 15 15.2 16 16.2 17.2 18.2 Dân tộc Kinh (Kít FSA, n = 200) - - 4.25 0.25 31.25 2 27.25 9.75 7 14.75 1 2.5 - - Dân tộc Kinh (Kít ID, n= 170) 1.471 0.294 4.412 1.176 23.824 05.00 25.294 11.471 5.8 15.00 1.471 4.118 0.294 0.294 Người Mỹ gốc Châu Á (Kít FSA, n = 97) - - 3.61 2.58 28.35 2.06 29.9 10.31 6.19 12.37 1.03 3.09 0.52 -

3.2.2.11. Locus vWA

Bảng 3.12. So sánh tần suất alen (%) của locus vWA [17, 32]

Alen

14 15 16 17 18 19 20 21 Dân tộc Kinh (Kít FSA, n = 200) 30.5 5.25 9 23 20 9.75 2 0.5 Dân tộc Kinh (Kít ID, n= 170) 25.882 1.765 16.765 23.529 19.118 10.588 2.353 - Người Mỹ gốc Châu Á (Kít FSA, n = 97) 19.59 2.06 13.92 31.44 20.62 10.82 1.55 -

Theo thang alen chuẩn của bộ kít Identifiler, locus vWA có 14 alen bao

gồm các alen 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 và 24 [39].

51

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, chúng tôi thu được 47 cá thể đồng hợp tử và 153 cá thể dị hợp tử, xuất hiện 8 alen (thiếu các alen 11, 12, 13, 22, 23 và 24 so với thang alen chuẩn của bộ kít Identifiler), nhiều hơn 1 alen (alen 21) so với kết quả khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler và 97 người Mỹ gốc Châu Á bằng bộ kit FSA.

Với locus vWA, alen 14 và 17 là các alen phân bố phổ biến ở các quần

thể với tổng số khoảng 50% dân số.

3.2.2.12. Locus TPOX

Bảng 3.13. So sánh tần suất alen (%) của locus TPOX [17, 32]

Alen

8 9 10 11 12 Dân tộc Kinh (Kít FSA, n = 200) 58 7.75 3.25 29 2 Dân tộc Kinh (Kít ID, n= 170) 59.118 10.294 2.647 25.882 2.059 Người Mỹ gốc Châu Á (Kít FSA, n = 97) 54.64 8.25 3.09 29.38 4.64

Theo thang alen chuẩn của bộ kít Identifiler, locus TPOX có 8 alen bao

gồm các alen 6, 7, 8, 9 10, 11, 12 và 13 [39].

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, chúng tôi thu được 85 cá thể đồng hợp tử và 115 cá thể dị hợp tử, xuất hiện 5 alen (thiếu alen 6, 7 và 13 so với thang alen chuẩn của bộ kít Identifiler).

Ở cả 3 kết quả nghiên cứu, số lượng alen xuất hiện và tần suất phân bố

các alen của locus TPOX khá tương đồng với nhau.

Locus TPOX là locus có tính đa hình thấp nhất trong 15 locus của hệ Identifiler với số cá thể có kiểu gen đồng hợp tử rất cao, alen 8 phân bố rất phổ biến trong quần thể, là alen có tần suất cao nhất (gần 60%) và alen 11 cũng có tần suất rất cao (khoảng 1/3 quần thể). Như vậy, alen 8 của locus TPOX có giá trị truy nguyên cá thể rất thấp (do có đến hơn 1 nửa quần thể đều mang alen 8).

52

3.2.2.13. Locus D18S51

Bảng 3.14. So sánh tần suất alen (%) của locus D18S51 [17, 32]

Alen

9 11 12 13 14 15 16 17 18 19 20 21 22 23 25 28 Dân tộc Kinh (Kít FSA, n = 200) - 0.5 4 16.75 18.5 20.5 19.25 7.75 6.75 2.5 1.5 1.25 0.25 0.25 0.25 - Dân tộc Kinh (Kít ID, n= 170) 0.294 0.882 9.412 10.882 17.647 19.412 21.471 6.765 3.529 3.824 1.765 2.059 0.882 0.882 0.294 - Người Mỹ gốc Châu Á (Kít FSA, n = 97) - - 3.61 21.65 23.71 18.04 12.89 6.7 3.09 4.12 2.58 1.03 1.55 0.52 - 0.52

Theo thang alen chuẩn của bộ kít Identifiler thì locus D18S51 có 23 alen bao gồm các alen số 7, 9, 10, 10.2, 11, 12, 13, 13.2, 14, 14.2, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 và 27 [39].

Nghiên cứu của chúng tôi đã phát hiện được 14 alen bao gồm các alen 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23 và 25 với 30 cá thể đồng hợp tử và 170 cá thể dị hợp tử.

Kết quả khảo sát 170 người dân tộc Kinh bằng bộ kít Identifiler xuất hiện thêm alen 9 so với kết quả khảo sát 200 người dân tộc Kinh bằng bộ kít FSA, tuy nhiên alen này có tần suất rất thấp (0.294%). Tần suất phân bố của các alen còn lại khi khảo sát bằng 2 bộ kít đều tương đồng nhau.

Tần suất phân bố của các alen phổ biến (các alen 13, 14, 15, 16) ở

người dân tộc Kinh và người Mỹ gốc Châu Á rất khác nhau.

Locus D18S51 là locus có tính đa hình cao với số lượng alen xuất hiện lớn, trong đó các alen 13, 14, 15 và 16 xuất hiện với tần suất cao hơn cả (tổng cộng 75%).

53

3.2.2.14. Locus D5S818

Bảng 3.15. So sánh tần suất alen (%) của locus D5S818 [17, 32]

Alen Người Mỹ gốc Châu Á (Kít FSA, n = 97)

7 8 9 10 11 12 13 14 15 16 Dân tộc Kinh (Kít FSA, n = 200) 4.5 - 5.5 23.25 27 22.75 16.75 0.25 0.5 - Dân tộc Kinh (Kít ID, n= 170) 2.647 - 5.882 18.824 31.765 20.294 18.529 1.765 - 0.294 1.55 0.52 9.79 22.68 27.32 20.62 15.98 1.55 - -

Theo thang alen chuẩn của bộ kít Identifiler thì locus D5S818 có 10

alen bao gồm các alen số 7, 8, 9, 10, 11, 12, 13, 14, 15 và 16. [39].

Nghiên cứu của chúng tôi đã phát hiện được 8 alen với 46 cá thể đồng

hợp tử và 154 cá thể dị hợp tử.

Các alen 10, 11, 12 và 13 là các alen xuất hiện với tần suất cao, đây là các alen phổ biến trong quần thể người dân tộc Kinh ở Việt Nam với tổng số 89.75%. Có 4 alen tần suất thấp, ít phổ biến của locus D5S818 gồm alen 7, 9, 14 và 15.

So sánh với kết quả khi nghiên cứu 170 cá thể bằng bộ kít Identifiler thì khác nhau ở việc xuất hiện alen 15 và alen 16 nhưng các alen này đều có tần suất rất thấp.

Phân bố các alen phổ biến (10, 11, 12 và 13) của quần thể người dân

tộc Kinh và người Mỹ gốc Châu Á tương đồng nhau.

54

3.2.2.15. Locus FGA

Locus FGA là locus có tính đa hình rất cao. Theo thang alen chuẩn, locus FGA có 28 alen bao gồm các alen số 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 26.2, 27, 28, 29, 30, 30.2, 31.2, 32.2, 33.2, 42.2, 43.2, 44.2, 45.2, 46.2, 47.2, 48.2, 50.2 và 51.2 [39].

Nghiên cứu của chúng tôi đã phát hiện được 18 alen với 20 cá thể đồng hợp tử và 180 cá thể dị hợp tử. FGA là locus có tỉ lệ cá thể dị hợp tử cao nhất trong số 27 locus nghiên cứu.

Bảng 3.16. So sánh tần suất alen (%) của locus FGA [17, 32]

Alen

Dân tộc Kinh (Kít FSA, n = 200) 0.5 - 2.75 9.5 5.75 0.25 14 1.25 21.5 0.5 15.25 1 11.25 1.5 5.75 0.5 6.75 - 1.75 0.25 - Dân tộc Kinh (Kít ID, n= 170) 0.294 - 0.882 10.588 5.588 - 14.118 0.588 21.176 2.059 13.824 1.176 13.235 1.765 6.765 0.882 4.118 0.588 1.765 0.294 0.294 Người Mỹ gốc Châu Á (Kít FSA, n = 97) - 1.03 2.58 5.67 8.67 - 10.31 - 24.23 - 20.62 - 14.95 0.52 7.22 - 3.09 - 0.52 - - 16 17 18 19 20 20.2 21 21.2 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28 30.2

Tần suất phân bố của các alen khi khảo sát bằng bộ kít Identifiler và bộ FSA đối với người dân tộc Kinh tương đồng với nhau. Alen 20.2 và alen 26.2 xuất hiện khác nhau ở 2 kết quả nghiên cứu nhưng đều với tần suất thấp.

55

Số lượng alen xuất hiện khi khảo sát 200 người dân tộc Kinh tại Việt Nam cao hơn rất nhiều so với kết quả nghiên cứu từ 97 người Mỹ gốc Châu Á (chỉ xuất hiện 12 alen) và tần suất phân bố cũng đồng đều hơn.

Từ việc so sánh bảng tần suất các alen của 15 locus trùng nhau giữa bộ

kít Identifiler và bộ kít FSA cho thấy:

- Tính đa hình của 15 locus này đối với người dân tộc Kinh tại Việt Nam là tương đồng nhau khi phân tích bằng bộ kít Identifiler hay bằng bộ kít FSA. Vì vậy, hoàn toàn có thể sử dụng các kết quả khi phân tích ADN bằng 2 bộ kít để so sánh với nhau. Điều này rất quan trọng trong giám định ADN để truy nguyên cá thể hay xác định quan hệ huyết thống khi so sánh với dữ liệu lưu trong tàng thư ADN, lưu trong hồ sơ giám định trước đây, hoặc so sánh giữa các phòng thí nghiệm, giữa các quốc gia với nhau.

- Tần suất phân bố các alen của 15 locus có trong bộ kít Identifiler đối với người dân tộc Kinh tại Việt Nam khác tần suất phân bố các alen của quần thể người dân tộc khác. Khi so với thang alen chuẩn của bộ kít Identifiler, quần thể người dân tộc Kinh tại Việt Nam xuất hiện thêm các alen: 30.3 ở locus D21S11, alen 9.1 và alen 10.1 ở locus D7S820, alen 7 ở locus D13S317.

3.2.2. Đánh giá tính đa hình của các locus không có trong hệ Identifiler

Để đánh giá tính đa hình của các locus không có trong hệ Identifiler thuộc bộ kít FSA đối với quần thể người dân tộc Kinh tại Việt Nam, chúng tôi so sánh với kết quả nghiên cứu từ quần thể người Mỹ da trắng (US Caucasians) và người Mỹ gốc Châu Á do Viện tiêu chuẩn và công nghệ quốc gia Hoa Kỳ (NIST) công bố tại cơ sở dữ liệu "Short tandem repeat DNA Internet Database" [32].

3.2.3.1. Locus D1S1656

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus D1S1656 chúng tôi thu được 37 cá thể đồng hợp tử và 163 cá thể dị hợp tử, xuất hiện 13 alen, gồm các alen số 11, 12, 13, 14, 15, 15.3, 16, 16.3, 17, 17.3, 18, 18.3 và 19, trong đó alen 15 có tần suất cao nhất với 32.25%.

56

Phân bố này khác biệt so với quần thể người Mỹ da trắng khi xuất hiện 15 loại alen, với alen 15 và 16 có tần suất cao nhất nhưng chỉ khoảng 14% mỗi alen và alen 12 có tần suất 11.63%, cao hơn nhiều so với quần thể người dân tộc Kinh tại Việt Nam và người Mỹ gốc Châu Á (chỉ gần 5%).

Người Mỹ gốc Châu Á xuất hiện ít alen nhất (với 12 loại alen), nhưng các alen phổ biến (alen 13, 15 và 16) có phân bố tương đương với quần thể người dân tộc Kinh tại Việt Nam.

Bảng 3.17. So sánh tần suất alen (%) của locus D1S1656 [32]

Alen

Dân tộc Kinh (N = 200) - 9 4.75 9.75 6.25 - 32.25 0.25 19 0.75 7.5 6.75 1.5 2 0.25 - Người Mỹ da trắng (N= 361) 0.26 7.76 11.63 6.65 7.89 0.26 14.36 5.82 13.57 6.09 4.71 13.3 0.55 4.99 - 1.52 Người Mỹ gốc Châu Á (N = 97) - 3.09 4.64 13.4 6.19 - 27.84 - 20.1 1.55 7.22 8.76 1.55 5.15 - 0.52 10 11 12 13 14 14.3 15 15.3 16 16.3 17 17.3 18 18.3 19 19.3

3.2.3.2. Locus D2S411

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus D2S411 chúng tôi thu được 31 cá thể đồng hợp tử và 169 cá thể dị hợp tử, xuất hiện 9 alen, trong đó các alen 10, 11, 12 và 14 phân bố phổ biến trong quần thể với tổng tần suất là 90.25%, tương đương với phân bố các alen của người Mỹ gốc Châu Á.

57

Quần thể người Mỹ da trắng có sự khác biệt lớn khi alen 12 chỉ có tần suất 4.71%, thấp hơn rất nhiều so với quần thể người dân tộc Kinh tại Việt Nam và người Mỹ gốc da trắng.

Bảng 3.18. So sánh tần suất alen (%) của locus D2S411 [32]

Alen

Dân tộc Kinh (N = 200) - 0.75 0.5 25 30.25 5.25 20.75 - 1.5 14.25 1.75 - Người Mỹ da trắng (N= 361) - 0.14 0.14 21.05 34.35 6.09 4.71 - 0.42 24.1 5.96 0.14 Người Mỹ gốc Châu Á (N = 97) 0.52 - 0.52 26.8 35.05 3.09 21.65 0.52 2.58 8.25 1.03 - 8 9 9.1 10 11 11.3 12 12.3 13 14 15 16

3.2.3.3. Locus D4S2408

Bảng 3.19. So sánh tần suất alen (%) của locus D4S2408 [32]

Alen

Dân tộc Kinh (N = 200) 0.25 11.25 31 39.5 14 3.75 0.25 Người Mỹ da trắng (N= 361) - 23.27 32.97 22.85 18.56 2.08 0.28 Người Mỹ gốc Châu Á (N = 97) 0.52 10.82 39.18 30.93 15.98 2.06 0.52 7 8 9 10 11 12 13

Nghiên cứu của chúng tôi đã phát hiện được 7 alen thuộc locus D4S2408 với 65 cá thể đồng hợp tử và 135 cá thể dị hợp tử trong số 200 mẫu khảo sát.

Locus D4S2408 có tính đa hình thấp khi phân bổ chủ yếu là các alen 9 và 10 (với tổng tần suất hơn 70%) ở cả quần thể người dân tộc Kinh và người

58

Mỹ gốc Châu Á. Đối với quần thể người Mỹ da trắng, mặc dù xuất hiện ít hơn 1 alen nhưng phân bố đồng đều hơn ở 4 loại alen (8, 9, 10 và 11).

Tần suất phân bố của alen 8 ở quần thể người dân tộc Kinh tương đương với ở quần thể người Mỹ gốc Châu Á (khoảng 11%), nhưng thấp hơn nhiều, chưa đến 1/2 so với quần thể người Mỹ da trắng (hơn 23%).

3.2.3.4. Locus D6S1043

Bảng 3.20. So sánh tần suất alen (%) của locus D6S1043 [32]

Alen

Dân tộc Kinh (N = 200) - 2.5 16 16 - 12.5 12.5 1.25 - 5 21.25 5 9 3.25 0.25 - Người Mỹ da trắng (N= 361) 0.14 1.66 29.64 23.55 - 8.73 5.54 1.25 0.42 6.09 8.86 - 9.83 3.19 0.97 0.14 Người Mỹ gốc Châu Á (N = 97) - 3.09 14.95 12.37 0.52 12.37 15.46 3.61 0.52 7.22 15.98 - 9.28 4.12 0.52 - 8 10 11 12 12.3 13 14 15 16 17 18 18.2 19 20 21 22

Từ 31 cá thể đồng hợp tử và 169 cá thể dị hợp tử đối với locus D6S1043, chúng tôi thu được 12 loại alen với sự phân bố đồng đều ở các alen 11, 12, 13, 14, 18 và 19. Các alen còn lại có tần suất thấp hơn. Phân bố này cũng tương đồng với phân bố ở quần thể người Mỹ gốc Châu Á.

Với locus D6S1043, phân bố của các alen phổ biến ở quần thể người dân tộc Kinh rất khác biệt so với quần thể người Mỹ da trắng. Alen 11 và 12 xuất hiện ở quần thể người dân tộc Kinh với tổng số 32%, trong khi đó ở quần thể người Mỹ da trắng lên tới hơn 53%. Ngược lại, alen 18 ở quần thể người dân tộc Kinh phân bố với tần suất cao hơn nhiều so với quần thể người Mỹ da trắng (21,25% so với 8,86%).

59

3.2.3.5. Locus D9S1122

Từ 200 mẫu khảo sát, chúng tôi thu được 50 cá thể đồng hợp tử và 150 cá thể dị hợp tử đối với locus D6S1043, xuất hiện 8 loại alen, trùng với số loại alen của quần thể người Mỹ gốc Châu Á.

Bảng 3.21. So sánh tần suất alen (%) của locus D9S1122 [32]

Alen

9 10 11 11.2 12 13 14 15 16 Dân tộc Kinh (N = 200) 0.75 3.5 15.5 - 38 34.75 5.25 1.75 0.25 Người Mỹ da trắng (N= 361) 0.83 1.39 17.76 0.14 41.56 32.28 5.54 0.56 - Người Mỹ gốc Châu Á (N = 97) 1.04 5.73 14.95 - 35.57 31.96 7.22 1.03 0.52

Mặc dù số lượng alen không thấp nhưng locus D6S1043 có tính đa hình thấp khi phân bố phổ biến trong quần thể người dân tộc Kinh ở Việt Nam và người Mỹ gốc Châu Á là alen 12 và alen 13 với tần suất mỗi alen đều trên 30%. Alen 11 có tần suất thấp hơn (khoảng 15%), còn lại là các alen có tần suất rất thấp. Đối với quần thể người Mỹ da trắng tính đa hình còn thấp hơn nữa khi tập trung phân bố ở 3 loại alen 11, 12 và 13 lên đến 91.6%.

3.2.3.6. Locus D10S1248

Bảng 3.22. So sánh tần suất alen (%) của locus D10S1248 [32]

Alen

10 11 12 13 14 15 16 17 18 19 Dân tộc Kinh (N = 200) 0.25 - 5.5 35.5 26 20 9.75 2.75 0.25 - Người Mỹ da trắng (N= 361) - 0.14 3.19 30.75 29.78 19.67 13.3 2.77 0.14 0.28 Người Mỹ gốc Châu Á (N = 97) 0.52 - 8.76 31.96 25.26 20.26 9.79 3.09 - -

60

Từ 200 mẫu khảo sát, chúng tôi thu được 43 cá thể đồng hợp tử và 157 cá thể dị hợp tử đối với locus D10S1248, xuất hiện 8 loại alen, nhiều hơn 1 alen so với quần thể người Mỹ gốc Châu Á và bằng số lượng alen so với quần thể người Mỹ da trắng.

Locus D10S1248 cũng là locus có sự phân bố tương đồng ở cả 3 quần thể, tập trung ở 3 alen 13, 14 và 15 (với tổng số 81%), phân bố thấp hơn với alen 12 và 16. Còn 3 alen 10, 17 và 18 có tần suất rất thấp.

3.2.3.7. Locus D12S391

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus D12S391 chúng tôi thu được 28 cá thể đồng hợp tử và 172 cá thể dị hợp tử, xuất hiện 12 alen.

Bảng 3.23. So sánh tần suất alen (%) của locus D12S391 [32]

Alen

Dân tộc Kinh (N = 200) 1 0.5 5.5 - 23 - 19 - 15.25 12.75 9.75 8.75 2.5 - 1.75 0.25 - Người Mỹ da trắng (N= 361) 3.19 2.22 12.74 2.08 17.17 2.49 12.47 0.42 11.08 12.86 9.56 6.93 4.71 - 1.66 0.28 0.14 Người Mỹ gốc Châu Á (N = 97) 4.12 1.03 8.25 - 26.29 - 17.53 0.52 19.59 9.79 5.67 2.58 1.03 0.52 1.55 1.03 0.52 15 16 17 17.3 18 18.3 19 19.3 20 21 22 23 24 24.3 25 26 27

Với tỉ lệ cá thể dị hợp tử và số loại alen nhiều như trên thì locus D12S391 thể hiện tính đa hình cao. Tần suất phân bố giữa các alen cũng khá đồng đều trong quần thể. Tuy nhiên, so với 2 quần thể còn lại thì quần thể

61

người dân tộc Kinh ở Việt Nam có tính đa hình thấp nhất (có 16 loại alen xuất hiện trong quần thể người Mỹ da trắng và 15 loại alen xuất hiện trong quần thể người Mỹ gốc Châu Á).

3.2.3.8. Locus PentaE

Bảng 3.24. So sánh tần suất alen (%) của locus PentaE [32]

Alen

Dân tộc Kinh (N = 200) 3 0.75 0.5 0.5 6.25 30.25 12.25 5.5 9 6.25 - 7 5 0.25 6 0.25 3.5 - 2 1.5 - 0.25 - - Người Mỹ da trắng (N= 361) 7.62 16.9 1.39 1.25 8.59 8.73 19.94 8.59 6.23 4.29 0.14 5.12 4.85 - 3.32 - 1.52 - 0.97 0.28 0.14 - 0.14 - Người Mỹ gốc Châu Á (N = 97) 7.22 - 0.52 2.58 6.19 15.98 9.28 5.15 5.15 11.34 - 5.67 8.25 - 7.73 - 4.12 1.03 2.06 2.06 3.09 2.06 - 0.52 5 7 8 9 10 11 12 13 14 15 15.4 16 17 17.4 18 18.4 19 19.4 20 21 22 23 24 25

62

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus PentaE chúng tôi thu được 42 cá thể đồng hợp tử và 158 cá thể dị hợp tử, xuất hiện 19 alen. Đây là một locus có tính đa hình cao.

Từ bảng so sánh trên cho thấy, mặc dù số lượng các alen ở cả 3 quần thể bằng nhau (đều 19 alen) nhưng loại alen và tần suất phân bố ở các quần thể có sự khác biệt. Đặc biệt là alen số 7 có tần suất cao trong quần thể người Mỹ da trắng (16.9%) nhưng không xuất hiện ở quần thể người Mỹ gốc Châu Á và xuất hiện ở quần thể người dân tộc Kinh ở Việt Nam nhưng với tần suất rất thấp (0.75%).

Ngược lại, alen số 11 có tần suất phân bố trong quần thể người dân tộc Kinh ở Việt Nam cao nhất (30.25%) nhưng ở quần thể người Mỹ gốc Châu Á chỉ tương đương 1/2 (15.98%) và ở quần thể người Mỹ da trắng thì có tần suất thấp hơn nhiều (8.73%).

3.2.3.9. Locus D17S1301

Bảng 3.25. So sánh tần suất alen (%) của locus D17S1301 [32]

Alen

7 8 9 10 11 12 13 14 15 Dân tộc Kinh (N = 200) 0.25 0.25 3.25 4.75 17.75 50.25 18.75 4.5 0.25 Người Mỹ da trắng (N= 361) - - 0.55 3.19 38.23 41.55 12.88 3.46 0.14 Người Mỹ gốc Châu Á (N = 97) - 0.52 1.55 6.19 18.56 49.48 20.62 3.09 -

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus D17S1301chúng tôi thu được 60 cá thể đồng hợp tử và 140 cá thể dị hợp tử, xuất hiện 9 loại alen, nhiều nhất so với quần thể người Mỹ da trắng và người Mỹ gốc Châu Á (đều xuất hiện 7 loại alen).

63

Mặc dù số loại alen xuất hiện không thấp, nhưng tính đa hình của locus D17S1301 không cao do phân bố không đồng đều, tập trung vào alen số 12 khi có tới hơn 50% quần thể người dân tộc Kinh tại Việt Nam mang alen này.

Tần suất phân bố alen 11 của người dân tộc Kinh và người Mỹ gốc Châu Á tương đương nhau (khoảng 18%) nhưng thấp hơn rất nhiều so với người Mỹ da trắng (hơn 38%).

3.2.3.10. Locus D20S482

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus D20S482 chúng tôi thu được 57 cá thể đồng hợp tử và 143 cá thể dị hợp tử, xuất hiện 7 loại alen, tương đương với số alen của quần thể người Mỹ gốc Châu Á (7 loại alen) và thấp hơn so với quần thể người Mỹ da trắng (10 loại alen).

Ở cả 3 quần thể thống kê ở trên, phân bố của locus D20S482 đều tập trung vào 3 loại alen (13, 14 và 15) khi tổng tần suất của 3 loại alen này đều trên 80%. Tuy nhiên, tần suất phân bố của từng loại alen ở các quần thể khác nhau là khác nhau. Alen 13 của người dân tộc Kinh có tần suất phân bố tương đồng với người Mỹ gốc Châu Á (hơn 30%), cao hơn nhiều so với tần suất phân bố của người Mỹ da trắng (chỉ chưa đến 19%). Ngược lại, tần suất phân bố alen 15 của người dân tộc Kinh là 12,5%, thấp hơn so với người Mỹ da trắng và người Mỹ gốc Châu Á.

Bảng 3.26. So sánh tần suất alen (%) của locus D20S482 [32]

Alen

9 10 11 12 13 14 15 16 17 18 19 Dân tộc Kinh (N = 200) - 4.25 0.75 6 33.25 40.5 12.5 2.75 - - - Người Mỹ da trắng (N= 361) 1.25 0.14 1.8 2.63 18.84 45.29 20.33 8.31 0.28 - 0.14 Người Mỹ gốc Châu Á (N = 97) - 3.09 - 7.74 30.42 33.5 17.53 7.22 - 0.52 -

64

3.2.3.11. Locus PentaD

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus PentaD chúng tôi thu được 41 cá thể đồng hợp tử và 159 cá thể dị hợp tử, xuất hiện 12 loại alen, thấp hơn 1 alen so với quần thể người Mỹ da trắng (13 loại alen), nhưng lại cao hơn đến 3 loại alen so với quần thể người Mỹ gốc Châu Á (9 loại alen).

Ở quần thể người dân tộc Kinh tại Việt Nam và người Mỹ gốc Châu Á có phân bố alen số 9 với tần suất cao nhất và tương đương nhau (khoảng 1/3 quần thể), khác biệt so với phân bố ở quần thể người Mỹ da trắng khi tần suất của alen số 9 chỉ là 22,16% và alen 12 mới là alen có tần suất cao nhất là 23.27% đối với quần thể này.

Bảng 3.27. So sánh tần suất alen (%) của locus PentaD [32]

Alen

Dân tộc Kinh (N = 200) - 0.25 2.75 8.5 35.75 14 14.25 0.25 11.5 8.5 2.5 1.5 - - 0.25 Người Mỹ da trắng (N= 361) 0.42 0.42 0.42 2.08 22.16 11.5 12.6 - 23.27 19.67 6.09 0.97 0.28 0.14 - Người Mỹ gốc Châu Á (N = 97) - 1.03 - 0.52 31.44 18.56 18.04 - 18.04 10.31 1.03 1.03 - - - 2.2 6 7 8 9 10 11 11.2 12 13 14 15 16 17 19

3.2.3.12. Locus D22S1045

Khi nghiên cứu bằng bộ kít FSA từ 200 người dân tộc Kinh, với locus D22S1045 chúng tôi thu được 86 cá thể đồng hợp tử và 114 cá thể dị hợp tử, xuất hiện 7 loại alen, thấp hơn 1 alen so với quần thể người Mỹ da trắng và quần thể người Mỹ gốc Châu Á (đều xuất hiện 8 loại alen).

65

Bảng 3.28. So sánh tần suất alen (%) của locus D22S1045 [30]

Alen

11 12 13 14 15 16 17 18 19 Dân tộc Kinh (N = 200) 23.5 - - 6.75 35.75 22.5 10.75 0.5 0.25 Người Mỹ da trắng (N= 361) 13.99 1.25 0.69 5.68 32.13 38.23 7.48 0.55 - Người Mỹ gốc Châu Á (N = 97) 20.1 0.52 - 1.03 30.93 22.68 22.16 2.06 0.52

Phân bố các alen của locus D22S1045 ở các quần thể khác nhau có sự khác nhau rõ rệt. Ở cả 3 quần thể, alen 15 phân bố tương đồng nhau (hơn 30%). Tuy nhiên, quần thể người Mỹ da trắng, alen 16 là alen có tần suất cao nhất (38.23%) nhưng hai quần thể còn lại thì alen này chỉ có hơn 22% và alen 15 mới là alen có tần suất cao nhất (35.75% đối với quần thể người dân tộc Kinh tại Việt Nam và 30.93% đối với quần thể người Mỹ gốc Châu Á).

Từ việc so sánh bảng tần suất các alen của 12 locus không có trong bộ kít Identifiler khi khảo sát quần thể người dân tộc Kinh tại Việt Nam, quần thể người Mỹ da trắng và quần thể người Mỹ gốc Châu Á bằng bộ kít FSA cho thấy:

- Sự phân bố alen của 12 locus này ở quần thể người dân tộc Kinh khác biệt so với các quần thể còn lại, cụ thể ở: Alen 15 của locus D1S1656; Alen 12 của locus D2S411; Alen 8 của locus D4S2408; Alen 11 và 12.5 của locus D6S1043; Alen 11 của locus PentaE; Alen 11 của locus D17S1301; Alen 13 và 15 của locus D20S482. Điều này khẳng định việc cần thiết phải khảo sát tính đa hình của từng quần thể khác nhau, không thể áp dụng tần suất phân bố của các quần thể khác cho quần thể người dân tộc Kinh ở Việt Nam trong công tác giám định ADN hình sự.

- 12 locus thuộc bộ kít FSA, không có trong bộ kít Identifiler đảm bảo tính đa hình đối với quần thể người dân tộc Kinh tại Việt Nam, có thể sử dụng trong giám định ADN hình sự.

66

3.2.3. Các chỉ số đánh giá trong giám định ADN hình sự

Chúng tôi đã thống kê các chỉ số đánh giá trong giám định ADN hình sự của 27 locus được khảo sát từ 200 người dân tộc Kinh tại Việt Nam tại phần Phụ lục 3.

3.2.4.1. Khả năng phân biệt (PD)

Chỉ số này cho ta biết khả năng phân biệt giữa 2 cá thể không liên quan được xác định về kiểu gen trong quần thể được nghiên cứu, chỉ số này càng gần tới giá trị 1 thì khả năng phân biệt càng cao. Chỉ số PD có thể đánh giá khả năng truy nguyên cá thể từ dấu vết [38].

Hình 3.6. Biểu đồ so sánh chỉ số PD giữa 27 locus

Nếu một hồ sơ ADN được phân tích từ mẫu thu ở hiện trường cho kết quả kiểm tra trùng với hồ sơ ADN của đối tượng khả nghi thì câu hỏi đặt ra là liệu hai mẫu đó có phải từ cùng một người không? Việc khẳng định xác suất

67

chính xác là bao nhiêu, phụ thuộc vào độ tin cậy của phương pháp phân tích ADN và khả năng phân biệt của từng locus nghiên cứu, phân tích. Việc xác định khả năng phân biệt của từng locus giúp tính toán được độ chính xác trong từng trường hợp cụ thể, hạn chế tối đa đưa ra kết luận không chính xác dẫn đến định hướng điều tra sai. Trong trường hợp đòi hỏi phải có độ chính xác cao hơn thì cần nghiên cứu bổ sung thêm các locus khác hoặc kết hợp với các nguồn chứng cứ điều tra khác để cho kết quả cao nhất.

Mỗi locus có khả năng phân biệt khác nhau, vì vậy, có vai trò quan trọng khác nhau trong việc tính toán độ tin cậy. Sắp xếp và lập biểu đồ theo khả năng phân biệt từ thấp đến cao của các locus trong quần thể nghiên cứu (hình 3.6), chúng tôi thấy locus FGA có khả năng phân biệt cao nhất với (0.9692) nên có ý nghĩa nhất trong giám định ADN hình sự. Còn locus TPOX có khả năng phân biệt thấp nhất với (0,7572).

3.2.4.2. Khả năng loại trừ (PE)

Hình 3.7. Biểu đồ so sánh chỉ số PE giữa 27 locus

68

Chỉ số khả năng loại trừ nhằm xác định khả năng ngẫu nhiên 2 cá thể không có quan hệ huyết thống mà trên thực tế lại có thể cho nhận các alen. Chỉ số này tùy thuộc vào từng cá thể; giá trị của chỉ số càng gần tới 1 thì khả năng nhận định sai về huyết thống trên lý thuyết càng nhỏ.

Mỗi locus có khả năng loại trừ khác nhau, vì vậy, nó có vai trò quan trọng khác nhau trong việc tính toán độ tin cậy. Locus càng có khả năng loại trừ cao thì càng có ý nghĩa trong giám định truy nguyên cá thể và xác định huyết thống cha - mẹ con.

Sắp xếp và lập biểu đồ theo khả năng loại trừ từ thấp đến cao của các locus trong quần thể nghiên cứu (Hình 3.7), tương tự như khả năng phân biệt thì khả năng loại trừ của locus FGA là cao nhất (0.7954), còn locus D22S1045 có khả năng loại trừ thấp nhất (0.2564).

3.2.4.3. Chỉ số quan hệ huyết thống (PI)

Hình 3.8. Biểu đồ so sánh chỉ số PI giữa 27 locus

Chỉ số quan hệ huyết thống (PI) là giá trị tính toán được đưa ra từ một locus, phản ánh khả năng gấp bao nhiêu lần cá thể đang được phân tích là

69

người cha (mẹ) sinh học so với một cá thể được lựa chọn ngẫu nhiên trong cùng quần thể.

Nếu PI ≤ 1, locus đó hoàn toàn không có ý nghĩa trong việc xác định

huyết thống cha, mẹ - con.

Nếu PI >1, thì locus đó có giá trị trong việc xác định huyết thống cha, mẹ - con. Tính đa hình của locus đó càng lớn thì giá trị này càng cao và càng có giá trị cao trong việc xác định huyết thống cha, mẹ - con.

Kết quả thống kê ở phần Phụ lục 3 cho thấy tất cả 27 locus trong nghiên cứu của chúng tôi đều cho giá trị lớn hơn 1, tức là chúng đều có ý nghĩa trong việc xác định huyết thống cha, mẹ - con.

Sắp xếp và lập biểu đồ theo chỉ số quan hệ huyết thống từ thấp đến cao của các locus trong quần thể nghiên cứu (Hình 3.8) chúng tôi nhận thấy locus FGA có chỉ số quan hệ huyết thống cao nhất (5), còn locus D22S1045 có chỉ số quan hệ huyết thống thấp nhất (1.16).

3.2.4.4. Chỉ số đa hình (PIC)

Hình 3.9. Biểu đồ so sánh chỉ số PIC giữa 27 locus

70

Chỉ số đa hình (PIC) để chỉ mức độ đa hình của một locus. Sắp xếp và lập biểu đồ theo chỉ số đa hình từ thấp đến cao của các locus trong quần thể nghiên cứu (Hình 3.9) chúng tôi nhận thấy locus FGA có chỉ số đa hình cao nhất (0.86), còn locus TPOX có chỉ số đa hình thấp nhất (0.51).

3.2.4.5. Các chỉ số kết hợp đánh giá giá trị bảng tần suất alen

Để đánh giá chất lượng bảng tần suất cũng như khả năng áp dụng vào công tác giám định ADN, các chỉ số kết hợp được tính toán bao gồm: Chỉ số kết hợp khả năng loại trừ - Combined Power of Exclusion (CPE), chỉ số kết hợp khả năng phân biệt - Combined Power of Discrimination (CPD) và chỉ số kết hợp xác định quan hệ huyết thống đặc trưng (Combined Paternity Index - CPI) cho toàn hệ 27 locus thuộc bộ kít FSA đối với quần thể người dân tộc Kinh tại Việt Nam.

- Chỉ số kết hợp khả năng loại trừ (Combined Power of Exclusion - CPE): Mỗi một bảng tần suất có một giá trị kết hợp khả năng loại trừ khác nhau dựa vào tần suất alen và số alen của tộc người tính được. Trong thang đánh giá, các chỉ số CPE có giá trị cao có ý nghĩa hơn giá trị CPE thấp. Lý tưởng nhất là CPE càng gần giá trị 1,00 càng tốt, nếu chỉ số CPE là 1,00 có nghĩa là không có khả năng buộc tội sai cho một nghi phạm nào đó khi có hai hồ sơ ADN giống nhau.

- Chỉ số kết hợp khả năng phân biệt (Combined Power of discrimination - CPD) là chỉ số quan trọng để đánh giá giá trị sử dụng của từng locus ADN trong bảng tần suất được tính.

- Chỉ số kết hợp xác định quan hệ huyết thống đặc trưng (Combined Paternity Index - CPI) là chỉ số kết hợp giá trị PI của toàn bộ các locus được phân tích, phản ánh khả năng gấp bao nhiêu lần cá thể đang được phân tích là người cha (mẹ) sinh học so với một cá thể được lựa chọn ngẫu nhiên trong cùng quần thể.

Kết quả tính toán các chỉ số kết hợp đánh giá giá trị bảng tần suất alen của quần thể, so sánh với các chỉ số đánh giá bảng tần suất theo hệ Identifiler

71

của một số dân tộc tại Việt Nam từ nghiên cứu khác được chúng tôi tổng hợp trong Bảng 3.29 [33].

Bảng 3.29. Tổng hợp và so sánh các chỉ số đánh giá bảng tần suất

Dân tộc Kinh tại Việt Nam

1-2.2x10-30

0.99999999995522

14718785685

(Hệ FSA, N=200)

0.999999999999999990948

Dân tộc Kinh tại Việt Nam

0.999997555

1928022

(1-7,4210-18)

(Hệ ID, N=8962)

0.999999999999999985006

Dân tộc Khmer tại Việt Nam

0.999996888

3804

(1-9,910-18)

(Hệ ID, N=150

0.9999999999999999892477

Dân tộc Hoa tại Việt Nam

0.999997347

9279

(1-7.74810-18)

(Hệ ID, N=150)

Quần thể CPD CPE CPI

Từ bảng tổng hợp và so sánh trên cho thấy tất cả các chỉ số kết hợp đánh giá giá trị bảng tần suất alen của 27 locus theo hệ FSA đối với quần thể người dân tộc Kinh tại Việt Nam đều cao hơn rất nhiều so với các bảng tần suất alen theo hệ Identifiler của các quần thể người dân tộc Kinh, dân tộc Khmer và dân tộc Hoa tại Việt Nam. Đặc biệt, các chỉ số CPD và CPE đã tiệm cận giá trị 1, tức là khi có 2 hồ sơ ADN với đầy đủ kiểu gen thì gần như là tuyệt đối của một người và không có khả năng buộc tội sai cho nghi phạm.

72

3.3. MỘT SỐ VÍ DỤ VỀ ỨNG DỤNG KẾT QUẢ CỦA ĐỀ TÀI

Ví dụ 1

- Nội dung vụ việc:

Ngày 21/6/2019, bà Lê Thị L. (sinh năm 1987) tố giác tên Trần Văn H. (sinh năm 1977, địa chỉ thường trú tại phường CK., thị xã Từ Sơn - Bắc Ninh) đã có hành vi giao cấu con bà là Nguyễn Thị Diễm N. (sinh ngày 25/10/2006, địa chỉ thường trú tại phường PK, thị xã Từ Sơn - Bắc Ninh) dẫn đến Nguyễn Thị Diễm N. có thai 26 tuần tuổi và ngày 25/8/2019 đã sinh con.

Để có cơ sở xử lý vụ việc, Cơ quan Cảnh sát điều tra - Công an thị xã Từ Sơn, tỉnh Bắc Ninh tiến hành thu mẫu và ra Quyết định trưng cầu giám định Viện Khoa học hình sự giám định ADN để xác định đối tượng Trần Văn H. có phải là cha đẻ (cha sinh học) của cháu bé do Nguyễn Thị Diễm N. sinh ra vào ngày 25/8/2019 không?

- Kết quả giám định:

Viện Khoa học hình sự đã tiến hành giám định ADN (sử dụng bộ kít

ForenSeqTM DNA Signature Prep - Mix A).

Ứng dụng bảng tần suất được nghiên cứu đối với người dân tộc Kinh tại Việt Nam vào việc tính xác suất, kết luận: Trần Văn H. là cha đẻ (cha sinh học) của cháu bé do Nguyễn Thị Diễm N. sinh ra vào ngày 25/8/2019 với xác suất 99,999999998%.

Ví dụ 2

- Nội dung vụ việc: Ngày 14/10/2019 tại khu phố X., thị trấn Ba Tri, huyện Ba Tri, tỉnh Bến Tre đã xảy ra vụ án mạng. Nguyễn Văn L. (sinh năm 1961, địa chỉ thường trú tại: số Y., đường 19/5, thị trấn Ba Tri, huyện Ba Tri, tỉnh Bến Tre) dùng búa (loại búa dùng để bổ củi) chém ông Nguyễn Văn D. (sinh năm 1961). Hậu quả ông D. tử vong trên đường đi cấp cứu.

Viện Khoa học hình sự đã nhận được Quyết định trưng cầu giám định của Cơ quan Cảnh sát điều tra - Công an tỉnh Bến Tre yêu cầu giám định

73

ADN kèm theo mẫu vật của vụ án để xác định trên chiếc quần dài và áo sơmi ngắn tay thu của đối tượng Nguyễn Văn L. và trên chiếc búa thu tại hiện trường có dính máu người không? Nếu có dính máu người thì có phải là máu của nạn nhân Nguyễn Văn D. không?

- Kết quả giám định: Viện Khoa học hình sự đã tiến hành giám định

ADN (sử dụng bộ kít ForenSeqTM DNA Signature Prep - Mix A).

Ứng dụng bảng tần suất được nghiên cứu đối với người dân tộc Kinh tại Việt Nam vào việc tính xác suất, kết luận: Trên chiếc quần dài, áo sơmi ghi thu của đối tượng Nguyễn Văn L. và trên chiếc búa ghi thu tại hiện trường đều dính máu của nạn nhân Nguyễn Văn D. với xác suất 99,999999999%.

74

CHƯƠNG 4: KẾT LUẬN VÀ KIẾN NGHỊ

KẾT LUẬN

Với kết quả khảo sát và xây dựng bảng dữ liệu tần suất các alen của 27 locus thuộc bộ kít ForenSeqTM DNA Signature Prep - Mix A của hãng Illumina từ quần thể người dân tộc Kinh tại Việt Nam chúng tôi có một số kết luận như sau:

1. Bộ kít ForenSeqTM DNA Signature Prep - Mix A với 27 locus STR trên nhiễm sắc thể thường mang tính đa hình di truyền đối với quần thể người dân tộc Kinh tại Việt Nam, trong đó locus FGA có tính đa hình cao nhất và locus TPOX có tính đa hình thấp nhất, có 15 locus STR tương đồng với hệ Identifiler đang được sử dụng trong giám định ADN hình sự tại Việt Nam.

2. Đề tài đã đưa ra bảng dữ liệu tần suất đầy đủ các alen của 27 locus thuộc bộ kít ForenSeqTM DNA Signature Prep - Mix A được phân tích từ 200 mẫu máu người dân tộc Kinh tại Việt Nam. Bảng dữ liệu tần suất này đã được kiểm định và cho thấy 200 mẫu khảo sát (mẫu thực nghiệm) phù hợp với quần thể lý thuyết, phản ánh tính khách quan của mẫu thu và đều đạt yêu cầu trong tính toán truy nguyên cá thể và xác định quan hệ huyết thống.

75

KIẾN NGHỊ

Thông qua kết quả nghiên cứu của đề tài, chúng tôi có thể đề xuất một

số nội dung sau:

1. Bổ sung bảng tần suất các alen của 27 locus STR trên nhiễm sắc thể thường thuộc bộ kít ForenSeqTM DNA Signature Prep - Mix A vào Quy trình

giám định ADN (đã được ban hành kèm theo Thông tư số 46/2013/TT-BCA

ngày 05/11/2013 của Bộ trưởng Bộ Công an) để tính xác suất trong các Kết

luận giám định ADN truy nguyên cá thể và xác định quan hệ huyết thống

phục vụ công tác điều tra tội phạm và yêu cầu giám định của các tổ chức và

cá nhân.

2. Cần phải có các nghiên cứu khảo sát tính đa hình về trình tự nucleotit

của các locus STR và tính đa hình đơn nucleotit (SNP) đối với các dân tộc

khác nhau tại Việt Nam để áp dụng trong giám định ADN khi đối tượng giám

định là các mẫu khó (lượng dấu vết ít, mẫu trong quá trình phân hủy, mẫu có

ADN đột biến, mẫu hài cốt, mẫu lẫn...).

3. Mở rộng nghiên cứu với số lượng mẫu lớn hơn, với nhiều nhóm quần

thể khác nhau để xây dựng cơ sở dữ liệu lớn (big data) phục vụ cuộc "Cách

mạng công nghiệp 4.0".

76

TÀI LIỆU THAM KHẢO

1. Chu Văn Mẫn, Đào Hữu Hồ, 1999, Giáo trình thống kê sinh học, Nhà

xuất bản Khoa học và kỹ thuật.

2. Lê Đình Lương, Phan Cự Nhân, 2003, Cơ sở di truyền học, Nhà xuất bản

Giáo dục.

3. Hồ Huỳnh Thùy Dương, 2001, Sinh học phân tử, Nhà xuất bản Y học.

4. Brinkmann B., 1992, Proceeding from the Third Int. Symposium on

Human Identification, Promega Corporation, Madison, pp. 357-373.

5. Brown T.A., 2010, Gene cloning and DNA analysis. Sixth edition, A John

Wiley & Sons, Ltd., Publication, USA.

6. Carracedo A., Lareu M.V., 1998, Development of new STRs for forensic casework: Criteria for selection, sequencing and population data and forensic validation, Proceedings from the 9th International Symposium on Human Identification, Madison WI: Promega corporation, pp. 89-107.

7. Gill P., Evett I., 1995, Population genetics of short tandem repeat (STR)

loci, Genetica, 96(1-2), pp. 69-87.

8. Butler J.M., Schoske R., Peter M., Vallone P.M., Redman J.W., Margaret, Kline M.C., 2003, Allele Frequencies for 15 Autosomal STR Loci on U.S. Caucasian, African American and Hispanic Populations, Journal of Forensic Sciences, 48(4), pp.1-4.

9. Catherine A., David D. E., Marco S., 2005, Identification and characterization of variant alleles at Codis Str Loci, Journal of Forensic Sciences, 50(5), pp.1128-1133.

10. 18Butler J.M., 2009, Fundamentals of Forensic DNA Typing, Academic

Press, London.

11. Butler J. M., 2005, Forensic DNA Typing: Biology, Technology, and

Genetics of STR Markers, second edition, Academic Press, London.

12. National Research Council, 1992, DNA technology in forensic science,

National Academy Press, Washington D.C.

13. National Research Council, 1996, The evaluation of forensic DNA

evidence, National Academy Press, Washington D.C.

77

14. Phạm Ngọc Sơn, 2016, Khảo sát và xây dựng cơ sở dữ liệu tần suất các alen của 15 locus gen hệ Identifiler từ quần thể người dân tộc Khmer ứng dụng trong giám định ADN, Đề tài khoa học Bộ Công an, Hà Nội.

15. Trần Trọng Hội, Lê Thị Bích Trâm, Phạm Đăng Khoa, Hồ Quang Huy, Trịnh Đình Đạt, Nguyễn Văn Hà, 2015, Khảo sát tần suất alen của 15 locus STR trên nhiễm sắc thể thường trong quần thể người Mường sống ở tỉnh Hòa Bình, Việt Nam, Tạp chí Phân tích Hóa - Lý và Sinh học, 20 (3), tr. 208-214.

16. Chakraborty, 1992, Sample size requirements for addressing

the population genetic issues of forensic use of DNA typing, Human Biology, 64, pp. 141-159.

17. Lê Thị Thu Thủy, 2012, Khảo sát và xây dựng cơ sở dữ liệu tần suất các alen của 15 gen hệ Identifiler trong quần thể người Việt (Kinh) ứng dụng trong giám định gen (ADN) của lực lượng Kỹ thuật hình sự, Đề tài khoa học Bộ Công an, Hà Nội.

18. John Buckleton, Christopher M. Triggs, Simon J. Walsh, 2005, Forensic

DNA Evidence Interpretation, CRC press. 19. ForenSeqTM DNA Signature Prep Guide 2015.

20. Yang Y., Xie B., Yan., 2014, Application of Next - Generation Sequencing Technology in Forensic Science, Genomicis Proteomics Bioinformatics, 12, pp.190-197.

21. Butler J. M., 2011, Advanced Topics in Forensic DNA Typing: Methodology, Contribution of the National Institute of Standards and Technology.

22. Zhivotovsky et al., 2009, An STR database on the Volga-Ural population,

Forensic Science International: Genetics, 3, pp. 133-136.

23. Hà Quốc Khanh, 2000, Điều tra và xây dựng cơ sở dữ liệu tần suất các gen hệ Nineplex người Việt (Kinh) ứng dụng trong giám định gen, Đề tài khoa học Bộ Công an, Hà Nội.

24. Tamyra R. Morettia, Lilliana I. Morenoa, Jill B. Smericka, Michelle L. Pignonea, Rosana Hizona, John S. Buckletonb, Jo-Anne Brightb, Anthony J. Onoratoa, 2016, Population data on the expanded CODIS core STR loci for eleven populations of significance for forensic DNA analyses in the United States, Forensic Science International: Genetic, 25, pp. 175-181.

78

25. Xiaoye Jin et al., 2017, Phylogenic analysis and forensic genetic characterization of Chinese Uyghur group via autosomal multi STR markers", Oncotarget 8, 73837–73845, DOI: 10.18632/oncotarget.17992.

26. Xiang Sheng, Yali Wang, Jiashuo Zhang, Liqin Chen, Yuan Lin, Zhenmin Zhao, Chengtao Li & Suhua Zhang, 2018, Forensic investigation of 23 autosomal STRs and application in Han and Mongolia ethnic groups, Forensic Sciences Research, DOI: 10.1080/20961790.2018.1428782.

27. Stefano C., Stefania T., Melissa F., Emanuela C., Domenico DL., 2015, MiSeq FGx sequencing system: A new platform for forensic genetics, Forensic Science International: Genetics Supplement Series, 5, pp. 98- 100.

28. John M. Butler, Sheila Willis, 2019, Interpol review of forensic biology and forensic DNA typing 2016-2019, Forensic Science International: Synergy, DOI: https://doi.org/10.1016/j.fsisyn.2019.12.002.

29. Churchill J. D., Schmedes S. E., King J. L., Budowle B., 2016, Evaluation of the Illumina® Beta Version ForenSeq™ DNA Signature Prep Kit for use in genetic profiling, Forensic Science International: Genetics Supplement Series, 20, pp. 20-29.

30. Kobilinsky L., Levine L., Margolis Nunno H., 2007, Forensic DNA

Analysis, Chelsea House.

tandem repeats in

31. Se-Yong Kim, Han-Chul Lee, Ukhee Chung, Seon-Kyu Ham, Ho Yeon Lee, Su Jeong Park, Ye Jee Roh, Seung Hwan Lee, 2018, Massive parallel the Korean population, sequencing of short Electrophoresis Journal, pp. 1-6.

32. Katherine Butler Gettings, Lisa A. Borsuk, Carolyn R. Steffen, Kevin M. Kiesler, Peter M. Vallone, 2018, Sequence-based U.S. population data for 27 autosomal STR loci, Forensic Science International: Genetic, 37, pp. 106-115.

33. Trịnh Tuấn Toàn, 2019, Nghiên cứu đặc trưng tần suất alen hệ nhận dạng STR (AmpFlSTR® Identifiler® Plus Kit) của một số tộc người Việt Nam để ứng dụng trong giám định ADN, Luận văn Tiến sỹ, Trường Đại học KHTN - ĐHQG Hà Nội, Hà Nội.

79

34. Nguyễn Thị Hồng Nhung, 2016, Đánh giá bộ kit ForenSeq trên hệ thống MiSeq FGx ứng dụng trong định danh cá thể người Việt Nam, Luận văn Thạc sỹ khoa học - Trường ĐH KHTN, ĐHQG Hà Nội, Hà Nội.

35. Phạm Xuân Kiều, 2005, Giáo trình Xác suất và thống kê, Nhà xuất bản

Giáo dục.

36. Butler J. M., Coble M. D., Vallone P. M., 2007, STRs vs SNPs: thought on the future of forensic DNA testing, Forensic Science Medicine Pathology, 3, pp. 200-205.

37. Butler J.M., 2015, Advanced Topics in Forensic DNA Typing:

Interpretation, Academic press, pp. 245-270.

38. Fung W. K., Hu Y. Q., 2008, Statistical DNA Forensic: Theory, Methods

and Computation, John Wiley and Sons Ltd., USA.

39. AmpFlSTR® Identifiler® PCR Amplification Kit - User’s Manual.

PHỤ LỤC 1: BẢNG TỔNG HỢP KIỂU GEN CỦA 27 LOCUS STR TRÊN NHIỄM SẮC THỂ THƯỜNG TỪ 200 CÁ THỂ NGƯỜI DÂN TỘC KINH

Phần 1: Các locus trùng với hệ Identifiler

AMEL

TH01

vWA

TPOX

FGA

Ký hiệu M001 M002 M003 M004 M005 M006 M007 M008 M009 M010 M011 M012 M013 M014 M015 M016 M017 M018 M019 M020 M021 M022 M023 M024 M025 M026

X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,X X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y

D8 S1179 11,15 11,14 12,15 12,13 13,15 13,13 11,15 10,10 10,10 14,15 11,15 11,14 14,15 11,14 10,11 10,12 10,14 12,16 10,15 13,14 10,10 12,13 11,13 10,10 10,16 13,13

D21 S11 29,33.2 28,29 29,32 29,29 28.2,30 28.2,32.2 29,30 29,30 29,30 29,31.2 30,33.2 32.2,33.2 29,33.2 29,33.2 30,32 29,32.2 29,30 29,31.2 29,32.2 29,31 31.2,31.2 29,31.2 30,33.2 28,32.2 32,32.2 29,30

D7 S820 11,11 12,13 12,12 11,11 10,12 10,11 12,13 8,10 8,10 8,11 10,10 11,13 10,11 8,11 10,11 11,12 9,11 12,12 11,11 10,10 10,11 10,11 9,11 11,11 8,11 10,11

CSF 1PO 11,11 12,13 12,12 12,12 11,11 11,11 10,12 10,12 10,12 12,12 11,12 10,11 11,12 11,13 11,11 12,12 11,12 11,12 10,11 11,13 10,12 11,12 12,14 10,12 8,12 11,12

D3 S1358 15,16 16,17 15,17 17,17 14,18 17,18 17,17 15,18 15,18 16,16 16,18 15,16 15,18 15,17 15,16 15,16 17,18 15,17 16,16 16,16 14,15 15,17 15,17 16,17 16,17 15,18

9,10 7,7 9,10 6,9 6,9 9,9 7,9 7,9 7,9 9,10 7,8 7,7 8,9 7,8 6,8 6,9 9,10 7,9 7,9 7,7 7,7 9,9.3 7,9 6,9.3 9,9.3 7,9

D2 S1338 20,22 17,19 17,23 23,25 20,20 18,20 18,24 19,24 19,24 20,23 19,20 16,20 17,20 20,25 23,23 20,24 20,24 17,20 19,20 24,24 16,20 23,25 23,25 17,20 18,23 18,20

D19 S433 13,13 15.2,15.2 13,14.2 13,14 14,14 14,14 14,16.2 13,14.2 13,14.2 14,14 13,13 13,14 13,14 13,15.2 12,15.2 14,15.2 13,15.2 13,15.2 13,14.2 13,16.2 13,14 13,14 12,14 14.2,15.2 13,14 14,15.2

17,18 14,18 17,18 18,19 14,16 16,17 14,14 14,17 14,17 17,17 14,18 17,18 16,18 14,17 16,18 14,18 14,14 15,18 14,17 18,18 16,17 18,19 17,19 14,14 18,20 14,17

D18 S51 13,16 14,17 14,15 13,13 14,17 13,17 14,16 14,18 14,18 12,13 16,20 14,18 20,23 14,15 15,15 14,17 12,14 14,15 14,15 14,14 13,14 14,15 12,15 14,21 13,15 16,19

D5 S818 9,12 11,11 10,12 11,12 9,10 10,12 11,12 12,13 12,13 10,10 10,11 11,12 10,11 12,12 10,10 10,13 11,13 13,13 10,12 12,12 11,11 11,12 9,15 9,13 10,13 10,13

19,23 23,26 19,26 23.2,24 23,23.2 23.2,26 22,24 20,22 20,22 22,22.2 18,21 19,21 21,21 19,24 23,26 21,21 20,26 21,22 20,26 19,24 21,21.2 21.2,22 21,21 21,23 24,24.2 19,22

11,12 9,12 8,11 8,12 8,9 8,11 8,8 8,8 8,8 8,11 8,9 8,10 8,8 8,10 9,11 8,11 8,8 8,8 8,10 8,9 8,11 8,8 8,9 8,11 8,8 8,8

D13 S317 12,12 12,13 8,12 8,8 8,12 8,8 11,11 11,13 11,13 8,11 8,9 8,10 9,11 8,12 8,11 12,12 11,12 12,12 11,13 9,11 8,12 11,12 10,12 9,9 8,8 8,10

D16 S539 9,12 10,11 11,12 11,11 11,12 11,12 9,11 12,12 12,12 9,11 12,12 12,12 9,12 12,12 9,12 10,10 11,11 10,10 9,13 12,13 11,12 11,13 9,10 9,12 11,12 9,11

80

AMEL

vWA

TPOX

TH01

FGA

Ký hiệu M027 M028 M029 M030 M031 M032 M033 M034 M035 M036 M037 M038 M039 M040 M041 M042 M043 M044 M045 M046 M047 M048 M049 M050 M051 M052 M053 M054 M055 M056 M057 M058

D8 S1179 15,16 10,11 12,16 11,11 14,15 11,13 15,16 11,12 14,15 12,13 11,14 11,11 15,16 14,15 15,16 14,16 14,17 14,16 12,15 12,14 15,16 10,10 13,15 12,13 14,14 10,12 10,13 15,16 12,13 13,16 10,11 14,15

D21 S11 31,33.2 30,32.2 30,31 30,31 28,32.2 29,31 31,33.2 32.2,33.2 27,31.2 29,31 29,31.2 30,32.2 31,33.2 29,31.2 30,30 30,31 30,32.2 29,30 30,33.2 29,30 29,32.2 28,32.2 29,29 30,32.2 29,32.2 32.2,32.2 30,30.2 31,33.2 29,30 29,32.2 28,28 29,31.2

D7 S820 8,12 8,11 8,9 10,10 11,12 8,10 8,12 8,11 8,10 11,13 10,11 11,11 8,12 8,11 7,10 9,11 8,12 10,11 10,11 11,12 11,11 11,11 11,12 8,8 12,12 9,12 9,11 8,12 9,11 9,11 10,11 11,11

X,Y X,Y X,Y X,Y X,X X,X X,Y X,Y X,Y X,Y X,Y X,X X,X X,Y X,Y X,Y X,Y X,X X,Y X,X X,X X,Y X,Y X,Y X,Y X,X X,Y X,Y X,X X,Y X,Y X,Y

CSF 1PO 12,12 12,13 10,13 11,12 10,12 11,12 12,12 10,12 12,12 12,12 11,12 11,12 12,12 12,12 12,13 11,11 12,12 12,12 12,13 10,12 9,11 10,12 12,12 12,12 12,13 11,12 10,11 12,12 10,12 11,12 11,12 10,12

D3 S1358 15,15 16,17 15,17 16,18 16,18 17,18 15,15 15,15 17,18 17,18 16,17 15,15 15,15 17,18 15,18 14,16 15,17 16,18 14,15 14,15 16,17 16,17 14,15 16,16 17,17 15,17 15,15 15,15 16,16 15,17 15,16 16,16

7,7 7,9.3 7,9 7,7 7,9 7,9 7,7 7,9.3 6,9 6,7 7,9 7,10 7,7 6,9.3 7,9 9,9 7,9 9,9.3 7,7 7,9 6,9.3 6,9.3 9,9 7,7 6,8 9,9 6,9 7,7 7,9.3 7,7 7,9 6,6

D13 S317 8,9 8,10 10,11 11,12 8,8 8,11 8,9 8,9 9,11 8,9 8,9 11,11 8,9 9,11 12,12 9,11 9,11 12,12 11,11 11,11 8,13 9,9 9,13 8,10 10,10 7,8 8,11 8,9 8,12 11,13 11,12 8,8

D16 S539 12,12 11,13 9,12 10,11 9,11 10,11 12,12 9,11 11,12 9,10 11,12 11,11 12,12 9,13 10,10 10,11 9,11 9,11 9,11 9,13 11,12 9,12 10,10 9,10 9,12 10,12 9,9 12,12 9,11 9,11 11,12 10,12

D2 S1338 17,18 18,23 24,24 19,23 19,20 19,23 17,18 20,23 20,20 22,23 17,20 19,24 17,18 22,25 20,20 18,24 19,19 16,21 20,21 20,23 17,21 17,20 17,23 19,20 23,24 18,23 18,20 17,18 17,23 22,22 19,20 23,24

D19 S433 15.2,16.2 13,14 13,14.2 14.2,15 14,14 14,14.2 15.2,16.2 13.2,16.2 13,14.2 14,14 13,14.2 13,13 15.2,16.2 13,14 14.2,14.2 14,15.2 14,15.2 14,15 15,15.2 13,13 13,13 14.2,15.2 13,14 13,14 13,14 14,15.2 13,13 15.2,16.2 14,14 14.2,16.2 13,14 13,15.2

14,17 18,20 14,18 14,15 16,18 15,17 14,17 14,19 14,14 17,19 14,14 16,19 14,14 16,19 17,18 16,16 14,17 16,18 18,21 14,17 14,20 14,14 14,17 14,18 17,17 17,19 16,19 14,17 16,17 14,17 18,20 14,19

D18 S51 13,15 14,15 13,18 13,13 13,14 13,15 13,15 16,20 16,16 14,19 13,16 16,16 13,15 16,18 14,21 14,15 15,17 16,18 15,16 13,14 14,15 14,21 16,20 14,14 12,21 13,14 15,15 13,15 15,15 15,15 13,17 15,15

D5 S818 10,13 10,11 10,11 11,12 10,13 7,11 10,13 11,11 11,12 13,13 10,12 11,11 13,13 12,12 11,12 12,12 10,12 10,10 7,11 10,11 7,10 9,13 11,13 10,10 10,11 7,12 11,11 10,13 10,10 10,13 9,13 12,12

22,27 19,25.2 20,23 19,23 21,24 19,24 22,27 19,24 18,26 21,23 18,23 23.2,24 22,27 20,23 21,22 21,26 23,23 21,26 22,23 18,25 22,26 21,23 22,23 22,25 23,25 22,25 21,22 22,27 21,22 23.2,25 22,24 21,23.2

8,8 8,8 8,8 8,9 8,8 9,11 8,8 8,8 8,8 8,8 8,11 8,11 8,8 11,11 8,10 8,9 8,11 8,8 8,8 11,11 8,8 8,11 8,8 8,12 8,11 8,8 8,8 8,8 8,8 8,8 8,11 8,11

81

AMEL

vWA

TPOX

TH01

FGA

Ký hiệu M059 M060 M061 M062 M063 M064 M065 M066 M067 M068 M069 M070 M071 M072 M073 M074 M075 M076 M077 M078 M079 M080 M081 M082 M083 M084 M085 M086 M087 M088 M089 M090

D8 S1179 12,15 14,16 12,14 13,16 13,16 13,16 10,15 13,16 11,12 10,14 10,13 14,15 11,12 10,15 13,16 18,18 12,15 12,15 12,15 13,15 12,15 14,18 13,14 10,13 12,15 13,15 10,14 11,14 9,14 11,13 9,15 11,15

D21 S11 29,32.2 30,31.2 30,30 32.2,34.2 32.2,34.2 32.2,34.2 30,32 32.2,34.2 29,33.2 29,31.2 30,33.2 29,30 29,31.2 29,32.2 32.2,34.2 28,29 30,31 29,30 30,31 29,30 30,31 31.2,33.2 32,32.2 29,30 30,31 29,29 28,29 31.2,32 30,33.2 32.2,33.2 30,33.2 29,32.2

D7 S820 10,11 12,12 10,11 10,11 10,11 10,11 11,11 10,11 8,12 11,12 11,11 10,10 10,10 11,11 10,11 8,10 10,11 10,11 10,11 11,11 10,11 11,11 11,11 11,11 10,11 10,11 11,12 12,12 9,11 10,12 9,9 10,12

X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,X X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y

CSF 1PO 11,11 12,12 11,12 12,14 12,14 12,14 10,13 12,14 10,12 10,11 11,12 11,12 10,12 11,12 12,14 13,13 11,12 11,12 11,12 12,12 11,12 12,12 10,12 12,12 11,12 10,10 10,11 11,12 7,10 11,11 7,10 10,12

D3 S1358 14,17 14,16 15,15 16,16 16,16 16,16 16,17 16,16 15,15 16,16 15,16 15,15 15,15 16,17 16,16 16,16 16,16 16,16 16,16 16,16 16,16 15,17 15,18 15,15 16,16 16,17 15,16 16,17 15,16 15,16 15,15 14,15

9,9.3 7,9 7,7 6,7 6,7 6,7 6,6 6,7 7,9 7,9 7,10 9,9 7,9 9,9 6,7 7,8 7,9 7,9 7,9 6,9 7,9 9,9 7,7 9,9 7,9 7,7 6,7 7,9 7,9 7,9 6,7 7,10

D13 S317 8,12 8,12 8,8 8,12 8,12 8,12 12,13 8,12 9,9 9,10 8,11 9,13 8,11 8,13 8,12 12,12 10,11 10,11 10,11 8,8 10,11 11,11 10,11 13,13 10,11 11,12 11,12 8,11 8,10 8,11 8,10 8,12

D16 S539 9,14 9,14 9,9 10,12 10,12 10,12 9,11 10,12 12,14 10,12 10,11 10,14 9,11 9,10 10,12 12,12 9,11 9,11 9,11 10,11 9,11 10,12 11,13 12,12 9,11 11,11 9,11 10,12 11,12 11,12 9,12 9,12

D2 S1338 17,24 17,24 19,20 19,23 19,23 19,23 17,17 19,23 17,17 24,25 19,24 23,24 21,24 19,24 19,23 22,25 23,24 23,24 23,24 24,25 23,24 16,19 19,24 19,23 23,24 18,21 24,25 24,24 19,19 17,19 19,26 19,23

D19 S433 14,16.2 14,14.2 15.2,15.2 13,14.2 13,14.2 13,14.2 14,14 13,14.2 13,13 13,14 13,13 13,14.2 15.2,15.2 13,13 13,14.2 14,15 13,15.2 13,15.2 13,15.2 14,14 13,15.2 12,14.2 12,14 14,14 13,15.2 14,15.2 13,13 13,14 13,14 12,14 13,14 13,15.2

14,14 14,17 14,18 17,18 17,18 17,18 14,17 17,18 17,17 14,14 17,18 14,17 17,17 14,16 17,18 17,18 15,17 15,17 15,17 18,19 15,17 14,16 15,17 14,14 15,17 15,16 14,19 15,16 17,18 14,18 17,18 15,18

D18 S51 14,16 13,14 15,15 16,17 16,17 16,17 16,17 16,17 15,16 15,16 15,16 11,12 14,15 15,17 16,17 13,14 16,17 16,18 16,18 16,18 16,18 15,16 13,13 15,15 16,18 13,16 13,14 16,18 15,16 14,16 15,15 13,16

D5 S818 7,9 10,13 12,13 11,11 11,11 11,11 12,13 11,11 9,11 10,11 10,12 10,10 10,10 11,11 11,11 10,13 7,11 7,11 7,11 10,11 7,11 9,11 7,11 11,12 7,11 10,11 11,12 11,13 10,10 11,12 10,11 7,10

21,22 21,24 21,22 22,24.2 22,24.2 22,24.2 20,25 22,24.2 23,24 21,24 20,22 19,21 18,22 25,27 22,24.2 21,22 22,25 22,25 22,26 19,22 22,26 22,23 22,22 21,22 22,26 24,24 22,24 25,25 22,25.2 23,24 20.2,22 21,25

8,8 10,11 8,11 8,8 8,8 8,8 8,11 8,8 8,11 8,11 8,9 8,8 8,9 8,8 8,8 11,11 8,11 8,11 8,11 11,11 8,11 8,11 11,11 8,8 8,11 8,8 8,11 8,8 8,8 11,11 8,8 8,9

82

AMEL

vWA

TPOX

TH01

FGA

Ký hiệu M091 M092 M093 M094 M095 M096 M097 M098 M099 M100 M101 M102 M103 M104 M105 M106 M107 M108 M109 M110 M111 M112 M113 M114 M115 M116 M117 M118 M119 M120 M121 M122

D8 S1179 13,14 14,15 12,16 10,16 11,13 14,14 11,13 10,14 13,14 11,13 13,14 10,15 10,13 12,12 10,13 15,16 10,13 10,10 12,12 13,16 12,15 12,15 10,12 12,15 10,11 11,12 10,18 10,14 11,14 12,13 8,12 14,16

D21 S11 30,31.2 32.2,33.2 31,31.2 29,31 29,33.2 31,31 29,33.2 30,31.2 31.2,31.2 29,33.2 29,33.2 29,30 30,30 30,31 29,32.2 29,30 28,29 29,32.2 29,32.2 29,31.2 31,33.2 29,31.2 31.2,31.2 29,32.2 29,32.2 31.2,33.2 30,30.2 30.2,32.2 29,29 31.2,32.2 29,31 30,32.2

D7 S820 8,12 7,9 9,10 10,11 8,11 8,12 8,13 10,12 10,13 8,11 11,11 8,11 11,11 10,11 11,12 10,12 8,10 8,11 10,12 8,11 10.1,11 11,11 8,12 12,12 12,12 9,14 10,12 12,12 8,12 8,10 8,11 9,10

X,X X,X X,X X,X X,Y X,X X,Y X,Y X,X X,Y X,X X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,X X,X X,Y X,X X,Y X,Y X,X

CSF 1PO 9,11 10,12 11,12 11,12 11,12 11,14 11,12 12,12 11,12 11,12 11,13 12,12 9,11 12,12 12,13 11,12 12,13 12,12 10,12 12,12 12,12 9,10 12,12 7,11 10,12 10,11 10,11 11,12 10,12 10,11 10,12 9,10

D3 S1358 15,16 15,15 15,17 14,15 17,17 15,17 16,17 16,17 17,17 17,17 15,16 15,16 15,18 16,17 15,15 13,15 15,15 16,17 14,16 17,17 16,16 15,16 16,17 16,18 15,17 15,16 14,16 16,17 15,17 17,18 15,15 16,16

9,10 6,9.3 6,9 7,7 7,10 8,9 7,10 7,7 7,9.3 7,10 6,9 8,9 7,9 8,9 7,9 6,7 6,6 9,9.3 7,9 7,9 7,7 9,9.3 6,9 7,9 9,9.3 9,10 6,6 7,9 8,9 8,9 6,7 7,7

D13 S317 8,8 10,11 8,12 9,10 8,11 12,12 8,11 9,11 8,12 8,11 8,9 10,11 12,13 8,8 11,11 9,11 9,12 8,11 8,9 8,11 11,11 10,12 10,11 8,8 11,11 9,12 12,13 9,10 8,13 8,8 8,9 9,10

D16 S539 9,12 11,11 8,13 12,13 10,12 9,11 10,12 9,12 10,13 10,12 11,11 9,9 12,12 9,12 10,11 10,12 9,10 12,13 10,12 9,10 11,12 10,12 10,12 11,12 9,12 11,12 10,11 9,12 11,13 11,12 11,11 12,13

D2 S1338 19,24 19,20 17,19 18,19 20,23 23,25 20,23 17,17 18,20 20,23 19,24 19,24 17,23 18,20 16,24 23,25 16,22 18,18 18,20 21,21 19,23 20,20 20,23 18,22 17,21 19,23 23,24 19,22 19,21 24,25 18,25 23,24

D19 S433 14,14.2 13.2,15.2 12,13 13,14 14,15.2 13,14 14,15.2 13,13 13,13.2 14,15.2 13,14 13,14 13,14.2 14,14 12,14.2 13,13 14,14.2 14,15 13.2,14 14,14.2 15,15.2 13,14.2 13,15.2 14.2,14.2 12,12 14,15.2 13,14 13,14 12.2,13.2 14,15.2 15.2,15.2 13,15

17,19 14,19 16,20 17,17 16,18 17,19 17,18 14,18 15,16 17,18 19,19 18,18 14,18 14,19 17,17 16,20 14,16 14,19 14,16 14,17 14,17 14,18 14,18 14,18 14,19 14,21 16,18 14,14 17,18 18,18 17,18 14,14

D18 S51 13,15 13,13 17,20 14,17 13,14 12,18 13,16 16,17 12,15 13,16 14,16 14,19 14,17 12,14 15,16 15,17 16,19 14,14 15,15 15,16 14,20 13,17 13,16 12,15 18,18 14,17 16,18 14,17 17,18 13,16 15,16 12,14

D5 S818 10,10 9,10 13,13 11,13 12,13 10,13 12,13 12,14 10,12 12,13 10,12 9,11 10,12 10,11 10,11 10,12 10,13 10,12 13,13 12,13 9,10 10,13 7,11 11,13 11,12 10,11 7,10 11,12 11,12 7,12 10,13 11,12

22,22 22,27 19,22 22,22 22,22 25,26 22,22 23,23 20,23 22,22 24,25 23,24 22,22 22,24 21,24 23,24 23,23 19,21.2 22.2,24 18,19 18,26 22,23 22,23 23,25 19,23 23,24 21,22 19,21 23,24 19,21 19,25 21,22

8,11 8,11 8,8 11,11 8,8 8,11 8,8 9,11 8,10 8,8 8,8 8,11 8,8 11,11 8,11 8,11 8,8 8,11 8,8 8,8 8,11 8,11 8,9 8,11 11,11 8,11 8,8 8,12 8,11 9,11 8,11 8,9

83

AMEL

vWA

TPOX

TH01

FGA

Ký hiệu M123 M124 M125 M126 M127 M128 M129 M130 M131 M132 M133 M134 M135 M136 M137 M138 M139 M140 M141 M142 M143 M144 M145 M146 M147 M148 M149 M150 M151 M152 M153 M154

D8 S1179 13,16 11,11 11,14 10,12 10,11 11,14 12,15 14,17 12,14 10,15 13,13 10,14 10,10 12,13 11,14 11,14 12,16 10,15 10,15 11,15 11,15 11,11 11,13 14,15 11,14 10,15 10,10 13,15 11,15 11,12 10,12 12,13

D21 S11 29,30 31.2,33.2 32.2,34 30,30 32.2,32.2 28,28 33.2,33.2 31.2,33.2 33.2,33.2 29,32.2 29,30 29,31 31.2,31.2 29,31.2 32.2,33.2 29,33.2 30,31 28,31.2 28,31.2 29,33.2 29,33.2 29,30 29,31 27,31.2 29,31.2 28,31.2 28,32.2 30,32 30,30 29,32.2 29,29 32.2,33.2

D7 S820 11,11 11,12 10,11 11,11 10,11 11,12 10,11 10,11 10,11 11,11 10,11 9,11 10,11 10,11 11,13 8,11 8,9 8,13 8,13 11,11 11,11 10,10 8,10 8,10 10,11 8,13 11,11 11,12 10,11 11,11 9,10 8,11

X,Y X,Y X,X X,Y X,Y X,Y X,Y X,X X,X X,Y X,Y X,X X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,X X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y

CSF 1PO 10,12 12,13 10,12 11,12 10,12 10,13 10,12 12,12 10,12 10,11 11,12 11,12 10,12 11,12 10,11 11,13 10,13 10,12 10,13 11,11 11,11 11,12 11,12 12,12 11,12 10,12 10,12 10,13 12,12 11,12 10,12 10,12

D3 S1358 14,17 16,16 15,19 17,18 16,16 16,17 15,15 16,18 15,16 16,16 15,18 17,18 14,15 15,17 15,16 15,17 15,17 16,16 16,16 15,16 15,16 16,18 17,18 17,18 16,17 16,16 16,17 14,16 15,19 16,16 15,15 15,16

7,7 6,6 7,7 9,9 7,9.3 6,9 6,7 7,8 6,7 7,9 7,9 9,10 7,7 9,9.3 7,7 7,8 7,9 9,10 9,10 9,10 9,10 7,7 7,9 6,9 7,9 9,10 6,9.3 9,10 7,7 7,7 9,9 6,9

D13 S317 8,11 8,8 8,11 8,8 8,10 8,12 8,12 8,11 11,12 11,13 8,10 11,12 8,12 11,12 8,10 8,12 10,11 8,12 8,12 12,12 12,12 11,12 8,11 9,11 8,9 8,12 9,9 8,11 10,12 8,8 8,11 8,10

D16 S539 9,11 11,12 10,12 10,12 11,11 12,13 9,13 9,9 9,9 9,13 9,11 11,11 11,12 11,13 12,12 12,12 9,12 12,12 12,12 9,12 9,12 10,11 10,11 11,12 11,12 12,12 9,12 9,11 9,9 9,11 9,9 11,12

D2 S1338 19,19 21,26 18,23 17,19 18,24 19,24 18,24 19,24 18,19 19,20 18,20 20,24 16,20 23,25 16,20 20,25 24,24 20,20 20,20 20,22 20,22 19,23 19,23 20,20 17,20 20,20 17,20 19,24 17,23 20,24 19,23 21,24

D19 S433 13,13.2 13,15.2 14,15 13,14 12,16.2 14,16 13,15.2 14,14 13,14 13,14.2 14,15.2 13,15.2 13,14 13,14 13,14 13,15.2 13,14.2 15,15.2 15,15.2 13,13 13,13 14.2,15 14,14.2 13,14.2 13,14.2 15,15.2 14.2,15.2 13,14 14,15 14.2,15.2 14,15 13,15

14,18 17,18 14,19 18,20 16,19 14,20 16,17 17,17 16,17 14,17 14,17 14,14 16,17 18,19 17,18 14,17 14,18 17,17 17,17 17,18 17,18 14,15 15,17 14,14 14,14 17,17 14,14 14,14 14,18 19,19 17,19 14,15

D18 S51 13,14 12,15 15,16 14,19 15,17 15,15 13,13 14,16 13,14 14,15 16,19 12,14 13,14 14,15 14,18 14,15 13,18 13,16 13,16 13,16 13,16 13,13 13,15 16,16 13,16 13,16 14,21 15,17 13,14 16,16 13,14 15,16

D5 S818 11,13 11,12 10,13 11,13 11,13 11,12 11,12 13,13 11,13 10,12 10,13 11,13 11,11 11,12 11,12 12,12 10,11 12,12 12,12 9,12 9,12 11,12 7,11 11,12 10,12 12,12 9,13 7,13 10,13 10,11 9,10 11,12

23,25 19,20 21,21.2 19,22 22,24 22,25 21,26 23,24 24,26 20,26 19,22 20,26 21,21.2 21.2,22 19,21 19,24 20,23 19,21 19,21 19,23 19,23 19,23 19,24 18,26 18,23 19,21 21,23 23,24 19,20 20,24 22,23 20,23

8,9 8,11 8,11 8,11 8,9 8,11 9,11 8,8 8,11 8,10 8,8 8,8 8,11 8,8 8,10 8,10 8,8 8,11 8,11 11,12 11,12 8,9 9,11 8,8 8,11 8,11 8,11 8,8 11,11 8,9 8,11 8,9

84

AMEL

vWA

TPOX

TH01

FGA

Ký hiệu M155 M156 M157 M158 M159 M160 M161 M162 M163 M164 M165 M166 M167 M168 M169 M170 M171 M172 M173 M174 M175 M176 M177 M178 M179 M180 M181 M182 M183 M184 M185 M186

D8 S1179 10,11 11,13 10,13 14,15 12,15 10,15 13,14 10,11 10,13 11,15 10,14 14,15 11,15 10,10 10,14 15,16 13,15 13,16 10,13 10,10 11,13 11,14 13,14 10,11 15,16 10,11 13,13 11,15 10,12 15,17 13,15 11,14

D21 S11 29,32.2 29,30 30,30.3 30,30.3 32.2,32.2 29,31 28,30 30,32 28,30 28,30 29,32.2 32.2,32.2 29,32.2 30,32.2 29,32.2 29,32.2 29,30.3 30,32.2 31.2,32.2 30,31.2 32.2,32.2 29,31.2 29,32.2 32.2,32.2 30,30 30,33.2 31,32.2 29,32.2 29,30 28,31 28,30 29,31.2

D7 S820 10,10 11,12 8,11 11,12 12,13 8,9 10,13 10,11 8,13 11,12 11,11 10,11 8,11 11,12 8,11 10,12 12,12 10,10 11,12 12,13 8,9 10,12 10,10 11,12 11,12 10,11 10,12 12,12 11,12 11,13 11,11 10,11

X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,X X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y

CSF 1PO 10,11 12,12 10,12 11,12 10,12 10,14 11,12 11,11 11,11 11,12 10,11 10,11 10,12 11,12 10,12 10,10 9,12 10,10 11,12 12,12 10,12 10,13 12,12 10,12 10,11 10,12 11,13 12,12 10,12 9,10 10,10 10,12

D3 S1358 17,17 16,17 15,15 15,18 16,17 17,17 16,16 15,16 16,16 15,17 15,17 15,16 15,16 14,15 15,16 16,17 16,16 15,16 16,17 15,17 17,18 15,16 15,16 15,17 15,17 14,16 16,16 15,17 14,16 16,17 14,14 14,15

9.3,9.3 9,9 7,7 7,9 7,7 6,9 6,9 6,8 9,10 9,9.3 9,9 7,9.3 7,7 9,9 7,9 9,9 7,9 7,9 6,7 6,7 6,7 7,9 7,9 7,10 9,9 7,9 7,10 7,9 7,9 6,10 6,9 6,7

D13 S317 8,9 11,13 11,12 9,11 8,12 9,11 9,10 8,11 9,11 7,11 9,11 8,11 8,10 11,12 8,11 9,10 9,10 8,12 12,13 10,14 8,10 8,11 11,14 10,11 8,11 11,12 8,8 12,12 10,12 8,12 11,12 10,10

D16 S539 12,12 8,13 10,11 9,10 9,12 9,10 10,12 9,12 12,14 11,11 9,9 10,12 9,11 12,13 11,12 12,14 9,11 11,12 9,10 10,13 9,11 13,13 11,12 11,11 9,12 10,12 10,11 10,12 11,12 10,12 10,12 11,14

D2 S1338 19,23 19,24 16,23 18,24 23,24 19,24 19,24 23,23 20,24 18,23 19,25 17,19 17,21 20,24 21,24 18,24 17,18 17,23 23,24 20,23 20,25 19,24 20,23 24,24 18,23 21,24 22,25 17,25 20,24 19,20 18,20 19,19

D19 S433 14,15 13,15.2 15.2,15.2 15,15.2 13,14 13,13 13,15.2 12,15.2 12,15 13,14.2 13,14 13.2,14.2 13,15.2 14,14 12,14 12,15.2 12,13.2 15,15.2 13,15.2 14,15.2 13,14 15,16 13,14 13,15 14,14 13,15.2 13,13 14.2,16 13,16 14,14.2 13.2,14 13,14.2

14,17 14,15 14,14 14,18 18,18 14,16 16,18 16,18 14,18 14,17 19,19 14,18 18,19 14,16 18,18 15,19 14,14 14,19 14,17 18,18 14,19 14,17 14,14 16,19 14,14 14,14 17,19 14,17 14,18 14,18 14,15 19,19

D18 S51 11,19 15,16 13,17 12,15 12,14 17,22 13,15 15,15 13,16 14,18 14,18 14,19 13,15 15,16 13,15 16,17 16,18 15,18 15,16 13,13 14,15 13,14 15,16 15,15 15,18 15,16 13,25 14,14 14,17 13,16 15,15 12,13

D5 S818 9,10 9,10 11,11 11,11 7,11 10,13 10,12 10,10 10,12 11,12 11,11 12,12 10,12 11,12 10,15 9,12 11,12 10,11 12,13 13,13 12,13 10,11 10,13 11,12 10,13 13,13 10,11 11,12 11,12 11,13 10,11 9,10

21,25 24,28 21,26 20,26 22,23 21,23 23,24 23,26 19,24 21,22 19,25 21,21 24,26 20,26 21,22 18,20 22,24 21,24 21,24 23,27 19,23 22,23 23,25 22,26 23,26 18,24 22,24 22,23 21,22 19,24 22,23 21,24

10,11 8,8 8,9 8,11 8,8 8,11 11,12 9,11 8,11 8,11 8,11 11,11 8,11 8,11 9,11 11,11 8,8 8,8 8,10 8,11 9,9 8,11 8,10 8,11 8,11 8,8 10,11 11,11 11,11 8,11 8,8 9,11

85

AMEL

TH01

vWA

TPOX

FGA

Ký hiệu M187 M188 M189 M190 M191 M192 M193 M194 M195 M196 M197 M198 M199 M200

X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y X,Y

D8 S1179 14,14 14,15 12,15 10,11 11,14 11,12 11,13 12,13 9,12 11,13 13,15 13,15 14,15 14,15

D21 S11 29,30 30,32 29,31.2 31.2,31.2 28,31.2 29,31.2 31,32.2 31,32.2 30,30 28,32.2 31.2,31.2 28,29 29,31.2 29,31.2

D7 S820 12,12 8,11 11,11 8,11 12,12 9,11 8,12 10,11 11,12 8,11 13,13 8,11 8,11 8,11

CSF 1PO 11,13 7,11 12,13 10,12 10,12 12,12 10,11 10,12 11,11 12,13 11,11 12,12 12,12 12,12

7,9.3 6,9 7,7 9,10 7,9 6,7 7,8 9,9 6,7 8,8 7,9 7,7 6,9.3 6,9.3

D13 S317 8,9 9,9 11,11 9,10 8,13 10,11 12,13 8,12 8,11 8,10 9,11 9,12 9,11 9,11

D16 S539 9,15 10,14 10,11 9,10 11,12 9,13 9,9 9,10 9,11 9,9 11,11 11,11 9,13 9,13

D2 S1338 18,23 17,23 17,19 19,22 18,23 17,24 20,22 19,25 17,25 16,19 19,20 19,25 22,25 22,25

D19 S433 13,13 12,14.2 13.2,14 13,13 14,15 14,14 13,14 13,13.2 12,15.2 14,15.2 13,15.2 14,14.2 13,14 13,14

14,18 14,18 15,18 17,19 18,18 17,17 14,17 14,14 18,18 14,15 14,17 14,16 16,19 16,19

8,11 11,11 8,11 8,9 8,11 8,8 8,8 8,8 8,11 8,11 8,8 8,9 11,11 11,11

D18 S51 14,18 16,16 14,15 14,15 13,16 13,15 12,15 14,16 13,16 14,15 17,19 14,17 16,18 16,18

D5 S818 12,13 10,11 12,13 9,10 9,12 10,10 10,11 11,13 11,12 10,13 11,12 12,13 12,12 12,12

24,25 20,22 16,22 16,23 20,22 23,23 19,25 21,21 21,22 22,22 19,24 22,22 20,23 20,23

D3 S1358 16,17 15,17 15,17 16,17 15,16 16,17 15,15 15,17 16,16 16,16 15,16 15,17 17,18 17,18

Phần 2: Các locus không có trong hệ Identifiler

Ký hiệu

PentaE

PentaD

M001 M002 M003 M004 M005 M006 M007 M008 M009 M010 M011

D1 S1656 15,15 15,15 13,14 15,16 13,16 13,16 15,15 16,18 16,18 15,16 14,15

D2 S441 11,11.3 11,14 10,11.3 10,15 10,14 10,10 9.1,11.3 11,12 11,12 10,10 10,11

D4 S2408 10,10 8,11 10,10 9,10 8,10 10,10 9,9 10,11 10,11 8,10 8,11

D9 S1122 11,13 12,12 11,12 11,12 15,15 13,15 12,13 12,13 12,13 12,13 11,13

D10 S1248 14,17 13,14 13,15 14,15 15,15 13,15 14,16 13,16 13,16 15,17 13,16

D12 S391 17,18 21,23 18,25 19,21 20,22 17,20 18,18 18,20 18,20 19,20 18,18

D17 S1301 11,12 12,12 11,13 12,13 12,12 12,12 10,13 12,14 12,14 12,12 11,12

D20 S482 13,14 10,14 13,14 14,14 13,13 13,15 13,14 13,14 13,14 14,14 14,15

11,14 19,19 12,21 10,11 16,18 14,18 15,18 11,12 11,12 11,11 12,12

D22 S1045 11,11 11,16 16,17 11,11 16,18 14,16 11,15 11,14 11,14 11,15 15,15

9,9 11,12 9,13 10,11 10,12 7,12 10,12 9,13 9,13 9,11 9,12

D6 S1043 13,14 13,18 11,18 15,19 18,20 12,18 18,20 12,18 12,18 11,17 11,11

86

Ký hiệu

PentaE

PentaD

M012 M013 M014 M015 M016 M017 M018 M019 M020 M021 M022 M023 M024 M025 M026 M027 M028 M029 M030 M031 M032 M033 M034 M035 M036 M037 M038 M039 M040 M041 M042 M043

D1 S1656 15,15 14,17 15,16 15,16 16,17.3 13,15 14,17.3 12,15 14,15 17.3,17.3 15,17.3 15,18.3 13,15 14,15 15,16 16,17 14,16 13,15 12,16 16,17 14,16 16,17 13,15 15,15 15,17 14,15 12,15 16,16 12,13 12,18.3 11,13 14,15

D2 S441 10,10 10,11 10,10 10,12 11.3,12 14,14 10,12 10,15 10,14 10,11 11,12 11,11.3 11,14 10,10 11,13 11,12 10,11 10,11 12,14 11.3,12 12,14 11,12 10,12 10.1,11 11,14 11,11 11,12 11,12 10,14 10,14 11.3,15 11,11.3

D4 S2408 9,9 10,11 9,9 9,10 9,11 9,11 10,11 10,10 10,10 9,10 8,9 9,10 8,10 10,11 9,11 10,11 9,11 9,9 8,10 10,11 8,11 10,11 8,10 8,9 9,12 8,12 9,10 10,11 9,9 9,11 9,12 10,11

D6 S1043 11,19 11,12 11,19 11,18 12,19 18,18 18,18 13,18 11,18 13,18 17,18 14,19 10,14 12,19 12,13 11,11 12,18 12,18 12,18 14,17 11,18 11,11 12,13 11,14 10,11 14,18 13,14 11,11 12,20 19,19 11,18 18,19

D9 S1122 12,12 11,11 12,12 13,13 10,12 12,12 10,13 11,13 13,14 13,14 11,12 12,13 12,12 11,12 12,12 12,13 11,13 11,13 11,12 12,13 9,12 12,13 12,12 13,13 10,12 12,13 13,13 11,13 12,12 12,13 12,14 12,13

D10 S1248 12,16 13,16 13,16 12,13 13,15 13,15 15,15 13,15 15,15 13,14 13,13 13,15 13,14 13,16 13,14 14,14 13,16 14,17 13,14 13,14 14,15 14,14 13,14 13,13 13,15 13,13 13,13 14,14 13,15 13,15 15,15 14,14

D12 S391 21,21 18,22 18,21 18,21 18,22 18,21 18,18 19,20 19,22 19,22 16,19 19,19 22,24 19,21 18,19 19,20 17,19 19,21 18,23 20,24 23,23 19,20 18,21 18,19 18,20 18,23 18,20 19,20 18,23 19,20 19,23 19,20

D17 S1301 11,13 11,11 11,14 12,12 10,11 12,12 10,12 12,13 12,13 11,12 11,13 12,13 12,13 12,13 11,13 11,12 12,15 12,13 9,12 11,13 12,12 11,12 12,13 9,12 11,12 9,12 12,12 11,12 11,12 12,13 12,13 11,12

D20 S482 13,13 13,15 13,14 13,13 13,14 12,14 13,14 13,16 14,15 14,15 13,14 14,14 14,14 13,15 15,15 13,15 13,14 13,14 14,14 11,13 13,14 13,16 13,14 10,14 10,14 14,14 13,14 13,16 14,15 13,13 13,13 12,13

11,12 13,13 11,15 12,13 10,12 10,11 11,13 12,18 10,11 15,19 10,11 5,16 11,16 11,17 10,13 11,18 13,17 11,15 10,15 13,13 10,17 11,18 11,14 11,13 16,16 11,14 12,14 11,18 7,14 10,10 14,14 11,11

D22 S1045 11,11 15,15 11,16 11,11 15,17 11,15 15,15 16,16 15,15 11,15 16,17 15,17 15,17 16,16 11,17 15,15 15,16 15,15 15,16 11,15 15,16 15,15 11,15 14,15 11,16 14,17 11,15 15,15 16,16 16,17 17,17 15,16

8,12 9,9 11,12 7,13 9,10 9,9 9,10 9,9 11,12 9,10 9,10 10,10 9,11 9,12 7,11 9,9 10,12 8,9 11,11 9,11 9,9 9,9 10,12 8,8 9,10 8,9 8,9 9,9 12,13 9,13 12,13 10,10

87

Ký hiệu

PentaE

PentaD

M044 M045 M046 M047 M048 M049 M050 M051 M052 M053 M054 M055 M056 M057 M058 M059 M060 M061 M062 M063 M064 M065 M066 M067 M068 M069 M070 M071 M072 M073 M074 M075

D1 S1656 15,17 13,17.3 13,16 14,15 13,15 16,16 17,18.3 13,15 13,15 14,15 16,17 16,18.3 14,17.3 13,17 11,17 12,15 12,15 13,16 15,16 15,16 15,16 15,17 15,16 17.3,18.3 13,15 16,17.3 15,16 12,13 15,15 15,16 15,17.3 11,11

D2 S441 13,14 11,11 12,14 10,14 11,14 11,12 10,14 12,14 11,14 10,11 11,12 11.3,12 12,12 11,14 11,11.3 11,12 10,12 11,14 10,11 10,11 10,11 10,11 10,11 11,15 12,12 11,12 11,11 11,11.3 11,11.3 10,11 11,14 10,12

D4 S2408 9,11 9,11 8,10 10,10 8,10 9,10 9,10 8,8 8,9 10,11 10,11 9,11 8,10 10,10 9,11 9,10 9,10 8,10 9,11 9,11 9,11 9,10 9,11 9,10 9,9 10,11 10,11 9,10 8,11 9,11 10,11 8,11

D6 S1043 18,18 13,14 10,12 11,19 10,14 11,20 12,14 19,19 12,19 10,11 11,11 12,18 14,15 15,18 12,14 13,14 18.2,20 12,18 12,13 12,13 12,13 11,12 12,13 14,20 11,11 11,13 10,13 12,18 14,17 12,13 14,18 12,12

D9 S1122 12,13 12,13 12,12 11,12 12,12 11,13 12,13 11,12 13,13 13,13 12,13 13,13 12,13 11,12 11,13 11,12 11,13 13,13 12,13 12,13 12,13 12,13 12,13 11,13 12,13 10,14 11,12 11,12 13,14 12,13 12,13 12,13

D10 S1248 14,15 13,14 15,16 15,16 13,14 16,17 13,15 13,14 14,15 10,14 14,14 13,14 12,12 14,16 13,15 13,15 12,13 14,16 13,15 13,15 13,15 13,13 13,15 14,15 15,15 14,15 14,15 14,15 12,15 13,15 13,14 13,14

D12 S391 18,20 18,19 23,23 18,19 22,24 18,19 20,20 22,23 15,17 18,22 19,20 20,21 18,20 19,21 19,25 18,22 19,20 18,18 18,20 18,20 18,20 23,24 18,20 19,21 18,22 18,20 18,19 18,18 21,22 18,20 18,21 20,22

11,11 11,13 12,18 11,16 11,16 17,17 5,19 11,13 11,11 11,18.4 11,18 12,18 5,20 11,11 11,11 14,16 11,12 5,12 11,11 11,11 11,11 9,10 11,11 11,12 17,23 16,16 11,12 11,12 16,19 11,11 18,19 11,17

D17 S1301 9,13 12,12 12,14 13,13 12,13 11,12 11,13 9,12 11,12 11,12 11,12 12,12 12,13 12,13 11,13 11,11 12,12 12,13 12,13 12,13 12,13 12,14 12,13 9,12 11,14 11,12 10,12 13,13 12,12 12,13 12,13 12,14

D20 S482 14,14 12,15 13,14 13,14 14,14 12,14 14,14 14,14 13,14 13,14 13,15 13,14 13,13 12,13 12,14 13,13 14,14 13,14 13,14 13,14 13,14 14,14 13,14 14,15 12,13 13,13 13,15 15,16 14,15 13,14 15,16 10,13

9,12 9,11 9,12 8,11 9,11 9,12 9,10 10,12 14,19 9,11 9,9 8,9 9,11 10,11 9,14 9,12 8,12 10,11 9,14 9,14 9,14 12,15 9,14 7,10 9,9 11,11 8,15 9,10 9,9 9,14 9,10 9,13

D22 S1045 11,16 15,17 16,17 11,17 15,15 11,15 11,17 17,17 14,17 15,16 15,15 15,15 15,16 11,16 15,15 11,16 15,17 11,17 15,16 15,16 15,16 11,15 15,16 11,16 11,15 15,16 15,15 15,15 11,11 15,16 16,17 14,15

88

Ký hiệu

PentaE

PentaD

M076 M077 M078 M079 M080 M081 M082 M083 M084 M085 M086 M087 M088 M089 M090 M091 M092 M093 M094 M095 M096 M097 M098 M099 M100 M101 M102 M103 M104 M105 M106 M107

D1 S1656 11,11 11,11 15,17.3 11,11 16,16.3 12,12 16,19 11,11 12,16 11,15 13,14 18,18 11,11 11,15 17.3,17.3 14,17 16,16 11,15 16,17 11,15 13,16 11,15 15,17.3 16,18 11,15 15,16 15,18.3 15,17.3 15,17.3 11,11 11,16 13,17

D2 S441 10,12 10,12 11.3,14 10,12 11,12 10,14 12,12 10,12 11,14 11,14 11.3,12 10,10 10,14 10,11 10,10 11.3,11.3 11,11 10,11 11.3,14 9.1,14 10,11 9.1,14 10,14 11.3,14 9.1,14 10,12 10,14 11,11.3 10,10 10,10 11,13 10,11

D4 S2408 8,11 8,11 9,10 8,11 9,10 9,12 10,10 8,11 9,12 9,9 10,10 9,10 10,10 10,11 10,10 10,11 9,10 9,9 10,10 9,12 7,10 10,12 9,9 9,10 10,12 9,10 8,10 10,11 9,10 10,12 10,11 10,10

D6 S1043 12,12 12,12 13,18 12,12 10,17 11,13 12,19 12,12 12,14 13,14 11,19 13,14 17,19 13,14 12,13 12,12 13,18 11,13 11,11 11,18 11,11 11,18 14,18 11,18 11,18 11,13 14,18 18,19 13,19 14,17 12,13 12,21

D9 S1122 12,13 12,13 10,13 12,13 11,11 11,13 12,13 12,13 12,13 13,13 12,13 12,12 12,12.3 11,12 12,12 11,13 12,12 12,13 10,12 12,14 11,13 12,14 11,13 11,12 12,14 11,12 12,13 13,13 12,12 11,12 11,13 12,15

D10 S1248 13,14 13,14 14,16 13,14 14,14 14,16 13,15 13,14 13,16 14,16 14,15 13,16 13,14 14,16 12,15 15,15 13,15 14,15 13,15 13,14 13,15 13,14 13,15 13,13 13,14 13,14 15,18 12,14 12,13 12,16 14,15 13,13

D12 S391 20,22 20,22 18,20 20,22 18,21 18,19 18,19 20,22 15,21 23,23 18,20 19,19 19,20 18,19 19,23 18,18 23,24 17,18 18,19 17,21 19,20 17,17 19,20 20,21 17,21 18,23 20,20 17,20 20,21 19,22 19,19 17,18

D17 S1301 12,14 12,14 12,12 12,14 12,12 10,13 12,13 12,14 12,12 11,12 11,12 10,12 11,12 10,12 12,12 12,14 12,12 9,11 10,13 9,11 7,12 10,11 10,12 12,12 10,11 11,13 13,13 10,11 12,13 9,13 12,13 12,12

D20 S482 10,13 10,13 14,14 10,13 13,13 10,15 14,14 10,13 12,12 13,14 15,16 14,14 13,14 13,14 12,14 13,14 14,15 14,14 14,15 11,12 13,13 12,14 12,15 13,14 12,14 13,14 14,16 14,15 15,15 13,15 13,14 13,14

11,17 11,17 14,15 11,17 11,13 5,5 12,16 11,17 15,16 5,11 15,15 17,18 12,14 17,18 5,11 11,12 12,12 15,16 12,18 11,11 10,11 10,11 10,11 12,15 11,20 12,12 9,19 11,14 12,16 15,15 12,16 11,21

D22 S1045 15,16 14,15 16,19 14,15 15,16 15,16 11,14 15,16 11,17 15,15 11,15 17,17 15,15 17,17 15,16 17,18 16,17 15,16 11,15 15,16 16,17 15,16 11,15 11,16 15,16 11,16 14,16 11,17 14,15 15,15 11,16 11,16

9,13 9,13 9,11 9,13 7,9 10,13 8,9 9,13 7,12 8,8 9,12 9,9 9,10 11,11 9,10 8,12 11,12 9,10 11,13 9,10 10,12 9,10 8,10 10,11 9,10 8,10 11,12 9,11 9,10 8,10 8,10 9,9

89

Ký hiệu

PentaE

PentaD

M108 M109 M110 M111 M112 M113 M114 M115 M116 M117 M118 M119 M120 M121 M122 M123 M124 M125 M126 M127 M128 M129 M130 M131 M132 M133 M134 M135 M136 M137 M138 M139

D1 S1656 15,17.3 15,15 14,17 11,12 14,15 16,17 17.3,17.3 15,17.3 13,15 11,17.3 13,16 15,16 13,15 15,16 13,13 16,16.3 13,17 15,16 11,14 11,16 15,16 12,15 12,17 12,15 12,15 15,16 13,15 17.3,17.3 15,17.3 15,15 15,16 13,15

D2 S441 10,11.3 10,12 11,12 10,13 9.1,11 11.3,12 12,15 11,11 12,12 11.3,12 11,11.3 11,12 12,15 11.3,12 12,14 11,12 10,10 11,12 10,12 11,14 10,11 10,11 10,12 10,12 10,15 11,13 14,14 10,11 11,12 10,10 10,10 10,11

D4 S2408 9,10 8,10 10,10 8,10 8,11 9,10 9,10 9,10 9,11 9,10 10,10 9,9 8,10 10,10 9,11 10,10 9,12 10,10 10,13 10,10 8,10 10,12 9,10 9,10 10,10 9,11 9,11 9,10 8,9 9,9 9,9 9,9

D6 S1043 18,19 18,19 11,19 12,18 12,20 13,18 13,14 13,18 11,11 12,12 11,12 14,18 13,14 12,18 12,18 14,14 13,18 14,15 11,19 10,17 11,12 15,18 13,17 17,18 13,18 12,13 18,18 13,18 17,18 11,19 11,19 12,18

D9 S1122 12,13 11,13 12,14 13,13 11,13 11,13 13,14 11,13 12,14 11,13 13,13 12,13 10,11 12,12 13,13 11,13 12,13 12,12 12,13 13,13 11,13 10,10 12,13 11,12 11,13 12,12 12,12 13,14 11,12 12,12 12,12 11,13

D10 S1248 13,13 13,15 15,16 13,15 13,15 14,14 13,14 14,16 14,14 16,16 12,13 13,15 13,14 12,17 12,13 13,16 13,13 13,14 14,14 14,15 14,16 13,14 13,13 13,14 13,15 13,14 13,15 13,14 13,13 12,16 13,16 14,17

D12 S391 18,22 18,22 18,19 22,23 22,23 23,25 22,22 18,22 15,18 18,23 21,22 15,19 18,19 21,22 19,22 21,24 17,20 17,21 19,20 18,19 23,25 18,19 19,20 18,20 19,20 18,19 18,21 19,22 16,19 21,21 18,21 19,21

D17 S1301 12,12 12,13 12,13 12,12 12,14 11,11 13,13 12,12 12,12 12,13 12,12 11,12 12,13 12,13 12,13 12,13 12,12 12,13 14,14 12,12 10,12 12,12 10,11 10,12 12,13 11,13 12,12 11,12 11,13 11,13 11,14 12,13

D20 S482 14,14 13,15 12,14 14,15 14,14 13,13 13,14 14,15 15,15 14,15 13,14 13,14 13,14 14,14 13,13 13,14 13,16 13,14 10,13 10,14 13,14 13,13 13,13 13,13 13,16 15,15 12,14 14,15 13,14 13,13 13,14 13,14

11,11 10,16 12,17 11,17 11,19 15,15 5,16 11,11 14,14 18,20 10,11 11,11 11,14 12,14 13,17 14,14 18,19 10,16 12,15 11,15 11,14 11,19 11,12 11,11 12,18 10,13 10,11 15,19 10,11 11,12 11,15 11,15

D22 S1045 11,15 15,15 11,11 16,17 11,15 16,17 16,16 15,15 16,17 11,11 16,17 15,16 16,17 15,16 16,16 15,15 15,16 16,16 14,14 15,17 15,16 16,16 14,15 15,16 16,16 11,11 11,15 11,15 16,17 11,11 11,11 15,15

9,14 9,13 10,11 8,12 9,9 9,12 9,10 9,11 9,12 9,11 11,12 10,11 11,13 9,11 9,15 9,11 10,12 6,12 9,11 9,11 9,11 12,13 9,11 11,13 9,9 7,11 9,9 9,10 9,10 8,12 11,12 8,9

90

Ký hiệu

PentaE

PentaD

M140 M141 M142 M143 M144 M145 M146 M147 M148 M149 M150 M151 M152 M153 M154 M155 M156 M157 M158 M159 M160 M161 M162 M163 M164 M165 M166 M167 M168 M169 M170 M171

D1 S1656 15,16 15,16 15,15 15,15 12,16 14,16 15,15 14,15 15,16 13,15 15.3,17 15,16 11,13 14,16 15,17 16,16.3 11,13 15,17 15,16 11,15 15,16 15,15 15,16 15,15 11,16 17,18.3 13,15 13,17 15,15 15,16 11,15.3 14,15

D2 S441 10,11 10,11 11,11.3 11,11.3 12,14 12,14 10.1,11 11,11 10,11 11,14 10,11 11.3,13 11.3,12 11,14 10,11 10,12 11.3,14 11,11 11,12 11.3,12 11.3,12 11,14 10,12 10,11 11,12 10,11.3 12,12 10,14 14,14 11,11.3 10,12 11,11.3

D4 S2408 10,10 10,10 10,10 10,10 8,10 8,11 8,9 8,12 10,10 8,10 9,12 8,9 9,10 8,10 9,10 9,10 10,11 10,10 9,10 8,10 9,10 9,10 9,10 9,10 9,10 10,10 9,9 9,10 9,9 9,10 10,10 9,10

D6 S1043 12,17 12,17 13,14 13,14 12,18 11,18 11,14 14,18 12,17 10,14 17,19 18,18 11,11 18,18 11,20 19,19 18,19 12,19 17,17 10,18 18,18.2 14,18 11,18 14,19 12,18 11,18 13,14 18,20 11,14 17,18 13,14 18,18

D9 S1122 13,15 13,15 11,13 11,13 11,12 9,12 13,13 12,13 13,15 12,12 12,14 12,13 13,13 13,13 10,12 11,13 14,14 12,13 12,13 12,13 12,13 10,12 13,13 12,14 12,14 12,13 12,14 12,13 10,12 11,11 12,13 13,13

D10 S1248 15,17 15,17 14,17 14,17 13,14 14,15 13,13 13,13 15,17 13,14 13,14 12,13 12,13 13,14 12,14 13,13 13,13 13,14 12,13 15,15 13,16 13,14 12,13 13,13 13,13 14,15 13,13 13,16 15,15 13,15 13,14 16,16

D12 S391 17,19 17,19 17,18 17,18 18,23 23,23 18,19 18,23 17,19 22,24 20,25 19,21 20,21 19,21 21,23 22,26 21,21 19,19 19,21 19,23 21,22 20,22 18,21 22,22 18,18 18,19 17,18 17,22 18,25 20,21 21,23 18,19

14,21 14,21 11,14 11,14 10,15 10,17 11,13 11,14 14,21 11,16 12,20 12,14 15,17 12,12 5,12 11,18 11,16 11,12 17,20 12,19 14,15 11,13 12,13 11,16 11,14 12,16 14,14 16,18 13,21 14,20 10,19 11,11

D17 S1301 12,12 12,12 11,12 11,12 9,12 12,12 9,12 9,12 12,12 12,13 11,12 11,11 12,12 8,13 12,13 12,12 12,12 11,12 11,13 13,13 13,13 11,12 12,12 12,12 12,13 12,12 9,13 11,13 12,12 11,13 12,12 12,12

D20 S482 12,14 12,14 13,14 13,14 14,14 13,14 10,14 14,14 12,14 14,14 13,14 13,14 12,13 13,15 12,13 11,13 14,15 14,16 13,14 10,14 13,14 13,14 13,13 13,14 14,14 10,14 13,14 13,14 13,13 14,14 10,13 14,14

9,9 9,9 9,9 9,9 11,11 9,9 8,8 8,9 9,9 9,11 8,9 10,13 11,13 12,15 9,13 11,12 11,12 10,15 9,15 9,13 11,11 10,12 7,13 8,10 7,10 9,9 12,13 8,9 9,9 9,10 11.2,13 13,13

D22 S1045 11,14 11,14 11,11 11,11 15,16 16,16 14,15 14,17 11,14 15,15 11,15 11,11 11,15 15,16 11,11 15,15 16,17 11,17 11,16 11,11 15,17 15,16 11,11 15,16 15,15 15,16 15,16 14,15 15,15 11,11 14,14 15,15

91

Ký hiệu

PentaE

PentaD

M172 M173 M174 M175 M176 M177 M178 M179 M180 M181 M182 M183 M184 M185 M186 M187 M188 M189 M190 M191 M192 M193 M194 M195 M196 M197 M198 M199 M200

D1 S1656 13,15 15,16 16,17.3 15,17 16,17.3 11,16 14,16 15,16 13,15 15,18.3 13,17 17,17 15,16 15,15 15,15 15,17 11,15 16,16 15,15 14,17.3 15,15 16,17 14,15 11,16 15,16 11,17 15,18 12,13 12,13

D2 S441 10,14 11,12 10,12 14,14 11,11.3 12,12 10,11.3 11.3,12 11.3,12 11,14 10,11 10,12 12,14 12,14 10,11 12,14 10,11 12,12 11,11.3 12,14 12,12 10,11.3 12,14 10,11 10,11 11,12 11,12 10,14 10,14

D4 S2408 9,10 9,10 10,12 9,11 9,9 8,10 8,9 9,10 9,10 10,11 9,9 8,9 11,11 8,9 8,9 10,12 9,11 10,11 10,10 8,10 9,10 9,11 9,10 9,10 9,9 10,10 10,10 9,9 9,9

D6 S1043 11,19 11,13 13,18 14,18 14,19 11,11 14,18 12,13 19,20 14,17 11,18 13,20 13,19 11,13 14,14 12,13 13,14 11,18 14,18 12,19 13,18 17,18 13,14 12,18 11,14 14,18 18,19 12,20 12,20

D9 S1122 11,13 12,13 11,12 11,13 11,12 12,14 11,16 9,11 11,12 13,13 12,13 11,13 13,14 10,12 12,12 12,12 12,14 12,13 12,13 12,13 12,13 12,13 12,13 10,11 12,13 11,13 12,13 12,12 12,12

D10 S1248 14,15 13,16 14,15 14,16 14,14 13,14 14,14 12,14 13,14 13,15 13,14 12,15 13,14 13,15 14,16 14,16 12,13 13,14 14,14 13,14 13,15 13,15 13,13 13,13 13,14 15,16 15,16 13,15 13,15

D12 S391 18,25 20,24 18,19 21,23 21,21 21,23 20,21 18,21 19,23 18,19 20,21 18,18 19,23 18,20 18,23 19,21 19,22 20,24 22,22 19,20 17,19 20,24 20,20 18,18 17,19 20,21 19,21 18,23 18,23

13,17 12,12 11,11 11,16 11,16 11,18 11,14 11,15 8,8 11,13 5,20 10,14 11,13 14,19 11,18 5,12 11,20 11,11 12,12 15,17.4 11,11 11,18 11,12 11,16 18,18 13,16 10,11 7,14 7,14

D17 S1301 12,12 12,12 12,12 11,12 12,12 12,12 11,12 12,12 11,11 11,12 12,12 11,12 10,13 12,13 11,12 10,11 11,12 12,13 11,13 10,12 12,13 10,14 12,13 11,12 12,14 11,12 11,12 11,12 11,12

D20 S482 13,15 13,13 13,14 14,15 13,14 13,14 14,14 15,15 14,15 10,14 10,14 13,14 14,15 14,14 12,14 14,16 13,14 14,14 13,13 13,15 13,13 12,14 14,15 12,13 14,14 15,15 13,15 14,15 14,15

8,14 10,13 7,8 10,12 12,14 10,13 9,11 9,9 9,9 8,10 8,11 9,12 10,11 7,9 9,9 10,13 9,11 8,9 9,13 9,9 8,12 9,9 11,13 9,9 10,11 8,10 10,11 12,13 12,13

D22 S1045 17,17 11,11 16,16 15,17 15,15 16,16 11,11 15,15 14,14 15,15 11,11 15,15 11,11 11,11 15,15 11,11 15,15 15,15 15,15 15,15 14,14 11,11 15,15 15,15 11,11 15,15 16,16 16,16 16,16

92

PHỤ LỤC 2: BẢNG TẦN SUẤT CÁC ALEN CỦA 27 LOCUS STR TRÊN NHIỄM SẮC THỂ THƯỜNG

TỪ QUẦN THỂ NGƯỜI DÂN TỘC KINH TẠI VIỆT NAM (N = 200)

Phần 1: Các locus trùng với hệ Identifiler

TH01

vWA

TPOX

FGA

Locus/ Alen

6.0 7.0 8.0 9.0 9.3 10.0 10.1 11.0 12.0 12.2 13.0 13.2 14.0 14.2 15.0 15.2 16.0 16.2 17.0 18.0 19.0 20.0 20.2 21.0 21.2 22.0

D8 S1179 - - 0.0025 0.0075 - 0.1625 - 0.1475 0.1200 - 0.1550 - 0.1500 - 0.1675 - 0.0700 - 0.0075 0.0100 - - - - - -

D21 S11 - - - - - - - - - - - - - - - - - - - - - - - - - -

D7 S820 - 0.0050 0.1350 0.0525 - 0.2075 0.0025 0.3800 0.1725 - 0.0425 - 0.0025 - - - - - - - - - - - - -

CSF 1P0 - 0.0100 0.0025 0.0175 - 0.1975 - 0.2425 0.4475 - 0.0625 - 0.0200 - - - - - - - - - - - - -

D3 S1358 - - - - - - - - - - 0.0025 - 0.0525 - 0.2950 - 0.3450 - 0.2225 0.0775 0.0050 - - - - -

0.1400 0.3750 0.0425 0.3175 0.0650 0.0600 - - - - - - - - - - - - - - - - - - - -

D13 S317 - 0.0050 0.2825 0.1325 - 0.1075 - 0.2350 0.1825 - 0.0500 - 0.0050 - - - - - - - - - - - - -

D16 S539 - - 0.0050 0.2250 - 0.1525 - 0.2425 0.2900 - 0.0625 - 0.0200 - 0.0025 - - - - - - - - - - -

D2 S1338 - - - - - - - - - - - - - - - - 0.0250 - 0.0975 0.0850 0.1650 0.1750 - 0.0325 - 0.0400

D19 S433 - - - - - - - - 0.0425 0.0025 0.3125 0.0200 0.2725 0.0975 0.0700 0.1475 0.0100 0.0250 - - - - - - - -

- - - - - - - - - - - - 0.3050 - 0.0525 - 0.0900 - 0.2300 0.200 0.0975 0.0200 - 0.0050 - -

- - 0.5800 0.0775 - 0.0325 - 0.2900 0.0200 - - - - - - - - - - - - - - - - -

D18 S51 - - - - - - - 0.0050 0.0400 - 0.1675 - 0.1850 - 0.2050 - 0.1925 - 0.0775 0.0675 0.0250 0.0150 - 0.0125 - 0.0025

D5 S818 - 0.0450 - 0.0550 - 0.2325 - 0.2700 0.2275 - 0.1675 - 0.0025 - 0.0050 - - - - - - - - - - -

- - - - - - - - - - - - - - - - 0.0050 - - 0.0275 0.0950 0.0575 0.0025 0.1400 0.0125 0.2150

93

TH01

vWA

TPOX

FGA

Locus/ Alen

22.2 23.0 23.2 24.0 24.2 25.0 25.2 26.0 27.0 28.0 28.2 29.0 30.0 30.2 30.3 31.0 31.2 32.0 32.2 33.2 34.0 34.2 H(0b) H(exp) HWE PD PE PIC PI

D8 S1179 - - - - - - - - - - - - - - - - - - - - - - 0.8195 0.8800 0.6855 0.9555 0.7548 0.84 4.17

D21 S11 - - - - - - - - 0.0050 0.0575 0.0050 0.2400 0.1875 0.0075 0.0075 0.0800 0.1125 0.0250 0.1650 0.0925 0.0025 0.0125 0.8132 0.8737 0.4729 0.9498 0.7421 0.83 3.96

D7 S820 - - - - - - - - - - - - - - - - - - - - - - 0.7522 0.7400 0.2935 0.9006 0.4928 0.73 1.92

CSF 1P0 - - - - - - - - - - - - - - - - - - - - - - 0.6960 0.7250 0.0992 0.8546 0.4680 0.65 1.82

D3 S1358 - - - - - - - - - - - - - - - - - - - - - - 0.7357 0.6750 0.1489 0.8890 0.3907 0.69 1.54

- - - - - - - - - - - - - - - - - - - - - - 0.7293 0.7300 0.1145 0.8803 0.4762 0.69 1.85

D13 S317 - - - - - - - - - - - - - - - - - - - - - - 0.7997 0.7900 0.1300 0.9273 0.5806 0.77 2.38

D16 S539 - - - - - - - - - - - - - - - - - - - - - - 0.7788 0.7700 0.2208 0.9132 0.5446 0.74 2.17

D2 S1338 0.1575 - 0.1575 - 0.0600 - 0.0050 - - - - - - - - - - - - - - 0.8537 0.8750 0.5166 0.9626 0.7447 0.85 4.00

D19 S433 - - - - - - - - - - - - - - - - - - - - - - 0.7762 0.8250 0.6918 0.9151 0.6462 0.76 2.86

- - - - - - - - - - - - - - - - - - - - - - 0.7932 0.9650 0.1302 0.9267 0.5358 0.76 2.13

- - - - - - - - - - - - - - - - - - - - - - 0.5720 0.5750 0.0233 0.7572 0.2619 0.51 1.18

D18 S51 0.0025 - - - 0.0025 - - - - - - - - - - - - - - - - 0.8387 0.8485 0.7707 0.9492 0.6919 0.82 3.30

D5 S818 - - - - - - - - - - - - - - - - - - - - - - 0.7907 0.7700 0.1806 0.9211 0.5446 0.76 2.17

0.0050 0.1525 0.0100 0.1125 0.0150 0.0575 0.0050 0.0675 0.0175 0.0025 - - - - - - - - - - - - 0.8682 0.9000 0.5919 0.9692 0.7954 0.86 5.00

94

Phần 2: Các locus không có trong hệ Identifiler

PentaE

PentaD

Locus/ Alen

5.0 6.0 6.3 7.0 8.0 8.1 9.0 9.1 10.0 11.0 11.2 11.3 12.0 13.0 14.0 15.0 15.3 16.0 16.3 17.0 17.3 17.4 18.0 18.2 18.3 18.4 19.0 20.0

D1 S1656 - - - - - - - - - 0.0900 - - 0.0475 0.0975 0.0625 0.3225 0.0025 0.1900 0.0075 0.0750 0.0675 - 0.0150 - 0.0200 - 0.0025 -

D2 S441 - - - - - - 0.0075 0.0050 0.2500 0.3025 - 0.0525 0.2075 0.0150 0.1425 0.0175 - - - - - - - - - - - -

D4 S2408 - - - 0.0025 0.1125 - 0.3100 - 0.3950 0.1400 - - 0.0375 0.0025 - - - - - - - - - - - - - -

D6 S1043 - - - - - - - - 0.0250 0.1600 - - 0.1600 0.1250 0.1250 0.0125 - - - 0.0500 - - 0.2125 0.0500 - - 0.0900 0.0325

D9 S1122 - - - - - - 0.0075 - 0.0350 0.1550 - - 0.3800 0.3475 0.0525 0.0175 - 0.0025 - - - - - - - - - -

D10 S1248 - - - - - - - - 0.0025 - - - 0.0550 0.3550 0.2600 0.200 - 0.0975 - 0.0275 - - 0.0025 - - - - -

D12 S391 - - - - - - - - - - - - - - - 0.0100 - 0.0050 - 0.0550 - - 0.2300 - - - 0.1900 0.1525

0.0300 - - 0.0075 0.0050 - 0.0050 - 0.0625 0.3025 - - 0.1225 0.0550 0.0900 0.0625 - 0.0700 - 0.0500 - 0.0025 0.0600 - - 0.0025 0.0350 0.0200

D17 S1301 - - - 0.0025 0.0025 - 0.0325 - 0.0475 0.1775 - - 0.5025 0.1875 0.0450 0.0025 - - - - - - - - - - - -

D20 S482 - - - - - - - - 0.0425 0.0075 - - 0.0600 0.3325 0.4050 0.1250 - 0.0275 - - - - - - - - - -

- 0.0025 - 0.0275 0.0850 - 0.3575 - 0.1400 0.1425 0.0025 - 0.1150 0.0850 0.0250 0.0150 - - - - - - - - - - 0.0025 -

D22 S1045 - - - - - - - - - 0.2350 - - - - 0.0675 0.3575 - 0.2250 - 0.1075 - - 0.0050 - - - 0.0025 -

95

PentaE

PentaD

Locus/ Alen

21.0 22.0 23.0 24.0 25.0 26.0 H(0b) H(exp) HWE PD PE PIC PI

D1 S1656 - - - - - - 0.7896 0.8150 0.7327 0.9445 0.6272 0.81 2.7

D2 S441 - - - - - - 0.7769 0.8450 0.2663 0.9039 0.6850 0.75 3.3200

D4 S2408 - - - - - - 0.7142 0.7350 0.0783 0.8721 0.4845 0.67 1.89

D6 S1043 0.0025 - - - - - 0.8422 0.8442 0.4266 0.9576 0.6835 0.84 3.21

D9 S1122 - - - - - - 0.7054 0.7500 0.2270 0.8494 0.5098 0.66 2.00

D10 S1248 - - - - - - 0.7530 0.7850 0.1171 0.8880 0.5715 0.71 2.33

D12 S391 0.1275 0.0975 0.0875 0.0250 0.0175 0.0025 0.8209 0.8600 0.3415 0.9547 0.7147 0.83 3.57

0.0150 - 0.0025 - - - 0.8270 0.7778 1.8389 0.9626 0.5585 0.84 2.25

D17 S1301 - - - - - - 0.6666 0.7000 0.0770 0.8559 0.4283 0.64 1.67

D20 S482 - - - - - - 0.7036 0.7150 0.1032 0.8567 0.4518 0.66 1.75

- - - - - - 0.8024 0.7950 0.5178 0.9357 0.5898 0.78 2.44

D22 S1045 - - - - - - 0.7502 0.5700 0.3342 0.8935 0.2564 0.71 1.16

96

PHỤ LỤC 3: CÁC CHỈ SỐ THỐNG KÊ CỦA 27 LOCUS STR TRÊN NHIỄM SẮC THỂ THƯỜNG TỪ QUẦN THỂ NGƯỜI DÂN TỘC KINH TẠI VIỆT NAM (N = 200)

HWE

STT

Locus

H(ob)

H(exp)

PD

PE

PIC

PI

Số cá thể đồng hợp tử 24 25 52 55 65 54 42 46 25 65 47 85 30 46 20 37 31 65 31 50 43 28 42 60 57 41 86

Số cá thể dị hợp tử 176 175 148 145 135 146 158 154 175 135 153 115 170 154 180 163 169 135 169 150 157 172 158 140 143 159 114

0.8195 0.8132 0.7522 0.6960 0.7357 0.7293 0.7997 0.7788 0.8537 0.7762 0.7932 0.5720 0.8387 0.7907 0.8682 0.7896 0.7769 0.7142 0.8422 0.7054 0.7530 0.8209 0.8270 0.6666 0.7036 0.8024 0.7502

D8S1179 D21S11 D7S820 CSF1P0 D3S1358 TH01 D13S317 D16S539 D2S1338 D19S433 vWA TPOX D18S51 D5S818 FGA D1S1656 D2S441 D4S2408 D6S1043 D9S1122 D10S1248 D12S391 PentaE D17S1301 D20S482 PentaD D22S1045

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

0.8800 0.8737 0.7400 0.7250 0.6750 0.7300 0.7900 0.7700 0.8750 0.8250 0.9650 0.5750 0.8485 0.7700 0.9000 0.8150 0.8450 0.7350 0.8442 0.7500 0.7850 0.8600 0.7778 0.7000 0.7150 0.7950 0.5700

2 TT 0.6855 0.4729 0.2935 0.0992 0.1489 0.1145 0.1300 0.2208 0.5166 0.6918 0.1302 0.0233 0.7707 0.1806 0.5919 0.7327 0.2663 0.0783 0.4266 0.2270 0.1171 0.3415 1.8389 0.0770 0.1032 0.5178 0.3342

2 LT 2.167 2.733 1.145 1.145 0.711 1.145 1.145 1.635 3.325 2.167 1.635 0.711 3.325 1.145 4.575 3.325 2.167 1.145 3.325 1.145 1.145 3.325 5.226 3.325 1.145 2.733 0.711

0.9555 0.9498 0.9006 0.8546 0.8890 0.8803 0.9273 0.9132 0.9626 0.9151 0.9267 0.7572 0.9492 0.9211 0.9692 0.9445 0.9039 0.8721 0.9576 0.8494 0.8880 0.9547 0.9626 0.8559 0.8567 0.9357 0.8935

0.7548 0.7421 0.4928 0.4680 0.3907 0.4762 0.5806 0.5446 0.7447 0.6462 0.5358 0.2619 0.6919 0.5446 0.7954 0.6272 0.685 0.4845 0.6835 0.5098 0.5715 0.7147 0.5585 0.4283 0.4518 0.5898 0.2564

0.84 0.83 0.73 0.65 0.69 0.69 0.77 0.74 0.85 0.76 0.76 0.51 0.82 0.76 0.86 0.81 0.75 0.67 0.84 0.66 0.71 0.83 0.84 0.64 0.66 0.78 0.71

4.17 3.96 1.92 1.82 1.54 1.85 2.38 2.17 4.00 2.86 2.13 1.18 3.30 2.17 5.00 2.70 3.32 1.89 3.21 2.00 2.33 3.57 2.25 1.67 1.75 2.44 1.16

97