BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ -----------------------------
Trần Huyền Linh
XÂY DỰNG CƠ SỞ DỮ LIỆU VỀ TẦN SỐ ALLELE 22 LOCUS ĐA HÌNH STR TRÊN NHIỄM SẮC THỂ THƯỜNG Ở QUẦN THỂ NGƯỜI MÔNG TẠI HÀ GIANG, VIỆT NAM
LUẬN VĂN THẠC SĨ
CÔNG NGHỆ SINH HỌC
Hà Nội - 2020
BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ -----------------------------
Trần Huyền Linh
XÂY DỰNG CƠ SỞ DỮ LIỆU VỀ TẦN SỐ ALLELE 22 LOCUS ĐA HÌNH STR TRÊN NHIỄM SẮC THỂ THƯỜNG Ở QUẦN THỂ NGƯỜI MÔNG TẠI HÀ GIANG, VIỆT NAM
Chuyên ngành: Sinh học thực nghiệm
Mã số: BIO2018
LUẬN VĂN THẠC SĨ
Công nghệ sinh học
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS. TS. Chu Hoàng Hà
Hà Nội - 2020
Lời cam đoan
Tôi xin cam đoan những nội dung viết trong luận văn là do sự tìm tòi,
học hỏi và nghiên cứu của bản thân với sự hướng dẫn tận tình của PGS. TS.
Chu Hoàng Hà và các đồng nghiệp tại Viện Công nghệ sinh học, Viện Hàn lâm
Khoa học và Công nghệ Việt Nam.
Mọi kết quả nghiên cứu cũng như ý tưởng của các tác giả khác (nếu có)
đều được trích dẫn cụ thể. Đề tài luận văn này cho đến nay chưa được bảo vệ
tại bất kỳ một hội đồng bảo vệ luận văn thạc sĩ nào và cũng chưa được công bố
trên bất kỳ phương tiện nào. Tôi xin chịu trách nhiệm về những lời cam đoan
trên.
Hà Nội, ngày 28 tháng 5 năm 2020
Người cam đoan
Trần Huyền Linh
Lời cảm ơn
Để hoàn thành được Luận văn cao học này, tôi xin bày tỏ lời cảm ơn đến
PGS. TS. Chu Hoàng Hà đã trực tiếp định hướng, hướng dẫn tôi một cách tận
tình và giúp đỡ tôi xây dựng ý tưởng để hoàn thiện luận văn.
Tôi xin cảm ơn tập thể lãnh đạo Viện Công nghệ sinh học, lãnh đạo và cán
bộ Phòng thí nghiệm Trọng điểm Công nghệ Gen – Viện Công nghệ sinh học
đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập và thực hiện
nghiên cứu đề tài.
Tôi xin trân trọng cảm ơn ban lãnh đạo cùng các thầy cô giáo Khoa Sinh
học, Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ
Việt Nam đã truyền đạt kiến thức và giúp đỡ tôi trong quá trình học tập và thực
hiện luận văn.
Cuối cùng, tôi xin bày tỏ lòng biết ơn đến gia đình, người thân, bạn bè và
đồng nghiệp, những người đã luôn động viên, tạo điều kiện cho thôi hoàn thành
luận văn này./.
Học viên
Trần Huyền Linh
Danh mục các ký hiệu và chữ viết tắt
Chữ viết tắt Nội dung
Deoxyribonucleic acid ADN
nucleotide nt
Tên riêng của một loại giấy thu mẫu máu FTA
nhiễm sắc thể NST
Short tandem repeat STR
Polymerase chain reaction PCR
Match probability MP
Discrimination capacity DC
Power of Exclusion PE
Polymorphic information content PIC
Paternity Index PI
Restriction Fragment Length Polymorphism RFLP
European Standard Set ESS
Federal Bureau of Investigation FBI
Variable number of tandem repeat VNTR
Expected Heterozygosity EH
Observed Heterozygosity OH
Neighbor Joining NJ
SWGDAM Scientific Working Group on DNA Analysis Methods
Linkage - Disequilibrium LD
Danh mục các bảng
Bảng 1.1. Thông tin về vị trí và tốc độ đột biến của một số locus thường dùng
theo cơ sở dữ liệu STRbase ............................. . 15
Bảng 1.2. Thông tin về vị trí và trình tự của một đơn vị lặp của các locus có
trong bộ kit PowerPlex Fusion System theo thông tin của nhà sản xuất ... 19
Bảng 2. Bảng thành phần phản ứng khuếch đại .................. 29
Bảng 3.1. Số lượng allele mỗi locus .......................... 33
Bảng 3.2. Bảng tần số allele 22 locus STR trên NST thường của Mông, tại Hà
Giang - Việt Nam ...................................... 35
Bảng 3.3. Các allele có tần số thấp phát hiện được trong quần thể ...... 41
Bảng 3.4. Kết quả kiểm định cân bằng HWE bằng phần mềm Arlequin v3.5
................................................. .42
Bảng 3.5. Kết quả tính các chỉ số EH và OH của từng locus .......... 44
Bảng 3.6. Bảng ma trận đánh giá linkage disequilibrium của các locus ... 46
Bảng 3.7. Các chỉ số MP, PE, DC và PIC của các locus ............. 51
Danh mục các hình vẽ, đồ thị
Hình 1.1 Các locus thuộc bộ CODIS của FBI và vị trí trên NST người .... 5
Hình 1.2. Kết quả các băng thu được sau phân giải bằng enzyme giới hạn và lai
Southern của một đại gia đình .............................. 12
Hình 1.3. Kết quả thu được so sánh giữa hai phương pháp sử dụng nhiều locus
và các đơn locus dựa trên phương pháp RFLP ................... 13
Hình 1.4. Hình ảnh kết quả điện di mao quản của một số locus sử dựng phương
pháp PCR và gắn huỳnh quang trên mỗi locus ................... 13
Hình 1.5. Cơ chế sinh đột biến STR do gấp đoạn trong quá trình nhân bản 16
Hình 1.6. Quá trình xác định kích thước của một allele dựa trên ô thang chuẩn
........................................................................................................................ 19
Hình 1.7. Sự phân bố các nhánh ngôn ngữ thuộc hệ Mông - Dao tại Việt Nam.
.................................................. 24
Hình 1.8. Cây phát sinh chủng loại miêu tả mối quan hệ di truyền gần gũi giữa
quần thể người Kinh và một số quần thể khác ................... 25
Hình 2.1. Bản đồ hành chính tỉnh Hà Giang ..................... 26
Hình 2.2. Độ dài và loại dye được sử dụng cho mỗi locus trong bộ kit ... 28
Hình 2.3. Chu trình nhiệt của phản ứng khuếch đại với 28 chu kỳ ...... 29
Hình 3.1. Biểu đồ màu theo giá trị chỉ số MP của từng locus .......... 47
Hình 3.2. Biều đồ màu theo giá trị chỉ só PE của từng locus .......... 48
Hình 3.3. Biều đồ màu theo giá trị DC của từng locus .............. 49
Hình 3.4. Biểu đồ màu theo giá trị của chỉ số PI của các locus ......... 50
Hình 3.5. Hình ảnh giao diện phần mềm STR-VN version 1.0 ......... 52
Hình 3.6. Cây phát sinh chủng loại về mối tương quan di truyền giữa người
Mông và các quần thể khác ............................... 54
1
MỤC LỤC
MỞ ĐẦU ............................................ 3
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU ....................... 5
1.1. Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR ........... 5
1.1.1. Short tandem repeat – STR ....................... 5 1.1.2. Bộ kit Powerplex Fusion system được sử dụng trong giám định ......................................... 18
1.1.3. Cơ sở dữ liệu tần số STR ........................ 21
1.1.4. Di truyền quần thể và dân tộc ..................... 21
1.2. Tình hình nghiên cứu trong và ngoài nước ............. 24
CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU .............................................. 26
2.1. Nguyên vật liệu ................................ 26
2.1.1. Địa điểm thu mẫu ............................. 26
2.1.2. Thu thập và bảo quản .......................... 27
2.2. Phương pháp nghiên cứu ......................... 27
2.2.1. Khuếch đại đoạn gen .......................... 27
2.2.2. Tính toán tần số và các chỉ số pháp y ................ 30
2.2.3. Xác định mối liên hệ giữa quần thể người Mông tại Hà Giang và các quần thể khác .................................. 31
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ................... 32
3.1. Kết quả thu mẫu và khuếch đại ADN ................. 32
3.2. Kết quả tính tần số các locus và xác định các allele có tần số thấp ........................................... 34
3.3. Kết quả phân tích thống kê ........................ 42
3.3.1. Kiểm định cân bằng Hardy-Weinberg ............... 42
3.3.2. Gía trị dị hợp tử mong đợi và quan sát được ........... 44
3.3.3. Kiểm tra tính di truyền liên kết của các locus STR ....... 45
3.4. Kết quả phân tích các chỉ số pháp y .................. 47
2
3.4.1. Chỉ số khả năng trùng hợp ngẫu nhiên - Match probability (MP) ......................................... 47
3.4.2. Chỉ số khả năng loại trừ - Power of Exclusion .......... 47
3.4.3. Chỉ số khả năng phân biệt – Discrimination capacity...... 48
3.4.4. Chỉ số đa hình - Polymorphic information content ....... 49
3.4.5. Chỉ số Parternity index – PI ...................... 49
3.5. Các chỉ số pháp y đánh giá tần số các allele của một quần thể 50
3.6. Kết quả phân tích mối tương quan di truyền với các quần thể khác ........................................... 52
CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ ................... 55
4.1. Kết luận ..................................... 55
4.2. Kiến nghị .................................... 56
TÀI LIỆU THAM KHẢO ............................... 57
PHỤ LỤC .......................................... 62
Phụ lục 1: Kết quả khuếch đại các locus STR của mẫu đối chứng dương ........................................... 62
Phụ lục 2: Kết quả khuếch đại các locus STR của mẫu đối chứng âm63
Phụ lục 3: Kết quả kiểm định Chi-square các cặp locus về lingkage disequilirium ...................................... 64
Phụ lục 4: Thông tin các mẫu tham gia đề tài ................ 85
3
MỞ ĐẦU
Short tandem repeat - STR là các đoạn trình tự ngắn, được cấu thành bằng sự lặp lại của khoảng 2 – 7 nucleotide. Trong hệ gen của người, các STR nằm rải rác khắp nơi, chúng nằm trong vùng không mã hóa, giữa các gen và chiếm khoảng 3% hệ gen người. Do vị trí đặc thù của STR, chúng có độ đa dạng cao về độ dài và trình tự lặp lại mà không ảnh hưởng đến hoạt động sống của con người. STR có tính bảo thủ cao, được truyền từ bố mẹ sang con cái, vì vậy mà các STR khác nhau giữa các cá thể khác nhau không có quan hệ huyết thống trực hệ. STR là các chỉ thị phân tử được ứng dụng rộng rãi trong các phân tích khoa học hình sự, cụ thể là công tác xác định danh tính, là công cụ đắc lực trong các vụ án hình sự phức tạp như cưỡng hiếp tập thể hoặc khi các dấu vết còn sót tại hiện trường không đủ cung cấp thông tin cho công tác điều tra [1], [2]. STR cũng được sử dụng trong nghiên cứu di truyền quần thể hay cho mục đích khảo cổ học. Mỗi một quần thể người đều có những đặc trưng sinh học riêng biệt hình thành trong quá trình sống qua nhiều thế hệ, trong đó ở cấp độ ADN, được thể hiện bằng sự phân bố khác nhau về tần suất allele trong mỗi nhóm dân tộc [3]. Việc thu thập dữ liệu STR các dân tộc sinh sống tại Việt Nam đã và đang được triển khai rộng khắp kể từ những năm 2000. Ngoài ứng dụng trong phân tích gen hình sự, các kết quả khảo sát còn được sử dụng trong nghiên cứu độ đa dạng về mặt nhân chủng học và xây dựng cơ sở dữ liệu về tần số phân bố allele trong quần thể người Việt Nam [4]–[6]. Tuy nhiên, việc thu thập dữ liệu nhiều dân tộc thiểu số vùng cao còn gặp nhiều khó khăn do địa bàn cư trú cách biệt và dân số thấp. Không chỉ vậy, Việt Nam cũng nằm trong vùng địa lý có lịch sử nhân chủng học rất phức tạp, đang còn nhiều tranh cãi về nguồn gốc, con đường hình thành các chủng người hiện đại đang sinh sống đó là khu vực Đông Nam Á [7]–[10]. Do đó nghiên cứu về các quần thể người sinh sống tại Việt Nam nói chung, về người Mông nói riêng còn rất hạn chế và chưa có một nghiên cứu chính thức nào được tiến hành.
Thực trạng đặt ra yêu cầu cấp thiết là phải xây dựng bộ cơ sở dữ liệu
STR cho nhóm dân tộc Mông sinh sống tại Việt Nam nhằm lưu trữ và phục vụ
cho truy xuất nguồn gốc, xác định danh tính trong công tác giám định pháp y,
4
cũng như cho công tác nghiên cứu di truyền học, nhân chủng học và bảo tồn tại
Việt Nam. Do đó, chúng tôi tiến hành thực hiện đề tài: “Xây dựng cơ sở dữ
liệu về tần số allele 22 locus đa hình STR trên nhiễm sắc thể thường ở quần
thể người Mông tại Hà Giang, Việt Nam”, nhằm : i) Xây dựng bộ số liệu tần
số allele của 22 locus đa hình STR trên nhiễm sắc thể thường của người Mông;
ii) Đánh giá các chỉ số thống kê đặc trưng của tần số allele, chỉ số đa dạng di
truyền của quần thể; iii) Xác định mối quan hệ di truyền của người Mông với
các quần thể gần gũi khác.
Ý nghĩa của nghiên cứu : Nghiên cứu cung cấp cơ sở dữ liệu tần số
STR nhiễm sắc thể thường phục vụ cho công tác giám định gen, xác định huyết
thống và nghiên cứu đa dạng di truyền quần thể.
5
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR
1.1.1. Short tandem repeat – STR
1.1.1.1. STR là gì
ADN đã được ứng dụng trong thực tế nghiên cứu pháp y từ thế kỉ XX,
đi cùng với sự phát triển của công nghệ giải mã hệ gen người. Trong công tác
giám định pháp y, dấu hiệu sinh học dựa trên ADN cung cấp rất nhiều thông
tin đặc biệt quan trọng và cũng là một bước nhảy của khoa học hình sự. ADN
mang những đặc điểm hóa sinh ưu thế khi mà các dấu vết sinh học khác còn có
thể thu thập được ở hiện trường thường rất ít, bị phân hủy nhanh chóng và tiêu
tốn thời gian. Hàng nghìn vụ án đã được đưa ra ánh sáng với sự hỗ trợ đắc lực
của công nghệ giám định ADN. Hiện nay, đối với giám định ADN trong khoa
học hình sự cả trong và ngoài nước thì các chỉ thị short tandem repeats (STR)
được sử dụng rất phổ biến do dựa trên phản ứng khuếch đại gen – polymerase
Hình 1.1 Các locus thuộc bộ CODIS của FBI và vị trí trên NST người
chain reaction (PCR), có độ đặc hiệu cao cũng như cho phép thực hiện đối với
6
các loại mẫu phức tạp. Điển hình các tổ chức lớn như FBI (Federal Bureau of
Investigation) đã công bố quy trình thường quy cho sử dụng 13 locus STR
(CODIS) (Hình 1.1) hay Interpol cũng xác định bộ 10 locus STR chuẩn cho
nước Anh và các nước Châu Âu cho công tác giám định xác định danh tính.
Tại Việt Nam, việc sử dụng STR trong công tác giám định xác định danh tính
cũng được sử dụng thường quy tại các viện Pháp y trong cả nước.
STR là đoạn trình tự đa hình nằm trong vùng không mã hóa, có cấu trúc
gồm các đoạn lặp lại của một trình tự nt có độ dài khoảng 2 – 7 bp, chiếm
khoảng 3% hệ gen người. Do nằm ngoài vùng mã hóa, các STR rất đa dạng
giữa người với người về độ dài (có thể lên đến hàng nghìn base), trình tự đoạn
lặp mà không ảnh hưởng đến hoạt động sinh học của tế bào. Các đoạn lặp lại
này nằm rải rác ở khắp nơi trong hệ gen của người. Từ những năm 1990 đến
nay đã có hàng chục nghìn STR trên các nhiễm sắc thể (NST) được phát hiện.
Trong quá trình phân bào, các đoạn STR này không bị phân cắt, chúng có tính
bảo thủ cao. Ngoại trừ trường hợp song sinh cùng trứng, số lượng lặp lại của
các STR là độc nhất cho từng cá thể, được di truyền từ bố mẹ sang con cái và
phân biệt các cá thể không có quan hệ huyết thống trực hệ. Do đó các cá thể
này sẽ mang bộ số lượng đoạn lặp lại khác nhau của các STR [1], [2]. Bộ chỉ
thị gồm nhiều các STR nằm trên các nhiễm sắc thể khác nhau cho phép phân
biệt các cá thể riêng biệt, ngay cả với những cá thể có quan hệ họ hàng gần gũi.
Đối với nghiên cứu di truyền quần thể, cơ sở di truyền của nghiên cứu dựa trên
hai định luật căn bản của di truyền học Mendel đó là định luật di truyền phân
ly độc lập và định luật di truyền phân ly. Do đó, các chỉ số về di truyền liên kết
cân bằng và cân bằng Hardy-Weinberg được kiểm định đồng thời các phép tính
thống kê được sử dụng nhằm tăng tính chính xác, giảm sai số trong phân tích
[11]. Trong giám định hình sự, xác định danh tính có thể được hiểu là sự so
sánh hồ sơ ADN của một người nào đó, lấy từ mẫu sinh học vương lại hoặc từ
7
các dấu vết như vết máu tại hiện trường của một vụ án với một người khác có
mối liên quan nhằm xác định danh tính hoặc loại trừ khả năng.
1.1.1.2. Phân loại và danh pháp
STR được phân loại dựa trên số lượng nucleotide được lặp lại, ví dụ
dinucleotide cho 2 nucleotide, trinucleotide cho 3 nucleotide…
Tuy nhiên, STR cũng có thể phân loại bằng một vài cách khác dựa trên tính
phức tạp của trình tự lặp lại. Các STR đơn giản là các STR cấu thành bởi sự lặp
lại của một trình tự nucleotide (ví dụ (GATA)n) hay STR phức là các đoạn được
cấu thành bởi sự lặp lại của 2 hoặc nhiều hơn trình tự nucleotide (ví dụ (CG)m–
(CA)n).
Danh pháp hay tên của từng đoạn STR được đặt theo tên của gen nếu
locus này nằm một phần hoặc nằm toàn bộ trong gen. Ví dụ chỉ thị STR TH01
có nguồn gốc từ tên gen tổng hợp enzym tyrosine hydroxylase của người, nằm
trên NST số 11. Chữ "TH" xuất phát từ chữ cái đầu tyrosine hydroxylase. Phần
"01" của ký hiệu "TH01" xuất phát từ vùng intron 1 của gen tổng hợp enzym
tyrosine hydroxylase. Các trình tự ADN nằm ngoài vùng gen thì được xác định
tên bằng vị trí của chúng trên NST. Ví dụ như locus D5S818 hay DYS19 là các
locus nằm ngoài vùng gen mã hóa, chữ “D” kí hiệu cho ADN, các kí hiệu tiếp
theo lần lượt là NST số 5/ Y cho NST Y; “S” có nghĩa là trình tự chỉ có một
bản copy trên genome; con số cuối tên là thứ tự chỉ thị này được phát hiện và
sắp xếp theo từng NST cụ thể.
1.1.1.3. Các chỉ thị STR thiết yếu
Đối với công tác giám định, việc sử dụng một bộ các chỉ thị theo một
tiêu chuẩn là cần thiết vì sự chính xác và đồng nhất của các kết quả giám định.
Bộ các chỉ thị được sử dụng rộng rãi ngày nay đã được nghiên cứu và phát triển
ở phòng thí nghiệm của tiến sĩ Thomas Caskey tại Trường đại học Y khoa
8
Baylor cùng với viện Forensic Science Service tại Anh thực hiện vào đầu những
năm 1990. Những chỉ thị này được sử dụng nhiều hơn trong các kit xét nghiệm
của hãng Promega (Mỹ) so với kit của hãng Applied Biosystems (Mỹ). Bộ kit
thương mại được đưa ra thị trường đầu tiên được giới thiệu bởi hãng Promega
năm 1994. Đây là bước nhảy lớn cho ứng dụng rộng rãi của STR trong công
tác giám định pháp y. Bộ kit bao gồm các locus CSF1PO, TPOX và TH01, là
các chỉ thị dạng “CTT”. Các chỉ thị triplex thường có chỉ số xác xuất trùng hợp
ngẫu nhiên chỉ khoảng 1/500 nhưng lại được sử dụng rộng rãi tại Mỹ do đây là
bộ kit thương mại đầu tiên cho phép khuếch đại cùng lúc nhiều chỉ thị với chi
phí thấp [11].
Vào năm 1990, Cục điều tra liên bang Mỹ - FBI đã khởi động một sự án
thăm dò trên tổng cộng 14 bang và phòng thí nghiệm liên quan tại địa phương.
Dự án được biết với tên “The DNA Identification Act” nhằm mục đích xây
dựng hệ thống dữ liệu quốc gia cho công tác điều tra án
(https://www.fbi.gov/services/laboratory/biometric-analysis/codis). Năm
1997, một bộ gồm 13 chỉ thị STR đã được chọn cho dự án xây dựng cơ sở dữ
liệu của hệ thống Combined DNA Index System - CODIS. Các chỉ thị bao gồm
các locus CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820,
D8S1179, D13S317, D16S539, D18S51, và D21S11 (Hình 1.1). Với bộ chỉ thị
này, chỉ số trùng hợp ngẫu nhiên đã được nâng lên đến 1/1000000 trên các cá
thể không có mối quan hệ huyết thống. Trong 13 locus thì các locus FGA,
D18S51 và D21S11 có tính đa hình cao nhất. Một locus được sử dụng phổ biến
thì có đặc tính riêng, trên cả số lượng allele, dạng trình tự lặp hay ngay cả các
điểm đa dạng phổ biến quan sát được.
1.1.1.4. Lịch sử nghiên cứu và phát triển của phương pháp giám
định gen trong khoa học hình sự
9
Thuật ngữ “DNA fingerprinting” được miêu tả lần đầu tiên vào năm
1985 bởi nhà di truyền học người Anh Alec Jeffreys. Tiến sĩ Jeffreys đã tìm
thấy các vùng gen nhất định chứa các đoạn trình tự lặp lại tuần tự, nối tiếp nhau
khi nghiên cứu các đoạn phát huỳnh quang gắn đa locus. Ông cũng phát hiện
ra rằng số đoạn lặp lại của các đoạn trình tự đặc biệt kia có tính cá thể cao, khác
nhau giữa các cá thể khác nhau. Bằng cách phát triển một công nghệ giúp kiểm
tra sự đa dạng của các đoạn lặp trên, tiến sĩ Jeffeys đã tạo ra phương thức định
danh người [12]. Phát hiện đó đã mở ra một kỷ nguyên mới trong khoa học.
Công nghệ này không chỉ nâng tầm khả năng ứng dụng trong nhiều lĩnh vực
như sinh học hệ thống, đa dạng sinh học, y học lâm sàng và cả trong khảo cổ
học. Những ứng dụng của công nghệ này đã vượt ra khỏi phạm vi nghiên cứu
khoa học thuần túy khi mà lần đầu tiên ứng dụng thành công trong điều tra án
và chiến tranh bắt đầu từ năm 1987.
Phương pháp xác định dấu vân tay ADN – DNA fingerprinting cổ điển
sử dụng phương pháp cắt enzyme giới hạn (RFLP) và Southern blot. Các đoạn
vi vệ tinh hoặc các đoạn lặp lại được gắn với probe phóng xạ. Liên kết này sẽ
bị phân giải bởi enzyme giới hạn, phân tách thành các đoạn riêng rẽ khi điện di
gel agarose và cố định lên màng bằng lai Southern blot. Do chứa các trình tự
nhận biết bởi enzyme giới hạn ở các vị trí khác nhau trên genome, các đoạn
ADN đích (vi vệ tinh hoặc các đoạn lặp) sẽ bị cắt khỏi genome thành các đoạn
có kích thước khác nhau theo số đơn vị đoạn lặp. Các đoạn này sẽ được rửa và
hiển thị trên phim X-Quang và được dùng để so sánh giữa các cá thể. Các đoạn
vi vệ tinh được gọi là 33,6 và 33,15 được dùng phổ biến ở Anh, phần lớn các
nước khối EU và Hoa Kỳ. Mặt khác, đoạn lặp năm – pentameric (CAC)/(GTG)5
lại được dùng phổ biến tại Đức. Những chỉ thị này cũng được gọi là các probe
đa locus có thể hiện thị được dải 15 - 20 trình tự có kích thước từ 3,5 đến 20
kb. Hình 1.2 là hình ảnh ví dụ một kết quả một bộ hồ sơ ADN của các cá thể
10
trong một gia đình. Tuy nhiên phương pháp này cho thấy một số hạn chế khi
ứng dụng trong điều tra án hoặc các xét nghiệm xác định huyết thống khi mà
điều kiện chạy hoặc chất lượng ADN quyết định rất lớn đến tính chính xác của
các băng ADN hiển thị được. Cho đến giữa những năm 1990, các phòng thí
nghiệm hình sự đã kết hợp với nhau để quy định cách tính các băng ADN dựa
trên các ô thang cố định nhằm khắc phục khó khăn trên. Các ô thang này quy
định tương đối vị trí các đoạn ADN quan sát được trên một ảnh điện di tiêu
chuẩn theo kích thước, từ đó làm tăng khả năng phân biệt của hệ thống. Hạn
chế thứ hai đến từ việc khi hồ sơ ADN không rõ danh tính, có nghĩa là không
rõ nguồn, thì dẫn đến các sai số thống kê do có thể có khả năng các locus di
truyền liên kết với nhau. Thêm nữa, để thu được một bộ hồ sơ ADN hoàn chỉnh
thì cần phải dùng một khối lượng phân tử ADN lớn, dẫn đến làm giảm khả năng
ứng dụng của phương pháp khi mà trên thực tế vụ án thì các mẫu sinh học lưu
lại tại hiện trường thường không lớn hoặc có thể phải xâm hại nhiều vào các
bằng chứng. Phương pháp sử dụng các locus đơn đã ra đời ngay trong năm
1987 nhằm khắc phục các hạn chế của phương pháp ban đầu [13]. Phương pháp
này có cùng nguyên lý hoạt động nhưng sử dụng một bộ gồm bốn locus đơn,
mỗi locus có hai allele. Phương pháp này chỉ cần 10 ng ADN và đã được kiểm
định bởi các thí nghiệm mở rộng và thực tế điều tra án (Hình 1.3). Tuy nhiên,
nhìn chung các phương pháp sử dụng RFLP vẫn mang nhiều hạn chế về độ
nhạy và độ đặc hiệu, cũng như khó có thể so sánh các kết quả từ các phòng thí
nghiệm khác nhau. Sau đó, phương pháp dựa trên PCR đã dần thay thế phương
pháp cũ bởi tính nhạy, tốc độ, và đặc hiệu của nó. Microsatelites – các vi vệ
tinh, được biết tới rộng rãi trong cộng đồng pháp y là các STR, được phát hiện
và trở thành chỉ thị lý tưởng cho các ứng dụng trong pháp y. Hồ sơ STR có độ
nhạy cao hơn so với các phương pháp RFLP đơn locus cũ, ít bị mất allele –
hiện tượng allele dropout như đối với hệ thống sử dụng các tiểu vệ tinh VNTR
và có khả năng phân biệt tốt hơn các phương pháp sử dụng HLA-DQA1. Do
11
đó, số lượng các công bố khoa học về các công nghệ này đã lên tới hàng nghìn,
thực hiện trên hàng trăm quần thể khác nhau, với nhiều công nghệ mới đã được
giới thiệu. Ngày nay, các bộ sinh phẩm được sử dụng đều dùng một panel nhiều
các chỉ thị STR đa allele. Các chỉ thị này có cấu trúc tương tự như các vi vệ
tinh đã được sử dụng nhưng có kích thước ngắn hơn, dễ dàng khuếch đại hơn
bằng PCR. Trong một lần chạy điện di mao quản có thể cùng lúc điện di lên
đến 30 chỉ thị STR khác nhau cho một cá thể [14].
Hình 1.2. Kết quả các băng thu được sau phân giải bằng enzyme giới hạn và lai Southern của một đại gia đình
12
Hình 1.3. Kết quả thu được so sánh giữa hai phương pháp sử dụng nhiều locus và các đơn
locus dựa trên phương pháp RFLP
13
Hình 1.4 là hình ảnh điển hình cho một kết quả điện di mao quản các locus
Hình 1.4. Hình ảnh kết quả điện di mao quản của một số locus sử dựng phương pháp PCR và
gắn huỳnh quang trên mỗi locus
STR gắn hình quang và được đo đếm bằng số đoạn lặp.
14
1.1.1.5. Đột biến ở STR
Các chỉ thị STR được dùng cho định danh cá thể một phần bởi đặc tính
có tốc độ đột biến nhanh. Trong khi một trình tự ADN điển hình trên genome
thường có tốc độ đột biến rất thấp, khoảng 10-9 nt trong một thế hệ, thì STR
thường có tốc độ đột biến trong khoảng 10-6 đến 10-2 trong một thế hệ [15],
[16]. Đối với mỗi loại sinh vật thì có tốc độ đột biến của STR là khác nhau
trong môi trường phòng thí nghiệm. Ví dụ, tốc độ đột biến STR của 1 tế bào
nấm men là 10-5, còn ở người thì trong khoảng 10-5 đến 10-3 trên mỗi chu kỳ
phân bào. Nghiên cứu của Chakraborty et al. (1997) [17] chỉ ra rằng, tốc độ đột
biến khác nhau ở các locus khác nhau trên cùng một genome. Nghiên cứu trên
các bộ STR khác nhau là di-, tri- và tetranucleotide STR trên một số quần thể
người cho thấy, các locus STR có tốc độ đột biến tỉ lệ nghịch với loại motif.
Các locus dạng di- có tốc độ đột biến cao gấp từ 1.5 đến 2 lần so với các tetra-
STR. Tuy nhiên, điều này lại ngược lại ở các STR liên quan đến một tình trạng
bệnh lý nào đó [17]. Đã có nhiều nghiên cứu được tiến hành để ước lượng tốc
độ đột biến của các STR trên các mô hình khác nhau: mô hình gia đình, mô
hình sinh học, mô hình quần thể và các dòng tế bào sinh dục [18]. Trong đó,
mô hình gia đình là dễ dàng ước lượng trực tiếp tốc độ đột biến các STR giữa
các cá thể qua thế hệ, cũng như dạng đột biến xuất hiện có thể có mà được di
truyền từ bố mẹ sang con cái. Tốc độ đột biến của một số chỉ thị STR thường
dùng hiện hay được cho trong Bảng 1.1 (https://strbase.nist.gov/mutation.htm).
Có ba cơ chế chính giải thích cho quá trình xảy ra đột biến của STR. Cơ chế
thứ nhất đó là sự phân li không cân bằng trong quá trình giảm phân. Đây là cơ
chế được biết đến rộng rãi là nguyên nhân dẫn đến các đoạn ADN vệ tinh lớn,
xảy ra trong quá trình trao đổi chéo giữa hai vùng tương đồng của các sợi NST.
Cơ chế thứ hai được cho là do sự phiên mã ngược xảy ra chủ yếu ở các STR
giàu adenin, xảy ra dưới cơ chế phiên mã ngược kéo dài đầu 3’ của sợi ADN,
15
tương tự như sự tạo thành của đuôi polyA trong quá trình phiên mã gen. Nghiên
cứu cũng cho thấy có bằng chứng chỉ ra rằng có mối liên hệ giữa STR giàu A
Bảng 1.1.. Thông tin về vị trí và tốc độ đột biến của một số locus thường dùng theo cơ sở dữ liệu STRbase (https://strbase.nist.gov/mutation.htm)
Phần trăm giảm
Tổng số đột
Phần trăm giảm phân
STR locus
Tốc độ đột biến
phân theo dòng mẹ
biến theo mỗi
theo dòng cha (%)
(%)
dòng
CSF1PO
95/304,307 (0.03)
982/643,118 (0.15)
1,487/947,425
0.16%
FGA
205/408,230 (0.05)
2,210/692,776 (0.32)
3,125/1,101,006
0.28%
TH01
31/327,172 (0.009)
41/452,382 (0.009)
100/779,554
0.01%
TPOX
18/400,061 (0.004)
54/457,420 (0.012)
100/857,481
0.01%
VWA
184/564,398 (0.03)
1,482/873,547 (0.17)
2,480/1,437,945
0.17%
D3S1358
60/405,452 (0.015)
713/558,836 (0.13)
1,152/964,288
0.12%
D5S818
111/451,736 (0.025)
763/655,603 (0.12)
1,259/1,107,339
0.11%
D7S820
59/440,562 (0.013)
745/644,743 (0.12)
1,089/1,085,305
0.10%
D8S1179
96/409,869 (0.02)
779/489,968 (0.16)
1,239/899,837
0.14%
D13S317
192/482,136 (0.04)
881/621,146 (0.14)
1,558/1,103,282
0.14%
D16S539
129/467,774 (0.03)
540/494,465 (0.11)
1,041/962,239
0.11%
D18S51
186/296,244 (0.06)
1,094/494,098 (0.22)
1,746/790,342
0.22%
D21S11
464/435,388 (0.11)
772/526,708 (0.15)
1,816/962,096
0.19%
Penta D
12/18,701 (0.06)
21/22,501 (0.09)
57/41,202
0.14%
với các gen nhảy [18].
Penta E
29/44,311 (0.065)
75/55,719 (0.135)
163/100,030
0.16%
D2S1338
15/72,830 (0.021)
157/152,310 (0.10)
262/225,140
0.12%
D19S433
38/70,001 (0.05)
78/103,489 (0.075)
187/173,490
0.11%
SE33 (ACTBP2)
0/330 (<0.30)
330/51,610 (0.64)
330/51,940
0.64%
16
Cơ chế thứ ba là cơ chế gấp đoạn khi tái bản – strand-slippage replication. Đây
là cơ chế chính được cho là gây ra đột biến STR. Quá trình tạo ra đột biến được
miêu tả qua Hình 1.5 khi tái bản sợi ADN, một đoạn khuôn tái bản bị gấp khúc
do nguyên nhân lý hóa nào đó, dẫn đến khung đọc mở bị thay đổi là dài hơn
hoặc ngắn đi, và bị ADN polymerase tổng hợp thêm hoặc bớt nt từ đó sinh ra
Hình 1.5. Cơ chế sinh đột biến STR do gấp đoạn trong quá trình nhân bản. Vì một lí do nào đó dẫn đến khung đọc mở bị gấp khúc, tạo thành nếp gấp mà polymerase không tổng hợp hoặc tổng hợp nhiều hơn so với trình tự trên khung, từ đó sinh ra đột biến thay đổi số đoạn lặp trên sợi ADN mới tổng hợp.
sự thay đổi số đoạn lặp của một locus STR [18].
Mô hình đột biến STR bao gồm: mô hình Infinite allele model (IAM) và
Stepwise mutation model (SMM), các mô hình này được sử dụng trong quá
17
trình nghiên cứu di truyền các chỉ thị STR và trong tính toán thống kê. Mô hình
IAM được đề xuất năm 1964 bởi hai nhà khoa học Kimura và Crow. Mô hình
dựa trên việc coi rằng mỗi đột biến sản sinh ra một allele mới và các đột biến
xảy ra với tỉ lệ như nhau. Từ đó, số đoạn lặp có thể là bất cứ một con số nào
mà trước đó không tồn tại trong quần thể ban đầu. Tuy nhiên, đã có nhiều
nghiên cứu chỉ ra rằng mô hình này không phù hợp với quá trình phát sinh đột
biến trong thực tế [18]. Chính vì vậy mà mô hình này ít được sử dụng trong các
phần mềm phân tích di truyền quần thể. Mô hình SMM được hai nhà khoa học
Kimura và Ota giới thiệu năm 1973, 9 năm sau mô hình thứ nhất. Ban đầu, mô
hình này được xây dựng để mô phỏng sự thay đổi điện tích của các phân tử
protein trong quá trình điện di phân tách, tuy nhiên lại không cho thấy hiệu quả.
Mặc dù vậy, mô hình này lại hoàn toàn phù hợp cho miêu tả sự đột biến của
các STR và được sử dụng rộng rãi trong các phân tích di truyền. Mô hình SMM
chấp nhận cơ chế đột biến gấp đoạn trong quá trình tái bản, và coi rằng:
- Đột biến làm thay đổi nhỏ trên số đoạn lặp - Sự tăng hay giảm số đoạn lặp có khả năng xảy ra như nhau - Không bị giới hạn ở kích thước allele - Tốc độ và kích thước của đột biến không phụ thuộc vào số đoạn lặp
Có rất nhiều yếu tố ảnh hưởng đến quá trình phát sinh đột biến ở STR.
Một trong những yếu tố quan trọng đó là số đoạn lặp lại của một locus STR.
Như có đề cập ở phần trước, từ các nghiên cứu dựa trên các mô hình tiếp cận
khác nhau từ mô hình gia đình hay quần thể, đều cho thấy tốc độ đột biến tăng
tỉ lệ thuận với số lượng đoạn lặp ở các loài động vật có vú, bao gồm con người.
Có nghĩa là, khi số lượng đoạn lặp càng lớn thì tốc độ đột biến của locus đó
càng lớn. Một yếu tố khác đó là số nt của một đơn vị lặp, các dinucleotide có
tốc độc đột biến cao hơn só với các tetranucleotide. Kết quả này cũng có thể
được giải thích bằng cơ chế gấp đoạn tái bản sinh đột biến. Cấu trúc của các
18
đơn vị lặp cũng ảnh hưởng đến tốc độ đột biến, khi mà ở NST thường, NST Y
hay ở các tế bào ung thư thì có tần số đột biến cao hơn ở các đoạn dị thể. Các
đoạn trình tự nối – flanking sequence cũng có mối tương quan tới tốc độ đột
biến khi mà quan sát thấy các đoạn trình tự nối chứa nhiều GC tỉ lệ nghịch với
sự đa dạng của các allele. Các yếu tố khác như sự tái tổ hợp trong quá trình
hình thành giao tử, độ tuổi hay giới tính cũng ảnh hưởng đến tốc độ đột biến
của các STR [18], [19].
1.1.2. Bộ kit Powerplex Fusion system được sử dụng trong giám định
Công nghệ STR typing sử dụng điện di mao quản cho phép khuếch đại
và phân tích cùng lúc nhiều chỉ thị STR. Các chỉ thị phân biệt bởi độ dài đoạn
đọc cùng với tín hiệu quang phân tử gắn trên các trình tự mồi của phản ứng
khuếch đại, từ đó quy đổi ra số lần lặp – STR allele của mỗi locus (Hình 1.6).
Việc quy đổi dựa trên một thang allele chuẩn thường được cung cấp cùng với
mỗi bộ kit xét nghiệm. Thang chuẩn được khuếch đại cùng với một bộ mồi như
đối với mẫu xét nghiệm. Phần mềm phân tích sẽ xử lý tín hiệu quang và thực
hiện việc quy đổi ra kích thước của từng allele theo từng “bin” – ô thang chuẩn.
Cách gọi tên và quy định allele phải theo bộ quy chuẩn chung. Mỗi ô thang
chuẩn có kích thước ± 0,5 bp quanh kích thước tiêu chuẩn của thang chuẩn, do
đó có thể phân biệt các kích thước chênh lệch nhau 1 bp [11].
Xuất phát từ hiệu quả thực tế ứng dụng của STR mà đã có rất nhiều bộ
kit thương mại được nghiên cứu, phát triển sử dụng đơn hoặc multiplex PCR
cho khuếch địa cùng lúc nhiều chỉ thị STR trong một thí nghiệm, qua công nghệ
giải trình tự Sanger và cả giải trình tự thế hệ mới (NGS). Từ cuối những năm
1990 thì các STR đã có thể được khuếch đại cùng lúc nhiều chỉ thị, từ một vài
lên đến 15 locus trong một phản ứng, với tính chính xác, độ nhạy cao và nhanh
19
chóng. Các bộ kit thương mại đều bao gồm 13 locus CODIS tiêu chuẩn cho
Hình 1. 6. Quá trình xác định kích thước của một allele dựa trên ô thang chuẩn. Thang allele chuẩn sẽ được chạy song song với mẫu, sau đó các tín hiệu huỳnh quang phân tách được của mẫu và thang allele chuẩn sẽ so với các ô thang chuẩn, từ đó xác định được các allele của mẫu
giám định của Mỹ và thêm các chỉ thị khác tùy vào thực tế của từng khu vực.
Bộ kit PowerPlex® Fusion System của hãng Promega cho phép khuếch
đại và phân tích cùng lúc 24 locus (Bảng 1.2) nhằm cải thiện tốc độ, tính chính
xác và khả năng phân biệt cá thể của phương pháp. Do đó, dựa trên đánh giá từ
thực tế ứng dụng, bộ kit hoàn toàn phù hợp cho công tác giám định pháp y trên
Bảng 1.2. Thông tin về vị trí và trình tự của một đơn vị lặp của các locus có trong bộ kit PowerPlex Fusion System theo thông tin của nhà sản xuất
thực tế [20].
STR Locus
Vị trí trên NST và kích thước Trình tự đoạn lặp lại theo chiều 5' -> 3'
Amelogenin3
Xp22.1–22.3 and Y
NA
D3S1358
3p21.31 (45.557Mb)
TCTA phức
D1S1656
1q42 (228.972Mb)
TAGA phức
D2S441
2p14 (68.214Mb)
TCTA
D10S1248
10q26.3 (130.567Mb)
GGAA
D13S317
13q31.1 (81.62Mb)
TATC
Penta E
15q26.2 (95.175Mb)
AAAGA
D16S539
16q24.1 (84.944Mb)
GATA
D18S51
18q21.33 (59.1Mb)
AGAA (19)
D2S1338
2q35 (218.705Mb)
TGCC/TTCC
CSF1PO
5q33.1 (149.436Mb)
AGAT
Penta D
21q22.3 (43.88Mb)
AAAGA
TH01
11p15.5 (2.149Mb)
AATG (19)
vWA
12p13.31 (5.963Mb)
TCTA phức (19)
D21S11
21q21.1 (19.476Mb)
TCTA phức (19)
D7S820
7q21.11 (83.433Mb)
GATA
D5S818
5q23.2 (123.139Mb)
AGAT
TPOX
2p25.3 (1.472Mb)
AATG
DYS391
Y
TCTA
D8S1179
8q24.13 (125.976Mb)
TCTA phức (19)
D12S391
12p12 (12.341Mb)
AGAT/AGAC phức
20
D19S433
19q12 (35.109Mb)
AAGG phức
FGA
4q28 (155.866Mb)
TTTC phức (19)
D22S1045
22q12.3 (35.779Mb)
ATT
21
1.1.3. Cơ sở dữ liệu tần số STR
Một cơ sở dữ liệu tần số STR là một bảng gồm các giá trị tương đối của
các allele của từng locus trong một quần thể cụ thể.
Các cơ sở dữ liệu tần số STR của một quần thể người được xây dựng cho
việc đánh giá và phân tích. Dựa trên các cơ sở dữ liệu có thể truy xuất từ một
bộ hồ sơ ADN của một người nào đó về thông tin nguồn gốc, chủng tộc của
người này. Một cơ sở dữ liệu phải được xây dựng trên một kích thước mẫu đủ
lớn nhằm đảm bảo giảm sai số do kích thước mẫu. Mục đích lớn nhất của việc
xây dựng cơ sở dữ liệu nhằm tạo dựng bộ thông tin di truyền của một quần thể
về các allele phổ biến trong quần thể đó. Chính vì vậy đã có rất nhiều quốc gia
xây dựng các bộ cơ sở dữ liệu lớn cho toàn bộ các nhóm dân của họ như Mỹ,
Anh, Hà Lan, Nhật Bản, Hàn Quốc, Trung Quốc… [21], [22].
1.1.4. Di truyền quần thể và dân tộc
Dân tộc và đặc điểm chung của các dân tộc tại Việt Nam
1.1.4.1.
Dân tộc – tộc người là một cộng đồng người có mối liên hệ chặt chẽ, bền
vững, có sinh hoạt kinh tế chung, có ngôn ngữ riêng và những nét văn hóa đặc
thù, xuất hiện sau bộ lạc, bộ tộc và tạo thành một quần thể sinh học. Việt Nam
là ngôi nhà chung của 54 dân tộc anh em. Sống trên mảnh đất Đông Dương -
nơi cửa ngõ nối Đông Nam Á lục địa với Đông Nam Á hải đảo, Việt Nam là
nơi giao lưu của các nền văn hoá trong khu vực. Đáng chú ý là, lịch sử nguồn
22
gốc hình thành các dân tộc ở khu vực này rất phức tạp và vẫn còn gây nhiều
tranh cãi trong giới khoa học cho đến thời điểm hiện tại [8], [9]. Tiếng nói của
các dân tộc Việt Nam thuộc 8 nhóm ngôn ngữ khác nhau:
- Nhóm Việt - Mường có 4 dân tộc là: Chứt, Kinh, Mường, Thổ.
- Nhóm Tày - Thái có 8 dân tộc là: Bố Y, Giáy, Lào, Lự, Nùng, Sán
Chay, Tày, Thái.
- Nhóm Môn - Khmer có 21 dân tộc là: Ba na, Brâu, Bru-Vân kiều,
Chơ-ro, Co, Cơ-ho, Cơ-tu, Gié-triêng, Hrê, Kháng, Khmer, Khơ mú,
Mạ, Mảng, M'Nông, Ơ-đu, Rơ-măm, Tà-ôi, Xinh-mun, Xơ-đăng,
Xtiêng.
- Nhóm Mông - Dao có 3 dân tộc là: Dao, Mông, Pà Thẻn.
- Nhóm Kađai có 4 dân tộc là: Cờ Lao, La Chí, La Ha, Pu Péo.
- Nhóm Nam đảo có 5 dân tộc là: Chăm, Chu-Ru, Ê Đê, Gia-Rai, Ra-
Glai.
- Nhóm Hán có 3 dân tộc là: Hoa, Ngái, Sán Dìu.
- Nhóm Tạng có 6 dân tộc là: Cống, Hà Nhì, La Hủ, Lô Lô, Phù Lá, Si
La.
Mặc dù tiếng nói của các dân tộc thuộc nhiều nhóm ngôn ngữ khác nhau,
song do các dân tộc sống rất xen kẽ với nhau nên một dân tộc thường biết tiếng
các dân tộc có quan hệ hàng ngày, và dù sống xen kẽ với nhau, giao lưu văn
hoá với nhau, nhưng các dân tộc vẫn lưu giữ được bản sắc văn hoá riêng của
dân tộc mình (Ủy ban dân tộc).Trong nghiên cứu này, chúng tôi dựa vào quy
định của Nhà nước Cộng hòa xã hội chủ nghĩa Việt Nam, công nhận một người
thuộc về dân tộc Mông dựa vào giấy khai sinh và sơ yếu lý lịch của người đó.
Đặc trưng các dân tộc ở Việt Nam là có lối sống quần tụ, làng xã, tập trung trên
một khu vực sinh sống nhất định, nên tần suất các allele của mỗi loci gen là
tương đối ổn định và có thể mang tính đặc trưng vùng, miền.
1.1.4.2. Các nhóm ngữ hệ tại Việt Nam
23
Ở Việt Nam, có đủ 5 ngữ hệ lớn trong khu vực Đông Nam Á, gồm: ngữ hệ
Nam Đảo, Nam Á, Thái – Kadai, Hán - Tạng và Mông - Dao. Các nhóm ngữ
hệ này sinh sống cùng nhau trên khắp cả nước và có sự pha trộn vốn gen với
nhau [23].
1.1.4.3. Dân tộc Mông tại Việt Nam
Dân tộc Mông là một dân tộc thiểu số trong tổng số 54 dân tộc anh em
sinh sống tại Việt Nam. Người Mông có nhiều nhóm nhỏ với tên gọi riêng, bao
gồm: Mông Ðơ (Mông Trắng), Mông Lềnh (Mông Hoa), Mông Sí (Mông Ðỏ),
Mông Ðú (Mông Ðen), Mông Súa (Mông Mán). Người Mông sử dụng nhóm
ngôn ngữ H’mông-Dao, một trong năm nhóm ngôn ngữ lớn nhất tại khu vực
Đông Nam Á. Họ sinh sống tập trung ở miền núi cao thuộc các tỉnh Hà Giang,
Tuyên Quang, Lào Cai, Yên Bái, Lai Châu, Sơn La, Cao Bằng, Nghệ An (hình
1.7) [24]. Theo số liệu của Tổng cục điều tra dân số và nhà ở năm 2009, ở Việt
Nam hiện có khoảng 1.068.189 người Mông sinh sống tại đây, đông dân thứ 6
tại Việt Nam. Dân tộc Mông có mặt ở hầu hết các tỉnh thành của Việt Nam,
nhưng tập trung chủ yếu ở các tỉnh Hà Giang (231,464 người, chiếm 21,7%
trên tổng số người Mông tại Việt Nam), theo sau là tại các tỉnh Điện Biên
(170.648 người), Sơn La (157.253 người) và các tỉnh khác. Người Mông có tập
quán tự do kén chọn bạn đời, nổi tiếng với tục “cướp vợ”. Do đó mà những
người cùng dòng họ không lấy nhau, vì vậy ít bị ảnh hưởng bởi hôn nhân cận
huyết như một số nhóm dân tộc thiểu số khác [24].
Hình 1.7. Sự phân bố các nhánh ngôn ngữ thuộc hệ Mông - Dao tại Việt Nam. Trong đó,
Hmong Daw tương ứng với nhóm Mông Trắng, Hmong Dô tương ứng với Mông Đỏ hay Hmong Don tương ứng với Mông Đen theo phân loại về ngôn ngữ và dân tộc học tại Việt Nam
24
1.2. Tình hình nghiên cứu trong và ngoài nước
Trong thời gian gần đây, tình trạng vi phạm pháp luật trong vùng đồng
bào dân tộc người thiểu số ở địa bàn miền núi, vùng xa có chiều hướng gia tăng
cả về số lượng và mức độ nghiêm trọng. Tuy nhiên, cơ sở dữ liệu STR cho từng
dân tộc sinh sống tại Việt Nam vẫn còn rất nhiều hạn chế. Hiện tại, Viện Khoa
học hình sự - Bộ Công an đang sử dụng bộ kit nhân gen AmpFlSTR®
Identifiler® Plus trong công tác giám định Sinh học pháp lý, sử dụng tần suất
allele của người Kinh, các tộc người khác chưa được chính thức sử dụng. Ngoài
người Kinh [25], [26], một số ít nghiên cứu trong nước được tiến hành trên các
dân tộc thiểu số là người Mường ở Hòa Bình [27], người Kh’mer tại Sóc Trăng
[28], người Nùng [29] và người Mông [30]. Và chỉ một vài nghiên cứu quốc
tế về quần thể người sinh sống tại Việt Nam của Shimada et al. (2002) tính tần
25
số của 178 người Kinh [5], chủ yếu sinh sống tại Hà Nội, hay trong một nghiên
cứu về quần thể người gốc Việt sinh sống tại tỉnh Vân Nam, Trung Quốc [6].
Đến gần đây, nhóm nghiên cứu của Tran et al. (2019) lần đầu tiên công bố
quốc tế bộ số liệu tần số allele cho 22 locus STR trên NST thường của hơn
2000 mẫu là người Kinh sinh sống tại Việt Nam [4]. Nghiên cứu này đã đưa ra
mối tương quan di truyền giữa người Kinh sinh sống tại Việt Nam với các quần
Hình 1.8. Cây phát sinh chủng loại miêu tả mối quan hệ di truyền gần gũi giữa quần thể
người Kinh và một số quần thể khác [4]
thể sinh sống tại các nước láng giềng qua cây phát sinh chủng loại (hình 1.8).
26
CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Nguyên vật liệu
2.1.1. Địa điểm thu mẫu
Mẫu được thu tại 2 huyện Mèo Vạc và Đồng Văn của tỉnh Hà Giang, Việt
Nam (Hình 2.1). Đây là 2 huyện nằm về phía cực bắc của Tổ quốc, có đường
biên giới Việt –Trung trải dài. Địa hình nơi đây chủ yếu là núi cao, dân cư thưa
Hình 2.1. Bản đồ hành chính tỉnh Hà Giang
thớt và nằm dải rác khắp các sườn núi.
27
2.1.2. Thu thập và bảo quản
Tổng cộng 156 mẫu, trong đó có 53 mẫu thu được tại huyện Mèo Vạc,
103 mẫu thu được tại huyện Đồng Văn, tỉnh Hà Giang. Tỉ lệ số mẫu là nam
giới trên mẫu là nữ giới là 63/93. Mẫu của các cá thể là dân tộc Mông sinh sống
tại Việt Nam, không có quan hệ huyết thống trực hệ liên tiếp ba đời gần nhất.
Mẫu thu có thể một trong ba loại, tùy thuộc vào điều kiện thu mẫu, gồm: mẫu
máu ngoại vi, tóc hoặc niêm mạc miệng. Đối với mẫu máu, mẫu được thu bằng
thẻ FTA chuyên dụng kích thước 2×2 mm. Đối với tóc, mẫu thu từ 3 đến 5 sợi
tóc có chân và bảo quản trong phong bì riêng biệt, được đánh số ký tự lưu mẫu.
Đối với mẫu niêm mạc, mẫu được thu bằng tăm bông y tế chuyên dụng. Việc
thu thập mẫu được căn cứ theo hồ sơ nhân thân được cung cấp bởi Công an các
quận, huyện trực thuộc các tỉnh, thành phố. Các mẫu thu thập được lưu trữ tại
Trung tâm giám định ADN, Viện Công nghệ sinh học.
2.2. Phương pháp nghiên cứu
2.2.1. Khuếch đại đoạn gen
2.2.1.1. Bộ kit sử dụng
Bộ kit khuếch đại 24 locus (22 locus trên NST thường và 2 locus trên
NST giới tính) sử dụng bộ kit Power plex Fusion System (Promega, Mỹ). Bộ
kit này cho phép khuếch đại cùng lúc 24 locus khác nhau trong cùng một phản
ứng. Bộ kit đã bao gồm 13 locus trong bộ CODIS của FBI (CSF1PO, FGA,
TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317,
D16S539, D18S51, D21S11) và bộ chỉ thị theo khuyến cáo của châu Âu là
(TH01, vWA, FGA, D21S11, D3S1358, D8S1179, D18S51, D10S1248,
D22S1045, D2S441, D1S1656, D12S391), hai loci Amelogenin và DY391 cho
xác định giới tính (Hình 2.2). Độ nhạy của kit là 100 pg theo thông tin của hãng
28
sản xuất. Các locus Penta D và Penta E được sử dụng nhằm tăng khả năng phân
biệt giữa các cá thể của bộ locus STR. Như vậy, bộ STR được sử dụng đảm bảo
Hình 2.2. Độ dài và loại dye được sử dụng cho mỗi locus trong bộ kit
được cả hai khuyến cáo của FBI và ESS.
2.2.1.2. Xử lý mẫu và khuếch đại đoạn gen
a) Xử lý mẫu:
Đối với mẫu máu thu bằng thẻ FTA, dùng kéo đã qua xử lý làm sạch cắt
lấy một hoặc hai mảnh giấy kích thước khoảng 1,2 mm trong vùng thấm máu
từ thẻ. Mẫu được thu trong ống nghiệm để tiến hành khuếch đại. Tương tự đối
với mẫu niêm mạc miệng, thu lấy một mảnh quanh miếng bông. Đối với mẫu
tóc, tóc được cắt lấy phần gốc tóc, cách chân tóc 0,5 cm.
Các mẫu sẽ được ly giải bằng SwabSolution Kit (Promega, Mỹ) theo
hướng dẫn của nhà sản xuất. Dịch thu được sẽ được sử dụng làm khuôn cho
phản ứng khuếch đại tiếp theo.
b) Phản ứng khuếch đại
Thành phần phản ứng được cho trong bảng 2.1 như sau:
Bảng 2. Bảng thành phần phản ứng khuếch đại
29
Thành phần
Thể tích
Nước dùng cho PCR
15,0 µL
PowerPlex Fusion 5X Master Mix
5,0 µL
PowerPlex Fusion 5X Primer Pair Mix
5,0 µL
Mẫu
25 µL
Tổng thể tích
Mỗi lượt chạy là 8 mẫu, bao gồm 1 mẫu là thang chuẩn của kit và 1 mẫu
là đối chứng dương. Mẫu đối chứng dương là mẫu sử dụng ADN chuẩn cung
cấp theo bộ kit là 2800M Control ADN nhằm kiểm tra hiệu quả khuếch đại.
Hình 2.3. Chu trình nhiệt của phản ứng khuếch đại với 28 chu kỳ
Mẫu sẽ được khuếch đại 28 chu kỳ với quy trình như hình dưới (Hình 2.3).
Phản ứng nhiệt diễn ra trên hệ máy ProFlex 3x32-Well PCR System
(Applied Biosystems-ThermoFisher, Mỹ).
c) Điện di mao quản
Các sản phẩm PCR được đánh dấu bằng được đánh dấu bằng hệ màu 6
kênh cho phép tối ưu hóa hiệu quả phân tích. Sản phẩm khuếch đại được điện
30
di và phân tích trên máy giải trình tự gen ABI 3500 Genetic Analyzer với phần
mềm GeneMapper ID v3.2, sử dụng kích thước chuẩn (GeneScan-600 LIZ,
Applied Biosystems, Mỹ) và thang alen chuẩn được nhà sản xuất cung cấp theo
Power plex Fusion System (Promega, Mỹ). Quy chuẩn gọi đỉnh mẫu và kiểm
định kết quả theo khuyến cáo của tổ chức SWGDAM về giám định STR
(“SWGDAM Interpretation Guidelines for Autosomal STR Typing by Forensic
DNA Testing Laboratories,” 2017).
2.2.2. Tính toán tần số và các chỉ số pháp y
2.2.2.1. Tính toán tần số và các chỉ số pháp y
Tần số xuất hiện của các allele, chỉ số đa dạng di truyền, Heterozygosity
expected, Heterozygosity observed, Homozygosity, Cân bằng Hardy-
Weinberg và linkage – disequilibrium test (p=0.002) tính bằng phần mềm
Arlequin v3.5 (Excoffier and Lischer 2010), chỉ số kết hợp khả năng loại trừ
(Combined Power of Exclusion – CPE), chỉ số kết hợp khả năng phân biệt
(Combined Discrimination Capacity – CDC), chỉ số kết hợp khả năng trùng
lặp ngẫu nhiên (Combinded Match Probability – CMP), Polymorphic
information content, Parentity index của từng locus, được tính bằng công cụ
online FORSTAT (https://fdl-uwc.shinyapps.io/forstat/)
2.2.2.2. Xác định và liệt kê các allele có tần số thấp
Các allele có tần số thấp là các allele có tần số hơn 5/2N [33], trong đó
N là kích thước mẫu. Một allele tồn tại trong quần thể có số lần xuất hiện tối
thiểu phải năm lần, do đó công thức tính tần số allele tối thiểu là 5/2N [33].
31
2.2.3. Xác định mối liên hệ giữa quần thể người Mông tại Hà Giang và các
quần thể khác
Cây phát sinh chủng loại được xây dựng bằng phần mềm POPTREE2
[34] để tính khoảng cách di truyền và xây dựng cây phát sinh chủng loại của
các quần thể bằng cách sử dụng phương pháp neighbor joining-NJ [35], cùng
với phương pháp nhóm theo cặp với giá trị khoảng cách trung bình không theo
trọng số (UPGMA) [36] và lặp lại với bootstrap 1000. File xuất ra được xử lý
hình ảnh bằng phần mềm Figtree v1.4.
32
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN
3.1. Kết quả thu mẫu và khuếch đại ADN
Tổng số mẫu thu được là 156 mẫu, trong đó có 63 mẫu nam giới và 93
mẫu nữ giới. Các mẫu đều có chất lượng tốt, đủ điều kiện để thực hiện các thí
nghiệm. Do sử dụng phương pháp khuếch đại trực tiếp từ mẫu sinh phẩm, nên
không có sản phẩm ADN tách chiết, do đó cũng không đánh giá định lượng
ADN. Tuy nhiên, chất lượng mẫu thể hiện ở hiệu quả khuếch đại bộ 24 locus
trong bộ kit thương mại được sử dụng là Power plex Fusion System (Promega,
Mỹ), đó là khuếch đại thành công 156 bộ hồ sơ ADN 24 locus và không ghi
nhận trường hợp bị mất allele – allele drop out nào, cũng không có trường hợp
3 allele – tri allele trên một locus. Mỗi một lượt chạy có kèm theo các phản ứng
đối chứng dương và đối chứng âm, kết quả trong phần phụ lục. Bảng 3.1 thống
kê số allele khác nhau thu được và phần trăm số allele bị mất trên từng locus từ
các mẫu nghiên cứu. Tổng số khuếch đại được 205 allele không kể Amelogenin
và DY391, các allele có độ dài nhỏ nhất là 5 (locus Penta E) và dài nhất là 34.2
(locus D21S11). Số lượng các allele phát hiện được ít hơn số với 252 allele thu
được từ quần thể người Kinh tại Việt Nam, khi hai nghiên cứu sử dụng cùng
một bộ kit STR [4]. Sự khác nhau cũng quan sát được về độ dài ngắn nhất và
dài nhất của các locus. Sự khác biệt này có thể từ khác biệt về quần thể người
cũng có thể do sự chênh lệch về kích thước mẫu được thực hiện. Locus Penta
E là locus có số lượng allele là lớn nhất với 16 allele khác nhau, theo sau là
locus D2S1338 (13 allele), D1S1656 và D18S51 với 12 allele. Mặt khác, các
locus có số allele thấp nhất là TPOX với 5 allele. Locus Penta E nằm trên NST
số 15, tại vị trí 15q26.2, có trình tự đơn vị lặp là [AAAGA]n, số đoạn lặp n có
thể từ 5 đến 26 đặc trưng cho từng chủng người
(https://strbase.nist.gov/str_Penta_E.htm ). Một số nghiên cứu đã sử chỉ thị này
33
để nghiên cứu đa dạng ở quần thể người hoặc đánh giá tính đa hình của Penta
E và thấy rằng chỉ thị này có tính đa hình cao, khả năng phân biệt cá thể cao,
và là một chỉ thỉ phù hợp cho nghiên cứu tìm kiếm allele hiếm do tính đa hình
Bảng 3.1. Số lượng allele mỗi locus
cao của nó.
Locus
Số lượng
Phần trăm allele bị mất
D3S1358
6
0
D1S1656
12
0
D2S441 D10S1248 D13S317 Penta E D16S539 D18S51 D2S1338 CSF1PO Penta D TH01 vWA D21S11 D7S820 D5S818 TPOX D8S1179 D12S391 D19S433 FGA D22S1045
8 7 8 16 8 12 13 6 9 6 7 10 8 8 5 9 10 12 16 9
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Từ kết quả trên cho thấy, việc sử dụng các phương pháp thu mẫu là phù
hợp với điều kiện thực tế tại Việt Nam, có thể sử dụng trong quy mô thu mẫu
rộng như điều tra xây dựng cơ sở dữ liệu STR toàn quốc trong tương lai. Đối
với mỗi loại mẫu có một vật liệu thu mẫu phù hợp như mẫu máu thu bằng thẻ
FTA, mẫu tóc thì chỉ cần thu thập 3 đến 5 sợi và mẫu niêm mạc miệng thu bằng
34
tăm bông y tế. Các mẫu trên có thể bảo quản ở nhiệt độ -20oC trong vòng vài
tháng, dễ dàng vận chuyển và vẫn đảm bảo đủ chất lượng cho phân tích STR.
3.2. Kết quả tính tần số các locus và xác định các allele có tần số thấp
Các hồ sơ của toàn bộ 156 hồ sơ được tập hợp trong một bảng tính, và
nhằm đảm bảo không có sai sót trong quá trình tính toán, tần số và các chỉ thị
liên quan đều được thực hiện bằng phần mềm phân tích chuyên biệt như đã mô
tả trong phần phương pháp. Bảng tần số các allele được cho Bảng 3.2.
Cách gọi tên allele theo quy chuẩn của tổ chức Scientific Working Group
on ADN Analysis Methods (SWGDAM) về giám định STR. Một số allele có
kích thước thập phân như allele 9.1 của locus D2S441 do allele không có số
lần lặp lại của một đơn vị lặp hoàn chỉnh, chỉ lặp một phần hoặc có kích thước
vùng trình tự hai đầu khác nhau. Các allele này sẽ được quy định gọi tên theo
kích thước của STR [11].
Bảng 3.2. Bảng tần số allele 22 locus STR trên NST thường của Mông, tại Hà Giang - Việt Nam
35
A
F G A
v W A
T H 0 1
T P O X
D 2 S 4 4 1
D 1 8 S 5 1
D 2 1 S 1 1
D 7 S 8 2 0
D 5 S 8 1 8
P e n t a E
P e n t a D
l l e l e / n
C S F 1 P O
D 3 S 1 3 5 8
D 1 S 1 6 5 6
D 1 3 S 3 1 7
D 1 6 S 5 3 9
D 2 S 1 3 3 8
D 8 S 1 1 7 9
D 1 2 S 3 9 1
D 1 9 S 4 3 3
D 1 0 S 1 2 4 8
D 2 2 S 1 0 4 5
0
.
5
0 2 5 6 4
0
.
6
2 1 1 5 4
0
0
0
0
.
.
.
.
7
0 0 9 6 2
0 0 9 6 2
2 2 4 3 6
0 0 9 6 2
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
8
0 0 6 4 1
5 6 7 3 1
0 1 6 0 3
0 0 3 2 1
1 9 8 7 2
0 0 6 4 1
3 5 2 5 6
0 1 9 2 3
0 6 7 3 1
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
9
0 9 6 1 5
4 0 3 8 5
0 0 9 6 2
0 3 8 4 6
0 8 3 3 3
3 2 3 7 2
0 0 3 2 1
4 4 5 5 1
0
.
9.1
0 0 6 4 1
0
.
9.3
0 7 0 5 1
0
0
0
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
.
10
3 2 0 5 1
0 1 6 0 3
0 0 3 2 1
1 1 2 1 8
0 7 3 7 2
0 5 1 2 8
1 9 5 5 1
1 5 3 8 5
1 2 8 2 1
2 3 0 7 7
3 6 8 5 9
0 2 8 8 5
0 0 3 2 1
0
0
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
36
11
4 7 1 1 5
5 2 2 4 4
3 4 9 3 6
1 2 1 7 9
0 8 6 5 4
0 2 8 8 5
3 5 2 5 6
1 1 5 3 8
1 1 8 5 9
2 1 7 9 5
2 1 1 5 4
1 4 4 2 3
0
.
11.3
1 2 5 0 0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12
1 2 8 2 1
0 3 8 4 6
2 2 7 5 6
0 3 2 0 5
0 2 5 6 4
0 2 8 8 5
0 6 4 1 0
0 6 0 9 0
0 5 1 2 8
2 5 6 4 1
0 0 9 6 2
5 5 1 2 8
1 7 3 0 8
0 0 9 6 2
0
.
12.2
0 0 3 2 1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
0 1 2 8 2
1 6 3 4 6
1 2 8 2 1
3 6 5 3 8
1 2 8 2 1
0 0 6 4 1
0 2 8 8 5
0 5 7 6 9
0 2 5 6 4
2 2 4 3 6
4 4 5 5 1
0 3 5 2 6
0 7 6 9 2
0 0 3 2 1
0
.
13.2
0 8 3 3 3
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
14
0 1 6 0 3
0 0 6 4 1
0 4 4 8 7
1 2 5 0 0
0 8 3 3 3
0 1 9 2 3
1 2 1 7 9
1 1 2 1 8
0 0 9 6 2
1 0 2 5 6
0 2 5 6 4
2 2 7 5 6
2 3 0 7 7
0 0 3 2 1
0 4 8 0 8
3 7 1 7 9
0
.
14.2
0 4 8 0 8
0
0
0
0
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
0 0 6 4 1
2 4 3 5 9
0 1 2 8 2
0 0 3 2 1
3 8 7 8 2
2 9 4 8 7
3 0 1 2 8
0 1 2 8 2
1 0 5 7 7
0 0 3 2 1
1 6 9 8 7
2 7 2 4 4
0 0 3 2 1
0 1 6 0 3
0
.
37
15.2
2 7 5 6 4
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
16
0 2 8 8 5
1 2 5 0 0
2 0 8 3 3
0 0 6 4 1
2 8 5 2 6
0 4 1 6 7
0 0 3 2 1
1 1 8 5 9
2 9 1 6 7
1 5 3 8 5
0
.
16.2
0 2 8 8 5
0
.
16.3
0 0 6 4 1
0
0
0
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
.
.
.
17
0 0 9 6 2
0 6 7 3 1
0 0 6 4 1
0 2 8 8 5
1 3 4 6 2
0 1 2 8 2
0 3 8 4 6
1 2 5 0 0
3 4 2 9 5
0 5 4 4 9
0 2 5 6 4
0
.
17.3
0 5 1 2 8
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
18
0 9 2 9 5
0 4 1 6 7
0 3 5 2 6
0 1 2 8 2
0 8 0 1 3
0 0 6 4 1
2 9 8 0 8
0 4 8 0 8
0
.
18.2
0 0 3 2 1
0
.
18.3
1 0 2 5 6
0
0
0
0
0
0
0
0
.
.
.
.
.
.
.
.
38
19
0 5 7 6 9
0 0 3 2 1
0 2 8 8 5
0 7 0 5 1
1 9 5 5 1
0 0 3 2 1
0 2 5 6 4
4 2 6 2 8
0
.
19.3
0 0 6 4 1
0
0
0
0
0
0
0
.
.
.
.
.
.
.
20
0 1 2 8 2
0 5 7 6 9
0 0 6 4 1
0 5 4 4 9
0 0 3 2 1
0 8 6 5 4
0 5 4 4 9
0
0
0
0
0
.
.
.
.
.
21
0 6 4 1 0
0 0 6 4 1
0 2 8 8 5
0 6 7 3 1
1 7 6 2 8
0
0
0
0
0
.
.
.
.
.
22
0 1 9 2 3
0 1 2 8 2
0 8 9 7 4
0 8 6 5 4
1 1 5 3 8
0
.
22.2
0 0 3 2 1
0
0
0
0
.
.
.
.
23
0 1 6 0 3
2 9 8 0 8
1 0 2 5 6
0 3 5 2 6
0
.
23.2
0 0 6 4 1
0
0
0
0
.
.
.
.
24
0 0 3 2 1
2 1 1 5 4
2 2 4 3 6
0 1 9 2 3
0
.
39
24.2
0 5 4 4 9
0
0
0
.
.
.
25
0 2 2 4 4
0 1 9 2 3
2 1 1 5 4
0
.
25.2
0 3 5 2 6
0
0
.
.
26
0 2 2 4 4
0 8 9 7 4
0
.
26.2
0 0 3 2 1
0
0
.
.
27
0 0 3 2 1
0 2 5 6 4
0
0
.
.
28
0 1 6 0 3
0 0 3 2 1
0
.
29
1 8 9 1 0
0
0
.
.
30
2 1 7 9 5
0 0 3 2 1
0
.
40
30.2
0 1 6 0 3
0
.
31
1 6 0 2 6
0
.
31.2
1 6 0 2 6
0
.
32
0 1 9 2 3
0
.
32.2
1 0 5 7 7
0
.
33.2
1 1 2 1 8
0
.
34.2
0 0 3 2 1
41
Các allele có tần số thấp là các allele có tần số ≤ 5/2N, trong đó N là kích
thước mẫu. Như vậy, đối với nghiên cứu này thì các allele có tần số ≤ 0.016026
được coi là các allele có tần số thấp, ít xuất hiện trong quần thể. Bảng 3.3 thống
kê các allele có tần số thấp phát hiện được trong quần thể nghiên cứu. Số lượng
allele có tần số thấp thấy nhiều nhất ở locus D18S51 và FGA. Kết quả này khác
so với nghiên cứu thực hiện trên quần thể người Kinh hay các quần thể người
dân tộc khác trước đó [4], [27], [37]. Tuy nhiên, nghiên cứu cùng trên đối tượng
là người Mông của tác giả Nguyễn Như Giang, năm 2014 lại không công bố số
liệu, do đó không thể tiến hành so sánh. Mặt khác, các allele được tìm thấy là
có tần số thấp là đánh giá tương đối, tùy thuộc vào kích thước mẫu, N càng lớn
thì tần số càng nhỏ dẫn đến việc allele A trong nghiên cứu này là allele có tần
số thấp nhưng có thể không phải allele có tần số thấp trong nghiên cứu khác là
Bảng 3.3. Các allele có tần số thấp phát hiện được trong quần thể
L o c u s
P e n t a E
P e n t a D
D 1 8 S 5 1
D 2 S 4 4 1
C S F 1 P O
D 3 S 1 3 5 8
D 1 S 1 6 5 6
D 1 3 S 3 1 7
D 1 6 S 5 3 9
D 2 S 1 3 3 8
D 1 0 S 1 2 4 8
allele
15
19 16.3 19.3
7 14
8 24
9 14
7 15
9.1 13 15
10 12 17
16 26 30
12 17 20 21 22
F G A
v W A
T H 0 1
T P O X
L o c u s
D 2 1 S 1 1
D 7 S 8 2 0
D 5 S 8 1 8
D 8 S 1 1 7 9
D 1 2 S 3 9 1
D 1 9 S 4 3 3
D 2 2 S 1 0 4 5
allele
20 34.2
10
8 17
13 15
7 8 9 14
15 12.2 15 16 18.2
13 18 19 20
18 22.2 23.2 26.2 28
hoàn toàn có khả năng.
42
3.3. Kết quả phân tích thống kê
3.3.1. Kiểm định cân bằng Hardy-Weinberg
Các STR allele được di truyền cho con cái từ bố và mẹ theo quy luật di
truyền Mendel, do đó tần số của một allele có thể dự đoán được theo quy luật
phân bố khả năng. Nếu 2 allele A và a có tần số p và q trong một quần thể, thì
tần số có kiểu hình đồng hợp AA sẽ là p2, kiểu hình dị hợp Aa là 2pq. Như vậy,
từ tần số allele có thể tính được tần số allele mong đợi và tần số allele đó trong
thực tế, và nếu giá trị mong đợi và thực tế tương đương nhau thì đồng nghĩa
với allele của locus trong quần thể đó đang ở trạng thái cân bằng [11]. Cân bằng
Hardy – Weinberg (HWE) giúp dự đoán tần số kiểu gen hay allele có ở trạng
thái di truyền cân bằng hay không [33]. Bộ số liệu trong nghiên cứu này được
kiểm định có đạt cân bằng HWE hay không, dưới giá trị p value = 0.002. Dựa
trên kết quả phân tích cho thấy, toàn bộ 22 locus (không tính 2 locus trên NST
giới tính) đều tuân theo cân bằng HWE (Bảng 3.4). Điều này có nghĩa là đối
với các locus STR trong bộ kit Powerplex Fusion Systems thì các allele đều
đang ở trạng thái cân bằng. Quần thể đạt cân bằng HWE có nghĩa là quần thể
đó được coi là: quần thể giao phỗi ngẫu nhiên, không có hiện tượng di nhập
gen hay đột biến phát sinh allele mới [33]. Tuy nhiên, những điều trên không
tồn tại trong tự nhiên. Do đó mà việc kiểm định HWE trong nghiên cứu này chỉ
trả lời câu hỏi là các locus có đang ở trạng thái di truyền cân bằng hay không,
các allele trong một locus là di truyền độc lập và có thể dự đoán tần số của các
Bảng 3.4. Kết quả kiểm định cân bằng HWE bằng phần mềm Arlequin v3.5
allele trong một kiểu gen nếu các locus đó theo cân bằng HWE.
Locus
#Genot
P-value
s.d.
Steps done
D3S1358
156
0.26
0.00039
1001000
D1S1656
156
0.927
0.00023
1001000
D2S441
156
0.422
0.00046
1001000
D10S1248
156
0.495
0.00049
1001000
D13S317
156
0.19
0.00039
1001000
Penta E
156
0.962
0.00016
1001000
D16S539
156
0.041
0.00017
1001000
D18S51
156
0.073
0.00016
1001000
D2S1338
156
0.188
0.00028
1001000
CSF1PO
156
0.559
0.00046
1001000
Penta D
156
0.463
0.00043
1001000
TH01
156
0.167
0.00039
1001000
vWA
156
0.844
0.00033
1001000
D21S11
156
0.018
0.00013
1001000
D7S820
156
0.755
0.00047
1001000
D5S818
156
0.574
0.00043
1001000
TPOX
156
0.738
0.0005
1001000
D8S1179
156
0.134
0.00028
1001000
D12S391
156
0.277
0.00041
1001000
D19S433
156
0.628
0.00037
1001000
FGA
156
0.21
0.00028
1001000
D22S1045
156
0.274
0.00035
1001000
43
44
3.3.2. Gía trị dị hợp tử mong đợi và quan sát được
Các giá trị dị hợp tử mong đợi (EH) và dị hợp tử quan sát được (OH) của
từng locus được cho trong Bảng 3.5. Có năm locus có giá trị EH > OH và 17
locus có EH < OH. Khi giá trị OH lớn hơn EH dưới kiểm định cân bằng HWE,
có nghĩa là điều kiện chấp nhận đặt ra là không phù hợp. Như có nói ở trên,
một quần thể trong tự nhiên không thể là một quần thể HWE. Do đó, hiện tượng
OH> EH xảy ra có thể giải thích rằng quần thể nghiên cứu không giao phối
ngẫu nhiên, điều này xảy ra thường xuyên trong quần thể loài người; quần thể
nghiên cứu có hiện tượng di nhập gen, chịu tác động của chọn lọc tự nhiên, có
Bảng 3.5. Kết quả tính các chỉ số EH và OH của từng locus, các locus được đánh dấu đậm có giá
trị OH phát sinh đột biến, và có biểu hiện của giao phối cận huyết [11], [38]. D3S1358 156 0.71154 0.26009 0.00039 1001000 D1S1656 156 0.85256 0.92682 0.00023 1001000 D2S441 156 0.69231 0.42209 0.00046 1001000 D10S1248 0.64744 0.49487 0.00049 1001000 156 D13S317 156 0.58974 0.18994 0.00039 1001000 Penta E 156 0.92949 0.96151 0.00016 1001000 D16S539 156 0.8141 0.04126 0.00017 1001000 D18S51 156 0.86538 0.07271 0.00016 1001000 D2S1338 156 0.78846 0.18777 0.00028 1001000 CSF1PO 156 0.64103 0.55855 0.00046 1001000 Penta D 156 0.76923 0.46318 0.00043 1001000 0.70513 0.16747 0.00039 1001000 156 TH01 0.76923 0.84353 0.00033 1001000 156 vWA 0.85897 0.01771 0.00013 1001000 156 D21S11 0.6859 0.75476 0.00047 1001000 156 D7S820 0.76923 0.57426 0.00043 1001000 156 D5S818 0.57051 0.73766 0.0005 1001000 156 TPOX 0.79487 0.13364 0.00028 1001000 156 D8S1179 0.77564 0.27693 0.00041 1001000 156 D12S391 0.80128 0.6282 0.00037 1001000 156 D19S433 0.83974 0.2096 0.00028 1001000 156 FGA 156 D22S1045 0.77564 0.27364 0.00035 1001000 45 3.3.3. Kiểm tra tính di truyền liên kết của các locus STR Các locus được đánh giá tính di truyền liên kết – linkage disequilibrium (LD) theo cặp, đánh giá sử dụng kiểm định Chi-Square với giá trị p = 0.002 (Bảng 3.6). Trong bộ 22 locus có locus D7S820 và D12S391 có p < 0.002, có nghĩa là hai locus trên di truyền liên kết cân bằng. Chi tiết các giá trị của kiểm định Chi-square các locus theo từng cặp được cho trong phần phụ lục 3. Bảng 3.6. Bảng ma trận đánh giá linkage disequilibrium của các locus. Dấu "-" là không có ý nghĩa thống kê, "+" là có ý nghĩa thống kê so với p = 0.002 P
e
n P
e
n t t F
G
A v
W
A T
H
0
1 T
P
O
X L
o
c
u
s a
E D
2
S
4
4
1 D
7
S
8
2
0 D
5
S
8
1
8 D
1
8
S
5
1 D
2
1
S
1
1 a
D C
S
F
1
P
O D
3
S
1
3
5
8 D
1
S
1
6
5
6 D
2
S
1
3
3
8 D
8
S
1
1
7
9 D
1
3
S
3
1
7 D
1
6
S
5
3
9 D
1
2
S
3
9
1 D
1
9
S
4
3
3 D
1
0
S
1
2
4
8 D
2
2
S
1
0
4
5 D3S1358
D1S1656
D2S441
D10S1248
D13S317
Penta E
D16S539
D18S51
D2S1338
CSF1PO
Penta D
TH01
vWA
D21S11
D7S820
D5S818
TPOX
D8S1179
D12S391
D19S433
FGA
D22S1045 *
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
*
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
*
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
*
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
*
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
*
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
*
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
*
-
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
*
-
-
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
*
-
-
-
-
+
-
-
-
+
-
-
- -
-
-
-
-
-
-
-
-
-
*
-
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
*
-
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
*
-
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
*
-
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
+
-
-
-
-
*
-
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
*
-
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
*
-
-
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
*
-
-
-
- -
-
-
-
-
-
-
-
-
+
-
-
-
-
-
-
-
-
*
-
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
*
-
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
*
- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
* 46 47 3.4. Kết quả phân tích các chỉ số pháp y 3.4.1. Chỉ số khả năng trùng hợp ngẫu nhiên - Match probability (MP) Chỉ số khả năng trùng hợp ngẫu nhiên là khả năng trùng lặp giữa mẫu xem xét với một mẫu trong quần thể tham khảo. Tuy nhiên, chỉ số này cần được đánh giá giữa các quần thể, do đó một locus có MP lớn trong quần thể này cũng có thể có MP nhỏ khi cách đánh giá thay đổi [33]. Hình 3.1 là biểu đồ biểu diễn các giá trị MP của từng locus, trong đó locus CSF1PO và TPOX cho giá trị MP lớn nhất. Ngược lại, locus Penta E cho giá trị MP là nhỏ nhất đối với quần thể Hình 3.1. Biểu đồ màu theo giá trị chỉ số MP của từng locus nghiên cứu. 3.4.2. Chỉ số khả năng loại trừ - Power of Exclusion Khả năng loại trừ - power of exclusion (PE) là khả năng loại trừ một cá thể ngẫu nhiên có là bố/mẹ của mẫu xem xét hay không. Giá trị PE đối với từng locus là khả năng loại trừ trong tính toán của locus đó. Như vậy, PE càng lớn, tiệm cận 1, đối với từng cá thể thì khả năng loại trừ càng cao, đồng nghĩa với khả năng nhận định theo huyết thống dựa trên tính toán xác xuất thống kê càng chính xác [39]. Đối với mỗi locus khác nhau thì sẽ có PE khác nhau, các giá trị này quyết định trọng số của locus đó trong quá trình tính toán xác xuất hai hồ 48 sơ ADN là có khả năng trùng nhau hay không. Với cùng một bộ kit thì giá trị PE của mỗi locus cũng khác nhau. Ở quần thể trong nghiên cứu này, locus Penta E có PE lớn nhất, nằm trong khoảng (0,85; 0,9). Ngược lại, locus TPOX cho PE nhỏ nhất, trong khoảng (0,25; 0,3) (Hình 3.2). Trong khi đó, giá trị PE lớn nhất xác định được ở locus Penta E và nhỏ nhất ở locus D3S1358 ở quần Hình 3.2. Biều đồ màu theo giá trị chỉ só PE của từng locus thể người Kinh, sử dụng cùng bộ kit [4]. 3.4.3. Chỉ số khả năng phân biệt – Discrimination capacity Chỉ số khả năng phân biệt – DC của từng locus là chỉ số đánh giá khả năng phân biệt cá thể của locus đó. Trong quá trình tạo lập hồ sơ ADN cho truy nguyên cá thể thì điều đặc biệt quan trọng đó là các chỉ thị locus STR được sử dụng phải có khả năng phân biệt cao. Đối với một locus theo cân bằng HWE, thì giá trị DC sẽ bằng 1 – giá trị PI (sẽ được đề cập ở phần sau). Chỉ số này càng gần 1 thì khả năng phân biệt của locus đó càng lớn. Hình 3.3 cho thấy giá trị DC của các locus khác nhau, từ khoảng 0,75 đến gần 1. Trong đó, locus Penta E cho giá trị DC lớn nhất, ngược lại thì locus TPOX cho DC nhỏ nhất. Kết quả này cho thấy sự tương đồng giữa các kết quả phân tích trước về số 49 allele của từng locus, cũng như các chỉ số pháp y liên quan. Locus Penta E có số allele xác định được là nhiều nhất, cũng có PE là lớn nhất, MP nhỏ và DC Hình 3.3. Biều đồ màu theo giá trị DC của từng locus lớn nhất. Trong khi đó, locus TPOX có PE nhỏ nhất, MP lớn và DC nhỏ nhất. 3.4.4. Chỉ số đa hình - Polymorphic information content Chỉ số đa hình – PIC là chỉ số đánh giá tính đa hình của các locus được sử dụng. Locus có tính đa hình càng lớn thì càng có ý nghĩa trong tính toán khả năng về mối quan hệ huyết thống giữa 2 cá thể. Đối với quần thể Mông trong nghiên cứu này, locus Penta E có giá trị PIC là lớn nhất 0,908266864265989, còn locus TPOX là nhỏ nhất với PIC = 0,519750407231249 (Bảng 3.8). Kết quả này cũng cho thấy sự tương quan giữa các chỉ số pháp y của từng locus. Penta E cũng được đánh giá có tính đa hình cao và được sử dụng làm chỉ thị đánh giá sự đa dạng quần thể trong nghiên cứu khác [40]. 3.4.5. Chỉ số Parternity index – PI Hình 15 biểu diễn chỉ số parternity index – PI của từng locus trên quần thể người Mông thu được. Trong đó, locus Penta E có PI lớn nhất, còn locus 50 TH0, TPOX, D2S441, D3S1358, CSF1PO, D10S1248, và D13S317 có PI nhỏ nhất. Giá trị PI có giá trị trong tính toán trọng số của các chỉ thị và khả năng một kiểu gen là cha hoặc mẹ của kiểu gen kiểm chứng. Giá trị PI ≤ 1 thì chỉ thị đó không có ý nghĩa trong tính toán xác suất thống kê [33]. Do đó, các locus trong nghiên cứu đều phù hợp cho phục đích giám định do đều có PI > Hình 3.4. Biểu đồ màu theo giá trị của chỉ số PI của các locus 1. 3.5. Các chỉ số pháp y đánh giá tần số các allele của một quần thể Các chỉ số kết hợp có thể dùng cho đánh giá chất lượng của bảng tần số và khả năng ứng dụng của bảng tần số đó trong công tác giám định thực tế [11], [33]. Các chỉ số Combined PE và Combinded DC càng lớn, càng gần một hoặc bằng 1 thì chứng minh rằng các locus được sử dụng cho các tần số allele có khả năng phân biệt và loại trừ cao, do đó có thể dùng để cho công tác giám định thực tế. Đối với chỉ số Combinded MP thì ngược lại, giá trị này càng nhỏ có nghĩa là khả năng trùng lặp ngẫu nhiên giữa 2 bộ hồ sơ ADN càng thấp, do đó sai số trong tính toán xác xuất thống kê càng nhỏ. Bảng 3.8 thể hiện chi tiết các giá trị MP, PE, DC và các giá trị combinded của các chỉ số đó, cùng với chỉ số PIC đối với bộ 22 locus của bộ kit Powerplex Fusion trên quần thể người Mông 51 trong nghiên cứu này. Giá trị Combinded PE (CPE) thu được là 0,999999987 cho thấy khả năng loại trừ của các locus và của bộ số liệu là rất cao. Giá trị Combinded DC thu được tiệm cận 1 (1,00000000000000) chứng tỏ khả năng phân biệt rất tốt của các locus. Thêm vào đó, giá trị combinded MP tại rất nhỏ, chỉ bằng 3,86 ×10-23. Như vậy, có thể kết luận dựa trên các chỉ số kết hợp là bộ số liệu tần số allele của 22 locus STR trên NST thường thu được trong nghiên cứu này hoàn toàn có thể ứng dụng được trong công tác giám định thực tế. Bảng số liệu tần số thu được trong nghiên cứu này sẽ được đưa vào làm cơ sở dữ liệu cho tính toàn bằng phần mềm STR – VN version 1.0, một phần mềm được xây dựng bởi nhóm nghiên cứu thuộc Viện Công nghệ Sinh học – Bảng 3.7. Các chỉ số MP, PE, DC và PIC của các locus Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Hình 3.5). Hình 3.5. Hình ảnh giao diện phần mềm STR-VN version 1.0 52 3.6. Kết quả phân tích mối tương quan di truyền với các quần thể khác Sự khác biệt về tần số allele các locus giữa các quần thể khác nhau có mối liên hệ về mối tương quan di truyền giữa các quần thể đó. Mối tương quan này có thể liên quan đến vị trí địa lý hoặc theo các nhóm ngôn ngữ [3]. Trong nghiên cứu này, bảng số liệu tần số allele của quần thể người Mông được so sánh với hai quần thể thuộc cùng một ngữ hệ đó là quần thể người Miao ở Quỳ Châu [41], và quần thể người Yao ở Quảng Đông [42], Trung Quốc. Hai quần thể này cùng với quần thể người Mông ở Việt Nam thuộc ngữ hệ H’mông – Dao. Ngoài ra, so sánh còn bao gốm các quần thể khác như: quần thể Kinh tại Việt Nam [4] và quần thể người Thái tại Thái Lan [43] thuộc nhóm ngữ hệ Nam Á; hai quần hể người Hán tại tỉnh Vân Nam và Liêu Ning, Trung Quốc thuộc 53 nhóm ngữ hệ Hán – Tạng [44], [45]; quần thể người Hàn tại Hàn Quốc [46]; quần thể người Nhật tại Nhật Bản [47]; người Ấn Độ tại Ấn Độ [48]; quần thể người Hà Lan tại Hà Lan [49] và quần thể người Ovambo – African tại Namibia [50]. Các quần thể người Hà Lan đại diện cho chủng người da trắng – Caucasian và người Ovambo đại diện cho chủng người da đen – African. Dựa trên kết quả phân tích tương quan di truyền qua cây phát sinh chủng loại (Hình 3.6) cho thấy, quần thể người Mông có mối quan hệ di truyền gần gũi với người Miao và Yao ở Trung Quốc. Kết quả này khẳng định mối quan hệ gần gũi và lịch sử hình thành các quần thể người H’mông – Dao tại khu vực Đông Nam Á và Trung Quốc. Châu Á là nơi có sự đa dạng về chủng tộc, nhóm người rất cao [8]. Các nhóm người có đặc điểm di truyền quần thể riêng và có mối quan hệ tương quan với nhau và có liên quan đến điều kiện địa lý. Điều này thể hiện rõ ràng trên cây chủng loại xây dựng được. Hai quần thể thuộc ngữ hệ Nam Á và có vị trí địa lý gần nhau như người Kinh và người Thái nằm cùng trong một nhánh với giá trị bootstrap 67 (Hình 3.6). Quần thể người Hán tại Vân Nam gần gũi với các nhánh của nhóm Nam Á và Mông – Dao hơn so với nhóm Hán tại Liêu Ning. Kết quả này có được có thể do ảnh hưởng bởi khoảng cách địa lý, khi mà tỉnh Vân Nam nằm ở phía Nam Trung Quốc, có đường biên giới chung với Việt Nam và Thái Lan, do đó sự pha trộn vốn gen với các nhóm người lân cận hơn so với nhóm tại Liêu Ning nằm ở phía Bắc Trung Quốc. Nhóm phía Bắc này do đó cũng gần với các nhóm người Hàn Quốc và Nhật Bản hơn (Hình 3.6). Các nhóm thuộc chủng người da trắng, người da đen và nhóm phía Nam Châu Á có sự khác biệt rõ ràng so với các nhóm còn lại. Kết quả này tương đồng với các kết quả nghiên cứu trước đó. [4], [44], [51], [52] Hình 3.6. Cây phát sinh chủng loại về mối tương quan di truyền giữa người Mông và các quần thể khác 54 55 CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ 4.1. Kết luận Dựa trên các kết quả có được từ nghiên cứu khảo sát và xây dựng cơ sở dữ liệu tần số allele 22 locus đa hình STR ở quần thể người Mông tại Hà Giang, Việt Nam bằng bộ kit Powerplex Fusion Systems, có thể kết luận như sau: (1) Khuếch đại thành công 22 locus bằng bộ kit Powerplex Fusion System đối với 156 mẫu là người Mông tại Hà Giang, Việt Nam. Quá trình và phương pháp thu thập mẫu được sử dụng trong nghiên cứu này là phù hợp và có thể ứng dụng cho các nghiên cứu khác. (2) Các locus được sử dụng trong bộ kit đã được đánh giá tính hiệu quả và chính xác dựa trên các phân tích thống kê. Kết quả cho thấy, bộ kit Powerplex Fusion System là phù hợp cho công tác giám định pháp y, xét nghiệm huyết thống cũng như có thể sử dụng trong nghiên cứu đánh giá sự đa dạng và di truyền của quần thể người Mông tại Hà Giang, Việt Nam. (3) Đề tài đã xây dựng thành công bộ cơ sở dữ liệu tần số allele 22 locus STR cho quần thể người Mông tại Hà Giang, và có thể đưa vào sử dụng trong thực tế xét nghiệm huyết thống, truy nguyên cá thể trong giám định pháp y, hoặc xác định nhóm người. (4) Kết quả phân tích cho thấy mối liên hệ di truyền gần gũi giữa quần thể người Mông tại Hà Giang, Việt Nam với quần thể người Miao và Yao ở Trung Quốc. Kết quả này khẳng định ứng dụng của tần số allele các locus STR trong nghiên cứu đa dạng và di truyền quần thể. Kết quả cũng lần đầu khẳng định mối quan hệ gần gũi về di truyền giữa các nhóm Mông tại Việt Nam và Trung Quốc mà đã được khẳng định trước đó dựa trên các bằng chứng khác. 56 4.2. Kiến nghị Dựa trên các kết quả thu được, chúng tôi đề xuất một số nội dung sau: (1) Bổ sung bảng tần số allele 22 locus STR trên NST bằng bộ kit Powerplex Fusion Systems vào quy trình xác định xác xuất thống kê trong giám định pháp y, truy nguyên cá thể, xác định huyết thống hoặc tìm kiếm người mất tích. (2) Mở rộng số lượng mẫu nghiên cứu lớn hơn, ít nhất là 500 cá thể nhằm cải thiện hiệu quả tính toán và giảm thiểu sai số thống kê. (3) Mở rộng nghiên cứu và xây dựng cơ sở dữ liệu tần số allele các locus STR đối với các nhóm dân tộc khác tại Việt Nam, nhằm phục vụ cho công tác giám định và nghiên cứu. 57 TÀI LIỆU THAM KHẢO [1] M. G. J. Tilanus, “Short tandem repeat markers in diagnostics: what’s in a repeat?,” Leukemia, vol. 20, no. 8, pp. 1353–1355, Aug. 2006. [2] J. M. Butler, “Short Tandem Repeat Analysis for Human Identity
Testing,” in Current Protocols in Human Genetics, vol. Chapter 14,
Hoboken, NJ, USA: John Wiley & Sons, Inc., 2004, p. Unit 14.8. [3] J. K. Pritchard, M. Stephens, and P. Donnelly, “Inference of population
structure using multilocus genotype data.,” Genetics, vol. 155, no. 2, pp.
945–59, Jun. 2000. [4] H. L. Tran, H. T. Nguyen, T. T. Pham, M. H. Nguyen, H. Hoang, and H.
H. Chu, “Allele frequencies for 22 autosomal STRs in the Kinh
population in Vietnam,” Int. J. Legal Med., Jan. 2019. [5] I. Shimada, B. Brinkmann, N. Q. Tuyen, and C. Hohoff, “Allele
frequency data for 16 STR loci in the Vietnamese population.,” Int. J.
Legal Med., vol. 116, no. 4, pp. 246–8, Aug. 2002. [6] X. Zhang et al., “Genetic polymorphisms of 20 autosomal STR loci in the
Vietnamese population from Yunnan Province, Southwest China,” Int. J.
Legal Med., vol. 131, no. 3, pp. 661–662, May 2017. [7] P. Lertrit et al., “Genetic history of Southeast Asian populations as
revealed by ancient and modern human mitochondrial DNA analysis,”
Am. J. Phys. Anthropol., vol. 137, no. 4, pp. 425–440, Dec. 2008. [8] T. H. P.-A. S. HUGO Pan-Asian SNP Consortium et al., “Mapping
human genetic diversity in Asia.,” Science, vol. 326, no. 5959, pp. 1541–
5, Dec. 2009. [9] H. McColl et al., “The prehistoric peopling of Southeast Asia.,” Science, vol. 361, no. 6397, pp. 88–92, Jul. 2018. [10] M. Lipson et al., “Ancient genomes document multiple waves of
migration in Southeast Asian prehistory,” Science (80-. )., vol. 361, no.
6397, pp. 92–95, Jul. 2018. [11] J. M. (John M. Butler, Fundamentals of forensic DNA typing, First. Academic Press/Elsevier, 2009. [12] A. J. Jeffreys, “The man behind the DNA fingerprints: an interview with
Professor Sir Alec Jeffreys,” Investig. Genet., vol. 4, p. 21, 2013. [13] Z. Wong, V. Wilson, I. Patel, S. Povey, and A. J. Jeffreys,
“Characterization of a panel of highly variable minisatellites cloned from 58 human DNA,” Ann. Hum. Genet., vol. 51, no. 4, pp. 269–288, 1987. [14] L. Roewer, “DNA fingerprinting in forensics: Past, present, future,”
Investigative Genetics, vol. 4, no. 1. BioMed Central, p. 22, 18-Nov-
2013. [15] L. L. Cavalli-Sforza and M. W. Feldman, “The application of molecular
genetic approaches to the study of human evolution.,” Nat. Genet., vol.
33 Suppl, pp. 266–75, Mar. 2003. [16] M. A. Jobling and P. Gill, “Encoded evidence: DNA in forensic analysis,” Nat. Rev. Genet., vol. 5, no. 10, pp. 739–751, Oct. 2004. [17] R. Chakraborty, M. Kimmel, D. N. Stivers, L. J. Davison, and R. Deka,
“Relative mutation rates at di-, tri-, and tetranucleotide microsatellite
loci,” Proc. Natl. Acad. Sci. U. S. A., vol. 94, no. 3, pp. 1041–1046, Feb.
1997. [18] H. Fan and J. Y. Chu, “A Brief Review of Short Tandem Repeat
Mutation,” Genomics, Proteomics and Bioinformatics, vol. 5, no. 1.
Beijing Genomics Institute, pp. 7–14, 2007. [19] M. Zavodna, A. Bagshaw, R. Brauning, and N. J. Gemmell, “The effects
of transcription and recombination on mutational dynamics of short
tandem repeats,” Nucleic Acids Res., vol. 46, no. 3, pp. 1321–1330, Dec.
2017. [20] K. Oostdik et al., “Developmental validation of the PowerPlex® Fusion
System for analysis of casework and reference samples: A 24-locus
multiplex for new database standards,” Forensic Sci. Int. Genet., vol. 12,
pp. 69–76, 2014. [21] C. D. Steele and D. J. Balding, “Choice of population database for
forensic DNA profile analysis,” Sci. Justice, vol. 54, no. 6, pp. 487–493,
2014. [22] M. Skipper, “Allele Frequency Database,” Nat. Rev. Genet., vol. 4, no. 9, pp. 674–674, Sep. 2003. [23] “Thông tin tổng [Online]. hợp.” Available:
http://www.chinhphu.vn/portal/page/portal/chinhphu/NuocCHXHCNVi
etNam/ThongTinTongHop?categoryId=920&articleId=3341. [Accessed:
28-May-2020]. [24] “Thông tin tổng [Online]. hợp.” Available:
http://www.chinhphu.vn/portal/page/portal/chinhphu/NuocCHXHCNVi
etNam/ThongTinTongHop?categoryId=920&articleId=3376. [Accessed:
23-Sep-2019]. 59 [25] T. T. Trịnh, Q. K. Hà, L. L. Vũ, Q. V. Nguyễn, and Q. H. Nguyễn,
“Nghiên cứu đa dạng Haplotype Y- STR của quần thể người Kinh - Việt
Nam,” Tạp chí Khoa học ĐHQGHN Khoa học Tự nhiên và Công nghệ,
vol. 33, no. 2S, pp. 212–218, 2017. [26] H. H. Ha, T. H. Nguyen, L. H. Tran, H. T. H. Nguyen, H. Hoang, and H.
H. Chu, “Genetic characteristics of 23 Y-chromosomal STRs in the Kinh
population in Northern Vietnam,” Int. J. Legal Med., Sep. 2019. [27] T. H. Trần, T. B. T. Trần, Đ. K. Phạm, Q. H. Hồ, and V. H. Nguyễn,
“Khảo sát tần suất alen của 15 locus STR trên nhiễm sắc thể thường trong
quần thể người Mường sống ở tỉnh Hòa Bình, Việt Nam,” Tạp chí Phân
tích Hóa, Lý và Sinh học, vol. 20, no. 3, pp. 208–214, 2014. [28] T. H. Trần, T. H. Trần, Đ. K. Phạm, Q. H. Hồ, Đ. Đ. Trịnh, and V. H.
Nguyễn, “Sự đa dạng di truyền của 15 Locus STR trên nhiễm sắc thể
thường trong quần thể người Khmer sống ở tỉnh Sóc Trăng, Việt Nam,”
Tạp chí Phân tích Hóa, Lý và Sinh học, vol. 20, no. 4, pp. 152–158, 2015. [29] L. Thị Phúc, “Khảo sát và xây dựng cơ sở dữ liệu tần suất các Alen ở 15
Locus gen bằng hệ Identifiler từ quần thể người dân tộc Nùng ứng dụng
trong giám định ADN ,” Viện Sinh thái và Tài nguyên Sinh vật, 2017. [30] N. Như Giang, “Khảo sát tần suất các alen trong các locus gen (ADN) hệ
Identifiler của dân tộc H’Mông phục vụ công tác giám định gen ở Việt
Nam,” Viện Sinh thái và Tài nguyên Sinh vật, 2014. [31] “SWGDAM Interpretation Guidelines for Autosomal STR Typing by Forensic DNA Testing Laboratories.” [32] L. Excoffier and H. E. L. Lischer, “Arlequin suite ver 3.5: a new series of
programs to perform population genetics analyses under Linux and
Windows,” Mol. Ecol. Resour., vol. 10, no. 3, pp. 564–567, May 2010. [33] “The evaluation of forensic DNA evidence,” Proceedings of the National
Academy of Sciences of the United States of America, vol. 94, no. 11.
National Academy of Sciences, pp. 5498–5500, 27-May-1997. [34] N. Takezaki, M. Nei, and K. Tamura, “POPTREE2: Software for
Constructing Population Trees from Allele Frequency Data and
Computing Other Population Statistics with Windows Interface,” Mol.
Biol. Evol., vol. 27, no. 4, pp. 747–752, Apr. 2010. [35] N. Saitou and M. Nei, “The neighbor-joining method: a new method for
reconstructing phylogenetic trees.,” Mol. Biol. Evol., vol. 4, no. 4, pp.
406–25, Jul. 1987. [36] T. Backeljau, L. De Bruyn, H. De Wolf, K. Jordaens, S. Van Dongen, and 60 B. Winnepennincks, “Multiple UPGMA and Neighbor-joining Trees and
the Performance of Some Computer Packages,” Mol. Biol. Evol., vol. 13,
no. 2, pp. 309–313, Feb. 1996. [37] Đ. Hoài Nam, “Nghiên cứu tần suất các alen của 15 locus gen hệ
identifiler thuộc quần thể người dân tộc Tày ứng dụng trong giám định
DNA nhân tế bào,” Viện Sinh thái và Tài nguyên Sinh vật, 2014. [38] D. J. Balding, I. Moltke, and J. Marioni, Handbook of statistical genomics. . [39] W. K. Fung, Y. ka Chung, and D. man Wong, “Power of exclusion
revisited: Probability of excluding relatives of the true father from
paternity,” Int. J. Legal Med., vol. 116, no. 2, pp. 64–67, 2002. [40] L. Lai, X. Shen, L. Han, D. Chen, and J. Hu, “Genetic study of the Penta
E locus and identification of rare alleles,” Chinese J. Med. Genet., vol.
32, no. 5, pp. 657–660, Oct. 2015. [41] X. Zhang et al., “Genetic analysis of 20 autosomal STR loci in the Miao
ethnic group from Yunnan Province, Southwest China.,” Forensic Sci.
Int. Genet., vol. 28, pp. e28–e29, May 2017. [42] Y. Liao, L. Chen, R. Huang, W. Wu, D. Liu, and H. Sun, “Genomic
Portrait of Guangdong Liannan Yao Population Based on 15 Autosomal
STRs and 19 Y-STRs,” Sci. Rep., vol. 9, no. 1, pp. 1–6, Dec. 2019. [43] W. Kutanan et al., “Genetic affinity and admixture of northern Thai
people along their migration route in northern Thailand: evidence from
autosomal STR loci,” J. Hum. Genet., vol. 56, no. 2, pp. 130–137, Feb.
2011. [44] H. Sun et al., “Autosomal STRs Provide Genetic Evidence for the
Hypothesis That Tai People Originate from Southern China,” PLoS One,
vol. 8, no. 4, p. e60822, Apr. 2013. [45] J. Yao, L. ming Wang, J. Gui, J. xin Xing, J. feng Xuan, and B. jie Wang,
“Population data of 15 autosomal STR loci in Chinese Han population
from Liaoning Province, Northeast China,” Forensic Science
International: Genetics, vol. 23. Elsevier Ireland Ltd, pp. e20–e21, 01-
Jul-2016. [46] S. Y. Yoo et al., “A large population genetic study of 15 autosomal short
tandem repeat loci for establishment of Korean DNA Profile Database,”
Mol. Cells, vol. 32, no. 1, pp. 15–19, Jul. 2011. [47] J. Tie, X. Wang, and S. Oxida, “Genetic Polymorphisms of 15 STR Loci
in a Japanese Population,” J. Forensic Sci., vol. 51, no. 1, pp. 188–189, 61 Jan. 2006. [48] P. Shrivastava, T. Jain, and V. Ben Trivedi, “Genetic polymorphism
study at 15 autosomal locus in central Indian population,” Springerplus,
vol. 4, no. 1, p. 566, Dec. 2015. [49] A. A. Westen et al., “Comparing six commercial autosomal STR kits in
a large Dutch population sample,” Forensic Sci. Int. Genet., vol. 10, no.
1, pp. 55–63, May 2014. [50] T. Muro, J. Fujihara, S. Imamura, H. Nakamura, T. Yasuda, and H.
Takeshita, “Allele frequencies for 15 STR loci in Ovambo population
using AmpFlSTR® Identifiler Kit,” Leg. Med., vol. 10, no. 3, pp. 157–
159, May 2008. [51] S. Wentao et al., “Worldwide Survey of Human Male Demographic
History Based on Y-SNP and Y-STR Data from the HGDP–CEPH
Populations | Molecular Biology and Evolution | Oxford Academic,” Mol.
Biol. Evol., vol. 27, no. 2, pp. 385–393, Oct. 2009. [52] S. Pischedda et al., “Phylogeographic and genome-wide investigations of
Vietnam ethnic groups reveal signatures of complex historical
demographic movements,” Sci. Rep., vol. 7, no. 1, pp. 1–15, Dec. 2017. 62 PHỤ LỤC 63 Phụ lục 2: Kết quả khuếch đại các locus STR của mẫu đối chứng âm 64 Pair(0, 1) LnLHood LD : -861.24647 LnLHood LE : -884.17909 Exact P= 0.57574 +- 0.00507 (10100 permutations done) Chi-square test value=45.86524 (P = 0.80509, 55
d.f.) Pair(0, 2) LnLHood LD : -728.02186 LnLHood LE : -740.85964 Exact P= 0.71238 +- 0.00408 (10100 permutations done) Chi-square test value=25.67555 (P = 0.87507, 35
d.f.) Pair(1, 2) LnLHood LD : -911.09147 LnLHood LE : -950.99694 Exact P= 0.07851 +- 0.00268 (10100 permutations done) Chi-square test value=79.81093 (P = 0.39073, 77
d.f.) Pair(0, 3) LnLHood LD : -648.56898 LnLHood LE : -661.02614 Exact P= 0.38307 +- 0.00483 (10100 permutations done) Chi-square test value=24.91432 (P = 0.72918, 30
d.f.) Pair(1, 3) LnLHood LD : -844.10472 LnLHood LE : -871.16343 Exact P= 0.34911 +- 0.00457 (10100 permutations done) Chi-square test value=54.11743 (P = 0.85194, 66
d.f.) Pair(2, 3) LnLHood LD : -708.91617 LnLHood LE : -727.84398 Exact P= 0.20406 +- 0.00389 (10100 permutations done) Chi-square test value=37.85563 (P = 0.65341, 42
d.f.) Pair(0, 4) LnLHood LD : -697.88926 LnLHood LE : -711.09903 Exact P= 0.71950 +- 0.00418 (10100 permutations done) Chi-square test value=26.41954 (P = 0.85137, 35
d.f.) Pair(1, 4) LnLHood LD : -886.07305 LnLHood LE : -921.23632 Exact P= 0.42683 +- 0.00555 (10100 permutations done) Chi-square test value=70.32654 (P = 0.69146, 77
d.f.) Pair(2, 4) LnLHood LD : -758.05441 LnLHood LE : -777.91687 Exact P= 0.61267 +- 0.00538 (10100 permutations done) Chi-square test value=39.72493 (P = 0.82512, 49
d.f.) Pair(3, 4) LnLHood LD : -683.71602 LnLHood LE : -698.08337 Exact P= 0.73297 +- 0.00402 (10100 permutations done) Chi-square test value=28.73471 (P = 0.94074, 42
d.f.) Pair(0, 5) Phụ lục 3: Kết quả kiểm định Chi-square các cặp locus về lingkage
disequilirium LnLHood LD : -1012.85505 LnLHood LE : -1034.98062 Exact P= 0.99475 +- 0.00072 (10100 permutations done) Chi-square test value=44.25114 (P = 0.99821, 75
d.f.) Pair(1, 5) LnLHood LD : -1170.03055 LnLHood LE : -1245.11791 Exact P= 0.57337 +- 0.00497 (10100 permutations done) Chi-square test value=150.17473 (P = 0.78957,
165 d.f.) Pair(2, 5) LnLHood LD : -1046.93382 LnLHood LE : -1101.79846 Exact P= 0.04663 +- 0.00194 (10100 permutations done) Chi-square test value=109.72928 (P = 0.35665,
105 d.f.) Pair(3, 5) LnLHood LD : -983.24827 LnLHood LE : -1021.96496 Exact P= 0.18020 +- 0.00385 (10100 permutations done) Chi-square test value=77.43338 (P = 0.82481, 90
d.f.) Pair(4, 5) LnLHood LD : -1010.23231 LnLHood LE : -1072.03785 Exact P= 0.00713 +- 0.00077 (10100 permutations done) Chi-square test value=123.61109 (P = 0.10369,
105 d.f.) Pair(0, 6) LnLHood LD : -696.96997 LnLHood LE : -708.26835 Exact P= 0.85653 +- 0.00358 (10100 permutations done) Chi-square test value=22.59677 (P = 0.94777, 35
d.f.) Pair(1, 6) LnLHood LD : -877.32986 LnLHood LE : -918.40565 Exact P= 0.05644 +- 0.00245 (10100 permutations done) Chi-square test value=82.15157 (P = 0.32287, 77
d.f.) Pair(2, 6) LnLHood LD : -749.00659 LnLHood LE : -775.08620 Exact P= 0.07683 +- 0.00264 (10100 permutations done) Chi-square test value=52.15921 (P = 0.35213, 49
d.f.) Pair(3, 6) LnLHood LD : -675.68160 LnLHood LE : -695.25269 Exact P= 0.16525 +- 0.00366 (10100 permutations done) Chi-square test value=39.14218 (P = 0.59714, 42
d.f.) Pair(4, 6) LnLHood LD : -718.56059 LnLHood LE : -745.32558 Exact P= 0.08772 +- 0.00253 (10100 permutations done) Chi-square test value=53.52999 (P = 0.30463, 49
d.f.) Pair(5, 6) LnLHood LD : -1019.06542 LnLHood LE : -1069.20717 Exact P= 0.21703 +- 0.00430 (10100 permutations done) Chi-square test value=100.28350 (P = 0.61190,
105 d.f.) Pair(0, 7) LnLHood LD : -808.83815 LnLHood LE : -831.06308 65 Exact P= 0.49861 +- 0.00439 (10100 permutations done) Chi-square test value=44.44986 (P = 0.84468, 55
d.f.) Pair(1, 7) LnLHood LD : -987.66016 LnLHood LE : -1041.20037 Exact P= 0.21574 +- 0.00425 (10100 permutations done) Chi-square test value=107.08042 (P = 0.81281,
121 d.f.) Pair(2, 7) LnLHood LD : -864.94328 LnLHood LE : -897.88092 Exact P= 0.28990 +- 0.00407 (10100 permutations done) Chi-square test value=65.87529 (P = 0.81306, 77
d.f.) Pair(3, 7) LnLHood LD : -795.70439 LnLHood LE : -818.04742 Exact P= 0.63535 +- 0.00503 (10100 permutations done) Chi-square test value=44.68607 (P = 0.97952, 66
d.f.) Pair(4, 7) LnLHood LD : -833.25563 LnLHood LE : -868.12031 Exact P= 0.24980 +- 0.00449 (10100 permutations done) Chi-square test value=69.72936 (P = 0.70926, 77
d.f.) Pair(5, 7) LnLHood LD : -1130.01631 LnLHood LE : -1192.00190 Exact P= 0.85129 +- 0.00360 (10100 permutations done) Chi-square test value=123.97117 (P = 0.99268,
165 d.f.) Pair(6, 7) LnLHood LD : -833.82540 LnLHood LE : -865.28963 Exact P= 0.38644 +- 0.00504 (10100 permutations done) Chi-square test value=62.92848 (P = 0.87633, 77
d.f.) Pair(0, 8) LnLHood LD : -833.06799 LnLHood LE : -858.74624 Exact P= 0.37673 +- 0.00428 (10100 permutations done) Chi-square test value=51.35651 (P = 0.77900, 60
d.f.) Pair(1, 8) LnLHood LD : -1009.81230 LnLHood LE : -1068.88353 Exact P= 0.18673 +- 0.00388 (10100 permutations done) Chi-square test value=118.14248 (P = 0.80046,
132 d.f.) Pair(2, 8) LnLHood LD : -891.69260 LnLHood LE : -925.56408 Exact P= 0.44970 +- 0.00495 (10100 permutations done) Chi-square test value=67.74296 (P = 0.90206, 84
d.f.) Pair(3, 8) LnLHood LD : -815.58755 LnLHood LE : -845.73058 Exact P= 0.17089 +- 0.00396 (10100 permutations done) Chi-square test value=60.28606 (P = 0.83606, 72
d.f.) Pair(4, 8) LnLHood LD : -867.01352 LnLHood LE : -895.80347 66 Exact P= 0.89149 +- 0.00330 (10100 permutations done) Chi-square test value=57.57990 (P = 0.98776, 84
d.f.) Pair(5, 8) LnLHood LD : -1132.34889 LnLHood LE : -1219.68506 Exact P= 0.02822 +- 0.00164 (10100 permutations done) Chi-square test value=174.67234 (P = 0.59808,
180 d.f.) Pair(6, 8) LnLHood LD : -858.48681 LnLHood LE : -892.97279 Exact P= 0.38416 +- 0.00401 (10100 permutations done) Chi-square test value=68.97198 (P = 0.88190, 84
d.f.) Pair(7, 8) LnLHood LD : -973.37146 LnLHood LE : -1015.76752 Exact P= 0.89822 +- 0.00292 (10100 permutations done) Chi-square test value=84.79213 (P = 0.99953, 132
d.f.) Pair(0, 9) LnLHood LD : -608.93490 LnLHood LE : -620.49676 Exact P= 0.20030 +- 0.00433 (10100 permutations done) Chi-square test value=23.12371 (P = 0.57034, 25
d.f.) Pair(1, 9) LnLHood LD : -808.76090 LnLHood LE : -830.63405 Exact P= 0.39465 +- 0.00431 (10100 permutations done) Chi-square test value=43.74631 (P = 0.86250, 55
d.f.) Pair(2, 9) LnLHood LD : -676.56680 LnLHood LE : -687.31460 Exact P= 0.77703 +- 0.00378 (10100 permutations done) Chi-square test value=21.49560 (P = 0.96435, 35
d.f.) Pair(3, 9) LnLHood LD : -595.10252 LnLHood LE : -607.48110 Exact P= 0.24386 +- 0.00403 (10100 permutations done) Chi-square test value=24.75716 (P = 0.73675, 30
d.f.) Pair(4, 9) LnLHood LD : -643.96534 LnLHood LE : -657.55399 Exact P= 0.49743 +- 0.00489 (10100 permutations done) Chi-square test value=27.17730 (P = 0.82486, 35
d.f.) Pair(5, 9) LnLHood LD : -952.00027 LnLHood LE : -981.43558 Exact P= 0.42634 +- 0.00435 (10100 permutations done) Chi-square test value=58.87062 (P = 0.91463, 75
d.f.) Pair(6, 9) LnLHood LD : -642.58709 LnLHood LE : -654.72331 Exact P= 0.60010 +- 0.00511 (10100 permutations done) Chi-square test value=24.27244 (P = 0.91326, 35
d.f.) Pair(7, 9) LnLHood LD : -757.46014 LnLHood LE : -777.51804 67 Exact P= 0.42703 +- 0.00502 (10100 permutations done) Chi-square test value=40.11579 (P = 0.93409, 55
d.f.) Pair(8, 9) LnLHood LD : -786.66288 LnLHood LE : -805.20120 Exact P= 0.76921 +- 0.00432 (10100 permutations done) Chi-square test value=37.07663 (P = 0.99129, 60
d.f.) Pair(0, 10) LnLHood LD : -804.57673 LnLHood LE : -822.88561 Exact P= 0.36891 +- 0.00448 (10100 permutations done) Chi-square test value=36.61775 (P = 0.62332, 40
d.f.) Pair(1, 10) LnLHood LD : -990.65774 LnLHood LE : -1033.02290 Exact P= 0.34386 +- 0.00428 (10100 permutations done) Chi-square test value=84.73033 (P = 0.57893, 88
d.f.) Pair(2, 10) LnLHood LD : -866.68788 LnLHood LE : -889.70345 Exact P= 0.61119 +- 0.00532 (10100 permutations done) Chi-square test value=46.03114 (P = 0.82651, 56
d.f.) Pair(3, 10) LnLHood LD : -790.51781 LnLHood LE : -809.86995 Exact P= 0.44248 +- 0.00487 (10100 permutations done) Chi-square test value=38.70428 (P = 0.82862, 48
d.f.) Pair(4, 10) LnLHood LD : -830.93747 LnLHood LE : -859.94284 Exact P= 0.21673 +- 0.00435 (10100 permutations done) Chi-square test value=58.01074 (P = 0.40105, 56
d.f.) Pair(5, 10) LnLHood LD : -1127.56831 LnLHood LE : -1183.82443 Exact P= 0.53267 +- 0.00534 (10100 permutations done) Chi-square test value=112.51224 (P = 0.67382,
120 d.f.) Pair(6, 10) LnLHood LD : -828.90544 LnLHood LE : -857.11216 Exact P= 0.17366 +- 0.00375 (10100 permutations done) Chi-square test value=56.41345 (P = 0.45939, 56
d.f.) Pair(7, 10) LnLHood LD : -943.04066 LnLHood LE : -979.90689 Exact P= 0.46832 +- 0.00527 (10100 permutations done) Chi-square test value=73.73246 (P = 0.86188, 88
d.f.) Pair(8, 10) LnLHood LD : -962.80631 LnLHood LE : -1007.59005 Exact P= 0.20554 +- 0.00397 (10100 permutations done) Chi-square test value=89.56748 (P = 0.66517, 96
d.f.) Pair(9, 10) LnLHood LD : -757.25198 LnLHood LE : -769.34057 68 Exact P= 0.86366 +- 0.00346 (10100 permutations done) Chi-square test value=24.17718 (P = 0.97725, 40
d.f.) Pair(0, 11) LnLHood LD : -684.42046 LnLHood LE : -694.25943 Exact P= 0.71663 +- 0.00416 (10100 permutations done) Chi-square test value=19.67796 (P = 0.76351, 25
d.f.) Pair(1, 11) LnLHood LD : -876.90584 LnLHood LE : -904.39673 Exact P= 0.44792 +- 0.00494 (10100 permutations done) Chi-square test value=54.98178 (P = 0.47533, 55
d.f.) Pair(2, 11) LnLHood LD : -744.86195 LnLHood LE : -761.07728 Exact P= 0.49762 +- 0.00569 (10100 permutations done) Chi-square test value=32.43066 (P = 0.59277, 35
d.f.) Pair(3, 11) LnLHood LD : -668.33100 LnLHood LE : -681.24378 Exact P= 0.48475 +- 0.00467 (10100 permutations done) Chi-square test value=25.82554 (P = 0.68401, 30
d.f.) Pair(4, 11) LnLHood LD : -717.84682 LnLHood LE : -731.31667 Exact P= 0.82832 +- 0.00373 (10100 permutations done) Chi-square test value=26.93970 (P = 0.83342, 35
d.f.) Pair(5, 11) LnLHood LD : -1019.01892 LnLHood LE : -1055.19825 Exact P= 0.63307 +- 0.00451 (10100 permutations done) Chi-square test value=72.35866 (P = 0.56498, 75
d.f.) Pair(6, 11) LnLHood LD : -710.72481 LnLHood LE : -728.48599 Exact P= 0.33168 +- 0.00465 (10100 permutations done) Chi-square test value=35.52236 (P = 0.44361, 35
d.f.) Pair(7, 11) LnLHood LD : -829.57152 LnLHood LE : -851.28072 Exact P= 0.78792 +- 0.00356 (10100 permutations done) Chi-square test value=43.41839 (P = 0.87037, 55
d.f.) Pair(8, 11) LnLHood LD : -849.43256 LnLHood LE : -878.96388 Exact P= 0.30505 +- 0.00462 (10100 permutations done) Chi-square test value=59.06264 (P = 0.50999, 60
d.f.) Pair(9, 11) LnLHood LD : -631.20112 LnLHood LE : -640.71440 Exact P= 0.60010 +- 0.00525 (10100 permutations done) Chi-square test value=19.02655 (P = 0.79585, 25
d.f.) Pair(10, 11) LnLHood LD : -821.09831 LnLHood LE : -843.10324 69 Exact P= 0.25733 +- 0.00427 (10100 permutations done) Chi-square test value=44.00987 (P = 0.30566, 40
d.f.) Pair(0, 12) LnLHood LD : -711.57334 LnLHood LE : -730.61009 Exact P= 0.06297 +- 0.00222 (10100 permutations done) Chi-square test value=38.07350 (P = 0.14787, 30
d.f.) Pair(1, 12) LnLHood LD : -906.65700 LnLHood LE : -940.74739 Exact P= 0.28465 +- 0.00430 (10100 permutations done) Chi-square test value=68.18078 (P = 0.40297, 66
d.f.) Pair(2, 12) LnLHood LD : -780.71030 LnLHood LE : -797.42793 Exact P= 0.72277 +- 0.00392 (10100 permutations done) Chi-square test value=33.43527 (P = 0.82451, 42
d.f.) Pair(3, 12) LnLHood LD : -697.00246 LnLHood LE : -717.59443 Exact P= 0.05812 +- 0.00237 (10100 permutations done) Chi-square test value=41.18394 (P = 0.25411, 36
d.f.) Pair(4, 12) LnLHood LD : -746.36788 LnLHood LE : -767.66732 Exact P= 0.33129 +- 0.00435 (10100 permutations done) Chi-square test value=42.59888 (P = 0.44521, 42
d.f.) Pair(5, 12) LnLHood LD : -1054.43940 LnLHood LE : -1091.54891 Exact P= 0.91604 +- 0.00262 (10100 permutations done) Chi-square test value=74.21902 (P = 0.88542, 90
d.f.) Pair(6, 12) LnLHood LD : -743.52993 LnLHood LE : -764.83665 Exact P= 0.26139 +- 0.00456 (10100 permutations done) Chi-square test value=42.61343 (P = 0.44459, 42
d.f.) Pair(7, 12) LnLHood LD : -866.43541 LnLHood LE : -887.63137 Exact P= 0.97129 +- 0.00176 (10100 permutations done) Chi-square test value=42.39192 (P = 0.98951, 66
d.f.) Pair(8, 12) LnLHood LD : -887.09734 LnLHood LE : -915.31453 Exact P= 0.78901 +- 0.00447 (10100 permutations done) Chi-square test value=56.43439 (P = 0.91115, 72
d.f.) Pair(9, 12) LnLHood LD : -661.24935 LnLHood LE : -677.06505 Exact P= 0.13297 +- 0.00344 (10100 permutations done) Chi-square test value=31.63140 (P = 0.38486, 30
d.f.) Pair(10, 12) LnLHood LD : -863.47096 LnLHood LE : -879.45390 70 Exact P= 0.96713 +- 0.00159 (10100 permutations done) Chi-square test value=31.96589 (P = 0.96368, 48
d.f.) Pair(11, 12) LnLHood LD : -737.06698 LnLHood LE : -750.82773 Exact P= 0.64376 +- 0.00548 (10100 permutations done) Chi-square test value=27.52150 (P = 0.59578, 30
d.f.) Pair(0, 13) LnLHood LD : -828.59435 LnLHood LE : -850.58577 Exact P= 0.23525 +- 0.00432 (10100 permutations done) Chi-square test value=43.98284 (P = 0.51498, 45
d.f.) Pair(1, 13) LnLHood LD : -1019.96975 LnLHood LE : -1060.72306 Exact P= 0.78416 +- 0.00401 (10100 permutations done) Chi-square test value=81.50663 (P = 0.89918, 99
d.f.) Pair(2, 13) LnLHood LD : -895.70292 LnLHood LE : -917.40361 Exact P= 0.90554 +- 0.00274 (10100 permutations done) Chi-square test value=43.40139 (P = 0.97181, 63
d.f.) Pair(3, 13) LnLHood LD : -815.83072 LnLHood LE : -837.57011 Exact P= 0.41218 +- 0.00466 (10100 permutations done) Chi-square test value=43.47878 (P = 0.84649, 54
d.f.) Pair(4, 13) LnLHood LD : -858.46061 LnLHood LE : -887.64300 Exact P= 0.42505 +- 0.00554 (10100 permutations done) Chi-square test value=58.36479 (P = 0.64197, 63
d.f.) Pair(5, 13) LnLHood LD : -1142.34001 LnLHood LE : -1211.52459 Exact P= 0.17079 +- 0.00354 (10100 permutations done) Chi-square test value=138.36915 (P = 0.40367,
135 d.f.) Pair(6, 13) LnLHood LD : -852.09256 LnLHood LE : -884.81232 Exact P= 0.10208 +- 0.00324 (10100 permutations done) Chi-square test value=65.43954 (P = 0.39210, 63
d.f.) Pair(7, 13) LnLHood LD : -973.74801 LnLHood LE : -1007.60705 Exact P= 0.91772 +- 0.00293 (10100 permutations done) Chi-square test value=67.71809 (P = 0.99313, 99
d.f.) Pair(8, 13) LnLHood LD : -994.16204 LnLHood LE : -1035.29021 Exact P= 0.76703 +- 0.00430 (10100 permutations done) Chi-square test value=82.25633 (P = 0.96910, 108
d.f.) Pair(9, 13) LnLHood LD : -777.79594 LnLHood LE : -797.04073 71 Exact P= 0.26911 +- 0.00440 (10100 permutations done) Chi-square test value=38.48959 (P = 0.74255, 45
d.f.) Pair(10, 13) LnLHood LD : -968.36567 LnLHood LE : -999.42958 Exact P= 0.63465 +- 0.00406 (10100 permutations done) Chi-square test value=62.12782 (P = 0.79027, 72
d.f.) Pair(11, 13) LnLHood LD : -848.65221 LnLHood LE : -870.80341 Exact P= 0.46208 +- 0.00520 (10100 permutations done) Chi-square test value=44.30239 (P = 0.50139, 45
d.f.) Pair(12, 13) LnLHood LD : -891.21820 LnLHood LE : -907.15406 Exact P= 0.99614 +- 0.00056 (10100 permutations done) Chi-square test value=31.87172 (P = 0.99290, 54
d.f.) Pair(0, 14) LnLHood LD : -707.09223 LnLHood LE : -725.28732 Exact P= 0.17287 +- 0.00389 (10100 permutations done) Chi-square test value=36.39019 (P = 0.40379, 35
d.f.) Pair(1, 14) LnLHood LD : -902.89077 LnLHood LE : -935.42462 Exact P= 0.58277 +- 0.00416 (10100 permutations done) Chi-square test value=65.06769 (P = 0.83191, 77
d.f.) Pair(2, 14) LnLHood LD : -774.20542 LnLHood LE : -792.10517 Exact P= 0.76891 +- 0.00405 (10100 permutations done) Chi-square test value=35.79950 (P = 0.92035, 49
d.f.) Pair(3, 14) LnLHood LD : -697.51593 LnLHood LE : -712.27167 Exact P= 0.67832 +- 0.00450 (10100 permutations done) Chi-square test value=29.51147 (P = 0.92683, 42
d.f.) Pair(4, 14) LnLHood LD : -738.75539 LnLHood LE : -762.34456 Exact P= 0.29050 +- 0.00432 (10100 permutations done) Chi-square test value=47.17834 (P = 0.54725, 49
d.f.) Pair(5, 14) LnLHood LD : -1048.95882 LnLHood LE : -1086.22614 Exact P= 0.96653 +- 0.00179 (10100 permutations done) Chi-square test value=74.53465 (P = 0.98933, 105
d.f.) Pair(6, 14) LnLHood LD : -742.24439 LnLHood LE : -759.51388 Exact P= 0.81762 +- 0.00358 (10100 permutations done) Chi-square test value=34.53899 (P = 0.94139, 49
d.f.) Pair(7, 14) LnLHood LD : -845.90375 LnLHood LE : -882.30861 72 Exact P= 0.11762 +- 0.00347 (10100 permutations done) Chi-square test value=72.80972 (P = 0.61409, 77
d.f.) Pair(8, 14) LnLHood LD : -872.21706 LnLHood LE : -909.99177 Exact P= 0.20743 +- 0.00371 (10100 permutations done) Chi-square test value=75.54941 (P = 0.73346, 84
d.f.) Pair(9, 14) LnLHood LD : -645.04825 LnLHood LE : -671.74229 Exact P= 0.00040 +- 0.00019 (10100 permutations done) Chi-square test value=53.38807 (P = 0.02404, 35
d.f.) Pair(10, 14) LnLHood LD : -846.11450 LnLHood LE : -874.13114 Exact P= 0.22683 +- 0.00412 (10100 permutations done) Chi-square test value=56.03326 (P = 0.47362, 56
d.f.) Pair(11, 14) LnLHood LD : -728.75109 LnLHood LE : -745.50496 Exact P= 0.46663 +- 0.00450 (10100 permutations done) Chi-square test value=33.50775 (P = 0.54018, 35
d.f.) Pair(12, 14) LnLHood LD : -760.44498 LnLHood LE : -781.85562 Exact P= 0.29277 +- 0.00427 (10100 permutations done) Chi-square test value=42.82128 (P = 0.43576, 42
d.f.) Pair(13, 14) LnLHood LD : -870.81583 LnLHood LE : -901.83130 Exact P= 0.20960 +- 0.00369 (10100 permutations done) Chi-square test value=62.03094 (P = 0.51088, 63
d.f.) Pair(0, 15) LnLHood LD : -697.71690 LnLHood LE : -715.23200 Exact P= 0.10851 +- 0.00320 (10100 permutations done) Chi-square test value=35.03022 (P = 0.46677, 35
d.f.) Pair(1, 15) LnLHood LD : -901.45849 LnLHood LE : -925.36930 Exact P= 0.92594 +- 0.00258 (10100 permutations done) Chi-square test value=47.82163 (P = 0.99635, 77
d.f.) Pair(2, 15) LnLHood LD : -761.03992 LnLHood LE : -782.04985 Exact P= 0.24020 +- 0.00415 (10100 permutations done) Chi-square test value=42.01986 (P = 0.74966, 49
d.f.) Pair(3, 15) LnLHood LD : -686.71204 LnLHood LE : -702.21635 Exact P= 0.40277 +- 0.00482 (10100 permutations done) Chi-square test value=31.00861 (P = 0.89416, 42
d.f.) Pair(4, 15) LnLHood LD : -730.82301 LnLHood LE : -752.28924 73 Exact P= 0.31129 +- 0.00512 (10100 permutations done) Chi-square test value=42.93246 (P = 0.71637, 49
d.f.) Pair(5, 15) LnLHood LD : -1034.65364 LnLHood LE : -1076.17082 Exact P= 0.41178 +- 0.00445 (10100 permutations done) Chi-square test value=83.03438 (P = 0.94405, 105
d.f.) Pair(6, 15) LnLHood LD : -733.27579 LnLHood LE : -749.45856 Exact P= 0.75327 +- 0.00462 (10100 permutations done) Chi-square test value=32.36555 (P = 0.96789, 49
d.f.) Pair(7, 15) LnLHood LD : -844.94475 LnLHood LE : -872.25329 Exact P= 0.50198 +- 0.00477 (10100 permutations done) Chi-square test value=54.61707 (P = 0.97504, 77
d.f.) Pair(8, 15) LnLHood LD : -863.88314 LnLHood LE : -899.93645 Exact P= 0.10356 +- 0.00301 (10100 permutations done) Chi-square test value=72.10660 (P = 0.81932, 84
d.f.) Pair(9, 15) LnLHood LD : -650.63338 LnLHood LE : -661.68697 Exact P= 0.63990 +- 0.00445 (10100 permutations done) Chi-square test value=22.10717 (P = 0.95571, 35
d.f.) Pair(10, 15) LnLHood LD : -838.73665 LnLHood LE : -864.07582 Exact P= 0.19851 +- 0.00377 (10100 permutations done) Chi-square test value=50.67834 (P = 0.67587, 56
d.f.) Pair(11, 15) LnLHood LD : -720.50571 LnLHood LE : -735.44964 Exact P= 0.49752 +- 0.00528 (10100 permutations done) Chi-square test value=29.88786 (P = 0.71321, 35
d.f.) Pair(12, 15) LnLHood LD : -750.25966 LnLHood LE : -771.80030 Exact P= 0.13307 +- 0.00331 (10100 permutations done) Chi-square test value=43.08128 (P = 0.42479, 42
d.f.) Pair(13, 15) LnLHood LD : -864.52478 LnLHood LE : -891.77598 Exact P= 0.23059 +- 0.00440 (10100 permutations done) Chi-square test value=54.50240 (P = 0.76849, 63
d.f.) Pair(14, 15) LnLHood LD : -744.13175 LnLHood LE : -766.47753 Exact P= 0.18931 +- 0.00381 (10100 permutations done) Chi-square test value=44.69156 (P = 0.64831, 49
d.f.) Pair(0, 16) LnLHood LD : -598.05108 LnLHood LE : -605.28428 74 Exact P= 0.62842 +- 0.00458 (10100 permutations done) Chi-square test value=14.46640 (P = 0.80608, 20
d.f.) Pair(1, 16) LnLHood LD : -797.14409 LnLHood LE : -815.42158 Exact P= 0.52990 +- 0.00551 (10100 permutations done) Chi-square test value=36.55497 (P = 0.77971, 44
d.f.) Pair(2, 16) LnLHood LD : -663.85094 LnLHood LE : -672.10213 Exact P= 0.89109 +- 0.00306 (10100 permutations done) Chi-square test value=16.50236 (P = 0.95778, 28
d.f.) Pair(3, 16) LnLHood LD : -581.00586 LnLHood LE : -592.26862 Exact P= 0.23000 +- 0.00471 (10100 permutations done) Chi-square test value=22.52553 (P = 0.54793, 24
d.f.) Pair(4, 16) LnLHood LD : -632.93116 LnLHood LE : -642.34151 Exact P= 0.80960 +- 0.00410 (10100 permutations done) Chi-square test value=18.82071 (P = 0.90358, 28
d.f.) Pair(5, 16) LnLHood LD : -937.22019 LnLHood LE : -966.22310 Exact P= 0.22198 +- 0.00376 (10100 permutations done) Chi-square test value=58.00581 (P = 0.54896, 60
d.f.) Pair(6, 16) LnLHood LD : -628.03526 LnLHood LE : -639.51084 Exact P= 0.49337 +- 0.00504 (10100 permutations done) Chi-square test value=22.95115 (P = 0.73548, 28
d.f.) Pair(7, 16) LnLHood LD : -742.76786 LnLHood LE : -762.30556 Exact P= 0.29762 +- 0.00490 (10100 permutations done) Chi-square test value=39.07540 (P = 0.68229, 44
d.f.) Pair(8, 16) LnLHood LD : -776.57909 LnLHood LE : -789.98872 Exact P= 0.95198 +- 0.00216 (10100 permutations done) Chi-square test value=26.81927 (P = 0.99428, 48
d.f.) Pair(9, 16) LnLHood LD : -545.71229 LnLHood LE : -551.73924 Exact P= 0.73455 +- 0.00398 (10100 permutations done) Chi-square test value=12.05390 (P = 0.91421, 20
d.f.) Pair(10, 16) LnLHood LD : -740.16994 LnLHood LE : -754.12809 Exact P= 0.44238 +- 0.00417 (10100 permutations done) Chi-square test value=27.91631 (P = 0.67349, 32
d.f.) Pair(11, 16) LnLHood LD : -619.89431 LnLHood LE : -625.50192 75 Exact P= 0.91861 +- 0.00280 (10100 permutations done) Chi-square test value=11.21522 (P = 0.94045, 20
d.f.) Pair(12, 16) LnLHood LD : -653.67664 LnLHood LE : -661.85258 Exact P= 0.81119 +- 0.00387 (10100 permutations done) Chi-square test value=16.35187 (P = 0.87496, 24
d.f.) Pair(13, 16) LnLHood LD : -766.51213 LnLHood LE : -781.82825 Exact P= 0.47663 +- 0.00468 (10100 permutations done) Chi-square test value=30.63224 (P = 0.72153, 36
d.f.) Pair(14, 16) LnLHood LD : -646.66749 LnLHood LE : -656.52981 Exact P= 0.73921 +- 0.00514 (10100 permutations done) Chi-square test value=19.72464 (P = 0.87429, 28
d.f.) Pair(15, 16) LnLHood LD : -639.11393 LnLHood LE : -646.47449 Exact P= 0.92059 +- 0.00252 (10100 permutations done) Chi-square test value=14.72112 (P = 0.98123, 28
d.f.) Pair(0, 17) LnLHood LD : -758.51619 LnLHood LE : -782.05279 Exact P= 0.07218 +- 0.00228 (10100 permutations done) Chi-square test value=47.07321 (P = 0.20552, 40
d.f.) Pair(1, 17) LnLHood LD : -952.32253 LnLHood LE : -992.19009 Exact P= 0.51673 +- 0.00517 (10100 permutations done) Chi-square test value=79.73511 (P = 0.72339, 88
d.f.) Pair(2, 17) LnLHood LD : -823.56807 LnLHood LE : -848.87064 Exact P= 0.40634 +- 0.00435 (10100 permutations done) Chi-square test value=50.60513 (P = 0.67852, 56
d.f.) Pair(3, 17) LnLHood LD : -747.38824 LnLHood LE : -769.03714 Exact P= 0.25871 +- 0.00475 (10100 permutations done) Chi-square test value=43.29780 (P = 0.66563, 48
d.f.) Pair(4, 17) LnLHood LD : -790.26118 LnLHood LE : -819.11003 Exact P= 0.20307 +- 0.00362 (10100 permutations done) Chi-square test value=57.69769 (P = 0.41227, 56
d.f.) Pair(5, 17) LnLHood LD : -1083.91333 LnLHood LE : -1142.99161 Exact P= 0.31168 +- 0.00495 (10100 permutations done) Chi-square test value=118.15657 (P = 0.53049,
120 d.f.) Pair(6, 17) LnLHood LD : -785.47215 LnLHood LE : -816.27935 76 Exact P= 0.07762 +- 0.00242 (10100 permutations done) Chi-square test value=61.61440 (P = 0.28221, 56
d.f.) Pair(7, 17) LnLHood LD : -893.76187 LnLHood LE : -939.07408 Exact P= 0.04782 +- 0.00227 (10100 permutations done) Chi-square test value=90.62441 (P = 0.40282, 88
d.f.) Pair(8, 17) LnLHood LD : -929.91838 LnLHood LE : -966.75724 Exact P= 0.74960 +- 0.00507 (10100 permutations done) Chi-square test value=73.67772 (P = 0.95609, 96
d.f.) Pair(9, 17) LnLHood LD : -711.76846 LnLHood LE : -728.50776 Exact P= 0.35891 +- 0.00496 (10100 permutations done) Chi-square test value=33.47859 (P = 0.75720, 40
d.f.) Pair(10, 17) LnLHood LD : -903.47686 LnLHood LE : -930.89660 Exact P= 0.68485 +- 0.00475 (10100 permutations done) Chi-square test value=54.83950 (P = 0.78588, 64
d.f.) Pair(11, 17) LnLHood LD : -784.66180 LnLHood LE : -802.27043 Exact P= 0.69366 +- 0.00438 (10100 permutations done) Chi-square test value=35.21727 (P = 0.68519, 40
d.f.) Pair(12, 17) LnLHood LD : -813.16686 LnLHood LE : -838.62109 Exact P= 0.26772 +- 0.00473 (10100 permutations done) Chi-square test value=50.90845 (P = 0.35986, 48
d.f.) Pair(13, 17) LnLHood LD : -934.20237 LnLHood LE : -958.59677 Exact P= 0.97911 +- 0.00130 (10100 permutations done) Chi-square test value=48.78878 (P = 0.98364, 72
d.f.) Pair(14, 17) LnLHood LD : -809.60564 LnLHood LE : -833.29832 Exact P= 0.60743 +- 0.00499 (10100 permutations done) Chi-square test value=47.38537 (P = 0.78700, 56
d.f.) Pair(15, 17) LnLHood LD : -802.57044 LnLHood LE : -823.24300 Exact P= 0.66802 +- 0.00442 (10100 permutations done) Chi-square test value=41.34513 (P = 0.92836, 56
d.f.) Pair(16, 17) LnLHood LD : -694.19829 LnLHood LE : -713.29528 Exact P= 0.06208 +- 0.00237 (10100 permutations done) Chi-square test value=38.19398 (P = 0.20855, 32
d.f.) Pair(0, 18) LnLHood LD : -779.05946 LnLHood LE : -797.98431 77 Exact P= 0.54000 +- 0.00495 (10100 permutations done) Chi-square test value=37.84970 (P = 0.76623, 45
d.f.) Pair(1, 18) LnLHood LD : -959.04769 LnLHood LE : -1008.12161 Exact P= 0.19446 +- 0.00351 (10100 permutations done) Chi-square test value=98.14784 (P = 0.50530, 99
d.f.) Pair(2, 18) LnLHood LD : -833.87282 LnLHood LE : -864.80215 Exact P= 0.18634 +- 0.00372 (10100 permutations done) Chi-square test value=61.85866 (P = 0.51706, 63
d.f.) Pair(3, 18) LnLHood LD : -763.34868 LnLHood LE : -784.96865 Exact P= 0.42842 +- 0.00440 (10100 permutations done) Chi-square test value=43.23994 (P = 0.85271, 54
d.f.) Pair(4, 18) LnLHood LD : -810.94972 LnLHood LE : -835.04154 Exact P= 0.81832 +- 0.00400 (10100 permutations done) Chi-square test value=48.18365 (P = 0.91617, 63
d.f.) Pair(5, 18) LnLHood LD : -1101.86890 LnLHood LE : -1158.92313 Exact P= 0.82792 +- 0.00349 (10100 permutations done) Chi-square test value=114.10846 (P = 0.90363,
135 d.f.) Pair(6, 18) LnLHood LD : -804.88208 LnLHood LE : -832.21087 Exact P= 0.43535 +- 0.00468 (10100 permutations done) Chi-square test value=54.65758 (P = 0.76383, 63
d.f.) Pair(7, 18) LnLHood LD : -917.72902 LnLHood LE : -955.00559 Exact P= 0.72515 +- 0.00421 (10100 permutations done) Chi-square test value=74.55314 (P = 0.96834, 99
d.f.) Pair(8, 18) LnLHood LD : -940.25082 LnLHood LE : -982.68875 Exact P= 0.63624 +- 0.00457 (10100 permutations done) Chi-square test value=84.87586 (P = 0.95114, 108
d.f.) Pair(9, 18) LnLHood LD : -714.67503 LnLHood LE : -744.43927 Exact P= 0.00198 +- 0.00042 (10100 permutations done) Chi-square test value=59.52848 (P = 0.07205, 45
d.f.) Pair(10, 18) LnLHood LD : -915.74848 LnLHood LE : -946.82812 Exact P= 0.64693 +- 0.00453 (10100 permutations done) Chi-square test value=62.15928 (P = 0.78944, 72
d.f.) Pair(11, 18) LnLHood LD : -799.28191 LnLHood LE : -818.20195 78 Exact P= 0.75950 +- 0.00407 (10100 permutations done) Chi-square test value=37.84009 (P = 0.76657, 45
d.f.) Pair(12, 18) LnLHood LD : -821.71748 LnLHood LE : -854.55260 Exact P= 0.05297 +- 0.00201 (10100 permutations done) Chi-square test value=65.67026 (P = 0.13262, 54
d.f.) Pair(13, 18) LnLHood LD : -933.53515 LnLHood LE : -974.52828 Exact P= 0.19228 +- 0.00395 (10100 permutations done) Chi-square test value=81.98627 (P = 0.44847, 81
d.f.) Pair(14, 18) LnLHood LD : -831.28878 LnLHood LE : -849.22984 Exact P= 0.99376 +- 0.00085 (10100 permutations done) Chi-square test value=35.88212 (P = 0.99765, 63
d.f.) Pair(15, 18) LnLHood LD : -809.68142 LnLHood LE : -839.17452 Exact P= 0.13396 +- 0.00316 (10100 permutations done) Chi-square test value=58.98621 (P = 0.62009, 63
d.f.) Pair(16, 18) LnLHood LD : -713.78402 LnLHood LE : -729.22680 Exact P= 0.47099 +- 0.00477 (10100 permutations done) Chi-square test value=30.88554 (P = 0.71031, 36
d.f.) Pair(17, 18) LnLHood LD : -871.88105 LnLHood LE : -905.99531 Exact P= 0.36743 +- 0.00480 (10100 permutations done) Chi-square test value=68.22852 (P = 0.60415, 72
d.f.) Pair(0, 19) LnLHood LD : -770.92748 LnLHood LE : -792.39257 Exact P= 0.47485 +- 0.00490 (10100 permutations done) Chi-square test value=42.93020 (P = 0.88157, 55
d.f.) Pair(1, 19) LnLHood LD : -952.42302 LnLHood LE : -1002.52987 Exact P= 0.28673 +- 0.00433 (10100 permutations done) Chi-square test value=100.21371 (P = 0.91588,
121 d.f.) Pair(2, 19) LnLHood LD : -834.55202 LnLHood LE : -859.21042 Exact P= 0.86149 +- 0.00354 (10100 permutations done) Chi-square test value=49.31679 (P = 0.99410, 77
d.f.) Pair(3, 19) LnLHood LD : -763.34864 LnLHood LE : -779.37692 Exact P= 0.97614 +- 0.00135 (10100 permutations done) Chi-square test value=32.05654 (P = 0.99987, 66
d.f.) Pair(4, 19) LnLHood LD : -791.63946 LnLHood LE : -829.44981 79 Exact P= 0.06030 +- 0.00214 (10100 permutations done) Chi-square test value=75.62070 (P = 0.52312, 77
d.f.) Pair(5, 19) LnLHood LD : -1081.21595 LnLHood LE : -1153.33139 Exact P= 0.10851 +- 0.00309 (10100 permutations done) Chi-square test value=144.23088 (P = 0.87657,
165 d.f.) Pair(6, 19) LnLHood LD : -797.69767 LnLHood LE : -826.61913 Exact P= 0.50901 +- 0.00481 (10100 permutations done) Chi-square test value=57.84293 (P = 0.94943, 77
d.f.) Pair(7, 19) LnLHood LD : -911.05561 LnLHood LE : -949.41386 Exact P= 0.80772 +- 0.00432 (10100 permutations done) Chi-square test value=76.71650 (P = 0.99942, 121
d.f.) Pair(8, 19) LnLHood LD : -929.27573 LnLHood LE : -977.09702 Exact P= 0.42287 +- 0.00558 (10100 permutations done) Chi-square test value=95.64256 (P = 0.99270, 132
d.f.) Pair(9, 19) LnLHood LD : -718.10556 LnLHood LE : -738.84754 Exact P= 0.31208 +- 0.00424 (10100 permutations done) Chi-square test value=41.48396 (P = 0.91110, 55
d.f.) Pair(10, 19) LnLHood LD : -906.90125 LnLHood LE : -941.23638 Exact P= 0.58505 +- 0.00445 (10100 permutations done) Chi-square test value=68.67026 (P = 0.93682, 88
d.f.) Pair(11, 19) LnLHood LD : -786.14241 LnLHood LE : -812.61021 Exact P= 0.27050 +- 0.00474 (10100 permutations done) Chi-square test value=52.93561 (P = 0.55390, 55
d.f.) Pair(12, 19) LnLHood LD : -824.20872 LnLHood LE : -848.96087 Exact P= 0.75505 +- 0.00452 (10100 permutations done) Chi-square test value=49.50431 (P = 0.93539, 66
d.f.) Pair(13, 19) LnLHood LD : -923.30791 LnLHood LE : -968.93655 Exact P= 0.09525 +- 0.00272 (10100 permutations done) Chi-square test value=91.25728 (P = 0.69762, 99
d.f.) Pair(14, 19) LnLHood LD : -803.65642 LnLHood LE : -843.63810 Exact P= 0.01842 +- 0.00129 (10100 permutations done) Chi-square test value=79.96336 (P = 0.38614, 77
d.f.) Pair(15, 19) LnLHood LD : -808.87179 LnLHood LE : -833.58278 80 Exact P= 0.68762 +- 0.00453 (10100 permutations done) Chi-square test value=49.42198 (P = 0.99390, 77
d.f.) Pair(16, 19) LnLHood LD : -706.56214 LnLHood LE : -723.63506 Exact P= 0.48069 +- 0.00452 (10100 permutations done) Chi-square test value=34.14584 (P = 0.85735, 44
d.f.) Pair(17, 19) LnLHood LD : -868.82229 LnLHood LE : -900.40357 Exact P= 0.78109 +- 0.00366 (10100 permutations done) Chi-square test value=63.16257 (P = 0.97897, 88
d.f.) Pair(18, 19) LnLHood LD : -875.14065 LnLHood LE : -916.33509 Exact P= 0.29733 +- 0.00537 (10100 permutations done) Chi-square test value=82.38888 (P = 0.88604, 99
d.f.) Pair(0, 20) LnLHood LD : -915.50138 LnLHood LE : -948.24614 Exact P= 0.24436 +- 0.00502 (10100 permutations done) Chi-square test value=65.48951 (P = 0.77546, 75
d.f.) Pair(1, 20) LnLHood LD : -1100.88619 LnLHood LE : -1158.38343 Exact P= 0.94257 +- 0.00222 (10100 permutations done) Chi-square test value=114.99448 (P = 0.99888,
165 d.f.) Pair(2, 20) LnLHood LD : -972.54497 LnLHood LE : -1015.06398 Exact P= 0.35812 +- 0.00502 (10100 permutations done) Chi-square test value=85.03803 (P = 0.92352, 105
d.f.) Pair(3, 20) LnLHood LD : -904.20520 LnLHood LE : -935.23048 Exact P= 0.52069 +- 0.00537 (10100 permutations done) Chi-square test value=62.05056 (P = 0.98922, 90
d.f.) Pair(4, 20) LnLHood LD : -937.10134 LnLHood LE : -985.30337 Exact P= 0.16158 +- 0.00376 (10100 permutations done) Chi-square test value=96.40405 (P = 0.71357, 105
d.f.) Pair(5, 20) LnLHood LD : -1219.84779 LnLHood LE : -1309.18495 Exact P= 0.70723 +- 0.00433 (10100 permutations done) Chi-square test value=178.67433 (P = 0.98990,
225 d.f.) Pair(6, 20) LnLHood LD : -944.01700 LnLHood LE : -982.47269 Exact P= 0.65713 +- 0.00494 (10100 permutations done) Chi-square test value=76.91137 (P = 0.98202, 105
d.f.) Pair(7, 20) LnLHood LD : -1045.04278 LnLHood LE : -1105.26742 81 Exact P= 0.43743 +- 0.00528 (10100 permutations done) Chi-square test value=120.44928 (P = 0.99630,
165 d.f.) Pair(8, 20) LnLHood LD : -1077.41445 LnLHood LE : -1132.95058 Exact P= 0.96327 +- 0.00181 (10100 permutations done) Chi-square test value=111.07225 (P = 0.99999,
180 d.f.) Pair(9, 20) LnLHood LD : -869.66121 LnLHood LE : -894.70110 Exact P= 0.60228 +- 0.00561 (10100 permutations done) Chi-square test value=50.07978 (P = 0.98813, 75
d.f.) Pair(10, 20) LnLHood LD : -1035.65720 LnLHood LE : -1097.08995 Exact P= 0.02693 +- 0.00158 (10100 permutations done) Chi-square test value=122.86550 (P = 0.41041,
120 d.f.) Pair(11, 20) LnLHood LD : -937.84017 LnLHood LE : -968.46377 Exact P= 0.74950 +- 0.00463 (10100 permutations done) Chi-square test value=61.24722 (P = 0.87382, 75
d.f.) Pair(12, 20) LnLHood LD : -963.27671 LnLHood LE : -1004.81443 Exact P= 0.31554 +- 0.00428 (10100 permutations done) Chi-square test value=83.07543 (P = 0.68437, 90
d.f.) Pair(13, 20) LnLHood LD : -1075.23647 LnLHood LE : -1124.79011 Exact P= 0.84050 +- 0.00389 (10100 permutations done) Chi-square test value=99.10727 (P = 0.99119, 135
d.f.) Pair(14, 20) LnLHood LD : -958.35391 LnLHood LE : -999.49166 Exact P= 0.54327 +- 0.00411 (10100 permutations done) Chi-square test value=82.27551 (P = 0.95065, 105
d.f.) Pair(15, 20) LnLHood LD : -947.20153 LnLHood LE : -989.43634 Exact P= 0.12584 +- 0.00284 (10100 permutations done) Chi-square test value=84.46963 (P = 0.92982, 105
d.f.) Pair(16, 20) LnLHood LD : -855.58834 LnLHood LE : -879.48862 Exact P= 0.45554 +- 0.00447 (10100 permutations done) Chi-square test value=47.80056 (P = 0.87235, 60
d.f.) Pair(17, 20) LnLHood LD : -1002.10529 LnLHood LE : -1056.25713 Exact P= 0.20663 +- 0.00356 (10100 permutations done) Chi-square test value=108.30370 (P = 0.76962,
120 d.f.) Pair(18, 20) LnLHood LD : -1021.97843 LnLHood LE : -1072.18865 82 Exact P= 0.78743 +- 0.00426 (10100 permutations done) Chi-square test value=100.42045 (P = 0.98856,
135 d.f.) Pair(19, 20) LnLHood LD : -1008.44745 LnLHood LE : -1066.59691 Exact P= 0.43198 +- 0.00550 (10100 permutations done) Chi-square test value=116.29893 (P = 0.99848,
165 d.f.) Pair(0, 21) LnLHood LD : -717.09069 LnLHood LE : -728.96238 Exact P= 0.83475 +- 0.00393 (10100 permutations done) Chi-square test value=23.74338 (P = 0.98071, 40
d.f.) Pair(1, 21) LnLHood LD : -902.79436 LnLHood LE : -939.09968 Exact P= 0.27208 +- 0.00420 (10100 permutations done) Chi-square test value=72.61063 (P = 0.88188, 88
d.f.) Pair(2, 21) LnLHood LD : -769.17482 LnLHood LE : -795.78023 Exact P= 0.07485 +- 0.00269 (10100 permutations done) Chi-square test value=53.21081 (P = 0.58112, 56
d.f.) Pair(3, 21) LnLHood LD : -696.96869 LnLHood LE : -715.94673 Exact P= 0.22792 +- 0.00427 (10100 permutations done) Chi-square test value=37.95607 (P = 0.85024, 48
d.f.) Pair(4, 21) LnLHood LD : -743.52887 LnLHood LE : -766.01962 Exact P= 0.42832 +- 0.00500 (10100 permutations done) Chi-square test value=44.98150 (P = 0.85415, 56
d.f.) Pair(5, 21) LnLHood LD : -1038.47483 LnLHood LE : -1089.90120 Exact P= 0.17010 +- 0.00375 (10100 permutations done) Chi-square test value=102.85275 (P = 0.86883,
120 d.f.) Pair(6, 21) LnLHood LD : -742.30316 LnLHood LE : -763.18894 Exact P= 0.45723 +- 0.00496 (10100 permutations done) Chi-square test value=41.77156 (P = 0.92138, 56
d.f.) Pair(7, 21) LnLHood LD : -843.36350 LnLHood LE : -885.98367 Exact P= 0.00812 +- 0.00094 (10100 permutations done) Chi-square test value=85.24034 (P = 0.56349, 88
d.f.) Pair(8, 21) LnLHood LD : -889.93257 LnLHood LE : -913.66683 Exact P= 0.99208 +- 0.00091 (10100 permutations done) Chi-square test value=47.46850 (P = 0.99999, 96
d.f.) Pair(9, 21) LnLHood LD : -667.14381 LnLHood LE : -675.41735 83 Exact P= 0.98465 +- 0.00117 (10100 permutations done) Chi-square test value=16.54708 (P = 0.99962, 40
d.f.) Pair(10, 21) LnLHood LD : -855.41685 LnLHood LE : -877.80619 Exact P= 0.72832 +- 0.00420 (10100 permutations done) Chi-square test value=44.77869 (P = 0.96758, 64
d.f.) Pair(11, 21) LnLHood LD : -731.38953 LnLHood LE : -749.18002 Exact P= 0.37446 +- 0.00518 (10100 permutations done) Chi-square test value=35.58098 (P = 0.66938, 40
d.f.) Pair(12, 21) LnLHood LD : -770.72415 LnLHood LE : -785.53068 Exact P= 0.91505 +- 0.00308 (10100 permutations done) Chi-square test value=29.61305 (P = 0.98298, 48
d.f.) Pair(13, 21) LnLHood LD : -879.34030 LnLHood LE : -905.50636 Exact P= 0.59970 +- 0.00448 (10100 permutations done) Chi-square test value=52.33211 (P = 0.96086, 72
d.f.) Pair(14, 21) LnLHood LD : -760.66791 LnLHood LE : -780.20791 Exact P= 0.66287 +- 0.00469 (10100 permutations done) Chi-square test value=39.08001 (P = 0.95829, 56
d.f.) Pair(15, 21) LnLHood LD : -753.68179 LnLHood LE : -770.15259 Exact P= 0.75901 +- 0.00398 (10100 permutations done) Chi-square test value=32.94161 (P = 0.99404, 56
d.f.) Pair(16, 21) LnLHood LD : -647.23507 LnLHood LE : -660.20487 Exact P= 0.37644 +- 0.00483 (10100 permutations done) Chi-square test value=25.93960 (P = 0.76627, 32
d.f.) Pair(17, 21) LnLHood LD : -815.95085 LnLHood LE : -836.97338 Exact P= 0.84178 +- 0.00374 (10100 permutations done) Chi-square test value=42.04506 (P = 0.98463, 64
d.f.) Pair(18, 21) LnLHood LD : -818.44282 LnLHood LE : -852.90490 Exact P= 0.06584 +- 0.00231 (10100 permutations done) Chi-square test value=68.92415 (P = 0.58093, 72
d.f.) Pair(19, 21) LnLHood LD : -817.98127 LnLHood LE : -847.31316 Exact P= 0.53139 +- 0.00483 (10100 permutations done) Chi-square test value=58.66378 (P = 0.99320, 88
d.f.) Pair(20, 21) LnLHood LD : -961.10476 LnLHood LE : -1003.16672 84 Exact P= 0.42228 +- 0.00444 (10100 permutations done) Chi-square test value=84.12392 (P = 0.99467, 120
d. 85 STT Mã số Năm sinh Giới tính Họ tên Dân tộc 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36 MV_M1
MV_M2
MV_M3
MV_M4
MV_M5
MV_M6
MV_M7
MV_M8
MV_M9
MV_M10
MV_M11
MV_M12
MV_M13
MV_M14
MV_M15
MV_M16
MV_M17
MV_M18
MV_M19
MV_M20
MV_M21
MV_M22
MV_M23
MV_M24
MV_M25
MV_M26
MV_M27
MV_M28
MV_M29
MV_M30
MV_M31
MV_M32
MV_M33
MV_M34
MV_M35
MV_M36 2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2006
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2006
2006
2006
2006
2006
2006
2005
2006
2006
2006 M
F
F
F
M
F
F
M
F
F
M
F
M
M
F
F
F
F
F
F
M
M
M
M
M
F
F
M
F
F
F
F
F
F
M
M Vàng M. D.
Sùng T. L.
Và T. M.
Giàng T. M.
Sùng M. M.
Ma M. N.
Ly T. S.
Vừ M. S.
Vàng T. T.
Sùng T. T.
Thò M. T.
Thào T. V.
Thò M. V.
Giàng M. C.
Hầu T. G.
Vừ T. H. H.
Vàng T. L. H.
Sùng T. M.
Vừ T. M.
Cử T. P.
Lầu M. P.
Giàng M. P.
Sình M. P.
Giàng S. T.
Vừ Q. T.
Ly T. N. A.
Vừ T. C.
Ly M. H.
Giàng T. M.
Thò T. M.
Vừ T. M.
Giàng T. M.
Thào T. M.
Giàng T. P.
Sùng M. S.
Vừ M. T. Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông Phụ lục 4: Thông tin các mẫu tham gia đề tài 37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79 MV_M37
MV_M38
MV_M39
MV_M40
MV_M41
MV_M42
MV_M43
MV_M44
MV_M45
MV_M46
MV_M47
MV_M48
MV_M49
MV_M50
MV_M51
MV_M52
MV_M53
MV_M54
MV_M55
MV_M56
MV_M57
MV_M58
MV_M59
MV_M60
MV_M61
MV_M62
MV_M63
MV_M64
MV_M65
MV_M66
MV_M67
MV_M68
MV_M69
MV_M70
MV_M71
MV_M72
MV_M73
MV_M74
MV_M75
MV_M76
MV_M77
MV_M78
MV_M79 2006
2006
2005
2006
2006
2006
2006
2005
2006
2005
2006
2005
2005
2005
2007
2007
2007
2007
2007
2007
2007
2007
2006
2007
2007
2007
2005
2004
2005
2005
2005
2005
2005
2005
2007
2006
2005
2005
2007
2004
2005
2005
2005 M
M
M
F
M
F
F
M
M
F
M
M
F
F
M
F
F
F
F
M
F
F
M
M
M
M
M
M
M
M
M
M
M
M
M
M
F
F
M
M
F
F
F Sùng M. T.
Hờ M. C.
Vàng M. D.
Vừ T. D.
Thào M. H.
Hờ T. M.
Sùng T. M.
Vàng M. P.
Sùng M. T.
Thào T. T.
Và M. V.
Vàng M. C.
Thò T. D.
Sùng T. D.
Vừ M. C.
Giàng T. D.
Phan T. L.
Vàng T. M.
Chá T. M.
Lầu T. T.
Vàng T. P.
Ly T. T. P.
Lư M. S.
Sình M. S.
Vàng M. S.
Vừ M. T.
Giàng M. L.
Vàng M. L.
Và M. L.
Lầu M. M.
Sùng M. P.
Vàng M. T.
Vàng M. V.
Vừ M. C.
Ly M.T.
Vừ M. H.
Vừ T. T. X.
Mua N. H.
Mua M. N.
Vừ M. C.
Vừ T. D.
Ly N. L.
Thò T. M. Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông 86 MV_M80
80
MV_M81
81
MV_M82
82
MV_M83
83
MV_M84
84
MV_M85
85
MV_M86
86
MV_M87
87
MV_M88
88
MV_M89
89
MV_M90
90
MV_M91
91
MV_M92
92
MV_M93
93
MV_M94
94
MV_M95
95
MV_M96
96
MV_M97
97
MV_M98
98
99
MV_M99
100 MV_M100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122 QB_M1
QB_M2
QB_M3
QB_M4
QB_M5
QB_M6
QB_M7
QB_M8
QB_M9
QB_M10
QB_M11
QB_M12
QB_M13
QB_M14
QB_M15
QB_M16
QB_M17
QB_M18
QB_M19
QB_M20
QB_M21
QB_M22 2005
2005
2005
2005
2005
2005
2004
2005
2004
2005
2005
2005
2004
2004
2004
2004
2004
2004
2004
2004
2004
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2007 F
F
F
M
M
M
M
F
M
M
M
F
M
F
F
M
M
M
F
M
M
M
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F Sùng T. M.
Dương H. M. M.
Vàng T. M.
Thào M. P.
Giàng M. S.
Vừ M. S.
Vừ M. S.
Vừ T. S.
Ly M. T.
Vừ M. T.
Thò M. V.
Vừ T. V.
Già M. C.
Giàng T. G.
Thào T. M.
Lầu M. S.
Già M. S.
Thào Đ. S.
Trương P. M. T.
Và M. T.
Mua M. V.
Cháng N. C.
Giàng T. N. D.
Lù T. B.
Giàng T. S.
Sùng T. L.
Hầu T. L.
Vàng T. H.
Vàng T. C.
Hạn T. M.
Dương T. C.
Giàng T. B.
Hầu T. H.
Trương T. N.
Vàng T. H.
Giàng T. L.
Ly T. H.
Vàng T. N.
Vương T. D.
Vương B. T.
Vàng T. S.
Vàng T. L.
Hạng T. L. Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông 87 QB_M23
QB_M24
QB_M25
QB_M26
QB_M27
QB_M28
QB_M29
QB_M30
QB_M31
QB_M32
QB_M33
QB_M34
QB_M35
QB_M36
QB_M37
QB_M38
QB_M39
QB_M40
QB_M41
QB_M42
QB_M43
QB_M44
QB_M45
QB_M46
QB_M47
QB_M48
QB_M49
QB_M50
QB_M51
QB_M52
QB_M53
QB_M54
QB_M55
QB_M56 123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156 2007
2007
2007
2007
2007
2007
2007
2007
2007
2007
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006
2006 F
F
F
F
F
M
M
M
M
M
M
M
M
M
M
F
F
F
F
F
F
F
F
F
F
F
F
F
F
M
M
M
M
M Sùng T. H.
Vàng T. T.
Ma T. P.
Hương T. X.
Hào T. M. N.
Lò V. T.
Giàng T. M.
Ly M. V.
Hạng M. T.
Sùng T. L.
Ly V. C.
Lò T. Đ.
Cháng L. T.
Vàng M. C.
Hào M. M.
D. N. T.
Ma T. M.
Giàng T. T.
Hạng T. A.
Giàng T. D.
Cháng T. N. A.
Mai T. N.
Ly T. T.
Ly T. M.
Thào T. H.
Thào T. D.
Lò T. K.
Mua T. T.
Dương T. T.
Giàng M. H.
Thào V. D.
Sùng M. L.
Cháng M. P.
Mua M.T. Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông
Mông 88Locus
Số lượng
OH
EH.
s.d.
Steps done
Locus
CSF1PO
D10S1248
D12S391
D13S317
D16S539
D18S51
D19S433
D1S1656
D21S11
D22S1045
D2S1338
D2S441
D3S1358
D5S818
D7S820
D8S1179
FGA
Penta.D
Penta.E
TH01
TPOX
vWA
Combined
MP
0.210141
0.162475
0.094017
0.170201
0.160339
0.069855
0.095743
0.048159
0.05498
0.124589
0.064924
0.110125
0.145135
0.112508
0.123932
0.087525
0.035667
0.062541
0.017834
0.143162
0.232906
0.118919
3.86E-23
PE
0.343027
0.351705
0.554641
0.278753
0.625471
0.725402
0.601422
0.699924
0.712627
0.554641
0.577803
0.416461
0.446335
0.543237
0.406783
0.589557
0.674753
0.543237
0.855961
0.436238
0.256979
0.543237
0.999999987
DC
0.789859
0.837525
0.905983
0.8298
0.839661
0.930145
0.904257
0.951841
0.94502
0.875411
0.935076
0.889875
0.854865
0.887492
0.876068
0.912475
0.964333
0.937459
0.982166
0.856838
0.767094
0.881082
1.00000000000000
PIC
0.557019
0.613837
0.731492
0.611476
0.673925
0.793209
0.731159
0.818746
0.820474
0.695176
0.789711
0.699439
0.650858
0.702541
0.667303
0.737462
0.852489
0.783956
0.908267
0.654371
0.51975
0.699066
Phụ lục 1: Kết quả khuếch đại các locus STR của mẫu đối chứng dương