BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ -----------------------------

Trần Huyền Linh

XÂY DỰNG CƠ SỞ DỮ LIỆU VỀ TẦN SỐ ALLELE 22 LOCUS ĐA HÌNH STR TRÊN NHIỄM SẮC THỂ THƯỜNG Ở QUẦN THỂ NGƯỜI MÔNG TẠI HÀ GIANG, VIỆT NAM

LUẬN VĂN THẠC SĨ

CÔNG NGHỆ SINH HỌC

Hà Nội - 2020

BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ -----------------------------

Trần Huyền Linh

XÂY DỰNG CƠ SỞ DỮ LIỆU VỀ TẦN SỐ ALLELE 22 LOCUS ĐA HÌNH STR TRÊN NHIỄM SẮC THỂ THƯỜNG Ở QUẦN THỂ NGƯỜI MÔNG TẠI HÀ GIANG, VIỆT NAM

Chuyên ngành: Sinh học thực nghiệm

Mã số: BIO2018

LUẬN VĂN THẠC SĨ

Công nghệ sinh học

NGƯỜI HƯỚNG DẪN KHOA HỌC

PGS. TS. Chu Hoàng Hà

Hà Nội - 2020

Lời cam đoan

Tôi xin cam đoan những nội dung viết trong luận văn là do sự tìm tòi,

học hỏi và nghiên cứu của bản thân với sự hướng dẫn tận tình của PGS. TS.

Chu Hoàng Hà và các đồng nghiệp tại Viện Công nghệ sinh học, Viện Hàn lâm

Khoa học và Công nghệ Việt Nam.

Mọi kết quả nghiên cứu cũng như ý tưởng của các tác giả khác (nếu có)

đều được trích dẫn cụ thể. Đề tài luận văn này cho đến nay chưa được bảo vệ

tại bất kỳ một hội đồng bảo vệ luận văn thạc sĩ nào và cũng chưa được công bố

trên bất kỳ phương tiện nào. Tôi xin chịu trách nhiệm về những lời cam đoan

trên.

Hà Nội, ngày 28 tháng 5 năm 2020

Người cam đoan

Trần Huyền Linh

Lời cảm ơn

Để hoàn thành được Luận văn cao học này, tôi xin bày tỏ lời cảm ơn đến

PGS. TS. Chu Hoàng Hà đã trực tiếp định hướng, hướng dẫn tôi một cách tận

tình và giúp đỡ tôi xây dựng ý tưởng để hoàn thiện luận văn.

Tôi xin cảm ơn tập thể lãnh đạo Viện Công nghệ sinh học, lãnh đạo và cán

bộ Phòng thí nghiệm Trọng điểm Công nghệ Gen – Viện Công nghệ sinh học

đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập và thực hiện

nghiên cứu đề tài.

Tôi xin trân trọng cảm ơn ban lãnh đạo cùng các thầy cô giáo Khoa Sinh

học, Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và Công nghệ

Việt Nam đã truyền đạt kiến thức và giúp đỡ tôi trong quá trình học tập và thực

hiện luận văn.

Cuối cùng, tôi xin bày tỏ lòng biết ơn đến gia đình, người thân, bạn bè và

đồng nghiệp, những người đã luôn động viên, tạo điều kiện cho thôi hoàn thành

luận văn này./.

Học viên

Trần Huyền Linh

Danh mục các ký hiệu và chữ viết tắt

Chữ viết tắt Nội dung

Deoxyribonucleic acid ADN

nucleotide nt

Tên riêng của một loại giấy thu mẫu máu FTA

nhiễm sắc thể NST

Short tandem repeat STR

Polymerase chain reaction PCR

Match probability MP

Discrimination capacity DC

Power of Exclusion PE

Polymorphic information content PIC

Paternity Index PI

Restriction Fragment Length Polymorphism RFLP

European Standard Set ESS

Federal Bureau of Investigation FBI

Variable number of tandem repeat VNTR

Expected Heterozygosity EH

Observed Heterozygosity OH

Neighbor Joining NJ

SWGDAM Scientific Working Group on DNA Analysis Methods

Linkage - Disequilibrium LD

Danh mục các bảng

Bảng 1.1. Thông tin về vị trí và tốc độ đột biến của một số locus thường dùng

theo cơ sở dữ liệu STRbase ............................. . 15

Bảng 1.2. Thông tin về vị trí và trình tự của một đơn vị lặp của các locus có

trong bộ kit PowerPlex Fusion System theo thông tin của nhà sản xuất ... 19

Bảng 2. Bảng thành phần phản ứng khuếch đại .................. 29

Bảng 3.1. Số lượng allele mỗi locus .......................... 33

Bảng 3.2. Bảng tần số allele 22 locus STR trên NST thường của Mông, tại Hà

Giang - Việt Nam ...................................... 35

Bảng 3.3. Các allele có tần số thấp phát hiện được trong quần thể ...... 41

Bảng 3.4. Kết quả kiểm định cân bằng HWE bằng phần mềm Arlequin v3.5

................................................. .42

Bảng 3.5. Kết quả tính các chỉ số EH và OH của từng locus .......... 44

Bảng 3.6. Bảng ma trận đánh giá linkage disequilibrium của các locus ... 46

Bảng 3.7. Các chỉ số MP, PE, DC và PIC của các locus ............. 51

Danh mục các hình vẽ, đồ thị

Hình 1.1 Các locus thuộc bộ CODIS của FBI và vị trí trên NST người .... 5

Hình 1.2. Kết quả các băng thu được sau phân giải bằng enzyme giới hạn và lai

Southern của một đại gia đình .............................. 12

Hình 1.3. Kết quả thu được so sánh giữa hai phương pháp sử dụng nhiều locus

và các đơn locus dựa trên phương pháp RFLP ................... 13

Hình 1.4. Hình ảnh kết quả điện di mao quản của một số locus sử dựng phương

pháp PCR và gắn huỳnh quang trên mỗi locus ................... 13

Hình 1.5. Cơ chế sinh đột biến STR do gấp đoạn trong quá trình nhân bản 16

Hình 1.6. Quá trình xác định kích thước của một allele dựa trên ô thang chuẩn

........................................................................................................................ 19

Hình 1.7. Sự phân bố các nhánh ngôn ngữ thuộc hệ Mông - Dao tại Việt Nam.

.................................................. 24

Hình 1.8. Cây phát sinh chủng loại miêu tả mối quan hệ di truyền gần gũi giữa

quần thể người Kinh và một số quần thể khác ................... 25

Hình 2.1. Bản đồ hành chính tỉnh Hà Giang ..................... 26

Hình 2.2. Độ dài và loại dye được sử dụng cho mỗi locus trong bộ kit ... 28

Hình 2.3. Chu trình nhiệt của phản ứng khuếch đại với 28 chu kỳ ...... 29

Hình 3.1. Biểu đồ màu theo giá trị chỉ số MP của từng locus .......... 47

Hình 3.2. Biều đồ màu theo giá trị chỉ só PE của từng locus .......... 48

Hình 3.3. Biều đồ màu theo giá trị DC của từng locus .............. 49

Hình 3.4. Biểu đồ màu theo giá trị của chỉ số PI của các locus ......... 50

Hình 3.5. Hình ảnh giao diện phần mềm STR-VN version 1.0 ......... 52

Hình 3.6. Cây phát sinh chủng loại về mối tương quan di truyền giữa người

Mông và các quần thể khác ............................... 54

1

MỤC LỤC

MỞ ĐẦU ............................................ 3

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU ....................... 5

1.1. Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR ........... 5

1.1.1. Short tandem repeat – STR ....................... 5 1.1.2. Bộ kit Powerplex Fusion system được sử dụng trong giám định ......................................... 18

1.1.3. Cơ sở dữ liệu tần số STR ........................ 21

1.1.4. Di truyền quần thể và dân tộc ..................... 21

1.2. Tình hình nghiên cứu trong và ngoài nước ............. 24

CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU .............................................. 26

2.1. Nguyên vật liệu ................................ 26

2.1.1. Địa điểm thu mẫu ............................. 26

2.1.2. Thu thập và bảo quản .......................... 27

2.2. Phương pháp nghiên cứu ......................... 27

2.2.1. Khuếch đại đoạn gen .......................... 27

2.2.2. Tính toán tần số và các chỉ số pháp y ................ 30

2.2.3. Xác định mối liên hệ giữa quần thể người Mông tại Hà Giang và các quần thể khác .................................. 31

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ................... 32

3.1. Kết quả thu mẫu và khuếch đại ADN ................. 32

3.2. Kết quả tính tần số các locus và xác định các allele có tần số thấp ........................................... 34

3.3. Kết quả phân tích thống kê ........................ 42

3.3.1. Kiểm định cân bằng Hardy-Weinberg ............... 42

3.3.2. Gía trị dị hợp tử mong đợi và quan sát được ........... 44

3.3.3. Kiểm tra tính di truyền liên kết của các locus STR ....... 45

3.4. Kết quả phân tích các chỉ số pháp y .................. 47

2

3.4.1. Chỉ số khả năng trùng hợp ngẫu nhiên - Match probability (MP) ......................................... 47

3.4.2. Chỉ số khả năng loại trừ - Power of Exclusion .......... 47

3.4.3. Chỉ số khả năng phân biệt – Discrimination capacity...... 48

3.4.4. Chỉ số đa hình - Polymorphic information content ....... 49

3.4.5. Chỉ số Parternity index – PI ...................... 49

3.5. Các chỉ số pháp y đánh giá tần số các allele của một quần thể 50

3.6. Kết quả phân tích mối tương quan di truyền với các quần thể khác ........................................... 52

CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ ................... 55

4.1. Kết luận ..................................... 55

4.2. Kiến nghị .................................... 56

TÀI LIỆU THAM KHẢO ............................... 57

PHỤ LỤC .......................................... 62

Phụ lục 1: Kết quả khuếch đại các locus STR của mẫu đối chứng dương ........................................... 62

Phụ lục 2: Kết quả khuếch đại các locus STR của mẫu đối chứng âm63

Phụ lục 3: Kết quả kiểm định Chi-square các cặp locus về lingkage disequilirium ...................................... 64

Phụ lục 4: Thông tin các mẫu tham gia đề tài ................ 85

3

MỞ ĐẦU

Short tandem repeat - STR là các đoạn trình tự ngắn, được cấu thành bằng sự lặp lại của khoảng 2 – 7 nucleotide. Trong hệ gen của người, các STR nằm rải rác khắp nơi, chúng nằm trong vùng không mã hóa, giữa các gen và chiếm khoảng 3% hệ gen người. Do vị trí đặc thù của STR, chúng có độ đa dạng cao về độ dài và trình tự lặp lại mà không ảnh hưởng đến hoạt động sống của con người. STR có tính bảo thủ cao, được truyền từ bố mẹ sang con cái, vì vậy mà các STR khác nhau giữa các cá thể khác nhau không có quan hệ huyết thống trực hệ. STR là các chỉ thị phân tử được ứng dụng rộng rãi trong các phân tích khoa học hình sự, cụ thể là công tác xác định danh tính, là công cụ đắc lực trong các vụ án hình sự phức tạp như cưỡng hiếp tập thể hoặc khi các dấu vết còn sót tại hiện trường không đủ cung cấp thông tin cho công tác điều tra [1], [2]. STR cũng được sử dụng trong nghiên cứu di truyền quần thể hay cho mục đích khảo cổ học. Mỗi một quần thể người đều có những đặc trưng sinh học riêng biệt hình thành trong quá trình sống qua nhiều thế hệ, trong đó ở cấp độ ADN, được thể hiện bằng sự phân bố khác nhau về tần suất allele trong mỗi nhóm dân tộc [3]. Việc thu thập dữ liệu STR các dân tộc sinh sống tại Việt Nam đã và đang được triển khai rộng khắp kể từ những năm 2000. Ngoài ứng dụng trong phân tích gen hình sự, các kết quả khảo sát còn được sử dụng trong nghiên cứu độ đa dạng về mặt nhân chủng học và xây dựng cơ sở dữ liệu về tần số phân bố allele trong quần thể người Việt Nam [4]–[6]. Tuy nhiên, việc thu thập dữ liệu nhiều dân tộc thiểu số vùng cao còn gặp nhiều khó khăn do địa bàn cư trú cách biệt và dân số thấp. Không chỉ vậy, Việt Nam cũng nằm trong vùng địa lý có lịch sử nhân chủng học rất phức tạp, đang còn nhiều tranh cãi về nguồn gốc, con đường hình thành các chủng người hiện đại đang sinh sống đó là khu vực Đông Nam Á [7]–[10]. Do đó nghiên cứu về các quần thể người sinh sống tại Việt Nam nói chung, về người Mông nói riêng còn rất hạn chế và chưa có một nghiên cứu chính thức nào được tiến hành.

Thực trạng đặt ra yêu cầu cấp thiết là phải xây dựng bộ cơ sở dữ liệu

STR cho nhóm dân tộc Mông sinh sống tại Việt Nam nhằm lưu trữ và phục vụ

cho truy xuất nguồn gốc, xác định danh tính trong công tác giám định pháp y,

4

cũng như cho công tác nghiên cứu di truyền học, nhân chủng học và bảo tồn tại

Việt Nam. Do đó, chúng tôi tiến hành thực hiện đề tài: “Xây dựng cơ sở dữ

liệu về tần số allele 22 locus đa hình STR trên nhiễm sắc thể thường ở quần

thể người Mông tại Hà Giang, Việt Nam”, nhằm : i) Xây dựng bộ số liệu tần

số allele của 22 locus đa hình STR trên nhiễm sắc thể thường của người Mông;

ii) Đánh giá các chỉ số thống kê đặc trưng của tần số allele, chỉ số đa dạng di

truyền của quần thể; iii) Xác định mối quan hệ di truyền của người Mông với

các quần thể gần gũi khác.

Ý nghĩa của nghiên cứu : Nghiên cứu cung cấp cơ sở dữ liệu tần số

STR nhiễm sắc thể thường phục vụ cho công tác giám định gen, xác định huyết

thống và nghiên cứu đa dạng di truyền quần thể.

5

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU

1.1. Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR

1.1.1. Short tandem repeat – STR

1.1.1.1. STR là gì

ADN đã được ứng dụng trong thực tế nghiên cứu pháp y từ thế kỉ XX,

đi cùng với sự phát triển của công nghệ giải mã hệ gen người. Trong công tác

giám định pháp y, dấu hiệu sinh học dựa trên ADN cung cấp rất nhiều thông

tin đặc biệt quan trọng và cũng là một bước nhảy của khoa học hình sự. ADN

mang những đặc điểm hóa sinh ưu thế khi mà các dấu vết sinh học khác còn có

thể thu thập được ở hiện trường thường rất ít, bị phân hủy nhanh chóng và tiêu

tốn thời gian. Hàng nghìn vụ án đã được đưa ra ánh sáng với sự hỗ trợ đắc lực

của công nghệ giám định ADN. Hiện nay, đối với giám định ADN trong khoa

học hình sự cả trong và ngoài nước thì các chỉ thị short tandem repeats (STR)

được sử dụng rất phổ biến do dựa trên phản ứng khuếch đại gen – polymerase

Hình 1.1 Các locus thuộc bộ CODIS của FBI và vị trí trên NST người

chain reaction (PCR), có độ đặc hiệu cao cũng như cho phép thực hiện đối với

6

các loại mẫu phức tạp. Điển hình các tổ chức lớn như FBI (Federal Bureau of

Investigation) đã công bố quy trình thường quy cho sử dụng 13 locus STR

(CODIS) (Hình 1.1) hay Interpol cũng xác định bộ 10 locus STR chuẩn cho

nước Anh và các nước Châu Âu cho công tác giám định xác định danh tính.

Tại Việt Nam, việc sử dụng STR trong công tác giám định xác định danh tính

cũng được sử dụng thường quy tại các viện Pháp y trong cả nước.

STR là đoạn trình tự đa hình nằm trong vùng không mã hóa, có cấu trúc

gồm các đoạn lặp lại của một trình tự nt có độ dài khoảng 2 – 7 bp, chiếm

khoảng 3% hệ gen người. Do nằm ngoài vùng mã hóa, các STR rất đa dạng

giữa người với người về độ dài (có thể lên đến hàng nghìn base), trình tự đoạn

lặp mà không ảnh hưởng đến hoạt động sinh học của tế bào. Các đoạn lặp lại

này nằm rải rác ở khắp nơi trong hệ gen của người. Từ những năm 1990 đến

nay đã có hàng chục nghìn STR trên các nhiễm sắc thể (NST) được phát hiện.

Trong quá trình phân bào, các đoạn STR này không bị phân cắt, chúng có tính

bảo thủ cao. Ngoại trừ trường hợp song sinh cùng trứng, số lượng lặp lại của

các STR là độc nhất cho từng cá thể, được di truyền từ bố mẹ sang con cái và

phân biệt các cá thể không có quan hệ huyết thống trực hệ. Do đó các cá thể

này sẽ mang bộ số lượng đoạn lặp lại khác nhau của các STR [1], [2]. Bộ chỉ

thị gồm nhiều các STR nằm trên các nhiễm sắc thể khác nhau cho phép phân

biệt các cá thể riêng biệt, ngay cả với những cá thể có quan hệ họ hàng gần gũi.

Đối với nghiên cứu di truyền quần thể, cơ sở di truyền của nghiên cứu dựa trên

hai định luật căn bản của di truyền học Mendel đó là định luật di truyền phân

ly độc lập và định luật di truyền phân ly. Do đó, các chỉ số về di truyền liên kết

cân bằng và cân bằng Hardy-Weinberg được kiểm định đồng thời các phép tính

thống kê được sử dụng nhằm tăng tính chính xác, giảm sai số trong phân tích

[11]. Trong giám định hình sự, xác định danh tính có thể được hiểu là sự so

sánh hồ sơ ADN của một người nào đó, lấy từ mẫu sinh học vương lại hoặc từ

7

các dấu vết như vết máu tại hiện trường của một vụ án với một người khác có

mối liên quan nhằm xác định danh tính hoặc loại trừ khả năng.

1.1.1.2. Phân loại và danh pháp

STR được phân loại dựa trên số lượng nucleotide được lặp lại, ví dụ

dinucleotide cho 2 nucleotide, trinucleotide cho 3 nucleotide…

Tuy nhiên, STR cũng có thể phân loại bằng một vài cách khác dựa trên tính

phức tạp của trình tự lặp lại. Các STR đơn giản là các STR cấu thành bởi sự lặp

lại của một trình tự nucleotide (ví dụ (GATA)n) hay STR phức là các đoạn được

cấu thành bởi sự lặp lại của 2 hoặc nhiều hơn trình tự nucleotide (ví dụ (CG)m–

(CA)n).

Danh pháp hay tên của từng đoạn STR được đặt theo tên của gen nếu

locus này nằm một phần hoặc nằm toàn bộ trong gen. Ví dụ chỉ thị STR TH01

có nguồn gốc từ tên gen tổng hợp enzym tyrosine hydroxylase của người, nằm

trên NST số 11. Chữ "TH" xuất phát từ chữ cái đầu tyrosine hydroxylase. Phần

"01" của ký hiệu "TH01" xuất phát từ vùng intron 1 của gen tổng hợp enzym

tyrosine hydroxylase. Các trình tự ADN nằm ngoài vùng gen thì được xác định

tên bằng vị trí của chúng trên NST. Ví dụ như locus D5S818 hay DYS19 là các

locus nằm ngoài vùng gen mã hóa, chữ “D” kí hiệu cho ADN, các kí hiệu tiếp

theo lần lượt là NST số 5/ Y cho NST Y; “S” có nghĩa là trình tự chỉ có một

bản copy trên genome; con số cuối tên là thứ tự chỉ thị này được phát hiện và

sắp xếp theo từng NST cụ thể.

1.1.1.3. Các chỉ thị STR thiết yếu

Đối với công tác giám định, việc sử dụng một bộ các chỉ thị theo một

tiêu chuẩn là cần thiết vì sự chính xác và đồng nhất của các kết quả giám định.

Bộ các chỉ thị được sử dụng rộng rãi ngày nay đã được nghiên cứu và phát triển

ở phòng thí nghiệm của tiến sĩ Thomas Caskey tại Trường đại học Y khoa

8

Baylor cùng với viện Forensic Science Service tại Anh thực hiện vào đầu những

năm 1990. Những chỉ thị này được sử dụng nhiều hơn trong các kit xét nghiệm

của hãng Promega (Mỹ) so với kit của hãng Applied Biosystems (Mỹ). Bộ kit

thương mại được đưa ra thị trường đầu tiên được giới thiệu bởi hãng Promega

năm 1994. Đây là bước nhảy lớn cho ứng dụng rộng rãi của STR trong công

tác giám định pháp y. Bộ kit bao gồm các locus CSF1PO, TPOX và TH01, là

các chỉ thị dạng “CTT”. Các chỉ thị triplex thường có chỉ số xác xuất trùng hợp

ngẫu nhiên chỉ khoảng 1/500 nhưng lại được sử dụng rộng rãi tại Mỹ do đây là

bộ kit thương mại đầu tiên cho phép khuếch đại cùng lúc nhiều chỉ thị với chi

phí thấp [11].

Vào năm 1990, Cục điều tra liên bang Mỹ - FBI đã khởi động một sự án

thăm dò trên tổng cộng 14 bang và phòng thí nghiệm liên quan tại địa phương.

Dự án được biết với tên “The DNA Identification Act” nhằm mục đích xây

dựng hệ thống dữ liệu quốc gia cho công tác điều tra án

(https://www.fbi.gov/services/laboratory/biometric-analysis/codis). Năm

1997, một bộ gồm 13 chỉ thị STR đã được chọn cho dự án xây dựng cơ sở dữ

liệu của hệ thống Combined DNA Index System - CODIS. Các chỉ thị bao gồm

các locus CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820,

D8S1179, D13S317, D16S539, D18S51, và D21S11 (Hình 1.1). Với bộ chỉ thị

này, chỉ số trùng hợp ngẫu nhiên đã được nâng lên đến 1/1000000 trên các cá

thể không có mối quan hệ huyết thống. Trong 13 locus thì các locus FGA,

D18S51 và D21S11 có tính đa hình cao nhất. Một locus được sử dụng phổ biến

thì có đặc tính riêng, trên cả số lượng allele, dạng trình tự lặp hay ngay cả các

điểm đa dạng phổ biến quan sát được.

1.1.1.4. Lịch sử nghiên cứu và phát triển của phương pháp giám

định gen trong khoa học hình sự

9

Thuật ngữ “DNA fingerprinting” được miêu tả lần đầu tiên vào năm

1985 bởi nhà di truyền học người Anh Alec Jeffreys. Tiến sĩ Jeffreys đã tìm

thấy các vùng gen nhất định chứa các đoạn trình tự lặp lại tuần tự, nối tiếp nhau

khi nghiên cứu các đoạn phát huỳnh quang gắn đa locus. Ông cũng phát hiện

ra rằng số đoạn lặp lại của các đoạn trình tự đặc biệt kia có tính cá thể cao, khác

nhau giữa các cá thể khác nhau. Bằng cách phát triển một công nghệ giúp kiểm

tra sự đa dạng của các đoạn lặp trên, tiến sĩ Jeffeys đã tạo ra phương thức định

danh người [12]. Phát hiện đó đã mở ra một kỷ nguyên mới trong khoa học.

Công nghệ này không chỉ nâng tầm khả năng ứng dụng trong nhiều lĩnh vực

như sinh học hệ thống, đa dạng sinh học, y học lâm sàng và cả trong khảo cổ

học. Những ứng dụng của công nghệ này đã vượt ra khỏi phạm vi nghiên cứu

khoa học thuần túy khi mà lần đầu tiên ứng dụng thành công trong điều tra án

và chiến tranh bắt đầu từ năm 1987.

Phương pháp xác định dấu vân tay ADN – DNA fingerprinting cổ điển

sử dụng phương pháp cắt enzyme giới hạn (RFLP) và Southern blot. Các đoạn

vi vệ tinh hoặc các đoạn lặp lại được gắn với probe phóng xạ. Liên kết này sẽ

bị phân giải bởi enzyme giới hạn, phân tách thành các đoạn riêng rẽ khi điện di

gel agarose và cố định lên màng bằng lai Southern blot. Do chứa các trình tự

nhận biết bởi enzyme giới hạn ở các vị trí khác nhau trên genome, các đoạn

ADN đích (vi vệ tinh hoặc các đoạn lặp) sẽ bị cắt khỏi genome thành các đoạn

có kích thước khác nhau theo số đơn vị đoạn lặp. Các đoạn này sẽ được rửa và

hiển thị trên phim X-Quang và được dùng để so sánh giữa các cá thể. Các đoạn

vi vệ tinh được gọi là 33,6 và 33,15 được dùng phổ biến ở Anh, phần lớn các

nước khối EU và Hoa Kỳ. Mặt khác, đoạn lặp năm – pentameric (CAC)/(GTG)5

lại được dùng phổ biến tại Đức. Những chỉ thị này cũng được gọi là các probe

đa locus có thể hiện thị được dải 15 - 20 trình tự có kích thước từ 3,5 đến 20

kb. Hình 1.2 là hình ảnh ví dụ một kết quả một bộ hồ sơ ADN của các cá thể

10

trong một gia đình. Tuy nhiên phương pháp này cho thấy một số hạn chế khi

ứng dụng trong điều tra án hoặc các xét nghiệm xác định huyết thống khi mà

điều kiện chạy hoặc chất lượng ADN quyết định rất lớn đến tính chính xác của

các băng ADN hiển thị được. Cho đến giữa những năm 1990, các phòng thí

nghiệm hình sự đã kết hợp với nhau để quy định cách tính các băng ADN dựa

trên các ô thang cố định nhằm khắc phục khó khăn trên. Các ô thang này quy

định tương đối vị trí các đoạn ADN quan sát được trên một ảnh điện di tiêu

chuẩn theo kích thước, từ đó làm tăng khả năng phân biệt của hệ thống. Hạn

chế thứ hai đến từ việc khi hồ sơ ADN không rõ danh tính, có nghĩa là không

rõ nguồn, thì dẫn đến các sai số thống kê do có thể có khả năng các locus di

truyền liên kết với nhau. Thêm nữa, để thu được một bộ hồ sơ ADN hoàn chỉnh

thì cần phải dùng một khối lượng phân tử ADN lớn, dẫn đến làm giảm khả năng

ứng dụng của phương pháp khi mà trên thực tế vụ án thì các mẫu sinh học lưu

lại tại hiện trường thường không lớn hoặc có thể phải xâm hại nhiều vào các

bằng chứng. Phương pháp sử dụng các locus đơn đã ra đời ngay trong năm

1987 nhằm khắc phục các hạn chế của phương pháp ban đầu [13]. Phương pháp

này có cùng nguyên lý hoạt động nhưng sử dụng một bộ gồm bốn locus đơn,

mỗi locus có hai allele. Phương pháp này chỉ cần 10 ng ADN và đã được kiểm

định bởi các thí nghiệm mở rộng và thực tế điều tra án (Hình 1.3). Tuy nhiên,

nhìn chung các phương pháp sử dụng RFLP vẫn mang nhiều hạn chế về độ

nhạy và độ đặc hiệu, cũng như khó có thể so sánh các kết quả từ các phòng thí

nghiệm khác nhau. Sau đó, phương pháp dựa trên PCR đã dần thay thế phương

pháp cũ bởi tính nhạy, tốc độ, và đặc hiệu của nó. Microsatelites – các vi vệ

tinh, được biết tới rộng rãi trong cộng đồng pháp y là các STR, được phát hiện

và trở thành chỉ thị lý tưởng cho các ứng dụng trong pháp y. Hồ sơ STR có độ

nhạy cao hơn so với các phương pháp RFLP đơn locus cũ, ít bị mất allele –

hiện tượng allele dropout như đối với hệ thống sử dụng các tiểu vệ tinh VNTR

và có khả năng phân biệt tốt hơn các phương pháp sử dụng HLA-DQA1. Do

11

đó, số lượng các công bố khoa học về các công nghệ này đã lên tới hàng nghìn,

thực hiện trên hàng trăm quần thể khác nhau, với nhiều công nghệ mới đã được

giới thiệu. Ngày nay, các bộ sinh phẩm được sử dụng đều dùng một panel nhiều

các chỉ thị STR đa allele. Các chỉ thị này có cấu trúc tương tự như các vi vệ

tinh đã được sử dụng nhưng có kích thước ngắn hơn, dễ dàng khuếch đại hơn

bằng PCR. Trong một lần chạy điện di mao quản có thể cùng lúc điện di lên

đến 30 chỉ thị STR khác nhau cho một cá thể [14].

Hình 1.2. Kết quả các băng thu được sau phân giải bằng enzyme giới hạn và lai Southern của một đại gia đình

12

Hình 1.3. Kết quả thu được so sánh giữa hai phương pháp sử dụng nhiều locus và các đơn

locus dựa trên phương pháp RFLP

13

Hình 1.4 là hình ảnh điển hình cho một kết quả điện di mao quản các locus

Hình 1.4. Hình ảnh kết quả điện di mao quản của một số locus sử dựng phương pháp PCR và

gắn huỳnh quang trên mỗi locus

STR gắn hình quang và được đo đếm bằng số đoạn lặp.

14

1.1.1.5. Đột biến ở STR

Các chỉ thị STR được dùng cho định danh cá thể một phần bởi đặc tính

có tốc độ đột biến nhanh. Trong khi một trình tự ADN điển hình trên genome

thường có tốc độ đột biến rất thấp, khoảng 10-9 nt trong một thế hệ, thì STR

thường có tốc độ đột biến trong khoảng 10-6 đến 10-2 trong một thế hệ [15],

[16]. Đối với mỗi loại sinh vật thì có tốc độ đột biến của STR là khác nhau

trong môi trường phòng thí nghiệm. Ví dụ, tốc độ đột biến STR của 1 tế bào

nấm men là 10-5, còn ở người thì trong khoảng 10-5 đến 10-3 trên mỗi chu kỳ

phân bào. Nghiên cứu của Chakraborty et al. (1997) [17] chỉ ra rằng, tốc độ đột

biến khác nhau ở các locus khác nhau trên cùng một genome. Nghiên cứu trên

các bộ STR khác nhau là di-, tri- và tetranucleotide STR trên một số quần thể

người cho thấy, các locus STR có tốc độ đột biến tỉ lệ nghịch với loại motif.

Các locus dạng di- có tốc độ đột biến cao gấp từ 1.5 đến 2 lần so với các tetra-

STR. Tuy nhiên, điều này lại ngược lại ở các STR liên quan đến một tình trạng

bệnh lý nào đó [17]. Đã có nhiều nghiên cứu được tiến hành để ước lượng tốc

độ đột biến của các STR trên các mô hình khác nhau: mô hình gia đình, mô

hình sinh học, mô hình quần thể và các dòng tế bào sinh dục [18]. Trong đó,

mô hình gia đình là dễ dàng ước lượng trực tiếp tốc độ đột biến các STR giữa

các cá thể qua thế hệ, cũng như dạng đột biến xuất hiện có thể có mà được di

truyền từ bố mẹ sang con cái. Tốc độ đột biến của một số chỉ thị STR thường

dùng hiện hay được cho trong Bảng 1.1 (https://strbase.nist.gov/mutation.htm).

Có ba cơ chế chính giải thích cho quá trình xảy ra đột biến của STR. Cơ chế

thứ nhất đó là sự phân li không cân bằng trong quá trình giảm phân. Đây là cơ

chế được biết đến rộng rãi là nguyên nhân dẫn đến các đoạn ADN vệ tinh lớn,

xảy ra trong quá trình trao đổi chéo giữa hai vùng tương đồng của các sợi NST.

Cơ chế thứ hai được cho là do sự phiên mã ngược xảy ra chủ yếu ở các STR

giàu adenin, xảy ra dưới cơ chế phiên mã ngược kéo dài đầu 3’ của sợi ADN,

15

tương tự như sự tạo thành của đuôi polyA trong quá trình phiên mã gen. Nghiên

cứu cũng cho thấy có bằng chứng chỉ ra rằng có mối liên hệ giữa STR giàu A

Bảng 1.1.. Thông tin về vị trí và tốc độ đột biến của một số locus thường dùng theo cơ sở dữ liệu STRbase (https://strbase.nist.gov/mutation.htm)

Phần trăm giảm

Tổng số đột

Phần trăm giảm phân

STR locus

Tốc độ đột biến

phân theo dòng mẹ

biến theo mỗi

theo dòng cha (%)

(%)

dòng

CSF1PO

95/304,307 (0.03)

982/643,118 (0.15)

1,487/947,425

0.16%

FGA

205/408,230 (0.05)

2,210/692,776 (0.32)

3,125/1,101,006

0.28%

TH01

31/327,172 (0.009)

41/452,382 (0.009)

100/779,554

0.01%

TPOX

18/400,061 (0.004)

54/457,420 (0.012)

100/857,481

0.01%

VWA

184/564,398 (0.03)

1,482/873,547 (0.17)

2,480/1,437,945

0.17%

D3S1358

60/405,452 (0.015)

713/558,836 (0.13)

1,152/964,288

0.12%

D5S818

111/451,736 (0.025)

763/655,603 (0.12)

1,259/1,107,339

0.11%

D7S820

59/440,562 (0.013)

745/644,743 (0.12)

1,089/1,085,305

0.10%

D8S1179

96/409,869 (0.02)

779/489,968 (0.16)

1,239/899,837

0.14%

D13S317

192/482,136 (0.04)

881/621,146 (0.14)

1,558/1,103,282

0.14%

D16S539

129/467,774 (0.03)

540/494,465 (0.11)

1,041/962,239

0.11%

D18S51

186/296,244 (0.06)

1,094/494,098 (0.22)

1,746/790,342

0.22%

D21S11

464/435,388 (0.11)

772/526,708 (0.15)

1,816/962,096

0.19%

Penta D

12/18,701 (0.06)

21/22,501 (0.09)

57/41,202

0.14%

với các gen nhảy [18].

Penta E

29/44,311 (0.065)

75/55,719 (0.135)

163/100,030

0.16%

D2S1338

15/72,830 (0.021)

157/152,310 (0.10)

262/225,140

0.12%

D19S433

38/70,001 (0.05)

78/103,489 (0.075)

187/173,490

0.11%

SE33 (ACTBP2)

0/330 (<0.30)

330/51,610 (0.64)

330/51,940

0.64%

16

Cơ chế thứ ba là cơ chế gấp đoạn khi tái bản – strand-slippage replication. Đây

là cơ chế chính được cho là gây ra đột biến STR. Quá trình tạo ra đột biến được

miêu tả qua Hình 1.5 khi tái bản sợi ADN, một đoạn khuôn tái bản bị gấp khúc

do nguyên nhân lý hóa nào đó, dẫn đến khung đọc mở bị thay đổi là dài hơn

hoặc ngắn đi, và bị ADN polymerase tổng hợp thêm hoặc bớt nt từ đó sinh ra

Hình 1.5. Cơ chế sinh đột biến STR do gấp đoạn trong quá trình nhân bản. Vì một lí do nào đó dẫn đến khung đọc mở bị gấp khúc, tạo thành nếp gấp mà polymerase không tổng hợp hoặc tổng hợp nhiều hơn so với trình tự trên khung, từ đó sinh ra đột biến thay đổi số đoạn lặp trên sợi ADN mới tổng hợp.

sự thay đổi số đoạn lặp của một locus STR [18].

Mô hình đột biến STR bao gồm: mô hình Infinite allele model (IAM) và

Stepwise mutation model (SMM), các mô hình này được sử dụng trong quá

17

trình nghiên cứu di truyền các chỉ thị STR và trong tính toán thống kê. Mô hình

IAM được đề xuất năm 1964 bởi hai nhà khoa học Kimura và Crow. Mô hình

dựa trên việc coi rằng mỗi đột biến sản sinh ra một allele mới và các đột biến

xảy ra với tỉ lệ như nhau. Từ đó, số đoạn lặp có thể là bất cứ một con số nào

mà trước đó không tồn tại trong quần thể ban đầu. Tuy nhiên, đã có nhiều

nghiên cứu chỉ ra rằng mô hình này không phù hợp với quá trình phát sinh đột

biến trong thực tế [18]. Chính vì vậy mà mô hình này ít được sử dụng trong các

phần mềm phân tích di truyền quần thể. Mô hình SMM được hai nhà khoa học

Kimura và Ota giới thiệu năm 1973, 9 năm sau mô hình thứ nhất. Ban đầu, mô

hình này được xây dựng để mô phỏng sự thay đổi điện tích của các phân tử

protein trong quá trình điện di phân tách, tuy nhiên lại không cho thấy hiệu quả.

Mặc dù vậy, mô hình này lại hoàn toàn phù hợp cho miêu tả sự đột biến của

các STR và được sử dụng rộng rãi trong các phân tích di truyền. Mô hình SMM

chấp nhận cơ chế đột biến gấp đoạn trong quá trình tái bản, và coi rằng:

- Đột biến làm thay đổi nhỏ trên số đoạn lặp - Sự tăng hay giảm số đoạn lặp có khả năng xảy ra như nhau - Không bị giới hạn ở kích thước allele - Tốc độ và kích thước của đột biến không phụ thuộc vào số đoạn lặp

Có rất nhiều yếu tố ảnh hưởng đến quá trình phát sinh đột biến ở STR.

Một trong những yếu tố quan trọng đó là số đoạn lặp lại của một locus STR.

Như có đề cập ở phần trước, từ các nghiên cứu dựa trên các mô hình tiếp cận

khác nhau từ mô hình gia đình hay quần thể, đều cho thấy tốc độ đột biến tăng

tỉ lệ thuận với số lượng đoạn lặp ở các loài động vật có vú, bao gồm con người.

Có nghĩa là, khi số lượng đoạn lặp càng lớn thì tốc độ đột biến của locus đó

càng lớn. Một yếu tố khác đó là số nt của một đơn vị lặp, các dinucleotide có

tốc độc đột biến cao hơn só với các tetranucleotide. Kết quả này cũng có thể

được giải thích bằng cơ chế gấp đoạn tái bản sinh đột biến. Cấu trúc của các

18

đơn vị lặp cũng ảnh hưởng đến tốc độ đột biến, khi mà ở NST thường, NST Y

hay ở các tế bào ung thư thì có tần số đột biến cao hơn ở các đoạn dị thể. Các

đoạn trình tự nối – flanking sequence cũng có mối tương quan tới tốc độ đột

biến khi mà quan sát thấy các đoạn trình tự nối chứa nhiều GC tỉ lệ nghịch với

sự đa dạng của các allele. Các yếu tố khác như sự tái tổ hợp trong quá trình

hình thành giao tử, độ tuổi hay giới tính cũng ảnh hưởng đến tốc độ đột biến

của các STR [18], [19].

1.1.2. Bộ kit Powerplex Fusion system được sử dụng trong giám định

Công nghệ STR typing sử dụng điện di mao quản cho phép khuếch đại

và phân tích cùng lúc nhiều chỉ thị STR. Các chỉ thị phân biệt bởi độ dài đoạn

đọc cùng với tín hiệu quang phân tử gắn trên các trình tự mồi của phản ứng

khuếch đại, từ đó quy đổi ra số lần lặp – STR allele của mỗi locus (Hình 1.6).

Việc quy đổi dựa trên một thang allele chuẩn thường được cung cấp cùng với

mỗi bộ kit xét nghiệm. Thang chuẩn được khuếch đại cùng với một bộ mồi như

đối với mẫu xét nghiệm. Phần mềm phân tích sẽ xử lý tín hiệu quang và thực

hiện việc quy đổi ra kích thước của từng allele theo từng “bin” – ô thang chuẩn.

Cách gọi tên và quy định allele phải theo bộ quy chuẩn chung. Mỗi ô thang

chuẩn có kích thước ± 0,5 bp quanh kích thước tiêu chuẩn của thang chuẩn, do

đó có thể phân biệt các kích thước chênh lệch nhau 1 bp [11].

Xuất phát từ hiệu quả thực tế ứng dụng của STR mà đã có rất nhiều bộ

kit thương mại được nghiên cứu, phát triển sử dụng đơn hoặc multiplex PCR

cho khuếch địa cùng lúc nhiều chỉ thị STR trong một thí nghiệm, qua công nghệ

giải trình tự Sanger và cả giải trình tự thế hệ mới (NGS). Từ cuối những năm

1990 thì các STR đã có thể được khuếch đại cùng lúc nhiều chỉ thị, từ một vài

lên đến 15 locus trong một phản ứng, với tính chính xác, độ nhạy cao và nhanh

19

chóng. Các bộ kit thương mại đều bao gồm 13 locus CODIS tiêu chuẩn cho

Hình 1. 6. Quá trình xác định kích thước của một allele dựa trên ô thang chuẩn. Thang allele chuẩn sẽ được chạy song song với mẫu, sau đó các tín hiệu huỳnh quang phân tách được của mẫu và thang allele chuẩn sẽ so với các ô thang chuẩn, từ đó xác định được các allele của mẫu

giám định của Mỹ và thêm các chỉ thị khác tùy vào thực tế của từng khu vực.

Bộ kit PowerPlex® Fusion System của hãng Promega cho phép khuếch

đại và phân tích cùng lúc 24 locus (Bảng 1.2) nhằm cải thiện tốc độ, tính chính

xác và khả năng phân biệt cá thể của phương pháp. Do đó, dựa trên đánh giá từ

thực tế ứng dụng, bộ kit hoàn toàn phù hợp cho công tác giám định pháp y trên

Bảng 1.2. Thông tin về vị trí và trình tự của một đơn vị lặp của các locus có trong bộ kit PowerPlex Fusion System theo thông tin của nhà sản xuất

thực tế [20].

STR Locus

Vị trí trên NST và kích thước Trình tự đoạn lặp lại theo chiều 5' -> 3'

Amelogenin3

Xp22.1–22.3 and Y

NA

D3S1358

3p21.31 (45.557Mb)

TCTA phức

D1S1656

1q42 (228.972Mb)

TAGA phức

D2S441

2p14 (68.214Mb)

TCTA

D10S1248

10q26.3 (130.567Mb)

GGAA

D13S317

13q31.1 (81.62Mb)

TATC

Penta E

15q26.2 (95.175Mb)

AAAGA

D16S539

16q24.1 (84.944Mb)

GATA

D18S51

18q21.33 (59.1Mb)

AGAA (19)

D2S1338

2q35 (218.705Mb)

TGCC/TTCC

CSF1PO

5q33.1 (149.436Mb)

AGAT

Penta D

21q22.3 (43.88Mb)

AAAGA

TH01

11p15.5 (2.149Mb)

AATG (19)

vWA

12p13.31 (5.963Mb)

TCTA phức (19)

D21S11

21q21.1 (19.476Mb)

TCTA phức (19)

D7S820

7q21.11 (83.433Mb)

GATA

D5S818

5q23.2 (123.139Mb)

AGAT

TPOX

2p25.3 (1.472Mb)

AATG

DYS391

Y

TCTA

D8S1179

8q24.13 (125.976Mb)

TCTA phức (19)

D12S391

12p12 (12.341Mb)

AGAT/AGAC phức

20

D19S433

19q12 (35.109Mb)

AAGG phức

FGA

4q28 (155.866Mb)

TTTC phức (19)

D22S1045

22q12.3 (35.779Mb)

ATT

21

1.1.3. Cơ sở dữ liệu tần số STR

Một cơ sở dữ liệu tần số STR là một bảng gồm các giá trị tương đối của

các allele của từng locus trong một quần thể cụ thể.

Các cơ sở dữ liệu tần số STR của một quần thể người được xây dựng cho

việc đánh giá và phân tích. Dựa trên các cơ sở dữ liệu có thể truy xuất từ một

bộ hồ sơ ADN của một người nào đó về thông tin nguồn gốc, chủng tộc của

người này. Một cơ sở dữ liệu phải được xây dựng trên một kích thước mẫu đủ

lớn nhằm đảm bảo giảm sai số do kích thước mẫu. Mục đích lớn nhất của việc

xây dựng cơ sở dữ liệu nhằm tạo dựng bộ thông tin di truyền của một quần thể

về các allele phổ biến trong quần thể đó. Chính vì vậy đã có rất nhiều quốc gia

xây dựng các bộ cơ sở dữ liệu lớn cho toàn bộ các nhóm dân của họ như Mỹ,

Anh, Hà Lan, Nhật Bản, Hàn Quốc, Trung Quốc… [21], [22].

1.1.4. Di truyền quần thể và dân tộc

Dân tộc và đặc điểm chung của các dân tộc tại Việt Nam

1.1.4.1.

Dân tộc – tộc người là một cộng đồng người có mối liên hệ chặt chẽ, bền

vững, có sinh hoạt kinh tế chung, có ngôn ngữ riêng và những nét văn hóa đặc

thù, xuất hiện sau bộ lạc, bộ tộc và tạo thành một quần thể sinh học. Việt Nam

là ngôi nhà chung của 54 dân tộc anh em. Sống trên mảnh đất Đông Dương -

nơi cửa ngõ nối Đông Nam Á lục địa với Đông Nam Á hải đảo, Việt Nam là

nơi giao lưu của các nền văn hoá trong khu vực. Đáng chú ý là, lịch sử nguồn

22

gốc hình thành các dân tộc ở khu vực này rất phức tạp và vẫn còn gây nhiều

tranh cãi trong giới khoa học cho đến thời điểm hiện tại [8], [9]. Tiếng nói của

các dân tộc Việt Nam thuộc 8 nhóm ngôn ngữ khác nhau:

- Nhóm Việt - Mường có 4 dân tộc là: Chứt, Kinh, Mường, Thổ.

- Nhóm Tày - Thái có 8 dân tộc là: Bố Y, Giáy, Lào, Lự, Nùng, Sán

Chay, Tày, Thái.

- Nhóm Môn - Khmer có 21 dân tộc là: Ba na, Brâu, Bru-Vân kiều,

Chơ-ro, Co, Cơ-ho, Cơ-tu, Gié-triêng, Hrê, Kháng, Khmer, Khơ mú,

Mạ, Mảng, M'Nông, Ơ-đu, Rơ-măm, Tà-ôi, Xinh-mun, Xơ-đăng,

Xtiêng.

- Nhóm Mông - Dao có 3 dân tộc là: Dao, Mông, Pà Thẻn.

- Nhóm Kađai có 4 dân tộc là: Cờ Lao, La Chí, La Ha, Pu Péo.

- Nhóm Nam đảo có 5 dân tộc là: Chăm, Chu-Ru, Ê Đê, Gia-Rai, Ra-

Glai.

- Nhóm Hán có 3 dân tộc là: Hoa, Ngái, Sán Dìu.

- Nhóm Tạng có 6 dân tộc là: Cống, Hà Nhì, La Hủ, Lô Lô, Phù Lá, Si

La.

Mặc dù tiếng nói của các dân tộc thuộc nhiều nhóm ngôn ngữ khác nhau,

song do các dân tộc sống rất xen kẽ với nhau nên một dân tộc thường biết tiếng

các dân tộc có quan hệ hàng ngày, và dù sống xen kẽ với nhau, giao lưu văn

hoá với nhau, nhưng các dân tộc vẫn lưu giữ được bản sắc văn hoá riêng của

dân tộc mình (Ủy ban dân tộc).Trong nghiên cứu này, chúng tôi dựa vào quy

định của Nhà nước Cộng hòa xã hội chủ nghĩa Việt Nam, công nhận một người

thuộc về dân tộc Mông dựa vào giấy khai sinh và sơ yếu lý lịch của người đó.

Đặc trưng các dân tộc ở Việt Nam là có lối sống quần tụ, làng xã, tập trung trên

một khu vực sinh sống nhất định, nên tần suất các allele của mỗi loci gen là

tương đối ổn định và có thể mang tính đặc trưng vùng, miền.

1.1.4.2. Các nhóm ngữ hệ tại Việt Nam

23

Ở Việt Nam, có đủ 5 ngữ hệ lớn trong khu vực Đông Nam Á, gồm: ngữ hệ

Nam Đảo, Nam Á, Thái – Kadai, Hán - Tạng và Mông - Dao. Các nhóm ngữ

hệ này sinh sống cùng nhau trên khắp cả nước và có sự pha trộn vốn gen với

nhau [23].

1.1.4.3. Dân tộc Mông tại Việt Nam

Dân tộc Mông là một dân tộc thiểu số trong tổng số 54 dân tộc anh em

sinh sống tại Việt Nam. Người Mông có nhiều nhóm nhỏ với tên gọi riêng, bao

gồm: Mông Ðơ (Mông Trắng), Mông Lềnh (Mông Hoa), Mông Sí (Mông Ðỏ),

Mông Ðú (Mông Ðen), Mông Súa (Mông Mán). Người Mông sử dụng nhóm

ngôn ngữ H’mông-Dao, một trong năm nhóm ngôn ngữ lớn nhất tại khu vực

Đông Nam Á. Họ sinh sống tập trung ở miền núi cao thuộc các tỉnh Hà Giang,

Tuyên Quang, Lào Cai, Yên Bái, Lai Châu, Sơn La, Cao Bằng, Nghệ An (hình

1.7) [24]. Theo số liệu của Tổng cục điều tra dân số và nhà ở năm 2009, ở Việt

Nam hiện có khoảng 1.068.189 người Mông sinh sống tại đây, đông dân thứ 6

tại Việt Nam. Dân tộc Mông có mặt ở hầu hết các tỉnh thành của Việt Nam,

nhưng tập trung chủ yếu ở các tỉnh Hà Giang (231,464 người, chiếm 21,7%

trên tổng số người Mông tại Việt Nam), theo sau là tại các tỉnh Điện Biên

(170.648 người), Sơn La (157.253 người) và các tỉnh khác. Người Mông có tập

quán tự do kén chọn bạn đời, nổi tiếng với tục “cướp vợ”. Do đó mà những

người cùng dòng họ không lấy nhau, vì vậy ít bị ảnh hưởng bởi hôn nhân cận

huyết như một số nhóm dân tộc thiểu số khác [24].

Hình 1.7. Sự phân bố các nhánh ngôn ngữ thuộc hệ Mông - Dao tại Việt Nam. Trong đó,

Hmong Daw tương ứng với nhóm Mông Trắng, Hmong Dô tương ứng với Mông Đỏ hay Hmong Don tương ứng với Mông Đen theo phân loại về ngôn ngữ và dân tộc học tại Việt Nam

24

1.2. Tình hình nghiên cứu trong và ngoài nước

Trong thời gian gần đây, tình trạng vi phạm pháp luật trong vùng đồng

bào dân tộc người thiểu số ở địa bàn miền núi, vùng xa có chiều hướng gia tăng

cả về số lượng và mức độ nghiêm trọng. Tuy nhiên, cơ sở dữ liệu STR cho từng

dân tộc sinh sống tại Việt Nam vẫn còn rất nhiều hạn chế. Hiện tại, Viện Khoa

học hình sự - Bộ Công an đang sử dụng bộ kit nhân gen AmpFlSTR®

Identifiler® Plus trong công tác giám định Sinh học pháp lý, sử dụng tần suất

allele của người Kinh, các tộc người khác chưa được chính thức sử dụng. Ngoài

người Kinh [25], [26], một số ít nghiên cứu trong nước được tiến hành trên các

dân tộc thiểu số là người Mường ở Hòa Bình [27], người Kh’mer tại Sóc Trăng

[28], người Nùng [29] và người Mông [30]. Và chỉ một vài nghiên cứu quốc

tế về quần thể người sinh sống tại Việt Nam của Shimada et al. (2002) tính tần

25

số của 178 người Kinh [5], chủ yếu sinh sống tại Hà Nội, hay trong một nghiên

cứu về quần thể người gốc Việt sinh sống tại tỉnh Vân Nam, Trung Quốc [6].

Đến gần đây, nhóm nghiên cứu của Tran et al. (2019) lần đầu tiên công bố

quốc tế bộ số liệu tần số allele cho 22 locus STR trên NST thường của hơn

2000 mẫu là người Kinh sinh sống tại Việt Nam [4]. Nghiên cứu này đã đưa ra

mối tương quan di truyền giữa người Kinh sinh sống tại Việt Nam với các quần

Hình 1.8. Cây phát sinh chủng loại miêu tả mối quan hệ di truyền gần gũi giữa quần thể

người Kinh và một số quần thể khác [4]

thể sinh sống tại các nước láng giềng qua cây phát sinh chủng loại (hình 1.8).

26

CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1. Nguyên vật liệu

2.1.1. Địa điểm thu mẫu

Mẫu được thu tại 2 huyện Mèo Vạc và Đồng Văn của tỉnh Hà Giang, Việt

Nam (Hình 2.1). Đây là 2 huyện nằm về phía cực bắc của Tổ quốc, có đường

biên giới Việt –Trung trải dài. Địa hình nơi đây chủ yếu là núi cao, dân cư thưa

Hình 2.1. Bản đồ hành chính tỉnh Hà Giang

thớt và nằm dải rác khắp các sườn núi.

27

2.1.2. Thu thập và bảo quản

Tổng cộng 156 mẫu, trong đó có 53 mẫu thu được tại huyện Mèo Vạc,

103 mẫu thu được tại huyện Đồng Văn, tỉnh Hà Giang. Tỉ lệ số mẫu là nam

giới trên mẫu là nữ giới là 63/93. Mẫu của các cá thể là dân tộc Mông sinh sống

tại Việt Nam, không có quan hệ huyết thống trực hệ liên tiếp ba đời gần nhất.

Mẫu thu có thể một trong ba loại, tùy thuộc vào điều kiện thu mẫu, gồm: mẫu

máu ngoại vi, tóc hoặc niêm mạc miệng. Đối với mẫu máu, mẫu được thu bằng

thẻ FTA chuyên dụng kích thước 2×2 mm. Đối với tóc, mẫu thu từ 3 đến 5 sợi

tóc có chân và bảo quản trong phong bì riêng biệt, được đánh số ký tự lưu mẫu.

Đối với mẫu niêm mạc, mẫu được thu bằng tăm bông y tế chuyên dụng. Việc

thu thập mẫu được căn cứ theo hồ sơ nhân thân được cung cấp bởi Công an các

quận, huyện trực thuộc các tỉnh, thành phố. Các mẫu thu thập được lưu trữ tại

Trung tâm giám định ADN, Viện Công nghệ sinh học.

2.2. Phương pháp nghiên cứu

2.2.1. Khuếch đại đoạn gen

2.2.1.1. Bộ kit sử dụng

Bộ kit khuếch đại 24 locus (22 locus trên NST thường và 2 locus trên

NST giới tính) sử dụng bộ kit Power plex Fusion System (Promega, Mỹ). Bộ

kit này cho phép khuếch đại cùng lúc 24 locus khác nhau trong cùng một phản

ứng. Bộ kit đã bao gồm 13 locus trong bộ CODIS của FBI (CSF1PO, FGA,

TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317,

D16S539, D18S51, D21S11) và bộ chỉ thị theo khuyến cáo của châu Âu là

(TH01, vWA, FGA, D21S11, D3S1358, D8S1179, D18S51, D10S1248,

D22S1045, D2S441, D1S1656, D12S391), hai loci Amelogenin và DY391 cho

xác định giới tính (Hình 2.2). Độ nhạy của kit là 100 pg theo thông tin của hãng

28

sản xuất. Các locus Penta D và Penta E được sử dụng nhằm tăng khả năng phân

biệt giữa các cá thể của bộ locus STR. Như vậy, bộ STR được sử dụng đảm bảo

Hình 2.2. Độ dài và loại dye được sử dụng cho mỗi locus trong bộ kit

được cả hai khuyến cáo của FBI và ESS.

2.2.1.2. Xử lý mẫu và khuếch đại đoạn gen

a) Xử lý mẫu:

Đối với mẫu máu thu bằng thẻ FTA, dùng kéo đã qua xử lý làm sạch cắt

lấy một hoặc hai mảnh giấy kích thước khoảng 1,2 mm trong vùng thấm máu

từ thẻ. Mẫu được thu trong ống nghiệm để tiến hành khuếch đại. Tương tự đối

với mẫu niêm mạc miệng, thu lấy một mảnh quanh miếng bông. Đối với mẫu

tóc, tóc được cắt lấy phần gốc tóc, cách chân tóc 0,5 cm.

Các mẫu sẽ được ly giải bằng SwabSolution Kit (Promega, Mỹ) theo

hướng dẫn của nhà sản xuất. Dịch thu được sẽ được sử dụng làm khuôn cho

phản ứng khuếch đại tiếp theo.

b) Phản ứng khuếch đại

Thành phần phản ứng được cho trong bảng 2.1 như sau:

Bảng 2. Bảng thành phần phản ứng khuếch đại

29

Thành phần

Thể tích

Nước dùng cho PCR

15,0 µL

PowerPlex Fusion 5X Master Mix

5,0 µL

PowerPlex Fusion 5X Primer Pair Mix

5,0 µL

Mẫu

25 µL

Tổng thể tích

Mỗi lượt chạy là 8 mẫu, bao gồm 1 mẫu là thang chuẩn của kit và 1 mẫu

là đối chứng dương. Mẫu đối chứng dương là mẫu sử dụng ADN chuẩn cung

cấp theo bộ kit là 2800M Control ADN nhằm kiểm tra hiệu quả khuếch đại.

Hình 2.3. Chu trình nhiệt của phản ứng khuếch đại với 28 chu kỳ

Mẫu sẽ được khuếch đại 28 chu kỳ với quy trình như hình dưới (Hình 2.3).

Phản ứng nhiệt diễn ra trên hệ máy ProFlex 3x32-Well PCR System

(Applied Biosystems-ThermoFisher, Mỹ).

c) Điện di mao quản

Các sản phẩm PCR được đánh dấu bằng được đánh dấu bằng hệ màu 6

kênh cho phép tối ưu hóa hiệu quả phân tích. Sản phẩm khuếch đại được điện

30

di và phân tích trên máy giải trình tự gen ABI 3500 Genetic Analyzer với phần

mềm GeneMapper ID v3.2, sử dụng kích thước chuẩn (GeneScan-600 LIZ,

Applied Biosystems, Mỹ) và thang alen chuẩn được nhà sản xuất cung cấp theo

Power plex Fusion System (Promega, Mỹ). Quy chuẩn gọi đỉnh mẫu và kiểm

định kết quả theo khuyến cáo của tổ chức SWGDAM về giám định STR

(“SWGDAM Interpretation Guidelines for Autosomal STR Typing by Forensic

DNA Testing Laboratories,” 2017).

2.2.2. Tính toán tần số và các chỉ số pháp y

2.2.2.1. Tính toán tần số và các chỉ số pháp y

Tần số xuất hiện của các allele, chỉ số đa dạng di truyền, Heterozygosity

expected, Heterozygosity observed, Homozygosity, Cân bằng Hardy-

Weinberg và linkage – disequilibrium test (p=0.002) tính bằng phần mềm

Arlequin v3.5 (Excoffier and Lischer 2010), chỉ số kết hợp khả năng loại trừ

(Combined Power of Exclusion – CPE), chỉ số kết hợp khả năng phân biệt

(Combined Discrimination Capacity – CDC), chỉ số kết hợp khả năng trùng

lặp ngẫu nhiên (Combinded Match Probability – CMP), Polymorphic

information content, Parentity index của từng locus, được tính bằng công cụ

online FORSTAT (https://fdl-uwc.shinyapps.io/forstat/)

2.2.2.2. Xác định và liệt kê các allele có tần số thấp

Các allele có tần số thấp là các allele có tần số hơn 5/2N [33], trong đó

N là kích thước mẫu. Một allele tồn tại trong quần thể có số lần xuất hiện tối

thiểu phải năm lần, do đó công thức tính tần số allele tối thiểu là 5/2N [33].

31

2.2.3. Xác định mối liên hệ giữa quần thể người Mông tại Hà Giang và các

quần thể khác

Cây phát sinh chủng loại được xây dựng bằng phần mềm POPTREE2

[34] để tính khoảng cách di truyền và xây dựng cây phát sinh chủng loại của

các quần thể bằng cách sử dụng phương pháp neighbor joining-NJ [35], cùng

với phương pháp nhóm theo cặp với giá trị khoảng cách trung bình không theo

trọng số (UPGMA) [36] và lặp lại với bootstrap 1000. File xuất ra được xử lý

hình ảnh bằng phần mềm Figtree v1.4.

32

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN

3.1. Kết quả thu mẫu và khuếch đại ADN

Tổng số mẫu thu được là 156 mẫu, trong đó có 63 mẫu nam giới và 93

mẫu nữ giới. Các mẫu đều có chất lượng tốt, đủ điều kiện để thực hiện các thí

nghiệm. Do sử dụng phương pháp khuếch đại trực tiếp từ mẫu sinh phẩm, nên

không có sản phẩm ADN tách chiết, do đó cũng không đánh giá định lượng

ADN. Tuy nhiên, chất lượng mẫu thể hiện ở hiệu quả khuếch đại bộ 24 locus

trong bộ kit thương mại được sử dụng là Power plex Fusion System (Promega,

Mỹ), đó là khuếch đại thành công 156 bộ hồ sơ ADN 24 locus và không ghi

nhận trường hợp bị mất allele – allele drop out nào, cũng không có trường hợp

3 allele – tri allele trên một locus. Mỗi một lượt chạy có kèm theo các phản ứng

đối chứng dương và đối chứng âm, kết quả trong phần phụ lục. Bảng 3.1 thống

kê số allele khác nhau thu được và phần trăm số allele bị mất trên từng locus từ

các mẫu nghiên cứu. Tổng số khuếch đại được 205 allele không kể Amelogenin

và DY391, các allele có độ dài nhỏ nhất là 5 (locus Penta E) và dài nhất là 34.2

(locus D21S11). Số lượng các allele phát hiện được ít hơn số với 252 allele thu

được từ quần thể người Kinh tại Việt Nam, khi hai nghiên cứu sử dụng cùng

một bộ kit STR [4]. Sự khác nhau cũng quan sát được về độ dài ngắn nhất và

dài nhất của các locus. Sự khác biệt này có thể từ khác biệt về quần thể người

cũng có thể do sự chênh lệch về kích thước mẫu được thực hiện. Locus Penta

E là locus có số lượng allele là lớn nhất với 16 allele khác nhau, theo sau là

locus D2S1338 (13 allele), D1S1656 và D18S51 với 12 allele. Mặt khác, các

locus có số allele thấp nhất là TPOX với 5 allele. Locus Penta E nằm trên NST

số 15, tại vị trí 15q26.2, có trình tự đơn vị lặp là [AAAGA]n, số đoạn lặp n có

thể từ 5 đến 26 đặc trưng cho từng chủng người

(https://strbase.nist.gov/str_Penta_E.htm ). Một số nghiên cứu đã sử chỉ thị này

33

để nghiên cứu đa dạng ở quần thể người hoặc đánh giá tính đa hình của Penta

E và thấy rằng chỉ thị này có tính đa hình cao, khả năng phân biệt cá thể cao,

và là một chỉ thỉ phù hợp cho nghiên cứu tìm kiếm allele hiếm do tính đa hình

Bảng 3.1. Số lượng allele mỗi locus

cao của nó.

Locus

Số lượng

Phần trăm allele bị mất

D3S1358

6

0

D1S1656

12

0

D2S441 D10S1248 D13S317 Penta E D16S539 D18S51 D2S1338 CSF1PO Penta D TH01 vWA D21S11 D7S820 D5S818 TPOX D8S1179 D12S391 D19S433 FGA D22S1045

8 7 8 16 8 12 13 6 9 6 7 10 8 8 5 9 10 12 16 9

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Từ kết quả trên cho thấy, việc sử dụng các phương pháp thu mẫu là phù

hợp với điều kiện thực tế tại Việt Nam, có thể sử dụng trong quy mô thu mẫu

rộng như điều tra xây dựng cơ sở dữ liệu STR toàn quốc trong tương lai. Đối

với mỗi loại mẫu có một vật liệu thu mẫu phù hợp như mẫu máu thu bằng thẻ

FTA, mẫu tóc thì chỉ cần thu thập 3 đến 5 sợi và mẫu niêm mạc miệng thu bằng

34

tăm bông y tế. Các mẫu trên có thể bảo quản ở nhiệt độ -20oC trong vòng vài

tháng, dễ dàng vận chuyển và vẫn đảm bảo đủ chất lượng cho phân tích STR.

3.2. Kết quả tính tần số các locus và xác định các allele có tần số thấp

Các hồ sơ của toàn bộ 156 hồ sơ được tập hợp trong một bảng tính, và

nhằm đảm bảo không có sai sót trong quá trình tính toán, tần số và các chỉ thị

liên quan đều được thực hiện bằng phần mềm phân tích chuyên biệt như đã mô

tả trong phần phương pháp. Bảng tần số các allele được cho Bảng 3.2.

Cách gọi tên allele theo quy chuẩn của tổ chức Scientific Working Group

on ADN Analysis Methods (SWGDAM) về giám định STR. Một số allele có

kích thước thập phân như allele 9.1 của locus D2S441 do allele không có số

lần lặp lại của một đơn vị lặp hoàn chỉnh, chỉ lặp một phần hoặc có kích thước

vùng trình tự hai đầu khác nhau. Các allele này sẽ được quy định gọi tên theo

kích thước của STR [11].

Bảng 3.2. Bảng tần số allele 22 locus STR trên NST thường của Mông, tại Hà Giang - Việt Nam

35

A

F G A

v W A

T H 0 1

T P O X

D 2 S 4 4 1

D 1 8 S 5 1

D 2 1 S 1 1

D 7 S 8 2 0

D 5 S 8 1 8

P e n t a E

P e n t a D

l l e l e / n

C S F 1 P O

D 3 S 1 3 5 8

D 1 S 1 6 5 6

D 1 3 S 3 1 7

D 1 6 S 5 3 9

D 2 S 1 3 3 8

D 8 S 1 1 7 9

D 1 2 S 3 9 1

D 1 9 S 4 3 3

D 1 0 S 1 2 4 8

D 2 2 S 1 0 4 5

0

.

5

0 2 5 6 4

0

.

6

2 1 1 5 4

0

0

0

0

.

.

.

.

7

0 0 9 6 2

0 0 9 6 2

2 2 4 3 6

0 0 9 6 2

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

8

0 0 6 4 1

5 6 7 3 1

0 1 6 0 3

0 0 3 2 1

1 9 8 7 2

0 0 6 4 1

3 5 2 5 6

0 1 9 2 3

0 6 7 3 1

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

9

0 9 6 1 5

4 0 3 8 5

0 0 9 6 2

0 3 8 4 6

0 8 3 3 3

3 2 3 7 2

0 0 3 2 1

4 4 5 5 1

0

.

9.1

0 0 6 4 1

0

.

9.3

0 7 0 5 1

0

0

0

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

.

.

.

10

3 2 0 5 1

0 1 6 0 3

0 0 3 2 1

1 1 2 1 8

0 7 3 7 2

0 5 1 2 8

1 9 5 5 1

1 5 3 8 5

1 2 8 2 1

2 3 0 7 7

3 6 8 5 9

0 2 8 8 5

0 0 3 2 1

0

0

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

.

.

36

11

4 7 1 1 5

5 2 2 4 4

3 4 9 3 6

1 2 1 7 9

0 8 6 5 4

0 2 8 8 5

3 5 2 5 6

1 1 5 3 8

1 1 8 5 9

2 1 7 9 5

2 1 1 5 4

1 4 4 2 3

0

.

11.3

1 2 5 0 0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

.

.

.

.

12

1 2 8 2 1

0 3 8 4 6

2 2 7 5 6

0 3 2 0 5

0 2 5 6 4

0 2 8 8 5

0 6 4 1 0

0 6 0 9 0

0 5 1 2 8

2 5 6 4 1

0 0 9 6 2

5 5 1 2 8

1 7 3 0 8

0 0 9 6 2

0

.

12.2

0 0 3 2 1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

.

.

.

.

13

0 1 2 8 2

1 6 3 4 6

1 2 8 2 1

3 6 5 3 8

1 2 8 2 1

0 0 6 4 1

0 2 8 8 5

0 5 7 6 9

0 2 5 6 4

2 2 4 3 6

4 4 5 5 1

0 3 5 2 6

0 7 6 9 2

0 0 3 2 1

0

.

13.2

0 8 3 3 3

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

14

0 1 6 0 3

0 0 6 4 1

0 4 4 8 7

1 2 5 0 0

0 8 3 3 3

0 1 9 2 3

1 2 1 7 9

1 1 2 1 8

0 0 9 6 2

1 0 2 5 6

0 2 5 6 4

2 2 7 5 6

2 3 0 7 7

0 0 3 2 1

0 4 8 0 8

3 7 1 7 9

0

.

14.2

0 4 8 0 8

0

0

0

0

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

.

.

.

.

15

0 0 6 4 1

2 4 3 5 9

0 1 2 8 2

0 0 3 2 1

3 8 7 8 2

2 9 4 8 7

3 0 1 2 8

0 1 2 8 2

1 0 5 7 7

0 0 3 2 1

1 6 9 8 7

2 7 2 4 4

0 0 3 2 1

0 1 6 0 3

0

.

37

15.2

2 7 5 6 4

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

16

0 2 8 8 5

1 2 5 0 0

2 0 8 3 3

0 0 6 4 1

2 8 5 2 6

0 4 1 6 7

0 0 3 2 1

1 1 8 5 9

2 9 1 6 7

1 5 3 8 5

0

.

16.2

0 2 8 8 5

0

.

16.3

0 0 6 4 1

0

0

0

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

.

.

.

17

0 0 9 6 2

0 6 7 3 1

0 0 6 4 1

0 2 8 8 5

1 3 4 6 2

0 1 2 8 2

0 3 8 4 6

1 2 5 0 0

3 4 2 9 5

0 5 4 4 9

0 2 5 6 4

0

.

17.3

0 5 1 2 8

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

18

0 9 2 9 5

0 4 1 6 7

0 3 5 2 6

0 1 2 8 2

0 8 0 1 3

0 0 6 4 1

2 9 8 0 8

0 4 8 0 8

0

.

18.2

0 0 3 2 1

0

.

18.3

1 0 2 5 6

0

0

0

0

0

0

0

0

.

.

.

.

.

.

.

.

38

19

0 5 7 6 9

0 0 3 2 1

0 2 8 8 5

0 7 0 5 1

1 9 5 5 1

0 0 3 2 1

0 2 5 6 4

4 2 6 2 8

0

.

19.3

0 0 6 4 1

0

0

0

0

0

0

0

.

.

.

.

.

.

.

20

0 1 2 8 2

0 5 7 6 9

0 0 6 4 1

0 5 4 4 9

0 0 3 2 1

0 8 6 5 4

0 5 4 4 9

0

0

0

0

0

.

.

.

.

.

21

0 6 4 1 0

0 0 6 4 1

0 2 8 8 5

0 6 7 3 1

1 7 6 2 8

0

0

0

0

0

.

.

.

.

.

22

0 1 9 2 3

0 1 2 8 2

0 8 9 7 4

0 8 6 5 4

1 1 5 3 8

0

.

22.2

0 0 3 2 1

0

0

0

0

.

.

.

.

23

0 1 6 0 3

2 9 8 0 8

1 0 2 5 6

0 3 5 2 6

0

.

23.2

0 0 6 4 1

0

0

0

0

.

.

.

.

24

0 0 3 2 1

2 1 1 5 4

2 2 4 3 6

0 1 9 2 3

0

.

39

24.2

0 5 4 4 9

0

0

0

.

.

.

25

0 2 2 4 4

0 1 9 2 3

2 1 1 5 4

0

.

25.2

0 3 5 2 6

0

0

.

.

26

0 2 2 4 4

0 8 9 7 4

0

.

26.2

0 0 3 2 1

0

0

.

.

27

0 0 3 2 1

0 2 5 6 4

0

0

.

.

28

0 1 6 0 3

0 0 3 2 1

0

.

29

1 8 9 1 0

0

0

.

.

30

2 1 7 9 5

0 0 3 2 1

0

.

40

30.2

0 1 6 0 3

0

.

31

1 6 0 2 6

0

.

31.2

1 6 0 2 6

0

.

32

0 1 9 2 3

0

.

32.2

1 0 5 7 7

0

.

33.2

1 1 2 1 8

0

.

34.2

0 0 3 2 1

41

Các allele có tần số thấp là các allele có tần số ≤ 5/2N, trong đó N là kích

thước mẫu. Như vậy, đối với nghiên cứu này thì các allele có tần số ≤ 0.016026

được coi là các allele có tần số thấp, ít xuất hiện trong quần thể. Bảng 3.3 thống

kê các allele có tần số thấp phát hiện được trong quần thể nghiên cứu. Số lượng

allele có tần số thấp thấy nhiều nhất ở locus D18S51 và FGA. Kết quả này khác

so với nghiên cứu thực hiện trên quần thể người Kinh hay các quần thể người

dân tộc khác trước đó [4], [27], [37]. Tuy nhiên, nghiên cứu cùng trên đối tượng

là người Mông của tác giả Nguyễn Như Giang, năm 2014 lại không công bố số

liệu, do đó không thể tiến hành so sánh. Mặt khác, các allele được tìm thấy là

có tần số thấp là đánh giá tương đối, tùy thuộc vào kích thước mẫu, N càng lớn

thì tần số càng nhỏ dẫn đến việc allele A trong nghiên cứu này là allele có tần

số thấp nhưng có thể không phải allele có tần số thấp trong nghiên cứu khác là

Bảng 3.3. Các allele có tần số thấp phát hiện được trong quần thể

L o c u s

P e n t a E

P e n t a D

D 1 8 S 5 1

D 2 S 4 4 1

C S F 1 P O

D 3 S 1 3 5 8

D 1 S 1 6 5 6

D 1 3 S 3 1 7

D 1 6 S 5 3 9

D 2 S 1 3 3 8

D 1 0 S 1 2 4 8

allele

15

19 16.3 19.3

7 14

8 24

9 14

7 15

9.1 13 15

10 12 17

16 26 30

12 17 20 21 22

F G A

v W A

T H 0 1

T P O X

L o c u s

D 2 1 S 1 1

D 7 S 8 2 0

D 5 S 8 1 8

D 8 S 1 1 7 9

D 1 2 S 3 9 1

D 1 9 S 4 3 3

D 2 2 S 1 0 4 5

allele

20 34.2

10

8 17

13 15

7 8 9 14

15 12.2 15 16 18.2

13 18 19 20

18 22.2 23.2 26.2 28

hoàn toàn có khả năng.

42

3.3. Kết quả phân tích thống kê

3.3.1. Kiểm định cân bằng Hardy-Weinberg

Các STR allele được di truyền cho con cái từ bố và mẹ theo quy luật di

truyền Mendel, do đó tần số của một allele có thể dự đoán được theo quy luật

phân bố khả năng. Nếu 2 allele A và a có tần số p và q trong một quần thể, thì

tần số có kiểu hình đồng hợp AA sẽ là p2, kiểu hình dị hợp Aa là 2pq. Như vậy,

từ tần số allele có thể tính được tần số allele mong đợi và tần số allele đó trong

thực tế, và nếu giá trị mong đợi và thực tế tương đương nhau thì đồng nghĩa

với allele của locus trong quần thể đó đang ở trạng thái cân bằng [11]. Cân bằng

Hardy – Weinberg (HWE) giúp dự đoán tần số kiểu gen hay allele có ở trạng

thái di truyền cân bằng hay không [33]. Bộ số liệu trong nghiên cứu này được

kiểm định có đạt cân bằng HWE hay không, dưới giá trị p value = 0.002. Dựa

trên kết quả phân tích cho thấy, toàn bộ 22 locus (không tính 2 locus trên NST

giới tính) đều tuân theo cân bằng HWE (Bảng 3.4). Điều này có nghĩa là đối

với các locus STR trong bộ kit Powerplex Fusion Systems thì các allele đều

đang ở trạng thái cân bằng. Quần thể đạt cân bằng HWE có nghĩa là quần thể

đó được coi là: quần thể giao phỗi ngẫu nhiên, không có hiện tượng di nhập

gen hay đột biến phát sinh allele mới [33]. Tuy nhiên, những điều trên không

tồn tại trong tự nhiên. Do đó mà việc kiểm định HWE trong nghiên cứu này chỉ

trả lời câu hỏi là các locus có đang ở trạng thái di truyền cân bằng hay không,

các allele trong một locus là di truyền độc lập và có thể dự đoán tần số của các

Bảng 3.4. Kết quả kiểm định cân bằng HWE bằng phần mềm Arlequin v3.5

allele trong một kiểu gen nếu các locus đó theo cân bằng HWE.

Locus

#Genot

P-value

s.d.

Steps done

D3S1358

156

0.26

0.00039

1001000

D1S1656

156

0.927

0.00023

1001000

D2S441

156

0.422

0.00046

1001000

D10S1248

156

0.495

0.00049

1001000

D13S317

156

0.19

0.00039

1001000

Penta E

156

0.962

0.00016

1001000

D16S539

156

0.041

0.00017

1001000

D18S51

156

0.073

0.00016

1001000

D2S1338

156

0.188

0.00028

1001000

CSF1PO

156

0.559

0.00046

1001000

Penta D

156

0.463

0.00043

1001000

TH01

156

0.167

0.00039

1001000

vWA

156

0.844

0.00033

1001000

D21S11

156

0.018

0.00013

1001000

D7S820

156

0.755

0.00047

1001000

D5S818

156

0.574

0.00043

1001000

TPOX

156

0.738

0.0005

1001000

D8S1179

156

0.134

0.00028

1001000

D12S391

156

0.277

0.00041

1001000

D19S433

156

0.628

0.00037

1001000

FGA

156

0.21

0.00028

1001000

D22S1045

156

0.274

0.00035

1001000

43

44

3.3.2. Gía trị dị hợp tử mong đợi và quan sát được

Các giá trị dị hợp tử mong đợi (EH) và dị hợp tử quan sát được (OH) của

từng locus được cho trong Bảng 3.5. Có năm locus có giá trị EH > OH và 17

locus có EH < OH. Khi giá trị OH lớn hơn EH dưới kiểm định cân bằng HWE,

có nghĩa là điều kiện chấp nhận đặt ra là không phù hợp. Như có nói ở trên,

một quần thể trong tự nhiên không thể là một quần thể HWE. Do đó, hiện tượng

OH> EH xảy ra có thể giải thích rằng quần thể nghiên cứu không giao phối

ngẫu nhiên, điều này xảy ra thường xuyên trong quần thể loài người; quần thể

nghiên cứu có hiện tượng di nhập gen, chịu tác động của chọn lọc tự nhiên, có

Bảng 3.5. Kết quả tính các chỉ số EH và OH của từng locus, các locus được đánh dấu đậm có giá trị OH

phát sinh đột biến, và có biểu hiện của giao phối cận huyết [11], [38].

Locus

Số lượng

OH

EH.

s.d.

Steps done

D3S1358

156

0.71154

0.26009

0.00039

1001000

D1S1656

156

0.85256

0.92682

0.00023

1001000

D2S441

156

0.69231

0.42209

0.00046

1001000

D10S1248

0.64744

0.49487

0.00049

1001000

156

D13S317

156

0.58974

0.18994

0.00039

1001000

Penta E

156

0.92949

0.96151

0.00016

1001000

D16S539

156

0.8141

0.04126

0.00017

1001000

D18S51

156

0.86538

0.07271

0.00016

1001000

D2S1338

156

0.78846

0.18777

0.00028

1001000

CSF1PO

156

0.64103

0.55855

0.00046

1001000

Penta D

156

0.76923

0.46318

0.00043

1001000

0.70513

0.16747

0.00039

1001000

156

TH01

0.76923

0.84353

0.00033

1001000

156

vWA

0.85897

0.01771

0.00013

1001000

156

D21S11

0.6859

0.75476

0.00047

1001000

156

D7S820

0.76923

0.57426

0.00043

1001000

156

D5S818

0.57051

0.73766

0.0005

1001000

156

TPOX

0.79487

0.13364

0.00028

1001000

156

D8S1179

0.77564

0.27693

0.00041

1001000

156

D12S391

0.80128

0.6282

0.00037

1001000

156

D19S433

0.83974

0.2096

0.00028

1001000

156

FGA

156

D22S1045

0.77564

0.27364

0.00035

1001000

45

3.3.3. Kiểm tra tính di truyền liên kết của các locus STR

Các locus được đánh giá tính di truyền liên kết – linkage disequilibrium

(LD) theo cặp, đánh giá sử dụng kiểm định Chi-Square với giá trị p = 0.002

(Bảng 3.6). Trong bộ 22 locus có locus D7S820 và D12S391 có p < 0.002, có

nghĩa là hai locus trên di truyền liên kết cân bằng.

Chi tiết các giá trị của kiểm định Chi-square các locus theo từng cặp được

cho trong phần phụ lục 3.

Bảng 3.6. Bảng ma trận đánh giá linkage disequilibrium của các locus. Dấu "-" là không có ý nghĩa thống kê, "+" là có ý nghĩa thống kê so với p = 0.002

P e n

P e n

t

t

F G A

v W A

T H 0 1

T P O X

L o c u s

a E

D 2 S 4 4 1

D 7 S 8 2 0

D 5 S 8 1 8

D 1 8 S 5 1

D 2 1 S 1 1

a D

C S F 1 P O

D 3 S 1 3 5 8

D 1 S 1 6 5 6

D 2 S 1 3 3 8

D 8 S 1 1 7 9

D 1 3 S 3 1 7

D 1 6 S 5 3 9

D 1 2 S 3 9 1

D 1 9 S 4 3 3

D 1 0 S 1 2 4 8

D 2 2 S 1 0 4 5

D3S1358 D1S1656 D2S441 D10S1248 D13S317 Penta E D16S539 D18S51 D2S1338 CSF1PO Penta D TH01 vWA D21S11 D7S820 D5S818 TPOX D8S1179 D12S391 D19S433 FGA D22S1045

* - - - - - - - - - - - - - - - - - - - - -

- * - - - - - - - - - - - - - - - - - - - -

- - * - - - - - - - - - - - - - - - - - - -

- - - * - - - - - - - - - - - - - - - - - -

- - - - * - - - - - - - - - - - - - - - - -

- - - - - * - - - - - - - - - - - - - - - -

- - - - - - * - - - - - - - - - - - - - - -

- - - - - - - * - - - - - - - - - - - - - -

- - - - - - - - * - - - - - - - - - - - - -

- - - - - - - - - * - - - - + - - - + - - -

- - - - - - - - - - * - - - - - - - - - - -

- - - - - - - - - - - * - - - - - - - - - -

- - - - - - - - - - - - * - - - - - - - - -

- - - - - - - - - - - - - * - - - - - - - -

- - - - - - - - - + - - - - * - - - - - - -

- - - - - - - - - - - - - - - * - - - - - -

- - - - - - - - - - - - - - - - * - - - - -

- - - - - - - - - - - - - - - - - * - - - -

- - - - - - - - - + - - - - - - - - * - - -

- - - - - - - - - - - - - - - - - - - * - -

- - - - - - - - - - - - - - - - - - - - * -

- - - - - - - - - - - - - - - - - - - - - *

46

47

3.4. Kết quả phân tích các chỉ số pháp y

3.4.1. Chỉ số khả năng trùng hợp ngẫu nhiên - Match probability (MP)

Chỉ số khả năng trùng hợp ngẫu nhiên là khả năng trùng lặp giữa mẫu

xem xét với một mẫu trong quần thể tham khảo. Tuy nhiên, chỉ số này cần được

đánh giá giữa các quần thể, do đó một locus có MP lớn trong quần thể này cũng

có thể có MP nhỏ khi cách đánh giá thay đổi [33]. Hình 3.1 là biểu đồ biểu diễn

các giá trị MP của từng locus, trong đó locus CSF1PO và TPOX cho giá trị MP

lớn nhất. Ngược lại, locus Penta E cho giá trị MP là nhỏ nhất đối với quần thể

Hình 3.1. Biểu đồ màu theo giá trị chỉ số MP của từng locus

nghiên cứu.

3.4.2. Chỉ số khả năng loại trừ - Power of Exclusion

Khả năng loại trừ - power of exclusion (PE) là khả năng loại trừ một cá

thể ngẫu nhiên có là bố/mẹ của mẫu xem xét hay không. Giá trị PE đối với từng

locus là khả năng loại trừ trong tính toán của locus đó. Như vậy, PE càng lớn,

tiệm cận 1, đối với từng cá thể thì khả năng loại trừ càng cao, đồng nghĩa với

khả năng nhận định theo huyết thống dựa trên tính toán xác xuất thống kê càng

chính xác [39]. Đối với mỗi locus khác nhau thì sẽ có PE khác nhau, các giá trị

này quyết định trọng số của locus đó trong quá trình tính toán xác xuất hai hồ

48

sơ ADN là có khả năng trùng nhau hay không. Với cùng một bộ kit thì giá trị

PE của mỗi locus cũng khác nhau. Ở quần thể trong nghiên cứu này, locus

Penta E có PE lớn nhất, nằm trong khoảng (0,85; 0,9). Ngược lại, locus TPOX

cho PE nhỏ nhất, trong khoảng (0,25; 0,3) (Hình 3.2). Trong khi đó, giá trị PE

lớn nhất xác định được ở locus Penta E và nhỏ nhất ở locus D3S1358 ở quần

Hình 3.2. Biều đồ màu theo giá trị chỉ só PE của từng locus

thể người Kinh, sử dụng cùng bộ kit [4].

3.4.3. Chỉ số khả năng phân biệt – Discrimination capacity

Chỉ số khả năng phân biệt – DC của từng locus là chỉ số đánh giá khả

năng phân biệt cá thể của locus đó. Trong quá trình tạo lập hồ sơ ADN cho truy

nguyên cá thể thì điều đặc biệt quan trọng đó là các chỉ thị locus STR được sử

dụng phải có khả năng phân biệt cao. Đối với một locus theo cân bằng HWE,

thì giá trị DC sẽ bằng 1 – giá trị PI (sẽ được đề cập ở phần sau). Chỉ số này

càng gần 1 thì khả năng phân biệt của locus đó càng lớn. Hình 3.3 cho thấy giá

trị DC của các locus khác nhau, từ khoảng 0,75 đến gần 1. Trong đó, locus

Penta E cho giá trị DC lớn nhất, ngược lại thì locus TPOX cho DC nhỏ nhất.

Kết quả này cho thấy sự tương đồng giữa các kết quả phân tích trước về số

49

allele của từng locus, cũng như các chỉ số pháp y liên quan. Locus Penta E có

số allele xác định được là nhiều nhất, cũng có PE là lớn nhất, MP nhỏ và DC

Hình 3.3. Biều đồ màu theo giá trị DC của từng locus

lớn nhất. Trong khi đó, locus TPOX có PE nhỏ nhất, MP lớn và DC nhỏ nhất.

3.4.4. Chỉ số đa hình - Polymorphic information content

Chỉ số đa hình – PIC là chỉ số đánh giá tính đa hình của các locus được

sử dụng. Locus có tính đa hình càng lớn thì càng có ý nghĩa trong tính toán khả

năng về mối quan hệ huyết thống giữa 2 cá thể. Đối với quần thể Mông trong

nghiên cứu này, locus Penta E có giá trị PIC là lớn nhất 0,908266864265989,

còn locus TPOX là nhỏ nhất với PIC = 0,519750407231249 (Bảng 3.8). Kết

quả này cũng cho thấy sự tương quan giữa các chỉ số pháp y của từng locus.

Penta E cũng được đánh giá có tính đa hình cao và được sử dụng làm chỉ thị

đánh giá sự đa dạng quần thể trong nghiên cứu khác [40].

3.4.5. Chỉ số Parternity index – PI

Hình 15 biểu diễn chỉ số parternity index – PI của từng locus trên quần

thể người Mông thu được. Trong đó, locus Penta E có PI lớn nhất, còn locus

50

TH0, TPOX, D2S441, D3S1358, CSF1PO, D10S1248, và D13S317 có PI

nhỏ nhất. Giá trị PI có giá trị trong tính toán trọng số của các chỉ thị và khả

năng một kiểu gen là cha hoặc mẹ của kiểu gen kiểm chứng. Giá trị PI ≤ 1 thì

chỉ thị đó không có ý nghĩa trong tính toán xác suất thống kê [33]. Do đó, các

locus trong nghiên cứu đều phù hợp cho phục đích giám định do đều có PI >

Hình 3.4. Biểu đồ màu theo giá trị của chỉ số PI của các locus

1.

3.5. Các chỉ số pháp y đánh giá tần số các allele của một quần thể

Các chỉ số kết hợp có thể dùng cho đánh giá chất lượng của bảng tần số

và khả năng ứng dụng của bảng tần số đó trong công tác giám định thực tế [11],

[33]. Các chỉ số Combined PE và Combinded DC càng lớn, càng gần một hoặc

bằng 1 thì chứng minh rằng các locus được sử dụng cho các tần số allele có khả

năng phân biệt và loại trừ cao, do đó có thể dùng để cho công tác giám định

thực tế. Đối với chỉ số Combinded MP thì ngược lại, giá trị này càng nhỏ có

nghĩa là khả năng trùng lặp ngẫu nhiên giữa 2 bộ hồ sơ ADN càng thấp, do đó

sai số trong tính toán xác xuất thống kê càng nhỏ. Bảng 3.8 thể hiện chi tiết các

giá trị MP, PE, DC và các giá trị combinded của các chỉ số đó, cùng với chỉ số

PIC đối với bộ 22 locus của bộ kit Powerplex Fusion trên quần thể người Mông

51

trong nghiên cứu này. Giá trị Combinded PE (CPE) thu được là 0,999999987

cho thấy khả năng loại trừ của các locus và của bộ số liệu là rất cao. Giá trị

Combinded DC thu được tiệm cận 1 (1,00000000000000) chứng tỏ khả năng

phân biệt rất tốt của các locus. Thêm vào đó, giá trị combinded MP tại rất nhỏ,

chỉ bằng 3,86 ×10-23. Như vậy, có thể kết luận dựa trên các chỉ số kết hợp là bộ

số liệu tần số allele của 22 locus STR trên NST thường thu được trong nghiên

cứu này hoàn toàn có thể ứng dụng được trong công tác giám định thực tế.

Bảng số liệu tần số thu được trong nghiên cứu này sẽ được đưa vào làm

cơ sở dữ liệu cho tính toàn bằng phần mềm STR – VN version 1.0, một phần

mềm được xây dựng bởi nhóm nghiên cứu thuộc Viện Công nghệ Sinh học –

Bảng 3.7. Các chỉ số MP, PE, DC và PIC của các locus

Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Hình 3.5).

Locus CSF1PO D10S1248 D12S391 D13S317 D16S539 D18S51 D19S433 D1S1656 D21S11 D22S1045 D2S1338 D2S441 D3S1358 D5S818 D7S820 D8S1179 FGA Penta.D Penta.E TH01 TPOX vWA Combined

MP 0.210141 0.162475 0.094017 0.170201 0.160339 0.069855 0.095743 0.048159 0.05498 0.124589 0.064924 0.110125 0.145135 0.112508 0.123932 0.087525 0.035667 0.062541 0.017834 0.143162 0.232906 0.118919 3.86E-23

PE 0.343027 0.351705 0.554641 0.278753 0.625471 0.725402 0.601422 0.699924 0.712627 0.554641 0.577803 0.416461 0.446335 0.543237 0.406783 0.589557 0.674753 0.543237 0.855961 0.436238 0.256979 0.543237 0.999999987

DC 0.789859 0.837525 0.905983 0.8298 0.839661 0.930145 0.904257 0.951841 0.94502 0.875411 0.935076 0.889875 0.854865 0.887492 0.876068 0.912475 0.964333 0.937459 0.982166 0.856838 0.767094 0.881082 1.00000000000000

PIC 0.557019 0.613837 0.731492 0.611476 0.673925 0.793209 0.731159 0.818746 0.820474 0.695176 0.789711 0.699439 0.650858 0.702541 0.667303 0.737462 0.852489 0.783956 0.908267 0.654371 0.51975 0.699066

Hình 3.5. Hình ảnh giao diện phần mềm STR-VN version 1.0

52

3.6. Kết quả phân tích mối tương quan di truyền với các quần thể khác

Sự khác biệt về tần số allele các locus giữa các quần thể khác nhau có

mối liên hệ về mối tương quan di truyền giữa các quần thể đó. Mối tương quan

này có thể liên quan đến vị trí địa lý hoặc theo các nhóm ngôn ngữ [3]. Trong

nghiên cứu này, bảng số liệu tần số allele của quần thể người Mông được so

sánh với hai quần thể thuộc cùng một ngữ hệ đó là quần thể người Miao ở Quỳ

Châu [41], và quần thể người Yao ở Quảng Đông [42], Trung Quốc. Hai quần

thể này cùng với quần thể người Mông ở Việt Nam thuộc ngữ hệ H’mông –

Dao. Ngoài ra, so sánh còn bao gốm các quần thể khác như: quần thể Kinh tại

Việt Nam [4] và quần thể người Thái tại Thái Lan [43] thuộc nhóm ngữ hệ Nam

Á; hai quần hể người Hán tại tỉnh Vân Nam và Liêu Ning, Trung Quốc thuộc

53

nhóm ngữ hệ Hán – Tạng [44], [45]; quần thể người Hàn tại Hàn Quốc [46];

quần thể người Nhật tại Nhật Bản [47]; người Ấn Độ tại Ấn Độ [48]; quần thể

người Hà Lan tại Hà Lan [49] và quần thể người Ovambo – African tại Namibia

[50]. Các quần thể người Hà Lan đại diện cho chủng người da trắng – Caucasian

và người Ovambo đại diện cho chủng người da đen – African.

Dựa trên kết quả phân tích tương quan di truyền qua cây phát sinh chủng

loại (Hình 3.6) cho thấy, quần thể người Mông có mối quan hệ di truyền gần

gũi với người Miao và Yao ở Trung Quốc. Kết quả này khẳng định mối quan

hệ gần gũi và lịch sử hình thành các quần thể người H’mông – Dao tại khu vực

Đông Nam Á và Trung Quốc.

Châu Á là nơi có sự đa dạng về chủng tộc, nhóm người rất cao [8]. Các

nhóm người có đặc điểm di truyền quần thể riêng và có mối quan hệ tương

quan với nhau và có liên quan đến điều kiện địa lý. Điều này thể hiện rõ ràng

trên cây chủng loại xây dựng được. Hai quần thể thuộc ngữ hệ Nam Á và có vị

trí địa lý gần nhau như người Kinh và người Thái nằm cùng trong một nhánh

với giá trị bootstrap 67 (Hình 3.6). Quần thể người Hán tại Vân Nam gần gũi

với các nhánh của nhóm Nam Á và Mông – Dao hơn so với nhóm Hán tại Liêu

Ning. Kết quả này có được có thể do ảnh hưởng bởi khoảng cách địa lý, khi mà

tỉnh Vân Nam nằm ở phía Nam Trung Quốc, có đường biên giới chung với Việt

Nam và Thái Lan, do đó sự pha trộn vốn gen với các nhóm người lân cận hơn

so với nhóm tại Liêu Ning nằm ở phía Bắc Trung Quốc. Nhóm phía Bắc này

do đó cũng gần với các nhóm người Hàn Quốc và Nhật Bản hơn (Hình 3.6).

Các nhóm thuộc chủng người da trắng, người da đen và nhóm phía Nam Châu

Á có sự khác biệt rõ ràng so với các nhóm còn lại. Kết quả này tương đồng với

các kết quả nghiên cứu trước đó. [4], [44], [51], [52]

Hình 3.6. Cây phát sinh chủng loại về mối tương quan di truyền giữa người Mông và các

quần thể khác

54

55

CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ

4.1. Kết luận

Dựa trên các kết quả có được từ nghiên cứu khảo sát và xây dựng cơ sở

dữ liệu tần số allele 22 locus đa hình STR ở quần thể người Mông tại Hà Giang,

Việt Nam bằng bộ kit Powerplex Fusion Systems, có thể kết luận như sau:

(1) Khuếch đại thành công 22 locus bằng bộ kit Powerplex Fusion System

đối với 156 mẫu là người Mông tại Hà Giang, Việt Nam. Quá trình và

phương pháp thu thập mẫu được sử dụng trong nghiên cứu này là phù

hợp và có thể ứng dụng cho các nghiên cứu khác.

(2) Các locus được sử dụng trong bộ kit đã được đánh giá tính hiệu quả và

chính xác dựa trên các phân tích thống kê. Kết quả cho thấy, bộ kit

Powerplex Fusion System là phù hợp cho công tác giám định pháp y,

xét nghiệm huyết thống cũng như có thể sử dụng trong nghiên cứu đánh

giá sự đa dạng và di truyền của quần thể người Mông tại Hà Giang, Việt

Nam.

(3) Đề tài đã xây dựng thành công bộ cơ sở dữ liệu tần số allele 22 locus

STR cho quần thể người Mông tại Hà Giang, và có thể đưa vào sử dụng

trong thực tế xét nghiệm huyết thống, truy nguyên cá thể trong giám

định pháp y, hoặc xác định nhóm người.

(4) Kết quả phân tích cho thấy mối liên hệ di truyền gần gũi giữa quần thể

người Mông tại Hà Giang, Việt Nam với quần thể người Miao và Yao ở

Trung Quốc. Kết quả này khẳng định ứng dụng của tần số allele các

locus STR trong nghiên cứu đa dạng và di truyền quần thể. Kết quả cũng

lần đầu khẳng định mối quan hệ gần gũi về di truyền giữa các nhóm

Mông tại Việt Nam và Trung Quốc mà đã được khẳng định trước đó dựa

trên các bằng chứng khác.

56

4.2. Kiến nghị

Dựa trên các kết quả thu được, chúng tôi đề xuất một số nội dung sau:

(1) Bổ sung bảng tần số allele 22 locus STR trên NST bằng bộ kit Powerplex

Fusion Systems vào quy trình xác định xác xuất thống kê trong giám

định pháp y, truy nguyên cá thể, xác định huyết thống hoặc tìm kiếm

người mất tích.

(2) Mở rộng số lượng mẫu nghiên cứu lớn hơn, ít nhất là 500 cá thể nhằm

cải thiện hiệu quả tính toán và giảm thiểu sai số thống kê.

(3) Mở rộng nghiên cứu và xây dựng cơ sở dữ liệu tần số allele các locus

STR đối với các nhóm dân tộc khác tại Việt Nam, nhằm phục vụ cho

công tác giám định và nghiên cứu.

57

TÀI LIỆU THAM KHẢO

[1] M. G. J. Tilanus, “Short tandem repeat markers in diagnostics: what’s in

a repeat?,” Leukemia, vol. 20, no. 8, pp. 1353–1355, Aug. 2006.

[2]

J. M. Butler, “Short Tandem Repeat Analysis for Human Identity Testing,” in Current Protocols in Human Genetics, vol. Chapter 14, Hoboken, NJ, USA: John Wiley & Sons, Inc., 2004, p. Unit 14.8.

[3]

J. K. Pritchard, M. Stephens, and P. Donnelly, “Inference of population structure using multilocus genotype data.,” Genetics, vol. 155, no. 2, pp. 945–59, Jun. 2000.

[4] H. L. Tran, H. T. Nguyen, T. T. Pham, M. H. Nguyen, H. Hoang, and H. H. Chu, “Allele frequencies for 22 autosomal STRs in the Kinh population in Vietnam,” Int. J. Legal Med., Jan. 2019.

[5]

I. Shimada, B. Brinkmann, N. Q. Tuyen, and C. Hohoff, “Allele frequency data for 16 STR loci in the Vietnamese population.,” Int. J. Legal Med., vol. 116, no. 4, pp. 246–8, Aug. 2002.

[6] X. Zhang et al., “Genetic polymorphisms of 20 autosomal STR loci in the Vietnamese population from Yunnan Province, Southwest China,” Int. J. Legal Med., vol. 131, no. 3, pp. 661–662, May 2017.

[7] P. Lertrit et al., “Genetic history of Southeast Asian populations as revealed by ancient and modern human mitochondrial DNA analysis,” Am. J. Phys. Anthropol., vol. 137, no. 4, pp. 425–440, Dec. 2008.

[8] T. H. P.-A. S. HUGO Pan-Asian SNP Consortium et al., “Mapping human genetic diversity in Asia.,” Science, vol. 326, no. 5959, pp. 1541– 5, Dec. 2009.

[9] H. McColl et al., “The prehistoric peopling of Southeast Asia.,” Science,

vol. 361, no. 6397, pp. 88–92, Jul. 2018.

[10] M. Lipson et al., “Ancient genomes document multiple waves of migration in Southeast Asian prehistory,” Science (80-. )., vol. 361, no. 6397, pp. 92–95, Jul. 2018.

[11] J. M. (John M. Butler, Fundamentals of forensic DNA typing, First.

Academic Press/Elsevier, 2009.

[12] A. J. Jeffreys, “The man behind the DNA fingerprints: an interview with Professor Sir Alec Jeffreys,” Investig. Genet., vol. 4, p. 21, 2013.

[13] Z. Wong, V. Wilson, I. Patel, S. Povey, and A. J. Jeffreys, “Characterization of a panel of highly variable minisatellites cloned from

58

human DNA,” Ann. Hum. Genet., vol. 51, no. 4, pp. 269–288, 1987.

[14] L. Roewer, “DNA fingerprinting in forensics: Past, present, future,” Investigative Genetics, vol. 4, no. 1. BioMed Central, p. 22, 18-Nov- 2013.

[15] L. L. Cavalli-Sforza and M. W. Feldman, “The application of molecular genetic approaches to the study of human evolution.,” Nat. Genet., vol. 33 Suppl, pp. 266–75, Mar. 2003.

[16] M. A. Jobling and P. Gill, “Encoded evidence: DNA in forensic analysis,”

Nat. Rev. Genet., vol. 5, no. 10, pp. 739–751, Oct. 2004.

[17] R. Chakraborty, M. Kimmel, D. N. Stivers, L. J. Davison, and R. Deka, “Relative mutation rates at di-, tri-, and tetranucleotide microsatellite loci,” Proc. Natl. Acad. Sci. U. S. A., vol. 94, no. 3, pp. 1041–1046, Feb. 1997.

[18] H. Fan and J. Y. Chu, “A Brief Review of Short Tandem Repeat Mutation,” Genomics, Proteomics and Bioinformatics, vol. 5, no. 1. Beijing Genomics Institute, pp. 7–14, 2007.

[19] M. Zavodna, A. Bagshaw, R. Brauning, and N. J. Gemmell, “The effects of transcription and recombination on mutational dynamics of short tandem repeats,” Nucleic Acids Res., vol. 46, no. 3, pp. 1321–1330, Dec. 2017.

[20] K. Oostdik et al., “Developmental validation of the PowerPlex® Fusion System for analysis of casework and reference samples: A 24-locus multiplex for new database standards,” Forensic Sci. Int. Genet., vol. 12, pp. 69–76, 2014.

[21] C. D. Steele and D. J. Balding, “Choice of population database for forensic DNA profile analysis,” Sci. Justice, vol. 54, no. 6, pp. 487–493, 2014.

[22] M. Skipper, “Allele Frequency Database,” Nat. Rev. Genet., vol. 4, no. 9,

pp. 674–674, Sep. 2003.

[23] “Thông tin tổng [Online]. hợp.”

Available: http://www.chinhphu.vn/portal/page/portal/chinhphu/NuocCHXHCNVi etNam/ThongTinTongHop?categoryId=920&articleId=3341. [Accessed: 28-May-2020].

[24] “Thông tin tổng [Online]. hợp.”

Available: http://www.chinhphu.vn/portal/page/portal/chinhphu/NuocCHXHCNVi etNam/ThongTinTongHop?categoryId=920&articleId=3376. [Accessed: 23-Sep-2019].

59

[25] T. T. Trịnh, Q. K. Hà, L. L. Vũ, Q. V. Nguyễn, and Q. H. Nguyễn, “Nghiên cứu đa dạng Haplotype Y- STR của quần thể người Kinh - Việt Nam,” Tạp chí Khoa học ĐHQGHN Khoa học Tự nhiên và Công nghệ, vol. 33, no. 2S, pp. 212–218, 2017.

[26] H. H. Ha, T. H. Nguyen, L. H. Tran, H. T. H. Nguyen, H. Hoang, and H. H. Chu, “Genetic characteristics of 23 Y-chromosomal STRs in the Kinh population in Northern Vietnam,” Int. J. Legal Med., Sep. 2019.

[27] T. H. Trần, T. B. T. Trần, Đ. K. Phạm, Q. H. Hồ, and V. H. Nguyễn, “Khảo sát tần suất alen của 15 locus STR trên nhiễm sắc thể thường trong quần thể người Mường sống ở tỉnh Hòa Bình, Việt Nam,” Tạp chí Phân tích Hóa, Lý và Sinh học, vol. 20, no. 3, pp. 208–214, 2014.

[28] T. H. Trần, T. H. Trần, Đ. K. Phạm, Q. H. Hồ, Đ. Đ. Trịnh, and V. H. Nguyễn, “Sự đa dạng di truyền của 15 Locus STR trên nhiễm sắc thể thường trong quần thể người Khmer sống ở tỉnh Sóc Trăng, Việt Nam,” Tạp chí Phân tích Hóa, Lý và Sinh học, vol. 20, no. 4, pp. 152–158, 2015.

[29] L. Thị Phúc, “Khảo sát và xây dựng cơ sở dữ liệu tần suất các Alen ở 15 Locus gen bằng hệ Identifiler từ quần thể người dân tộc Nùng ứng dụng trong giám định ADN ,” Viện Sinh thái và Tài nguyên Sinh vật, 2017.

[30] N. Như Giang, “Khảo sát tần suất các alen trong các locus gen (ADN) hệ Identifiler của dân tộc H’Mông phục vụ công tác giám định gen ở Việt Nam,” Viện Sinh thái và Tài nguyên Sinh vật, 2014.

[31] “SWGDAM Interpretation Guidelines for Autosomal STR Typing by

Forensic DNA Testing Laboratories.”

[32] L. Excoffier and H. E. L. Lischer, “Arlequin suite ver 3.5: a new series of programs to perform population genetics analyses under Linux and Windows,” Mol. Ecol. Resour., vol. 10, no. 3, pp. 564–567, May 2010.

[33] “The evaluation of forensic DNA evidence,” Proceedings of the National Academy of Sciences of the United States of America, vol. 94, no. 11. National Academy of Sciences, pp. 5498–5500, 27-May-1997.

[34] N. Takezaki, M. Nei, and K. Tamura, “POPTREE2: Software for Constructing Population Trees from Allele Frequency Data and Computing Other Population Statistics with Windows Interface,” Mol. Biol. Evol., vol. 27, no. 4, pp. 747–752, Apr. 2010.

[35] N. Saitou and M. Nei, “The neighbor-joining method: a new method for reconstructing phylogenetic trees.,” Mol. Biol. Evol., vol. 4, no. 4, pp. 406–25, Jul. 1987.

[36] T. Backeljau, L. De Bruyn, H. De Wolf, K. Jordaens, S. Van Dongen, and

60

B. Winnepennincks, “Multiple UPGMA and Neighbor-joining Trees and the Performance of Some Computer Packages,” Mol. Biol. Evol., vol. 13, no. 2, pp. 309–313, Feb. 1996.

[37] Đ. Hoài Nam, “Nghiên cứu tần suất các alen của 15 locus gen hệ identifiler thuộc quần thể người dân tộc Tày ứng dụng trong giám định DNA nhân tế bào,” Viện Sinh thái và Tài nguyên Sinh vật, 2014.

[38] D. J. Balding, I. Moltke, and J. Marioni, Handbook of statistical

genomics. .

[39] W. K. Fung, Y. ka Chung, and D. man Wong, “Power of exclusion revisited: Probability of excluding relatives of the true father from paternity,” Int. J. Legal Med., vol. 116, no. 2, pp. 64–67, 2002.

[40] L. Lai, X. Shen, L. Han, D. Chen, and J. Hu, “Genetic study of the Penta E locus and identification of rare alleles,” Chinese J. Med. Genet., vol. 32, no. 5, pp. 657–660, Oct. 2015.

[41] X. Zhang et al., “Genetic analysis of 20 autosomal STR loci in the Miao ethnic group from Yunnan Province, Southwest China.,” Forensic Sci. Int. Genet., vol. 28, pp. e28–e29, May 2017.

[42] Y. Liao, L. Chen, R. Huang, W. Wu, D. Liu, and H. Sun, “Genomic Portrait of Guangdong Liannan Yao Population Based on 15 Autosomal STRs and 19 Y-STRs,” Sci. Rep., vol. 9, no. 1, pp. 1–6, Dec. 2019.

[43] W. Kutanan et al., “Genetic affinity and admixture of northern Thai people along their migration route in northern Thailand: evidence from autosomal STR loci,” J. Hum. Genet., vol. 56, no. 2, pp. 130–137, Feb. 2011.

[44] H. Sun et al., “Autosomal STRs Provide Genetic Evidence for the Hypothesis That Tai People Originate from Southern China,” PLoS One, vol. 8, no. 4, p. e60822, Apr. 2013.

[45] J. Yao, L. ming Wang, J. Gui, J. xin Xing, J. feng Xuan, and B. jie Wang, “Population data of 15 autosomal STR loci in Chinese Han population from Liaoning Province, Northeast China,” Forensic Science International: Genetics, vol. 23. Elsevier Ireland Ltd, pp. e20–e21, 01- Jul-2016.

[46] S. Y. Yoo et al., “A large population genetic study of 15 autosomal short tandem repeat loci for establishment of Korean DNA Profile Database,” Mol. Cells, vol. 32, no. 1, pp. 15–19, Jul. 2011.

[47] J. Tie, X. Wang, and S. Oxida, “Genetic Polymorphisms of 15 STR Loci in a Japanese Population,” J. Forensic Sci., vol. 51, no. 1, pp. 188–189,

61

Jan. 2006.

[48] P. Shrivastava, T. Jain, and V. Ben Trivedi, “Genetic polymorphism study at 15 autosomal locus in central Indian population,” Springerplus, vol. 4, no. 1, p. 566, Dec. 2015.

[49] A. A. Westen et al., “Comparing six commercial autosomal STR kits in a large Dutch population sample,” Forensic Sci. Int. Genet., vol. 10, no. 1, pp. 55–63, May 2014.

[50] T. Muro, J. Fujihara, S. Imamura, H. Nakamura, T. Yasuda, and H. Takeshita, “Allele frequencies for 15 STR loci in Ovambo population using AmpFlSTR® Identifiler Kit,” Leg. Med., vol. 10, no. 3, pp. 157– 159, May 2008.

[51] S. Wentao et al., “Worldwide Survey of Human Male Demographic History Based on Y-SNP and Y-STR Data from the HGDP–CEPH Populations | Molecular Biology and Evolution | Oxford Academic,” Mol. Biol. Evol., vol. 27, no. 2, pp. 385–393, Oct. 2009.

[52] S. Pischedda et al., “Phylogeographic and genome-wide investigations of Vietnam ethnic groups reveal signatures of complex historical demographic movements,” Sci. Rep., vol. 7, no. 1, pp. 1–15, Dec. 2017.

62

PHỤ LỤC

Phụ lục 1: Kết quả khuếch đại các locus STR của mẫu đối chứng dương

63

Phụ lục 2: Kết quả khuếch đại các locus STR của mẫu đối chứng âm

64

Pair(0, 1)

LnLHood LD : -861.24647 LnLHood LE : -884.17909

Exact P= 0.57574 +- 0.00507 (10100 permutations done) Chi-square test value=45.86524 (P = 0.80509, 55 d.f.)

Pair(0, 2)

LnLHood LD : -728.02186 LnLHood LE : -740.85964

Exact P= 0.71238 +- 0.00408 (10100 permutations done) Chi-square test value=25.67555 (P = 0.87507, 35 d.f.)

Pair(1, 2)

LnLHood LD : -911.09147 LnLHood LE : -950.99694

Exact P= 0.07851 +- 0.00268 (10100 permutations done) Chi-square test value=79.81093 (P = 0.39073, 77 d.f.)

Pair(0, 3)

LnLHood LD : -648.56898 LnLHood LE : -661.02614

Exact P= 0.38307 +- 0.00483 (10100 permutations done) Chi-square test value=24.91432 (P = 0.72918, 30 d.f.)

Pair(1, 3)

LnLHood LD : -844.10472 LnLHood LE : -871.16343

Exact P= 0.34911 +- 0.00457 (10100 permutations done) Chi-square test value=54.11743 (P = 0.85194, 66 d.f.)

Pair(2, 3)

LnLHood LD : -708.91617 LnLHood LE : -727.84398

Exact P= 0.20406 +- 0.00389 (10100 permutations done) Chi-square test value=37.85563 (P = 0.65341, 42 d.f.)

Pair(0, 4)

LnLHood LD : -697.88926 LnLHood LE : -711.09903

Exact P= 0.71950 +- 0.00418 (10100 permutations done) Chi-square test value=26.41954 (P = 0.85137, 35 d.f.)

Pair(1, 4)

LnLHood LD : -886.07305 LnLHood LE : -921.23632

Exact P= 0.42683 +- 0.00555 (10100 permutations done) Chi-square test value=70.32654 (P = 0.69146, 77 d.f.)

Pair(2, 4)

LnLHood LD : -758.05441 LnLHood LE : -777.91687

Exact P= 0.61267 +- 0.00538 (10100 permutations done) Chi-square test value=39.72493 (P = 0.82512, 49 d.f.)

Pair(3, 4)

LnLHood LD : -683.71602 LnLHood LE : -698.08337

Exact P= 0.73297 +- 0.00402 (10100 permutations done) Chi-square test value=28.73471 (P = 0.94074, 42 d.f.)

Pair(0, 5)

Phụ lục 3: Kết quả kiểm định Chi-square các cặp locus về lingkage disequilirium

LnLHood LD : -1012.85505 LnLHood LE : -1034.98062

Exact P= 0.99475 +- 0.00072 (10100 permutations done) Chi-square test value=44.25114 (P = 0.99821, 75 d.f.)

Pair(1, 5)

LnLHood LD : -1170.03055 LnLHood LE : -1245.11791

Exact P= 0.57337 +- 0.00497 (10100 permutations done) Chi-square test value=150.17473 (P = 0.78957, 165 d.f.)

Pair(2, 5)

LnLHood LD : -1046.93382 LnLHood LE : -1101.79846

Exact P= 0.04663 +- 0.00194 (10100 permutations done) Chi-square test value=109.72928 (P = 0.35665, 105 d.f.)

Pair(3, 5)

LnLHood LD : -983.24827 LnLHood LE : -1021.96496

Exact P= 0.18020 +- 0.00385 (10100 permutations done) Chi-square test value=77.43338 (P = 0.82481, 90 d.f.)

Pair(4, 5)

LnLHood LD : -1010.23231 LnLHood LE : -1072.03785

Exact P= 0.00713 +- 0.00077 (10100 permutations done) Chi-square test value=123.61109 (P = 0.10369, 105 d.f.)

Pair(0, 6)

LnLHood LD : -696.96997 LnLHood LE : -708.26835

Exact P= 0.85653 +- 0.00358 (10100 permutations done) Chi-square test value=22.59677 (P = 0.94777, 35 d.f.)

Pair(1, 6)

LnLHood LD : -877.32986 LnLHood LE : -918.40565

Exact P= 0.05644 +- 0.00245 (10100 permutations done) Chi-square test value=82.15157 (P = 0.32287, 77 d.f.)

Pair(2, 6)

LnLHood LD : -749.00659 LnLHood LE : -775.08620

Exact P= 0.07683 +- 0.00264 (10100 permutations done) Chi-square test value=52.15921 (P = 0.35213, 49 d.f.)

Pair(3, 6)

LnLHood LD : -675.68160 LnLHood LE : -695.25269

Exact P= 0.16525 +- 0.00366 (10100 permutations done) Chi-square test value=39.14218 (P = 0.59714, 42 d.f.)

Pair(4, 6)

LnLHood LD : -718.56059 LnLHood LE : -745.32558

Exact P= 0.08772 +- 0.00253 (10100 permutations done) Chi-square test value=53.52999 (P = 0.30463, 49 d.f.)

Pair(5, 6)

LnLHood LD : -1019.06542 LnLHood LE : -1069.20717

Exact P= 0.21703 +- 0.00430 (10100 permutations done) Chi-square test value=100.28350 (P = 0.61190, 105 d.f.)

Pair(0, 7)

LnLHood LD : -808.83815 LnLHood LE : -831.06308

65

Exact P= 0.49861 +- 0.00439 (10100 permutations done) Chi-square test value=44.44986 (P = 0.84468, 55 d.f.)

Pair(1, 7)

LnLHood LD : -987.66016 LnLHood LE : -1041.20037

Exact P= 0.21574 +- 0.00425 (10100 permutations done) Chi-square test value=107.08042 (P = 0.81281, 121 d.f.)

Pair(2, 7)

LnLHood LD : -864.94328 LnLHood LE : -897.88092

Exact P= 0.28990 +- 0.00407 (10100 permutations done) Chi-square test value=65.87529 (P = 0.81306, 77 d.f.)

Pair(3, 7)

LnLHood LD : -795.70439 LnLHood LE : -818.04742

Exact P= 0.63535 +- 0.00503 (10100 permutations done) Chi-square test value=44.68607 (P = 0.97952, 66 d.f.)

Pair(4, 7)

LnLHood LD : -833.25563 LnLHood LE : -868.12031

Exact P= 0.24980 +- 0.00449 (10100 permutations done) Chi-square test value=69.72936 (P = 0.70926, 77 d.f.)

Pair(5, 7)

LnLHood LD : -1130.01631 LnLHood LE : -1192.00190

Exact P= 0.85129 +- 0.00360 (10100 permutations done) Chi-square test value=123.97117 (P = 0.99268, 165 d.f.)

Pair(6, 7)

LnLHood LD : -833.82540 LnLHood LE : -865.28963

Exact P= 0.38644 +- 0.00504 (10100 permutations done) Chi-square test value=62.92848 (P = 0.87633, 77 d.f.)

Pair(0, 8)

LnLHood LD : -833.06799 LnLHood LE : -858.74624

Exact P= 0.37673 +- 0.00428 (10100 permutations done) Chi-square test value=51.35651 (P = 0.77900, 60 d.f.)

Pair(1, 8)

LnLHood LD : -1009.81230 LnLHood LE : -1068.88353

Exact P= 0.18673 +- 0.00388 (10100 permutations done) Chi-square test value=118.14248 (P = 0.80046, 132 d.f.)

Pair(2, 8)

LnLHood LD : -891.69260 LnLHood LE : -925.56408

Exact P= 0.44970 +- 0.00495 (10100 permutations done) Chi-square test value=67.74296 (P = 0.90206, 84 d.f.)

Pair(3, 8)

LnLHood LD : -815.58755 LnLHood LE : -845.73058

Exact P= 0.17089 +- 0.00396 (10100 permutations done) Chi-square test value=60.28606 (P = 0.83606, 72 d.f.)

Pair(4, 8)

LnLHood LD : -867.01352 LnLHood LE : -895.80347

66

Exact P= 0.89149 +- 0.00330 (10100 permutations done) Chi-square test value=57.57990 (P = 0.98776, 84 d.f.)

Pair(5, 8)

LnLHood LD : -1132.34889 LnLHood LE : -1219.68506

Exact P= 0.02822 +- 0.00164 (10100 permutations done) Chi-square test value=174.67234 (P = 0.59808, 180 d.f.)

Pair(6, 8)

LnLHood LD : -858.48681 LnLHood LE : -892.97279

Exact P= 0.38416 +- 0.00401 (10100 permutations done) Chi-square test value=68.97198 (P = 0.88190, 84 d.f.)

Pair(7, 8)

LnLHood LD : -973.37146 LnLHood LE : -1015.76752

Exact P= 0.89822 +- 0.00292 (10100 permutations done) Chi-square test value=84.79213 (P = 0.99953, 132 d.f.)

Pair(0, 9)

LnLHood LD : -608.93490 LnLHood LE : -620.49676

Exact P= 0.20030 +- 0.00433 (10100 permutations done) Chi-square test value=23.12371 (P = 0.57034, 25 d.f.)

Pair(1, 9)

LnLHood LD : -808.76090 LnLHood LE : -830.63405

Exact P= 0.39465 +- 0.00431 (10100 permutations done) Chi-square test value=43.74631 (P = 0.86250, 55 d.f.)

Pair(2, 9)

LnLHood LD : -676.56680 LnLHood LE : -687.31460

Exact P= 0.77703 +- 0.00378 (10100 permutations done) Chi-square test value=21.49560 (P = 0.96435, 35 d.f.)

Pair(3, 9)

LnLHood LD : -595.10252 LnLHood LE : -607.48110

Exact P= 0.24386 +- 0.00403 (10100 permutations done) Chi-square test value=24.75716 (P = 0.73675, 30 d.f.)

Pair(4, 9)

LnLHood LD : -643.96534 LnLHood LE : -657.55399

Exact P= 0.49743 +- 0.00489 (10100 permutations done) Chi-square test value=27.17730 (P = 0.82486, 35 d.f.)

Pair(5, 9)

LnLHood LD : -952.00027 LnLHood LE : -981.43558

Exact P= 0.42634 +- 0.00435 (10100 permutations done) Chi-square test value=58.87062 (P = 0.91463, 75 d.f.)

Pair(6, 9)

LnLHood LD : -642.58709 LnLHood LE : -654.72331

Exact P= 0.60010 +- 0.00511 (10100 permutations done) Chi-square test value=24.27244 (P = 0.91326, 35 d.f.)

Pair(7, 9)

LnLHood LD : -757.46014 LnLHood LE : -777.51804

67

Exact P= 0.42703 +- 0.00502 (10100 permutations done) Chi-square test value=40.11579 (P = 0.93409, 55 d.f.)

Pair(8, 9)

LnLHood LD : -786.66288 LnLHood LE : -805.20120

Exact P= 0.76921 +- 0.00432 (10100 permutations done) Chi-square test value=37.07663 (P = 0.99129, 60 d.f.)

Pair(0, 10)

LnLHood LD : -804.57673 LnLHood LE : -822.88561

Exact P= 0.36891 +- 0.00448 (10100 permutations done) Chi-square test value=36.61775 (P = 0.62332, 40 d.f.)

Pair(1, 10)

LnLHood LD : -990.65774 LnLHood LE : -1033.02290

Exact P= 0.34386 +- 0.00428 (10100 permutations done) Chi-square test value=84.73033 (P = 0.57893, 88 d.f.)

Pair(2, 10)

LnLHood LD : -866.68788 LnLHood LE : -889.70345

Exact P= 0.61119 +- 0.00532 (10100 permutations done) Chi-square test value=46.03114 (P = 0.82651, 56 d.f.)

Pair(3, 10)

LnLHood LD : -790.51781 LnLHood LE : -809.86995

Exact P= 0.44248 +- 0.00487 (10100 permutations done) Chi-square test value=38.70428 (P = 0.82862, 48 d.f.)

Pair(4, 10)

LnLHood LD : -830.93747 LnLHood LE : -859.94284

Exact P= 0.21673 +- 0.00435 (10100 permutations done) Chi-square test value=58.01074 (P = 0.40105, 56 d.f.)

Pair(5, 10)

LnLHood LD : -1127.56831 LnLHood LE : -1183.82443

Exact P= 0.53267 +- 0.00534 (10100 permutations done) Chi-square test value=112.51224 (P = 0.67382, 120 d.f.)

Pair(6, 10)

LnLHood LD : -828.90544 LnLHood LE : -857.11216

Exact P= 0.17366 +- 0.00375 (10100 permutations done) Chi-square test value=56.41345 (P = 0.45939, 56 d.f.)

Pair(7, 10)

LnLHood LD : -943.04066 LnLHood LE : -979.90689

Exact P= 0.46832 +- 0.00527 (10100 permutations done) Chi-square test value=73.73246 (P = 0.86188, 88 d.f.)

Pair(8, 10)

LnLHood LD : -962.80631 LnLHood LE : -1007.59005

Exact P= 0.20554 +- 0.00397 (10100 permutations done) Chi-square test value=89.56748 (P = 0.66517, 96 d.f.)

Pair(9, 10)

LnLHood LD : -757.25198 LnLHood LE : -769.34057

68

Exact P= 0.86366 +- 0.00346 (10100 permutations done) Chi-square test value=24.17718 (P = 0.97725, 40 d.f.)

Pair(0, 11)

LnLHood LD : -684.42046 LnLHood LE : -694.25943

Exact P= 0.71663 +- 0.00416 (10100 permutations done) Chi-square test value=19.67796 (P = 0.76351, 25 d.f.)

Pair(1, 11)

LnLHood LD : -876.90584 LnLHood LE : -904.39673

Exact P= 0.44792 +- 0.00494 (10100 permutations done) Chi-square test value=54.98178 (P = 0.47533, 55 d.f.)

Pair(2, 11)

LnLHood LD : -744.86195 LnLHood LE : -761.07728

Exact P= 0.49762 +- 0.00569 (10100 permutations done) Chi-square test value=32.43066 (P = 0.59277, 35 d.f.)

Pair(3, 11)

LnLHood LD : -668.33100 LnLHood LE : -681.24378

Exact P= 0.48475 +- 0.00467 (10100 permutations done) Chi-square test value=25.82554 (P = 0.68401, 30 d.f.)

Pair(4, 11)

LnLHood LD : -717.84682 LnLHood LE : -731.31667

Exact P= 0.82832 +- 0.00373 (10100 permutations done) Chi-square test value=26.93970 (P = 0.83342, 35 d.f.)

Pair(5, 11)

LnLHood LD : -1019.01892 LnLHood LE : -1055.19825

Exact P= 0.63307 +- 0.00451 (10100 permutations done) Chi-square test value=72.35866 (P = 0.56498, 75 d.f.)

Pair(6, 11)

LnLHood LD : -710.72481 LnLHood LE : -728.48599

Exact P= 0.33168 +- 0.00465 (10100 permutations done) Chi-square test value=35.52236 (P = 0.44361, 35 d.f.)

Pair(7, 11)

LnLHood LD : -829.57152 LnLHood LE : -851.28072

Exact P= 0.78792 +- 0.00356 (10100 permutations done) Chi-square test value=43.41839 (P = 0.87037, 55 d.f.)

Pair(8, 11)

LnLHood LD : -849.43256 LnLHood LE : -878.96388

Exact P= 0.30505 +- 0.00462 (10100 permutations done) Chi-square test value=59.06264 (P = 0.50999, 60 d.f.)

Pair(9, 11)

LnLHood LD : -631.20112 LnLHood LE : -640.71440

Exact P= 0.60010 +- 0.00525 (10100 permutations done) Chi-square test value=19.02655 (P = 0.79585, 25 d.f.)

Pair(10, 11)

LnLHood LD : -821.09831 LnLHood LE : -843.10324

69

Exact P= 0.25733 +- 0.00427 (10100 permutations done) Chi-square test value=44.00987 (P = 0.30566, 40 d.f.)

Pair(0, 12)

LnLHood LD : -711.57334 LnLHood LE : -730.61009

Exact P= 0.06297 +- 0.00222 (10100 permutations done) Chi-square test value=38.07350 (P = 0.14787, 30 d.f.)

Pair(1, 12)

LnLHood LD : -906.65700 LnLHood LE : -940.74739

Exact P= 0.28465 +- 0.00430 (10100 permutations done) Chi-square test value=68.18078 (P = 0.40297, 66 d.f.)

Pair(2, 12)

LnLHood LD : -780.71030 LnLHood LE : -797.42793

Exact P= 0.72277 +- 0.00392 (10100 permutations done) Chi-square test value=33.43527 (P = 0.82451, 42 d.f.)

Pair(3, 12)

LnLHood LD : -697.00246 LnLHood LE : -717.59443

Exact P= 0.05812 +- 0.00237 (10100 permutations done) Chi-square test value=41.18394 (P = 0.25411, 36 d.f.)

Pair(4, 12)

LnLHood LD : -746.36788 LnLHood LE : -767.66732

Exact P= 0.33129 +- 0.00435 (10100 permutations done) Chi-square test value=42.59888 (P = 0.44521, 42 d.f.)

Pair(5, 12)

LnLHood LD : -1054.43940 LnLHood LE : -1091.54891

Exact P= 0.91604 +- 0.00262 (10100 permutations done) Chi-square test value=74.21902 (P = 0.88542, 90 d.f.)

Pair(6, 12)

LnLHood LD : -743.52993 LnLHood LE : -764.83665

Exact P= 0.26139 +- 0.00456 (10100 permutations done) Chi-square test value=42.61343 (P = 0.44459, 42 d.f.)

Pair(7, 12)

LnLHood LD : -866.43541 LnLHood LE : -887.63137

Exact P= 0.97129 +- 0.00176 (10100 permutations done) Chi-square test value=42.39192 (P = 0.98951, 66 d.f.)

Pair(8, 12)

LnLHood LD : -887.09734 LnLHood LE : -915.31453

Exact P= 0.78901 +- 0.00447 (10100 permutations done) Chi-square test value=56.43439 (P = 0.91115, 72 d.f.)

Pair(9, 12)

LnLHood LD : -661.24935 LnLHood LE : -677.06505

Exact P= 0.13297 +- 0.00344 (10100 permutations done) Chi-square test value=31.63140 (P = 0.38486, 30 d.f.)

Pair(10, 12)

LnLHood LD : -863.47096 LnLHood LE : -879.45390

70

Exact P= 0.96713 +- 0.00159 (10100 permutations done) Chi-square test value=31.96589 (P = 0.96368, 48 d.f.)

Pair(11, 12)

LnLHood LD : -737.06698 LnLHood LE : -750.82773

Exact P= 0.64376 +- 0.00548 (10100 permutations done) Chi-square test value=27.52150 (P = 0.59578, 30 d.f.)

Pair(0, 13)

LnLHood LD : -828.59435 LnLHood LE : -850.58577

Exact P= 0.23525 +- 0.00432 (10100 permutations done) Chi-square test value=43.98284 (P = 0.51498, 45 d.f.)

Pair(1, 13)

LnLHood LD : -1019.96975 LnLHood LE : -1060.72306

Exact P= 0.78416 +- 0.00401 (10100 permutations done) Chi-square test value=81.50663 (P = 0.89918, 99 d.f.)

Pair(2, 13)

LnLHood LD : -895.70292 LnLHood LE : -917.40361

Exact P= 0.90554 +- 0.00274 (10100 permutations done) Chi-square test value=43.40139 (P = 0.97181, 63 d.f.)

Pair(3, 13)

LnLHood LD : -815.83072 LnLHood LE : -837.57011

Exact P= 0.41218 +- 0.00466 (10100 permutations done) Chi-square test value=43.47878 (P = 0.84649, 54 d.f.)

Pair(4, 13)

LnLHood LD : -858.46061 LnLHood LE : -887.64300

Exact P= 0.42505 +- 0.00554 (10100 permutations done) Chi-square test value=58.36479 (P = 0.64197, 63 d.f.)

Pair(5, 13)

LnLHood LD : -1142.34001 LnLHood LE : -1211.52459

Exact P= 0.17079 +- 0.00354 (10100 permutations done) Chi-square test value=138.36915 (P = 0.40367, 135 d.f.)

Pair(6, 13)

LnLHood LD : -852.09256 LnLHood LE : -884.81232

Exact P= 0.10208 +- 0.00324 (10100 permutations done) Chi-square test value=65.43954 (P = 0.39210, 63 d.f.)

Pair(7, 13)

LnLHood LD : -973.74801 LnLHood LE : -1007.60705

Exact P= 0.91772 +- 0.00293 (10100 permutations done) Chi-square test value=67.71809 (P = 0.99313, 99 d.f.)

Pair(8, 13)

LnLHood LD : -994.16204 LnLHood LE : -1035.29021

Exact P= 0.76703 +- 0.00430 (10100 permutations done) Chi-square test value=82.25633 (P = 0.96910, 108 d.f.)

Pair(9, 13)

LnLHood LD : -777.79594 LnLHood LE : -797.04073

71

Exact P= 0.26911 +- 0.00440 (10100 permutations done) Chi-square test value=38.48959 (P = 0.74255, 45 d.f.)

Pair(10, 13)

LnLHood LD : -968.36567 LnLHood LE : -999.42958

Exact P= 0.63465 +- 0.00406 (10100 permutations done) Chi-square test value=62.12782 (P = 0.79027, 72 d.f.)

Pair(11, 13)

LnLHood LD : -848.65221 LnLHood LE : -870.80341

Exact P= 0.46208 +- 0.00520 (10100 permutations done) Chi-square test value=44.30239 (P = 0.50139, 45 d.f.)

Pair(12, 13)

LnLHood LD : -891.21820 LnLHood LE : -907.15406

Exact P= 0.99614 +- 0.00056 (10100 permutations done) Chi-square test value=31.87172 (P = 0.99290, 54 d.f.)

Pair(0, 14)

LnLHood LD : -707.09223 LnLHood LE : -725.28732

Exact P= 0.17287 +- 0.00389 (10100 permutations done) Chi-square test value=36.39019 (P = 0.40379, 35 d.f.)

Pair(1, 14)

LnLHood LD : -902.89077 LnLHood LE : -935.42462

Exact P= 0.58277 +- 0.00416 (10100 permutations done) Chi-square test value=65.06769 (P = 0.83191, 77 d.f.)

Pair(2, 14)

LnLHood LD : -774.20542 LnLHood LE : -792.10517

Exact P= 0.76891 +- 0.00405 (10100 permutations done) Chi-square test value=35.79950 (P = 0.92035, 49 d.f.)

Pair(3, 14)

LnLHood LD : -697.51593 LnLHood LE : -712.27167

Exact P= 0.67832 +- 0.00450 (10100 permutations done) Chi-square test value=29.51147 (P = 0.92683, 42 d.f.)

Pair(4, 14)

LnLHood LD : -738.75539 LnLHood LE : -762.34456

Exact P= 0.29050 +- 0.00432 (10100 permutations done) Chi-square test value=47.17834 (P = 0.54725, 49 d.f.)

Pair(5, 14)

LnLHood LD : -1048.95882 LnLHood LE : -1086.22614

Exact P= 0.96653 +- 0.00179 (10100 permutations done) Chi-square test value=74.53465 (P = 0.98933, 105 d.f.)

Pair(6, 14)

LnLHood LD : -742.24439 LnLHood LE : -759.51388

Exact P= 0.81762 +- 0.00358 (10100 permutations done) Chi-square test value=34.53899 (P = 0.94139, 49 d.f.)

Pair(7, 14)

LnLHood LD : -845.90375 LnLHood LE : -882.30861

72

Exact P= 0.11762 +- 0.00347 (10100 permutations done) Chi-square test value=72.80972 (P = 0.61409, 77 d.f.)

Pair(8, 14)

LnLHood LD : -872.21706 LnLHood LE : -909.99177

Exact P= 0.20743 +- 0.00371 (10100 permutations done) Chi-square test value=75.54941 (P = 0.73346, 84 d.f.)

Pair(9, 14)

LnLHood LD : -645.04825 LnLHood LE : -671.74229

Exact P= 0.00040 +- 0.00019 (10100 permutations done) Chi-square test value=53.38807 (P = 0.02404, 35 d.f.)

Pair(10, 14)

LnLHood LD : -846.11450 LnLHood LE : -874.13114

Exact P= 0.22683 +- 0.00412 (10100 permutations done) Chi-square test value=56.03326 (P = 0.47362, 56 d.f.)

Pair(11, 14)

LnLHood LD : -728.75109 LnLHood LE : -745.50496

Exact P= 0.46663 +- 0.00450 (10100 permutations done) Chi-square test value=33.50775 (P = 0.54018, 35 d.f.)

Pair(12, 14)

LnLHood LD : -760.44498 LnLHood LE : -781.85562

Exact P= 0.29277 +- 0.00427 (10100 permutations done) Chi-square test value=42.82128 (P = 0.43576, 42 d.f.)

Pair(13, 14)

LnLHood LD : -870.81583 LnLHood LE : -901.83130

Exact P= 0.20960 +- 0.00369 (10100 permutations done) Chi-square test value=62.03094 (P = 0.51088, 63 d.f.)

Pair(0, 15)

LnLHood LD : -697.71690 LnLHood LE : -715.23200

Exact P= 0.10851 +- 0.00320 (10100 permutations done) Chi-square test value=35.03022 (P = 0.46677, 35 d.f.)

Pair(1, 15)

LnLHood LD : -901.45849 LnLHood LE : -925.36930

Exact P= 0.92594 +- 0.00258 (10100 permutations done) Chi-square test value=47.82163 (P = 0.99635, 77 d.f.)

Pair(2, 15)

LnLHood LD : -761.03992 LnLHood LE : -782.04985

Exact P= 0.24020 +- 0.00415 (10100 permutations done) Chi-square test value=42.01986 (P = 0.74966, 49 d.f.)

Pair(3, 15)

LnLHood LD : -686.71204 LnLHood LE : -702.21635

Exact P= 0.40277 +- 0.00482 (10100 permutations done) Chi-square test value=31.00861 (P = 0.89416, 42 d.f.)

Pair(4, 15)

LnLHood LD : -730.82301 LnLHood LE : -752.28924

73

Exact P= 0.31129 +- 0.00512 (10100 permutations done) Chi-square test value=42.93246 (P = 0.71637, 49 d.f.)

Pair(5, 15)

LnLHood LD : -1034.65364 LnLHood LE : -1076.17082

Exact P= 0.41178 +- 0.00445 (10100 permutations done) Chi-square test value=83.03438 (P = 0.94405, 105 d.f.)

Pair(6, 15)

LnLHood LD : -733.27579 LnLHood LE : -749.45856

Exact P= 0.75327 +- 0.00462 (10100 permutations done) Chi-square test value=32.36555 (P = 0.96789, 49 d.f.)

Pair(7, 15)

LnLHood LD : -844.94475 LnLHood LE : -872.25329

Exact P= 0.50198 +- 0.00477 (10100 permutations done) Chi-square test value=54.61707 (P = 0.97504, 77 d.f.)

Pair(8, 15)

LnLHood LD : -863.88314 LnLHood LE : -899.93645

Exact P= 0.10356 +- 0.00301 (10100 permutations done) Chi-square test value=72.10660 (P = 0.81932, 84 d.f.)

Pair(9, 15)

LnLHood LD : -650.63338 LnLHood LE : -661.68697

Exact P= 0.63990 +- 0.00445 (10100 permutations done) Chi-square test value=22.10717 (P = 0.95571, 35 d.f.)

Pair(10, 15)

LnLHood LD : -838.73665 LnLHood LE : -864.07582

Exact P= 0.19851 +- 0.00377 (10100 permutations done) Chi-square test value=50.67834 (P = 0.67587, 56 d.f.)

Pair(11, 15)

LnLHood LD : -720.50571 LnLHood LE : -735.44964

Exact P= 0.49752 +- 0.00528 (10100 permutations done) Chi-square test value=29.88786 (P = 0.71321, 35 d.f.)

Pair(12, 15)

LnLHood LD : -750.25966 LnLHood LE : -771.80030

Exact P= 0.13307 +- 0.00331 (10100 permutations done) Chi-square test value=43.08128 (P = 0.42479, 42 d.f.)

Pair(13, 15)

LnLHood LD : -864.52478 LnLHood LE : -891.77598

Exact P= 0.23059 +- 0.00440 (10100 permutations done) Chi-square test value=54.50240 (P = 0.76849, 63 d.f.)

Pair(14, 15)

LnLHood LD : -744.13175 LnLHood LE : -766.47753

Exact P= 0.18931 +- 0.00381 (10100 permutations done) Chi-square test value=44.69156 (P = 0.64831, 49 d.f.)

Pair(0, 16)

LnLHood LD : -598.05108 LnLHood LE : -605.28428

74

Exact P= 0.62842 +- 0.00458 (10100 permutations done) Chi-square test value=14.46640 (P = 0.80608, 20 d.f.)

Pair(1, 16)

LnLHood LD : -797.14409 LnLHood LE : -815.42158

Exact P= 0.52990 +- 0.00551 (10100 permutations done) Chi-square test value=36.55497 (P = 0.77971, 44 d.f.)

Pair(2, 16)

LnLHood LD : -663.85094 LnLHood LE : -672.10213

Exact P= 0.89109 +- 0.00306 (10100 permutations done) Chi-square test value=16.50236 (P = 0.95778, 28 d.f.)

Pair(3, 16)

LnLHood LD : -581.00586 LnLHood LE : -592.26862

Exact P= 0.23000 +- 0.00471 (10100 permutations done) Chi-square test value=22.52553 (P = 0.54793, 24 d.f.)

Pair(4, 16)

LnLHood LD : -632.93116 LnLHood LE : -642.34151

Exact P= 0.80960 +- 0.00410 (10100 permutations done) Chi-square test value=18.82071 (P = 0.90358, 28 d.f.)

Pair(5, 16)

LnLHood LD : -937.22019 LnLHood LE : -966.22310

Exact P= 0.22198 +- 0.00376 (10100 permutations done) Chi-square test value=58.00581 (P = 0.54896, 60 d.f.)

Pair(6, 16)

LnLHood LD : -628.03526 LnLHood LE : -639.51084

Exact P= 0.49337 +- 0.00504 (10100 permutations done) Chi-square test value=22.95115 (P = 0.73548, 28 d.f.)

Pair(7, 16)

LnLHood LD : -742.76786 LnLHood LE : -762.30556

Exact P= 0.29762 +- 0.00490 (10100 permutations done) Chi-square test value=39.07540 (P = 0.68229, 44 d.f.)

Pair(8, 16)

LnLHood LD : -776.57909 LnLHood LE : -789.98872

Exact P= 0.95198 +- 0.00216 (10100 permutations done) Chi-square test value=26.81927 (P = 0.99428, 48 d.f.)

Pair(9, 16)

LnLHood LD : -545.71229 LnLHood LE : -551.73924

Exact P= 0.73455 +- 0.00398 (10100 permutations done) Chi-square test value=12.05390 (P = 0.91421, 20 d.f.)

Pair(10, 16)

LnLHood LD : -740.16994 LnLHood LE : -754.12809

Exact P= 0.44238 +- 0.00417 (10100 permutations done) Chi-square test value=27.91631 (P = 0.67349, 32 d.f.)

Pair(11, 16)

LnLHood LD : -619.89431 LnLHood LE : -625.50192

75

Exact P= 0.91861 +- 0.00280 (10100 permutations done) Chi-square test value=11.21522 (P = 0.94045, 20 d.f.)

Pair(12, 16)

LnLHood LD : -653.67664 LnLHood LE : -661.85258

Exact P= 0.81119 +- 0.00387 (10100 permutations done) Chi-square test value=16.35187 (P = 0.87496, 24 d.f.)

Pair(13, 16)

LnLHood LD : -766.51213 LnLHood LE : -781.82825

Exact P= 0.47663 +- 0.00468 (10100 permutations done) Chi-square test value=30.63224 (P = 0.72153, 36 d.f.)

Pair(14, 16)

LnLHood LD : -646.66749 LnLHood LE : -656.52981

Exact P= 0.73921 +- 0.00514 (10100 permutations done) Chi-square test value=19.72464 (P = 0.87429, 28 d.f.)

Pair(15, 16)

LnLHood LD : -639.11393 LnLHood LE : -646.47449

Exact P= 0.92059 +- 0.00252 (10100 permutations done) Chi-square test value=14.72112 (P = 0.98123, 28 d.f.)

Pair(0, 17)

LnLHood LD : -758.51619 LnLHood LE : -782.05279

Exact P= 0.07218 +- 0.00228 (10100 permutations done) Chi-square test value=47.07321 (P = 0.20552, 40 d.f.)

Pair(1, 17)

LnLHood LD : -952.32253 LnLHood LE : -992.19009

Exact P= 0.51673 +- 0.00517 (10100 permutations done) Chi-square test value=79.73511 (P = 0.72339, 88 d.f.)

Pair(2, 17)

LnLHood LD : -823.56807 LnLHood LE : -848.87064

Exact P= 0.40634 +- 0.00435 (10100 permutations done) Chi-square test value=50.60513 (P = 0.67852, 56 d.f.)

Pair(3, 17)

LnLHood LD : -747.38824 LnLHood LE : -769.03714

Exact P= 0.25871 +- 0.00475 (10100 permutations done) Chi-square test value=43.29780 (P = 0.66563, 48 d.f.)

Pair(4, 17)

LnLHood LD : -790.26118 LnLHood LE : -819.11003

Exact P= 0.20307 +- 0.00362 (10100 permutations done) Chi-square test value=57.69769 (P = 0.41227, 56 d.f.)

Pair(5, 17)

LnLHood LD : -1083.91333 LnLHood LE : -1142.99161

Exact P= 0.31168 +- 0.00495 (10100 permutations done) Chi-square test value=118.15657 (P = 0.53049, 120 d.f.)

Pair(6, 17)

LnLHood LD : -785.47215 LnLHood LE : -816.27935

76

Exact P= 0.07762 +- 0.00242 (10100 permutations done) Chi-square test value=61.61440 (P = 0.28221, 56 d.f.)

Pair(7, 17)

LnLHood LD : -893.76187 LnLHood LE : -939.07408

Exact P= 0.04782 +- 0.00227 (10100 permutations done) Chi-square test value=90.62441 (P = 0.40282, 88 d.f.)

Pair(8, 17)

LnLHood LD : -929.91838 LnLHood LE : -966.75724

Exact P= 0.74960 +- 0.00507 (10100 permutations done) Chi-square test value=73.67772 (P = 0.95609, 96 d.f.)

Pair(9, 17)

LnLHood LD : -711.76846 LnLHood LE : -728.50776

Exact P= 0.35891 +- 0.00496 (10100 permutations done) Chi-square test value=33.47859 (P = 0.75720, 40 d.f.)

Pair(10, 17)

LnLHood LD : -903.47686 LnLHood LE : -930.89660

Exact P= 0.68485 +- 0.00475 (10100 permutations done) Chi-square test value=54.83950 (P = 0.78588, 64 d.f.)

Pair(11, 17)

LnLHood LD : -784.66180 LnLHood LE : -802.27043

Exact P= 0.69366 +- 0.00438 (10100 permutations done) Chi-square test value=35.21727 (P = 0.68519, 40 d.f.)

Pair(12, 17)

LnLHood LD : -813.16686 LnLHood LE : -838.62109

Exact P= 0.26772 +- 0.00473 (10100 permutations done) Chi-square test value=50.90845 (P = 0.35986, 48 d.f.)

Pair(13, 17)

LnLHood LD : -934.20237 LnLHood LE : -958.59677

Exact P= 0.97911 +- 0.00130 (10100 permutations done) Chi-square test value=48.78878 (P = 0.98364, 72 d.f.)

Pair(14, 17)

LnLHood LD : -809.60564 LnLHood LE : -833.29832

Exact P= 0.60743 +- 0.00499 (10100 permutations done) Chi-square test value=47.38537 (P = 0.78700, 56 d.f.)

Pair(15, 17)

LnLHood LD : -802.57044 LnLHood LE : -823.24300

Exact P= 0.66802 +- 0.00442 (10100 permutations done) Chi-square test value=41.34513 (P = 0.92836, 56 d.f.)

Pair(16, 17)

LnLHood LD : -694.19829 LnLHood LE : -713.29528

Exact P= 0.06208 +- 0.00237 (10100 permutations done) Chi-square test value=38.19398 (P = 0.20855, 32 d.f.)

Pair(0, 18)

LnLHood LD : -779.05946 LnLHood LE : -797.98431

77

Exact P= 0.54000 +- 0.00495 (10100 permutations done) Chi-square test value=37.84970 (P = 0.76623, 45 d.f.)

Pair(1, 18)

LnLHood LD : -959.04769 LnLHood LE : -1008.12161

Exact P= 0.19446 +- 0.00351 (10100 permutations done) Chi-square test value=98.14784 (P = 0.50530, 99 d.f.)

Pair(2, 18)

LnLHood LD : -833.87282 LnLHood LE : -864.80215

Exact P= 0.18634 +- 0.00372 (10100 permutations done) Chi-square test value=61.85866 (P = 0.51706, 63 d.f.)

Pair(3, 18)

LnLHood LD : -763.34868 LnLHood LE : -784.96865

Exact P= 0.42842 +- 0.00440 (10100 permutations done) Chi-square test value=43.23994 (P = 0.85271, 54 d.f.)

Pair(4, 18)

LnLHood LD : -810.94972 LnLHood LE : -835.04154

Exact P= 0.81832 +- 0.00400 (10100 permutations done) Chi-square test value=48.18365 (P = 0.91617, 63 d.f.)

Pair(5, 18)

LnLHood LD : -1101.86890 LnLHood LE : -1158.92313

Exact P= 0.82792 +- 0.00349 (10100 permutations done) Chi-square test value=114.10846 (P = 0.90363, 135 d.f.)

Pair(6, 18)

LnLHood LD : -804.88208 LnLHood LE : -832.21087

Exact P= 0.43535 +- 0.00468 (10100 permutations done) Chi-square test value=54.65758 (P = 0.76383, 63 d.f.)

Pair(7, 18)

LnLHood LD : -917.72902 LnLHood LE : -955.00559

Exact P= 0.72515 +- 0.00421 (10100 permutations done) Chi-square test value=74.55314 (P = 0.96834, 99 d.f.)

Pair(8, 18)

LnLHood LD : -940.25082 LnLHood LE : -982.68875

Exact P= 0.63624 +- 0.00457 (10100 permutations done) Chi-square test value=84.87586 (P = 0.95114, 108 d.f.)

Pair(9, 18)

LnLHood LD : -714.67503 LnLHood LE : -744.43927

Exact P= 0.00198 +- 0.00042 (10100 permutations done) Chi-square test value=59.52848 (P = 0.07205, 45 d.f.)

Pair(10, 18)

LnLHood LD : -915.74848 LnLHood LE : -946.82812

Exact P= 0.64693 +- 0.00453 (10100 permutations done) Chi-square test value=62.15928 (P = 0.78944, 72 d.f.)

Pair(11, 18)

LnLHood LD : -799.28191 LnLHood LE : -818.20195

78

Exact P= 0.75950 +- 0.00407 (10100 permutations done) Chi-square test value=37.84009 (P = 0.76657, 45 d.f.)

Pair(12, 18)

LnLHood LD : -821.71748 LnLHood LE : -854.55260

Exact P= 0.05297 +- 0.00201 (10100 permutations done) Chi-square test value=65.67026 (P = 0.13262, 54 d.f.)

Pair(13, 18)

LnLHood LD : -933.53515 LnLHood LE : -974.52828

Exact P= 0.19228 +- 0.00395 (10100 permutations done) Chi-square test value=81.98627 (P = 0.44847, 81 d.f.)

Pair(14, 18)

LnLHood LD : -831.28878 LnLHood LE : -849.22984

Exact P= 0.99376 +- 0.00085 (10100 permutations done) Chi-square test value=35.88212 (P = 0.99765, 63 d.f.)

Pair(15, 18)

LnLHood LD : -809.68142 LnLHood LE : -839.17452

Exact P= 0.13396 +- 0.00316 (10100 permutations done) Chi-square test value=58.98621 (P = 0.62009, 63 d.f.)

Pair(16, 18)

LnLHood LD : -713.78402 LnLHood LE : -729.22680

Exact P= 0.47099 +- 0.00477 (10100 permutations done) Chi-square test value=30.88554 (P = 0.71031, 36 d.f.)

Pair(17, 18)

LnLHood LD : -871.88105 LnLHood LE : -905.99531

Exact P= 0.36743 +- 0.00480 (10100 permutations done) Chi-square test value=68.22852 (P = 0.60415, 72 d.f.)

Pair(0, 19)

LnLHood LD : -770.92748 LnLHood LE : -792.39257

Exact P= 0.47485 +- 0.00490 (10100 permutations done) Chi-square test value=42.93020 (P = 0.88157, 55 d.f.)

Pair(1, 19)

LnLHood LD : -952.42302 LnLHood LE : -1002.52987

Exact P= 0.28673 +- 0.00433 (10100 permutations done) Chi-square test value=100.21371 (P = 0.91588, 121 d.f.)

Pair(2, 19)

LnLHood LD : -834.55202 LnLHood LE : -859.21042

Exact P= 0.86149 +- 0.00354 (10100 permutations done) Chi-square test value=49.31679 (P = 0.99410, 77 d.f.)

Pair(3, 19)

LnLHood LD : -763.34864 LnLHood LE : -779.37692

Exact P= 0.97614 +- 0.00135 (10100 permutations done) Chi-square test value=32.05654 (P = 0.99987, 66 d.f.)

Pair(4, 19)

LnLHood LD : -791.63946 LnLHood LE : -829.44981

79

Exact P= 0.06030 +- 0.00214 (10100 permutations done) Chi-square test value=75.62070 (P = 0.52312, 77 d.f.)

Pair(5, 19)

LnLHood LD : -1081.21595 LnLHood LE : -1153.33139

Exact P= 0.10851 +- 0.00309 (10100 permutations done) Chi-square test value=144.23088 (P = 0.87657, 165 d.f.)

Pair(6, 19)

LnLHood LD : -797.69767 LnLHood LE : -826.61913

Exact P= 0.50901 +- 0.00481 (10100 permutations done) Chi-square test value=57.84293 (P = 0.94943, 77 d.f.)

Pair(7, 19)

LnLHood LD : -911.05561 LnLHood LE : -949.41386

Exact P= 0.80772 +- 0.00432 (10100 permutations done) Chi-square test value=76.71650 (P = 0.99942, 121 d.f.)

Pair(8, 19)

LnLHood LD : -929.27573 LnLHood LE : -977.09702

Exact P= 0.42287 +- 0.00558 (10100 permutations done) Chi-square test value=95.64256 (P = 0.99270, 132 d.f.)

Pair(9, 19)

LnLHood LD : -718.10556 LnLHood LE : -738.84754

Exact P= 0.31208 +- 0.00424 (10100 permutations done) Chi-square test value=41.48396 (P = 0.91110, 55 d.f.)

Pair(10, 19)

LnLHood LD : -906.90125 LnLHood LE : -941.23638

Exact P= 0.58505 +- 0.00445 (10100 permutations done) Chi-square test value=68.67026 (P = 0.93682, 88 d.f.)

Pair(11, 19)

LnLHood LD : -786.14241 LnLHood LE : -812.61021

Exact P= 0.27050 +- 0.00474 (10100 permutations done) Chi-square test value=52.93561 (P = 0.55390, 55 d.f.)

Pair(12, 19)

LnLHood LD : -824.20872 LnLHood LE : -848.96087

Exact P= 0.75505 +- 0.00452 (10100 permutations done) Chi-square test value=49.50431 (P = 0.93539, 66 d.f.)

Pair(13, 19)

LnLHood LD : -923.30791 LnLHood LE : -968.93655

Exact P= 0.09525 +- 0.00272 (10100 permutations done) Chi-square test value=91.25728 (P = 0.69762, 99 d.f.)

Pair(14, 19)

LnLHood LD : -803.65642 LnLHood LE : -843.63810

Exact P= 0.01842 +- 0.00129 (10100 permutations done) Chi-square test value=79.96336 (P = 0.38614, 77 d.f.)

Pair(15, 19)

LnLHood LD : -808.87179 LnLHood LE : -833.58278

80

Exact P= 0.68762 +- 0.00453 (10100 permutations done) Chi-square test value=49.42198 (P = 0.99390, 77 d.f.)

Pair(16, 19)

LnLHood LD : -706.56214 LnLHood LE : -723.63506

Exact P= 0.48069 +- 0.00452 (10100 permutations done) Chi-square test value=34.14584 (P = 0.85735, 44 d.f.)

Pair(17, 19)

LnLHood LD : -868.82229 LnLHood LE : -900.40357

Exact P= 0.78109 +- 0.00366 (10100 permutations done) Chi-square test value=63.16257 (P = 0.97897, 88 d.f.)

Pair(18, 19)

LnLHood LD : -875.14065 LnLHood LE : -916.33509

Exact P= 0.29733 +- 0.00537 (10100 permutations done) Chi-square test value=82.38888 (P = 0.88604, 99 d.f.)

Pair(0, 20)

LnLHood LD : -915.50138 LnLHood LE : -948.24614

Exact P= 0.24436 +- 0.00502 (10100 permutations done) Chi-square test value=65.48951 (P = 0.77546, 75 d.f.)

Pair(1, 20)

LnLHood LD : -1100.88619 LnLHood LE : -1158.38343

Exact P= 0.94257 +- 0.00222 (10100 permutations done) Chi-square test value=114.99448 (P = 0.99888, 165 d.f.)

Pair(2, 20)

LnLHood LD : -972.54497 LnLHood LE : -1015.06398

Exact P= 0.35812 +- 0.00502 (10100 permutations done) Chi-square test value=85.03803 (P = 0.92352, 105 d.f.)

Pair(3, 20)

LnLHood LD : -904.20520 LnLHood LE : -935.23048

Exact P= 0.52069 +- 0.00537 (10100 permutations done) Chi-square test value=62.05056 (P = 0.98922, 90 d.f.)

Pair(4, 20)

LnLHood LD : -937.10134 LnLHood LE : -985.30337

Exact P= 0.16158 +- 0.00376 (10100 permutations done) Chi-square test value=96.40405 (P = 0.71357, 105 d.f.)

Pair(5, 20)

LnLHood LD : -1219.84779 LnLHood LE : -1309.18495

Exact P= 0.70723 +- 0.00433 (10100 permutations done) Chi-square test value=178.67433 (P = 0.98990, 225 d.f.)

Pair(6, 20)

LnLHood LD : -944.01700 LnLHood LE : -982.47269

Exact P= 0.65713 +- 0.00494 (10100 permutations done) Chi-square test value=76.91137 (P = 0.98202, 105 d.f.)

Pair(7, 20)

LnLHood LD : -1045.04278 LnLHood LE : -1105.26742

81

Exact P= 0.43743 +- 0.00528 (10100 permutations done) Chi-square test value=120.44928 (P = 0.99630, 165 d.f.)

Pair(8, 20)

LnLHood LD : -1077.41445 LnLHood LE : -1132.95058

Exact P= 0.96327 +- 0.00181 (10100 permutations done) Chi-square test value=111.07225 (P = 0.99999, 180 d.f.)

Pair(9, 20)

LnLHood LD : -869.66121 LnLHood LE : -894.70110

Exact P= 0.60228 +- 0.00561 (10100 permutations done) Chi-square test value=50.07978 (P = 0.98813, 75 d.f.)

Pair(10, 20)

LnLHood LD : -1035.65720 LnLHood LE : -1097.08995

Exact P= 0.02693 +- 0.00158 (10100 permutations done) Chi-square test value=122.86550 (P = 0.41041, 120 d.f.)

Pair(11, 20)

LnLHood LD : -937.84017 LnLHood LE : -968.46377

Exact P= 0.74950 +- 0.00463 (10100 permutations done) Chi-square test value=61.24722 (P = 0.87382, 75 d.f.)

Pair(12, 20)

LnLHood LD : -963.27671 LnLHood LE : -1004.81443

Exact P= 0.31554 +- 0.00428 (10100 permutations done) Chi-square test value=83.07543 (P = 0.68437, 90 d.f.)

Pair(13, 20)

LnLHood LD : -1075.23647 LnLHood LE : -1124.79011

Exact P= 0.84050 +- 0.00389 (10100 permutations done) Chi-square test value=99.10727 (P = 0.99119, 135 d.f.)

Pair(14, 20)

LnLHood LD : -958.35391 LnLHood LE : -999.49166

Exact P= 0.54327 +- 0.00411 (10100 permutations done) Chi-square test value=82.27551 (P = 0.95065, 105 d.f.)

Pair(15, 20)

LnLHood LD : -947.20153 LnLHood LE : -989.43634

Exact P= 0.12584 +- 0.00284 (10100 permutations done) Chi-square test value=84.46963 (P = 0.92982, 105 d.f.)

Pair(16, 20)

LnLHood LD : -855.58834 LnLHood LE : -879.48862

Exact P= 0.45554 +- 0.00447 (10100 permutations done) Chi-square test value=47.80056 (P = 0.87235, 60 d.f.)

Pair(17, 20)

LnLHood LD : -1002.10529 LnLHood LE : -1056.25713

Exact P= 0.20663 +- 0.00356 (10100 permutations done) Chi-square test value=108.30370 (P = 0.76962, 120 d.f.)

Pair(18, 20)

LnLHood LD : -1021.97843 LnLHood LE : -1072.18865

82

Exact P= 0.78743 +- 0.00426 (10100 permutations done) Chi-square test value=100.42045 (P = 0.98856, 135 d.f.)

Pair(19, 20)

LnLHood LD : -1008.44745 LnLHood LE : -1066.59691

Exact P= 0.43198 +- 0.00550 (10100 permutations done) Chi-square test value=116.29893 (P = 0.99848, 165 d.f.)

Pair(0, 21)

LnLHood LD : -717.09069 LnLHood LE : -728.96238

Exact P= 0.83475 +- 0.00393 (10100 permutations done) Chi-square test value=23.74338 (P = 0.98071, 40 d.f.)

Pair(1, 21)

LnLHood LD : -902.79436 LnLHood LE : -939.09968

Exact P= 0.27208 +- 0.00420 (10100 permutations done) Chi-square test value=72.61063 (P = 0.88188, 88 d.f.)

Pair(2, 21)

LnLHood LD : -769.17482 LnLHood LE : -795.78023

Exact P= 0.07485 +- 0.00269 (10100 permutations done) Chi-square test value=53.21081 (P = 0.58112, 56 d.f.)

Pair(3, 21)

LnLHood LD : -696.96869 LnLHood LE : -715.94673

Exact P= 0.22792 +- 0.00427 (10100 permutations done) Chi-square test value=37.95607 (P = 0.85024, 48 d.f.)

Pair(4, 21)

LnLHood LD : -743.52887 LnLHood LE : -766.01962

Exact P= 0.42832 +- 0.00500 (10100 permutations done) Chi-square test value=44.98150 (P = 0.85415, 56 d.f.)

Pair(5, 21)

LnLHood LD : -1038.47483 LnLHood LE : -1089.90120

Exact P= 0.17010 +- 0.00375 (10100 permutations done) Chi-square test value=102.85275 (P = 0.86883, 120 d.f.)

Pair(6, 21)

LnLHood LD : -742.30316 LnLHood LE : -763.18894

Exact P= 0.45723 +- 0.00496 (10100 permutations done) Chi-square test value=41.77156 (P = 0.92138, 56 d.f.)

Pair(7, 21)

LnLHood LD : -843.36350 LnLHood LE : -885.98367

Exact P= 0.00812 +- 0.00094 (10100 permutations done) Chi-square test value=85.24034 (P = 0.56349, 88 d.f.)

Pair(8, 21)

LnLHood LD : -889.93257 LnLHood LE : -913.66683

Exact P= 0.99208 +- 0.00091 (10100 permutations done) Chi-square test value=47.46850 (P = 0.99999, 96 d.f.)

Pair(9, 21)

LnLHood LD : -667.14381 LnLHood LE : -675.41735

83

Exact P= 0.98465 +- 0.00117 (10100 permutations done) Chi-square test value=16.54708 (P = 0.99962, 40 d.f.)

Pair(10, 21)

LnLHood LD : -855.41685 LnLHood LE : -877.80619

Exact P= 0.72832 +- 0.00420 (10100 permutations done) Chi-square test value=44.77869 (P = 0.96758, 64 d.f.)

Pair(11, 21)

LnLHood LD : -731.38953 LnLHood LE : -749.18002

Exact P= 0.37446 +- 0.00518 (10100 permutations done) Chi-square test value=35.58098 (P = 0.66938, 40 d.f.)

Pair(12, 21)

LnLHood LD : -770.72415 LnLHood LE : -785.53068

Exact P= 0.91505 +- 0.00308 (10100 permutations done) Chi-square test value=29.61305 (P = 0.98298, 48 d.f.)

Pair(13, 21)

LnLHood LD : -879.34030 LnLHood LE : -905.50636

Exact P= 0.59970 +- 0.00448 (10100 permutations done) Chi-square test value=52.33211 (P = 0.96086, 72 d.f.)

Pair(14, 21)

LnLHood LD : -760.66791 LnLHood LE : -780.20791

Exact P= 0.66287 +- 0.00469 (10100 permutations done) Chi-square test value=39.08001 (P = 0.95829, 56 d.f.)

Pair(15, 21)

LnLHood LD : -753.68179 LnLHood LE : -770.15259

Exact P= 0.75901 +- 0.00398 (10100 permutations done) Chi-square test value=32.94161 (P = 0.99404, 56 d.f.)

Pair(16, 21)

LnLHood LD : -647.23507 LnLHood LE : -660.20487

Exact P= 0.37644 +- 0.00483 (10100 permutations done) Chi-square test value=25.93960 (P = 0.76627, 32 d.f.)

Pair(17, 21)

LnLHood LD : -815.95085 LnLHood LE : -836.97338

Exact P= 0.84178 +- 0.00374 (10100 permutations done) Chi-square test value=42.04506 (P = 0.98463, 64 d.f.)

Pair(18, 21)

LnLHood LD : -818.44282 LnLHood LE : -852.90490

Exact P= 0.06584 +- 0.00231 (10100 permutations done) Chi-square test value=68.92415 (P = 0.58093, 72 d.f.)

Pair(19, 21)

LnLHood LD : -817.98127 LnLHood LE : -847.31316

Exact P= 0.53139 +- 0.00483 (10100 permutations done) Chi-square test value=58.66378 (P = 0.99320, 88 d.f.)

Pair(20, 21)

LnLHood LD : -961.10476 LnLHood LE : -1003.16672

84

Exact P= 0.42228 +- 0.00444 (10100 permutations done) Chi-square test value=84.12392 (P = 0.99467, 120 d.

85

STT

Mã số

Năm sinh

Giới tính

Họ tên

Dân tộc

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

MV_M1 MV_M2 MV_M3 MV_M4 MV_M5 MV_M6 MV_M7 MV_M8 MV_M9 MV_M10 MV_M11 MV_M12 MV_M13 MV_M14 MV_M15 MV_M16 MV_M17 MV_M18 MV_M19 MV_M20 MV_M21 MV_M22 MV_M23 MV_M24 MV_M25 MV_M26 MV_M27 MV_M28 MV_M29 MV_M30 MV_M31 MV_M32 MV_M33 MV_M34 MV_M35 MV_M36

2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2006 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2006 2006 2006 2006 2006 2006 2005 2006 2006 2006

M F F F M F F M F F M F M M F F F F F F M M M M M F F M F F F F F F M M

Vàng M. D. Sùng T. L. Và T. M. Giàng T. M. Sùng M. M. Ma M. N. Ly T. S. Vừ M. S. Vàng T. T. Sùng T. T. Thò M. T. Thào T. V. Thò M. V. Giàng M. C. Hầu T. G. Vừ T. H. H. Vàng T. L. H. Sùng T. M. Vừ T. M. Cử T. P. Lầu M. P. Giàng M. P. Sình M. P. Giàng S. T. Vừ Q. T. Ly T. N. A. Vừ T. C. Ly M. H. Giàng T. M. Thò T. M. Vừ T. M. Giàng T. M. Thào T. M. Giàng T. P. Sùng M. S. Vừ M. T.

Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông

Phụ lục 4: Thông tin các mẫu tham gia đề tài

37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79

MV_M37 MV_M38 MV_M39 MV_M40 MV_M41 MV_M42 MV_M43 MV_M44 MV_M45 MV_M46 MV_M47 MV_M48 MV_M49 MV_M50 MV_M51 MV_M52 MV_M53 MV_M54 MV_M55 MV_M56 MV_M57 MV_M58 MV_M59 MV_M60 MV_M61 MV_M62 MV_M63 MV_M64 MV_M65 MV_M66 MV_M67 MV_M68 MV_M69 MV_M70 MV_M71 MV_M72 MV_M73 MV_M74 MV_M75 MV_M76 MV_M77 MV_M78 MV_M79

2006 2006 2005 2006 2006 2006 2006 2005 2006 2005 2006 2005 2005 2005 2007 2007 2007 2007 2007 2007 2007 2007 2006 2007 2007 2007 2005 2004 2005 2005 2005 2005 2005 2005 2007 2006 2005 2005 2007 2004 2005 2005 2005

M M M F M F F M M F M M F F M F F F F M F F M M M M M M M M M M M M M M F F M M F F F

Sùng M. T. Hờ M. C. Vàng M. D. Vừ T. D. Thào M. H. Hờ T. M. Sùng T. M. Vàng M. P. Sùng M. T. Thào T. T. Và M. V. Vàng M. C. Thò T. D. Sùng T. D. Vừ M. C. Giàng T. D. Phan T. L. Vàng T. M. Chá T. M. Lầu T. T. Vàng T. P. Ly T. T. P. Lư M. S. Sình M. S. Vàng M. S. Vừ M. T. Giàng M. L. Vàng M. L. Và M. L. Lầu M. M. Sùng M. P. Vàng M. T. Vàng M. V. Vừ M. C. Ly M.T. Vừ M. H. Vừ T. T. X. Mua N. H. Mua M. N. Vừ M. C. Vừ T. D. Ly N. L. Thò T. M.

Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông

86

MV_M80 80 MV_M81 81 MV_M82 82 MV_M83 83 MV_M84 84 MV_M85 85 MV_M86 86 MV_M87 87 MV_M88 88 MV_M89 89 MV_M90 90 MV_M91 91 MV_M92 92 MV_M93 93 MV_M94 94 MV_M95 95 MV_M96 96 MV_M97 97 MV_M98 98 99 MV_M99 100 MV_M100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122

QB_M1 QB_M2 QB_M3 QB_M4 QB_M5 QB_M6 QB_M7 QB_M8 QB_M9 QB_M10 QB_M11 QB_M12 QB_M13 QB_M14 QB_M15 QB_M16 QB_M17 QB_M18 QB_M19 QB_M20 QB_M21 QB_M22

2005 2005 2005 2005 2005 2005 2004 2005 2004 2005 2005 2005 2004 2004 2004 2004 2004 2004 2004 2004 2004 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2007

F F F M M M M F M M M F M F F M M M F M M M F F F F F F F F F F F F F F F F F F F F F

Sùng T. M. Dương H. M. M. Vàng T. M. Thào M. P. Giàng M. S. Vừ M. S. Vừ M. S. Vừ T. S. Ly M. T. Vừ M. T. Thò M. V. Vừ T. V. Già M. C. Giàng T. G. Thào T. M. Lầu M. S. Già M. S. Thào Đ. S. Trương P. M. T. Và M. T. Mua M. V. Cháng N. C. Giàng T. N. D. Lù T. B. Giàng T. S. Sùng T. L. Hầu T. L. Vàng T. H. Vàng T. C. Hạn T. M. Dương T. C. Giàng T. B. Hầu T. H. Trương T. N. Vàng T. H. Giàng T. L. Ly T. H. Vàng T. N. Vương T. D. Vương B. T. Vàng T. S. Vàng T. L. Hạng T. L.

Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông

87

QB_M23 QB_M24 QB_M25 QB_M26 QB_M27 QB_M28 QB_M29 QB_M30 QB_M31 QB_M32 QB_M33 QB_M34 QB_M35 QB_M36 QB_M37 QB_M38 QB_M39 QB_M40 QB_M41 QB_M42 QB_M43 QB_M44 QB_M45 QB_M46 QB_M47 QB_M48 QB_M49 QB_M50 QB_M51 QB_M52 QB_M53 QB_M54 QB_M55 QB_M56

123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156

2007 2007 2007 2007 2007 2007 2007 2007 2007 2007 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006 2006

F F F F F M M M M M M M M M M F F F F F F F F F F F F F F M M M M M

Sùng T. H. Vàng T. T. Ma T. P. Hương T. X. Hào T. M. N. Lò V. T. Giàng T. M. Ly M. V. Hạng M. T. Sùng T. L. Ly V. C. Lò T. Đ. Cháng L. T. Vàng M. C. Hào M. M. D. N. T. Ma T. M. Giàng T. T. Hạng T. A. Giàng T. D. Cháng T. N. A. Mai T. N. Ly T. T. Ly T. M. Thào T. H. Thào T. D. Lò T. K. Mua T. T. Dương T. T. Giàng M. H. Thào V. D. Sùng M. L. Cháng M. P. Mua M.T.

Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông Mông

88