BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT

NGUYỄN NHƢ GIANG

KHẢO SÁT TẦN SUẤT CÁC ALEN TRONG CÁC LOCUS GEN (ADN) HỆ IDENTIFILER CỦA DÂN TỘC H’MÔNG PHỤC VỤ CÔNG TÁC GIÁM ĐỊNH GEN Ở VIỆT NAM

LUẬN VĂN THẠC SỸ SINH HỌC

HÀ NỘI - NĂM 2014 Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT

LUẬN VĂN THẠC SỸ SINH HỌC

Đề tài:

KHẢO SÁT TẦN SUẤT CÁC ALEN TRONG CÁC LOCUS GEN (ADN) HỆ IDENTIFILER CỦA DÂN TỘC H’MÔNG PHỤC VỤ CÔNG TÁC

GIÁM ĐỊNH GEN Ở VIỆT NAM

Học viên : Nguyễn Nhƣ Giang

Chuyên ngành : Hóa Sinh

Mã số : 60 42 01 14

Ngƣời hƣớng dẫn : PGS. TS Nguyễn Văn Hà

NĂM 2014 Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn

LỜI CẢM ƠN

Lời đầu tiên, tôi xin được gửi lời cảm ơn tới các Thầy, cô đã giảng dạy tại

Viện sinh thái và tài nguyên sinh vật - Viện hàn lâm khoa học và công nghệ Việt

Nam đã truyền đạt cho tôi những kiến thức cơ bản và chuyên sâu về lĩnh vực

Công nghệ sinh học, làm tiền đề cho tôi hoàn thành Luận văn tốt nghiệp.

Tôi cũng xin được bày tỏ lòng biết ơn sâu sắc tới PGS. TS Nguyễn Văn Hà

- Phó giám đốc Trung tâm giám định sinh học pháp lý - Viện Khoa học hình sự

đã tận tình hướng dẫn trong thời gian tôi thực hiện luận văn này.

Tôi xin cảm ơn Lãnh đạo Viện khoa học hình sự, Lãnh đạo Trung tâm giám

định sinh học pháp lý, toàn bộ tập thể cán bộ Trung tâm đã tạo mọi điều kiện

giúp đỡ tôi.

Cuối cùng, tôi xin cảm ơn gia đình đã luôn tạo điều kiện tốt nhất cho tôi

trong suốt quá trình học cũng như hoàn thành luận văn tốt nghiệp.

Hà Nội, ngày 10 tháng 12 năm 2014

Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn

Học viên Nguyễn Nhƣ Giang

ADN

Axit Deoxyribonucleic

STR

Short Tandem Repeats

PCR

Polymerase chain Reaction

D8

D8S1179

D21

D21S11

D7

D7S820

CSF

CSF1PO

D3

D3 S1358

THO1

HUMTHO1

D13

D13S317

D16

D16S539

D2

D2 S1338

D19

D19S433

D18

D18S51

D5

D5 S818

χ²

Khi bình phương thành phần thí nghiệm

Khi bình phương tiêu chuẩn

χα

Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn

CÁC KÍ HIỆU VIẾT TẮT

MỤC LỤC

MỞ ĐẦU .......................................................................................................... 1

CHƢƠNG 1. TỔNG QUAN TÀI LIỆU ........................................................ 5

1. Tình hình nghiên cứu trong và ngoài nước về khảo sát tần suất các

alen của các locus gen sử dụng trong giám định ADN. ................................. 5

1.1. Tình hình nghiên cứu trên thế giới ..................................................... 5

1.2. Tình hình nghiên cứu tại Việt nam .................................................... 5

2. Giám định gen (ADN) ....................................................................................... 6

2.1. Cơ sở khoa học của giám định gen .................................................... 6

2.1.1. Cấu trúc, chức năng của phân tử ADN ........................................... 6

2.1.2. Cơ chế phân ly độc lập và tổ hợp tự do trong sinh sản hữu tính .... 7

2.2. Lịch sử phát triển giám định ADN ................................................... 8

2.3. Khái niệm giám định gen (ADN)..................................................... 10

2.4. Khái niệm về locus và alen .............................................................. 12

2.5. Các tiêu chuẩn cho locus STR dùng trong giám định ADN ............ 13

2.6. Ý nghĩa của cơ sở dữ liệu tần suất alen của các locus STR ............ 14

CHƢƠNG 2. NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU ............ 16

1. Nội dung nghiên cứu: ....................................................................................... 16

2. Phương pháp nghiên cứu: ............................................................................... 16

2.1. Thu mẫu: ......................................................................................... 16

2.2. Hóa chất, thiết bị và dụng cụ: .......................................................... 17

2.2.1. Hóa chất và thiết bị cho tách chiết ADN ...................................... 17

2.2.2. Hóa chất và thiết bị cho định lượng ADN .................................... 18

2.2.3. Hóa chất và thiết bị cho nhân bội và điện di ................................. 18

2.3. Phân tích mẫu ................................................................................................. 18

2.3.1. Tách chiết mẫu bằng chelex ......................................................... 18

2.3.2. Định lượng ADN bằng Realtime PCR ......................................... 19

2.3.3. Nhân bội ADN (PCR) .................................................................. 20

2.3.4. Điện di trên máy điện di mao dẫn (Capillary Electrophoresis- CE)

Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn

................................................................................................................. 22

2.4. Xử lý thống kê số liệu và tính tần suất các locus gen .......................... 25

2.4.1. Cơ sở lý thuyết .............................................................................. 25

2.4.2. Phương pháp xử lý thống kê ........................................................ 25

2.4.3. Các bước tính toán thống kê và kiểm định tiến hành trên phần

mềm Excel: .............................................................................................. 26

CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN ....................... 27

1. Kết quả ................................................................................................................. 27

1.1. Thu mẫu ........................................................................................... 27

1.2. Phân tích mẫu thu được kiểu gen theo yêu cầu và lập được bảng

kiểu gen của 120 cá thể. (Xem bảng 3 - phụ lục) .......................................... 27

1.3. Xử lý số liệu thống kê (Xem bảng 3.1 đến 3.15); tính được bảng tần

suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30); và so sánh với

một số quần thể người Việt và người nước ngoài (Xem bảng 3.31 đến

3.45). ......................................................................................................................... 27

1.3.1. Xử lý số liệu thống kê ................................................................... 27

1.3.2. Bảng tần suất của các mẫu nghiên cứu ......................................... 49

Bảng kết quả và thảo luận cơ sở dữ liệu tần suất phân bố các alen của 15

locus gen (gồm bảng 3.16 đến bảng 3.30) .............................................. 49

1.3.3. Kết quả so sánh tần suất alen của người H’Mông với một số người

tộc người (xem Bảng từ 3.31 đến 3.45) và biện luận : ........................... 56

2. Bàn luận ............................................................................................................. 68

KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................... 69

1. Kết luận ............................................................................................................... 69

2. Kiến nghị ............................................................................................................. 70

TÀI LIỆU THAM KHẢO

PHỤ LỤC

Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn

ỨNG DỤNG ĐỀ TÀI

DANH MỤC CÁC HÌNH, BẢNG BIỂU

Hình 1. Cấu trúc ADN trong nhân tế bào (trang 7)

Hình 2. Các locus gen hệ Identifiler (trang 24)

Bảng 2.1. Thành phần phản ứng Realtime PCR (trang 20)

Bảng 2.2. Chu trình nhiệt của phản ứng PCR trên máy realtime 7500 (trang 20)

Bảng 2.3. Thành phần của phản ứng PCR (trang 22)

Bảng 2.4. Chu trình nhiệt trên máy PCR 9700 (trang 22)

Bảng 2.5. Thành phần của hỗn hợp điện di (trang 24)

Bảng 3.1 đến 3.15. Xử lý số liệu thống kê (trang 27 đến trang 46)

Bảng 3.16 đến 3.30 Bảng tần suất alen của 120 mẫu nghiên cứu (trang 49 đến trang 55)

Bảng 3.31 đến 3.45. So sánh tần suất alen với một số quần thể (trang 56 đến trang 67)

Bảng 1: Danh sách người H’ Mông được thu mẫu (Phần phụ lục)

Bảng 2: Kết quả định lượng 120 mẫu ADN của 120 cá thể người H’Mông (Phần

phụ lục)

Bảng 3: Kết quả kiểu gen 120 cá thể người H’ Mông (kí hiệu HM1 đến HM120)

(Phần phụ lục)

Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn

MỞ ĐẦU

Cơ sở khoa học, thực tiễn và tính cấp thiết của việc nghiên cứu đề tài:

Người đầu tiên đặt nền móng cho ngành di truyền học là Mendel. Ông

là người đầu tiên phát hiện ra các quy luật di truyền. Mendel đã gọi những đặc

điểm được truyền từ thế hệ này qua thế hệ khác là “nhân tố di truyền”, mà sau

này được gọi là gen.

Trong nhân tế bào, các nhiễm sắc thể sắp xếp thành 23 cặp, trong đó 22

cặp nhiễm sắc thể thường và 1 cặp nhiễm sắc thể giới tính. Các cặp nhiễm sắc

thể này quy định các tính trạng khác nhau của cơ thể, được bảo tồn duy trì

trong thế hệ và được di truyền từ thế hệ này sang thế hệ khác. Con cái được

thừa hưởng các đặc tính di truyền thông qua 23 nhiễm sắc thể từ tinh trùng

của bố và 23 nhiễm sắc thể từ tế bào trứng của mẹ. Xét nghiệm truy nguyên

cá thể người cũng như xác định huyết thống trực hệ cha - con, mẹ - con chủ

yếu được thực hiện bằng cách sử dụng các marker ADN nằm trên các NST

trong nhân tế bào. Ngoài ra phân tích các marker trên nhiễm sắc thể Y còn có

thể xác định quan hệ huyết thống theo dòng cha.

ADN thường được coi là vật liệu di truyền ở cấp độ phân tử tham gia

quyết định các tính trạng. Trong quá trình sinh sản, phân tử ADN được nhân

đôi và truyền cho thế hệ sau. Năm 1953, Watson và Crick đã xây dựng mô

hình cấu trúc không gian của phân tử ADN. Theo hai ông, ADN có cấu trúc

từ hai sợi xoắn kép có phân tử lượng rất lớn, mỗi sợi ADN là một chuỗi xoắn

nucleotid gồm 4 loại bazơ nitơ: Adenin (A), Guanin (G), Cytosin (C) và

Thymin (T) sắp xếp kế tiếp nhau, xoắn đều quanh một trục theo chiều từ trái

sang phải như một thang dây xoắn, mà 2 tay thang là các phân tử đường

(C5H10O4) và axit phôtphoric sắp xếp xen kẽ nhau, còn mỗi bậc thang là một

cặp bazơ nitric đứng đối diện và liên kết với nhau bằng các liên kết hiđrô theo

1

nguyên tắc bổ sung, nghĩa là một bazơ lớn (A hoặc G) được bù bằng một

bazơ bé (T hoặc C) hay ngược lại. Do đặc điểm cấu trúc, Adenin chỉ liên kết

với Thymin bằng 2 liên kết hiđrô và Guanin chỉ liên kết với Cytosin bằng 3

liên kết hiđrô. Do các cặp nuclêôtit liên kết với nhau theo nguyên tắc bổ sung,

chiều rộng của chuỗi xoắn kép bằng 20Å , khoảng cách giữa các bậc thang

trên chuỗi xoắn bằng 3,4Å, phân tử ADN xoắn theo chu kỳ xoắn, mỗi chu kỳ

xoắn có 10 cặp nucleotit có chiều cao 34Å.

Nghiên cứu và ứng dụng công nghệ ADN vào công tác đấu tranh

phòng chống tội phạm là một mũi nhọn đã được thực hiện ở nhiều quốc gia từ

những năm 80 của thế kỷ XX. Cùng với sự tiến bộ của khoa học công nghệ,

giám định ADN ngày càng phát triển, hoàn thiện cả về công nghệ, phương

pháp và khả năng đáp ứng nhu cầu chung của pháp luật và của cả xã hội. Kết

luận của giám định ADN mang tính quyết định đối với các vụ việc mang tính

hình sự, dân sự như truy nguyên cá thể, xác định quan hệ huyết thống, xác

định tung tích nạn nhân trong các vụ thảm họa, chiến tranh… là rất cần thiết

và cấp bách. Tuy nhiên, để bảo đảm tính khoa học và tính pháp lý thì các

phòng thí nghiệm giám định ADN cần phải có tần suất các alen của các locus

gen để sử dụng khi dùng phân tích, kết luận giám định ADN cho mỗi một

quần thể người (dân tộc). Việc nghiên cứu, khảo sát tần suất alen của các

locus gen dùng trong giám định ADN của các dân tộc trên thế giới đã được

tiến hành ở mức cơ bản. Tuy nhiên tùy thuộc vào số dân tộc ở mỗi quốc gia

cũng như phụ thuộc vào năng lực giám định ADN của mỗi nước, các công bố

về tần suất alen của các locus gen dùng trong giám định ADN ở mỗi nước

khác nhau đối với mỗi dân tộc khác nhau là khác nhau.

Trong các điều kiện cần phải có khi kết luận giám định ADN thì có một

điều kiện bắt buộc đó là phải có cơ sở dữ liệu tần suất alen của các locus gen

dùng cho giám định gen đối mỗi quần thể người (dân tộc) cụ thể. Hiện nay,

trên thế giới, các đơn vị giám định ADN đang sử dụng phổ biến các bộ Kit

2

với 16 locus gen như bộ kit Identifiler, Identifiler Plus và Identifiler Direct

(hãng AB, Mỹ) hoặc bộ kit Powerplex (hãng Promega, Mỹ)… để tính toán tần

suất xuất hiện của các alen. Trên cơ sở đó tính toán xác suất trùng nhau giữa

các mẫu khi phải truy nguyên đồng nhất hoặc xác suất quan hệ huyết thống

giữa các mẫu khi phải xác định quan hệ huyết thống trong giám định ADN.

Ở Việt Nam hiện nay, Viện Khoa học hình sự và đa số các cơ quan, tổ

chức giám định đang sử dụng các bộ kit Identifiler, Identifiler Plus, và

Identifiler Direct cho giám định ADN. Năm 2011, bảng tần suất các alen của

các locus gen của hệ Identifiler trong quần thể người Việt (Kinh) được công

bố trên tạp chí ForensicAsia. Cho đến nay, chưa có một nghiên cứu nào được

công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ

Identifiler (gồm 15 gen) trong quần thể người H’Mông. Với dân số khoảng

80.000 người (đứng thứ 8 trong tổng số 54 các dân tộc Việt Nam), dân tộc

H’Mông phân bố khắp trên các tỉnh miền núi phía Bắc Việt Nam: Quảng

Ninh, Lạng Sơn, Bắc Cạn, Cao Bằng, Hà Giang, Tuyên Quang, Yên Bái, Lào

Cai, Lai Châu, Điện Biên, Sơn La, Hoà Bình, Thanh Hoá, Nghệ An và số ít ở

Phú Thọ, cũng như các tỉnh Tây Nguyên, đây là những điểm nóng về tình

hình an ninh và trật tự xã hội, số vụ án trong cộng đồng người H’Mông có

diễn biến phức tạp với xu hướng ngày càng gia tăng. Vì vậy, việc tiến hành

triển khai đề tài nghiên cứu: “Khảo sát tần suất các alen trong các locus gen

(ADN) hệ Identifiler của dân tộc H’Mông phục vụ cho công tác giám định

gen ở Việt Nam” là một yêu cầu cấp thiết.

Mục đích của đề tài :

1. Khảo sát tần suất các alen trong các locus gen (ADN) hệ Identifiler

của dân tộc H’Mông phục vụ công tác giám định gen ở Việt Nam.

2. Trên cơ sở đó, tính tần suất xuất hiện của mỗi alen trong từng locus

của dân tộc H’Mông, làm cơ sở khoa học để phân tích, đánh giá và

đưa ra kết luận giám định truy nguyên huyết thống hoặc truy nguyên

3

cá thể.

Nội dung của đề tài, các vấn đề cần giải quyết

Đề tài sẽ bao gồm một số nội dung chính với các vấn đề cần giải quyết sau:

- Thu thập 120 mẫu tế bào niêm mạc miệng của cá thể người H’Mông

không có quan hệ họ hàng ở các tỉnh khác nhau (có thông tin cá

nhân).

- Tách chiết ADN bằng phương pháp tách chiết vô cơ, sử dụng chelex

100 (hãng Bio - Rad, Mỹ).

- Định lượng ADN bằng phương pháp Real-time PCR sử dụng bộ Kit

Quantifiler® Human DNA Quantification (hãng ABI, Mỹ).

- Nhân bội ADN trên máy tạo chu trình nhiệt ABI – 9700 bằng bộ Kit

Identifiler (hãng ABI, Mỹ).

- Điện di và phân tích kết quả trên máy Phân tích gen ABI – 3130 với

phần mềm GeneMapper ID của hàng ABI (Mỹ).

- Phân tích kiểu gen (ADN) của các locus gen hệ Identifiler (15 locus

gen) của 120 cá thể người H’Mông. Từ cơ sở đó, tính tần suất xuất

hiện của mỗi alen của từng locus trong quần thể, kiểm định tính

chính xác của số lượng mẫu trong khảo sát với độ tin cậy p = 0,05.

Kết quả là bảng tần suất các alen của các locus gen hệ Identifiler

quần thể người H’Mông làm cơ sở khoa học để các cơ quan giám

định, các cơ quan tố tụng hình sự, dân sự sử dụng phân tích và đưa

ra kết luận trong giám định gen.

Đề tài này khi được hoàn thành sẽ đáp ứng yêu cầu của giám định

gen ở Việt Nam nói chung và đóng góp vào nhiệm vụ giám định ADN

cho các lực lượng thực thi pháp luật trên toàn cầu, nhất là trong bối

4

cảnh toàn cầu hóa giữa cảnh sát các nước thông qua Interpol.

CHƢƠNG 1. TỔNG QUAN TÀI LIỆU

1. Tình hình nghiên cứu trong và ngoài nƣớc về khảo sát tần suất các

alen của các locus gen sử dụng trong giám định ADN.

1.1. Tình hình nghiên cứu trên thế giới

Trên thế giới, ở các nước có phòng giám định gen đều đã nghiên cứu,

khảo sát và công bố kết quả của mình về sự phân bố tần suất các alen của các

gen hình sự. Ví dụ như tập đoàn Applied Biosystem (Mỹ) khảo sát 15 gen của

người Mỹ - Phi, người Mỹ - Tây Ban Nha ... Kết quả khảo sát 15 gen của

người Malaixia, Philipin, Hàn quốc, Guatemala, Sudan, Thái lan, Vênêzuela,

Bănglađet, Inđônêsia... đã được công bố. Đây là những số liệu rất có giá trị

không chỉ đối với lĩnh vực giám định gen của các nước đó mà còn có giá trị

về mặt khoa học đối với các giám định viên và các nhà khoa học nghiên cứu

về gen sử dụng trong giám định ADN trên thế giới [15, 26, 27].

Trong giám định ADN, bên cạnh việc sử dụng rộng rãi bộ kít của hãng

Applied Biosystem, bộ kít của hãng Promega cũng được nhiều nơi sử dụng

[14]. Ví dụ tại Mỹ, mỗi bang có từ 1 đến nhiều phòng thí nghiệm giám định

ADN và có thể dùng kit hệ Identifiler hoặc kit PowerPlex. Để thống nhất trên

toàn nước Mỹ, cảnh sát liên bang Mỹ (FBI) hiện dùng cơ sở dữ liệu tần suất

của 13 locus gen (trùng nhau trong hệ Identifiler và hệ PowerPlex) trong phần

mềm CODIS (Combined DNA index system) - một phần mềm nổi tiếng để

truy xuất, tìm kiếm, so sánh dữ liệu trong giám định ADN. Phần mềm này

đang được triển khai ở 49 quốc gia và vùng lãnh thổ trên thế giới.

1.2. Tình hình nghiên cứu tại Việt nam

Giám định gen ở Việt Nam bắt đầu triển khai chính thức từ tháng 4 năm

1999 tại Viện Khoa học hình sự, toàn bộ quy trình giám định gen được

chuyển giao từ Viện Khoa học hình sự - Bang Victoria - c cùng đội ngũ

5

giám định viên được đào tạo cơ bản tại c. Năm 2000, đề tài cấp Bộ nghiên

cứu khảo sát và xây dựng tần suất của các gen trong hệ Nineplex (10 locus

gen, trong đó có 1 locus gen xác định giới tính) được triển khai và năm 2002

đã được nghiệm thu đưa vào sử dụng làm cơ sở tính toán kết quả giám định

ADN [4] tại Viện Khoa học hình sự.

Năm 2006, Viện Khoa học hình sự - Bộ Công an được trang bị và triển

khai sử dụng kit phân tích ADN hệ Identifiler (gồm 15 locus gen và 1 locus

gen xác định giới tính) để tăng hiệu quả phân tích gen (ADN) phục vụ cho

công tác điều tra, phá án, tìm kiếm nạn nhân trong các vụ việc cũng như trong

các vụ giám định ngoài tố tụng .... Do tần suất xuất hiện của mỗi alen của các

locus gen trong hệ Identifiler ở mỗi quần thể dân tộc khác nhau là có sự phân

bố alen khác nhau. Yêu cầu cấp thiết đặt ra là phải xây dựng được tần suất

phân bố các alen của các locus gen hệ Identifiler trong quần thể của mỗi dân

tộc sinh sống trên lãnh thổ Việt Nam [28, 29].

Đến năm 2011, một đề tài cấp bộ do Viện Khoa học hình sự chủ trì đã

hoàn thành việc khảo sát tần suất alen các locus gen hệ Identifiler trong quần

thể người Việt (Kinh) với 170 cá thể.

Ở Việt Nam, cho đến nay chưa có một nghiên cứu hoàn chỉnh nào được

công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ

Identifiler trong quần thể người H’Mông được công bố.

2. Giám định gen (ADN)

2.1. Cơ sở khoa học của giám định gen

2.1.1. Cấu trúc, chức năng của phân tử ADN

Năm 1953, hai nhà nghiên cứu khoa học James D.Watson (Mỹ) và

Francis H.C Crick (Anh) đã công bố mô hình cấu trúc chuỗi xoắn kép phân tử

ADN. Đây là dấu mốc chính thức đánh dấu sự ra đời của Sinh học phân tử.

Các nhà khoa học đã phát hiện ra bản chất di truyền nằm trên cấu trúc

6

nhiễm sắc thể. Nhiễm sắc thể được cấu trúc từ phân tử ADN kết hợp với các

protein kiềm (histon). Phân tử ADN là một chuỗi xoắn kép gồm hai mạch

đơn, mỗi mạch đơn là một chuỗi nucleotide. Mỗi nucleotide gồm nhóm

phosphate, đường deoxyribose và một trong bốn base (adenine, cytosine,

guanine và thymine). Hai mạch đơn kết hợp với nhau nhờ các liên kết hydro

hình thành giữa các base bổ xung nằm trên hai mạch: base adenine (A) liên

kết với base thymine (T) bằng hai liên kết hydro (A=T); base cytosine (C) liên

kết với base guanine (G) bằng ba liên kềt hydro (CG). Mỗi mạch đơn là một trình tự có định hướng với một đầu là đầu 5'phosphate tự do và một đầu là

3'hydroxyl tự do (hướng quy ước là 5’3'). Hướng của hai mạch đơn trong

chuỗi xoắn kép ngược nhau và là hai mạch đối song song.

Hình 1. Cấu trúc ADN

2.1.2. Cơ chế phân ly độc lập và tổ hợp tự do trong sinh sản hữu tính

Năm 1956, Joe Hin Tjio và Albert Levan đã xác định chính xác ở

người, trong nhân tế bào thể (tế bào lưỡng bội) có 46 nhiễm sắc thể (NST)

7

được xếp thành 23 cặp đồng dạng: 22 cặp nhiễm sắc thể thường và một cặp

nhiễm sắc thể giới tính. Riêng tế bào trứng và tế bào tinh trùng chỉ có 23

nhiễm sắc thể (tế bào đơn bội). Thế hệ con cái nhận từ mẹ 23 nhiễm sắc thể

thông qua tế bào trứng và 23 nhiễm sắc thể từ cha thông qua tế bào tinh trùng.

Bộ nhiễm sắc thể được bảo tồn và truyền từ thế hệ này sang thế hệ khác và

mang tính đặc trưng cho loài người [19, 20,]. Theo định luật 1 và 2 của

Mendel, các nhiễm sắc thể phân ly độc lập, tổ hợp tự do đã góp phần tạo ra sự

đa dạng của các cá thể của mỗi loài thông qua sinh sản hữu tính. Đó là cơ sở

khoa học góp phần tạo nên sự khác biệt của mỗi cá thể trong quần thể, điều

mà chúng ta sử dụng để truy nguyên cá thể, xác định quan hệ huyết thống …

trong giám định gen.

2.2. Lịch sử phát triển giám định ADN

Năm 1985, Alec Jeffreys và các cộng sự ở trường đại học Leicester nước

Anh khi nghiên cứu các đoạn ADN mã hóa cho myoglobin trong máu người

đã phát hiện ra trình tự của các bazơnitơ được lặp lại một số lần với chiều dài

đoạn lặp từ 10 - 15 bp (base pair) hoặc vài chục bp, các đoạn lặp này được gọi

là tiểu vệ tinh (minisatellite) hay VNTR (Variable Number of Tandem

Repeats). Điều đáng chú ý là số lần lặp lại các đoạn lặp này ở các cá thể khác

nhau thì khác nhau. Alec Jeffreys coi đây là đặc điểm rất quan trọng để phân

biệt sự khác nhau giữa các cá thể và có thể sử dụng để truy nguyên cá thể.

Cũng vào thời điểm năm 1985, tác giả Karry Mullis và cộng sự đã công

bố kết quả thử nghiệm thành công phản ứng chuỗi nhân gen PCR (Polymerase

Chain Reaction). Thành công này là một chìa khóa để mở ra tất cả những

hướng nghiên cứu trong sinh học phân tử [13, 16].

Năm 1991, một phương pháp mới trong giám định ADN được giới

thiệu, đó là phương pháp phân tích sử dụng các đoạn lặp lại ngắn STR (Short

8

Tandem Repeats), các STR có đoạn lặp từ 2 - 6 bp.

Các cấu trúc STR đều mang tính bảo thủ cao, được di truyền qua các thế

hệ và mang tính đặc trưng cho cá thể. Các gen này thường có tính đa hình

cao, ít đột biến, tương đối bền vững và cho phép đồng thời thực hiện được

phản ứng nhân gen của nhiều gen khác nhau.

Dựa trên tính đa hình của các cấu trúc STR về chiều dài: Một số gốc

nucleotid được lặp đi lặp lại nhiều lần trên chiều dài của đoạn ADN.

Ví dụ: tại locus D7S820 của một cá thể, các alen phân biệt nhau bằng

số đoạn lặp GATA.

Alen thứ nhất: GATA GATA... ............GATA  có 8 đoạn lặp

GATA

Alen thứ hai: GATA GATA GATA... GATA 12 đoạn lặp GATA

Locus D7S820 này là dị hợp tử với các alen là: 8 - 12.

Các locus STR có ưu điểm hơn các locus VNTR vì chúng bền vững

hơn (ít bị đột biến và đứt gãy), có khả năng nhân tổ hợp được nhiều gen trong

cùng một phản ứng PCR và những mẫu đem phân tích ít nhiều có biến tính

vẫn có thể cho kết quả.

Tháng 10 năm 1990, tại Mỹ, Dự án hệ gen người (Human Genome

Project-HGP) chính thức khởi động. Đến ngày 12 tháng 02 năm 2001, HGP

và Celera đã công bố trình tự đầy đủ của hệ gen người. Đây là một sự kiện

trọng đại trong sự phát triển của sinh học phân tử nói chung và trong việc

nghiên cứu gen người nói riêng. Theo công bố này, số lượng gen trong bộ gen

người có khoảng 35000 gen, trong đó có hàng chục gen được nghiên cứu ứng

dụng để sử dụng xác định huyết thống và truy nguyên cá thể [19].

Đến những năm cuối thế kỷ 20, các nhà khoa học hình sự mới ứng

dụng công nghệ gen (DNA Technology) vào trong đấu tranh với tội phạm,

9

xác định huyết thống và định danh cá thể. Giám định gen (ADN) là một trong

những phương pháp khoa học có độ chính xác rất cao, giúp cơ quan pháp luật

xác định chính xác tội phạm, truy tìm tung tích nạn nhân cũng như xác định

quan hệ huyết thống [23, 24].

2.3. Khái niệm giám định gen (ADN)

Trong giám định kỹ thuật hình sự có nhiều phương pháp để truy

nguyên cá thể người và giám định ADN hiện nay là một trong những phương

pháp đắc lực nhất để giúp các nhà điều tra hình sự xác định chính xác tội

phạm, truy tìm tung tích nạn nhân cũng như xác định quan hệ huyết thống

[13]. Từ năm 1987 đến nay, phương pháp giám định ADN từ các mẫu vật có

nguồn gốc cơ thể người được phát triển mạnh mẽ do tính chính xác, khả năng

truy nguyên cao và đa dạng về loại mẫu vật. Tính ưu việt của giám định gen

là truy nguyên được cá thể người, xác định quan hệ huyết thống cha - con -

mẹ, xác định danh tính hài cốt... Ban đầu, giám định gen được gọi là giám

định vân tay di truyền (DNA - "fingerprinting"), về sau để tránh sự hiểu lầm

giữa giám định đường vân và giám định gen, Uỷ ban nghiên cứu quốc gia Mỹ

(NRC) đề nghị đổi là truy nguyên ADN (DNA - profiling) [14, 20].

Giám định gen (ADN) là nghiên cứu, phân tích ADN từ các dấu vết,

vật chứng có nguồn gốc cơ thể người bằng kỹ thuật gen.Thông qua phân tích

ADN để xác định truy nguyên, nhận dạng cá thể người hoặc xác định quan hệ

huyết thống [19]. Trong đó, giám định gen trong nhân tế bào trên các nhiễm

sắc thể thường là phổ biến để tính toán truy nguyên cá thể hoặc xác định quan

hệ huyết thống. Giám định gen trên nhiễm sắc thể giới tính được quan tâm

nhiều ở các locus trên nhiễm sắc thể Y nhằm truy nguyên theo dòng cha.

Giám định gen ti thể để xác định quan hệ huyết thống theo dòng mẹ, đây là

loại giám định truy nguyên theo nhóm …

Số lượng locus gen được sử dụng phân tích càng nhiều thì khi tính toán

10

xác suất xuất hiện để truy nguyên hoặc tính quan hệ huyết thống cho kết quả

có độ tin cậy càng cao. Theo tập đoàn Perkin-Elmer (Mỹ), khi phân tích tổ

hợp 9 locus gen hệ Profiler Plus thì khả năng trùng hợp ngẫu nhiên tổ hợp các

kiểu gen là vô cùng nhỏ, vì tần suất xuất hiện của chúng là khoảng 1/72 tỉ

[29].

Trong vài năm trở lại đây, trên thế giới cũng như ở Viện Khoa học hình

sự đã đưa vào sử dụng bộ kit Identifiler phân tích 16 locus gen bằng máy giải

trình tự gen ABI 3130 Genetic Analyzer [6, 15].

Đây là bộ kit phức hợp dùng nhân bội, phân tích đồng thời 16 locus

STR. Đặc điểm của các locus gen STR trong bộ kit này:

- Locus gen D8S1179 nằm trên nhiễm sắc thể số 8, dài 128 - 168 cặp

bazơ, có 12 alen

- Locus gen D21S11 nằm trên nhiễm sắc thể số 21, dài 189 - 243 cặp

bazơ, có 35 alen

- Locus gen D7S820 nằm trên nhánh dài nhiễm sắc thể số 7, dài 258 -

294 cặp bazơ, có 11 alen

- Locus CSF1PO nằm trên nhánh dài nhiễm sắc thể số 5, dài 284 - 312

cặp bazơ, có 8 alen

- Locus gen D3S1358 nằm trên nhánh ngắn nhiễm sắc thể số 3, dài 114

- 142 cặp bazơ, có 12 alen

- Locus HUMTH01 nằm ở intron 1 của gen tyrosine hydroxylase

người, trên nhánh ngắn nhiễm sắc thể số 11, dài 168 - 192 cặp bazơ, có 7 alen

- Locus gen D13S317 nằm trên nhánh dài nhiễm sắc thể số 13, dài 206

- 234 cặp bazơ, có 9 alen

- Locus gen D16S539 nằm trên nhiễm sắc thể số 16, dài 245-269 cặp

11

bazơ, có 7 alen

- Locus gen D2S1338 nằm trên nhiễm sắc thể số 2

- Locus gen D19S433 nằm trên nhiễm sắc thể số 19

- Locus gen vWA nằm trên nhánh ngắn nhiễm sắc thể số 12, dài 157 -

197 cặp bazơ, có 13 alen

- Locus TPOX: Nằm ở intron 10 của gen thyroid peroxidase người, trên

nhánh ngắn nhiễm sắc thể số 2, dài 221 - 241 cặp bazơ, có 6 alen

- Locus gen D18S51 nằm trên nhánh dài nhiễm sắc thể số 18, dài 273 -

341cặp bazơ, có 25 alen

- Locus D5S818 (D5) nằm trên nhánh dài nhiễm sắc thể số 5, dài 135 -

171cặp bazơ, có 10 alen

Theo các nhà khoa học hình sự, khi phân tích bằng bộ kit Identifiler thì độ tin cậy đạt là: 1/ 4,62 x 1019, có nghĩa là trong số 4,62 x 1019 người thì mới

có một người trùng ngẫu nhiên với tổ hợp kiểu gen trên [15, 20].

Cùng với sự phát triển của công nghệ tự động hóa, các công đoạn giám

định ADN đã được tự động bằng các robot chuyên dụng, có khả năng phân

tích tới hàng trăm mẫu mỗi ngày trên 1 hệ thống. Về cơ bản, các hệ thống

phân tích tự động để xây dựng tàng thư ADN vẫn đang phân tích mẫu bằng

cách sử dụng các bộ kit có tổ hợp 13 locus (hệ CODIS) hoặc 16 locus hệ

Identifiler … dùng lưu trữ, tìm kiếm tội phạm và quản lý các đối tượng có

nguy cơ phạm pháp cao.

2.4. Khái niệm về locus và alen

Locus: là một đoạn ADN trên nhiễm sắc thể, dành cho một gen nhất

định [19]. Trong giám định ADN thì locus còn có thể là những đoạn ADN

không mã hóa [19].

Alen là các trạng thái khác nhau của cùng một gen. Mỗi cá thể đều có

12

hai alen cho mỗi một locus, trong đó một alen di truyền từ bố, một alen di

truyền từ mẹ. Nếu hai alen của một locus hoàn toàn giống nhau thì được gọi

là đồng hợp tử, còn khác nhau được gọi là dị hợp tử [14, 19].

2.5. Các tiêu chuẩn cho locus STR dùng trong giám định ADN

Giám định ADN hiện nay sử dụng các locus STR là chủ yếu. Phương

pháp giám định gen có độ tin cậy rất cao bởi các locus STR có tính đa alen

(tính đa hình) rất cao, mỗi alen chỉ xuất hiện trong quần thể với tần số rất thấp

[14, 24]. Locus STR ngắn nên có thể đồng thời phân tích được ba hoặc nhiều

STR hơn trong cùng một thời điểm. Việc phân tích đa hệ rất có giá trị vì

chúng có kết quả phân biệt lớn và thành công ngay cả một số trường hợp mẫu

lẫn hoặc đã bị phân hủy phần nào [13].

Một locus STR được sử dụng cho mục đích nhận dạng và xác định cá

thể phải đảm bảo các thông số sau:

- Có tính bền vững cao (tần suất đột biến thấp)

- Locus STR phải có tính đa hình và mức độ dị hợp tử cao. Điều này

giúp các nhà phân tích chỉ sử dụng một số locus tối thiểu đã đạt được sự phân

biệt cá thể một cách tốt nhất.

- Các locus STR có độ dài ngắn, trung bình từ 100 - 400 bp so với các

đoạn đa hình ngẫu nhiên khác. Các đoạn ADN ngắn có độ bền vững cao, ít bị

đứt gãy dưới tác động của điều kiện ngoại cảnh. Do vậy, khi tiến hành PCR

sẽ thu được hiệu quả tốt hơn các đoạn ADN dài.

- Các locus chứa đoạn STR phải đảm bảo yếu tố di truyền độc lập, do

vậy nên lựa chọn tổ hợp các locus nằm trên các nhiễm sắc thể khác nhau là rất

quan trọng. Các STR thông thường có rất nhiều alen, độ dài của các alen

thông thường khác nhau số đoạn lặp. Do vậy, việc sử dụng các STR có chiều

dài dưới 400 base để dễ dàng phân tích là một yêu cầu cần thiết trong quá

13

trình lựa chọn.

Nhiều đoạn đa hình có trình tự lặp lại chứa các đơn vị lặp lại từ 4

nucleotide đã được nghiên cứu và đáp ứng được yêu cầu của quy trình phân

tích cá thể người. Các đoạn này có đặc tính như sau:

- Có tính đa hình và mức độ dị hợp tử cao (>70%).

- Dễ dàng phối hợp thành bộ phức khi thực hiện PCR.

- Sản phẩm PCR ổn định, ít xảy ra trường hợp khi PCR đoạn lặp bị

thiếu.

2.6. Ý nghĩa của cơ sở dữ liệu tần suất alen của các locus STR

Mỗi cá thể người có cấu trúc di truyền riêng không ai giống ai, trừ

những trường hợp sinh ra cùng một trứng [4]. Nếu xét rộng trong cả một quần

thể thì một số đặc điểm di truyền (ADN) ở các cá thể khác nhau vẫn có thể

giống nhau (trùng lặp). Mặt khác mỗi một quần thể người (tộc người) khác

nhau cũng có những đặc điểm di truyền đặc trưng thể hiện bằng sự phân bố

tần suất alen trong mỗi quần thể [22, 29]. Do vậy, trong giám định ADN các

nhà khoa học hình sự ngoài lựa chọn, nghiên cứu những locus (vị trí trên

nhiễm sắc thể) có tính đa alen (đa hình) cao thì cần khảo sát tần suất phân bố

các alen trong quần thể của từng locus để sử dụng trong tính toán và kết luận

giám định. Quần thể được nghiên cứu khảo sát phải đạt được các yêu cầu

trong thống kê, di truyền như: các mẫu dùng trong nghiên cứu phải đảm bảo

tính ngẫu nhiên, không có quan hệ huyết thống trong 3 đời [17, 28].

Để có được tần suất của mỗi alen, trước hết phải tìm được số lần xuất

hiện của mỗi alen trong quần thể nghiên cứu sau đó tính tần suất lý thuyết của

alen đó theo định luật di truyền quần thể [29]. Khi có được tần suất thực tế và

tần suất lý thuyết của mỗi alen, chúng ta tiến hành kiểm định xem tần suất

14

alen có được chấp nhận với mức xác suất đã chọn.

Giám định gen (ADN) đòi hỏi cơ sở khoa học vững chắc để tính toán

xác suất một người ngẫu nhiên trong quần thể là người có cấu trúc di truyền

đặc trưng trùng lặp với ADN trong các mẫu vật (thu thập được trong quá trình

điều tra, phá án) [7, 21, 23]. Nếu không có tần suất alen thì không tính toán

được tần suất xuất hiện của một kiểu gen nào đó trong một quần thể nhất định

[7, 29].

Trong trường hợp cần xác định huyết thống, để kết luận một người có

phải là cha đẻ hoặc mẹ đẻ của người con không, phải dựa vào khả năng cho

nhận của các alen và phải căn cứ vào tần suất alen để tính ra chỉ số quan hệ

huyết thống (Paternity Index - PI). Từ đó tính độ tin cậy đạt được. Mặt khác,

đó cũng là cơ sở khoa học để so sánh độ tin cậy trong trường hợp phân tích

được nhiều locus gen hoặc ít locus gen hơn [7, 21, 24].

Như vậy Chương I đã trình bày tình hình nghiên cứu, giám định ADN

trong, ngoài nước và tại Viện Khoa học hình sự. Cơ sở khoa học, khái niệm

giám định ADN và các phương pháp giám định ADN. Giám định ADN hiện

nay sử dụng các locus STR là chủ yếu, có độ tin cậy rất cao, mỗi alen chỉ

xuất hiện trong quần thể với tần số rất thấp [14, 24]. Việc xác định tần suất

các alen trong giám định ADN là cần thiết, là cơ sở khoa học để cơ quan

giám định sử dụng để phân tích và đưa ra kết luận trong giám định gen. Hiện

nay đã có một số công trình nghiên cứu tần suất các alen hệ Identifiler của

quần thể một số dân tộc tại Việt Nam song chưa có công trình nào nghiên

cứu tần suất các alen hệ Identifiler của quần thể người H’Mông nên việc lựa

chọn đề tài nghiên cứu tần suất các alen trong các locus gen hệ Identifiler

với quần thể người dân tộc H’Mông là cần thiết và có ý nghĩa cao cả về khoa

15

học và thực tiễn.

CHƢƠNG 2. NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU

1. Nội dung nghiên cứu:

- Thu 120 mẫu tế bào của 120 cá thể người H’Mông.

- Phân tích mẫu bao gồm các bước tách chiết ADN, định lượng ADN,

nhân bội ADN, điện di trên máy điện di mao dẫn, kết quả lập được bảng kiểu

gen của các mẫu nghiên cứu.

- Xử lý số liệu thống kê, kiểm định tần suất kiểu gen giữa kết quả thực

tế và tính toán lý thuyết với độ tin cậy p = 0,05. Tính toán và đưa ra bảng tần

suất các alen của các locus gen hệ Identifiler cho 120 cá thể người H’Mông.

2. Phƣơng pháp nghiên cứu:

2.1. Thu mẫu:

Mục tiêu nhằm thu đủ số lượng mẫu 120 của 120 cá thể người H’Mông

đã được phê duyệt. Các mẫu không có quan hệ họ hàng huyết thống (trong

vòng 3 đời).

Cách thu: Thu mẫu tế bào trực tiếp của những người cho mẫu bằng tăm

bông vô trùng, lấy ngẫu nhiên (120 mẫu tế bào của 120 cá thể người H’Mông

được thu bằng cách này). (Xem phụ lục bảng 1. Thu thập mẫu)

- Mẫu thu đảm bảo chất lượng, không bị lẫn, nhiễm, phơi khô tự nhiên,

đóng gói riêng rẽ, ghi ký hiệu cho mẫu từ HM1 đến HM120.

Sau khi thu mẫu chúng tôi tiến hành xử lí và phân tích theo sơ đồ

16

nghiên cứu tổng quát dưới đây:

Tách chiết ADN bằng phương pháp vô cơ

Định lượng ADN bằng phương pháp

Realtime PCR

Nhân bội ADN (PCR) bằng Kit

Identifiler

Điện di ADN trên máy AB 3130

Phân tích kết quả trên phần mềm

Genmapper ID 3.2

2.2. Hóa chất, thiết bị và dụng cụ:

2.2.1. Hóa chất và thiết bị cho tách chiết ADN

STT Tên hoá chất, thiết bị

Block nhiệt khô cho ống 1,5ml (1000C) kèm nhiệt kế

Tủ an toàn sinh học

17

1 Dung dịch Chelex 100, tỷ lệ 5% 2 3 Máy li tâm ống 1,5ml 14.000v/p 4 5 Ống tách chiết 1,5ml 6 Các đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng

2.2.2. Hóa chất và thiết bị cho định lƣợng ADN

STT Tên hoá chất thiết bị

1 Kit Human DNA quantification (Quantifiler- hãng Applied

biosystems)

2 Optical plate 96 well 3 Optical seal 4 Máy Realtime PCR 7500 (Applied biosystems) 5 Các loại đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng

2.2.3. Hóa chất và thiết bị cho nhân bội và điện di

STT Tên hoá chất thiết bị

1 Máy giải trình tự Applied biosystems

2 Máy PCR 9700 96 well Applied biosystems

3 Kit Identifiler của hãng Applied biosystems

POP 4 (ABI) Liz 500 Gene scan

Buffer 10X for AB - 3130 Capilary 3130 (36cm x 50µl)

4 5 6 HIDI formamide 7 8 9 Optical plate 96 well 10 Septa 11 Ống PCR (0,25 ml) và điện di (0,5 ml) 12 Các loại đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng.

2.3. Phân tích mẫu

2.3.1. Tách chiết mẫu bằng chelex

Chelex là một loại nhựa tạo phức có ái lực cao đối với các ion kim loại

đa hoá trị. Nó là hợp chất trùng ngưng styrene divinylbenzene có chứa các

18

cặp ion imminodiaxetat hoạt động là nhóm tạo phức. Sự có mặt của chelex ở nhiệt độ 1000C sẽ ngăn cản sự biến tính của ADN vì nó gắn được với các ion

kim loại đa hoá trị như magnesium (Mg++). Nhờ việc loại bỏ Mg++ ra khỏi

phản ứng thì các enzym phân huỷ ADN (nuclease) sẽ bị bất hoạt và do vậy

mà các phân tử ADN được bảo vệ [17].

Tách chiết ADN bằng chelex là phương pháp vô cơ, có ưu điểm thao

tác đơn giản, ít bị nhiễm và tốn ít thời gian.

120 mẫu tế bào của 120 cá thể người H’Mông được tách chiết bằng

Chelex theo quy trình dưới đây:

* Tách chiết tế bào niêm mạc từ que tăm bông thu tế bào niêm mạc

miệng

1. Sử dụng kéo sạch cho mỗi mẫu khác nhau, cắt một miếng bông (với

diện tích khoảng 5 mm x 5 mm) trên que tăm bông. Để vào trong ống tách

chiết 1,5 ml vô trùng.

2. Thêm 500 ul Chelex 5%. Lắc trộn trong 10 giây. 3. Ủ trong block nhiệt 56oC trong 30 phút.

4. Lắc trộn ống trong 10 giây. 5. Ủ trong block nhiệt 100 oC trong 8 phút.

6. Lắc trộn ống trong 10 giây.

7. Li tâm ống ở tốc độ cao nhất trong 3 phút.

8. Chuyển dịch nổi sang ống tách chiết khác để sử dụng cho quá trình

định lượng.

9. Bảo quản mẫu ở - 20 oC.

2.3.2. Định lƣợng ADN bằng Realtime PCR

Định lượng ADN trên máy Realtime PCR là công nghệ sử dụng kỹ

thuật PCR có gắn mồi huỳnh quang, mục đích để phát hiện chính xác số

19

lượng ADN người có trong mẫu cần phân tích.

120 mẫu ADN đã được tách chiết của 120 cá thể người H’Mông được

tiến hành định lượng để xác định chính xác nồng độ ADN trước khi PCR

bằng kit Identifiler theo phản ứng và chu trình nhiệt dưới đây

Bảng 2.1. Thành phần phản ứng Realtime PCR

Thành phần Thể tích

PCR Reaction Mix 12,5 µl

Human Primer Mix 10,5 µl

2 µl / phản ứng

Mẫu (ADN khuôn hoặc ADN chuẩn)

Tổng 25 µl

Bảng 2.2. Chu trình nhiệt của phản ứng PCR trên máy realtime 7500

Nhiệt độ Thời gian Số chu kỳ

50°C 2 phút 1 chu kỳ

95°C 10 phút 1 chu kỳ

95°C 15 giây 40 chu kỳ 60°C 1 phút

Quá trình định lượng được thực hiện trên máy Realtime PCR 7500 của

hãng AB.

2.3.3. Nhân bội ADN (PCR)

Nhân bội ADN (PCR) nghĩa là làm tăng lượng ADN lên rất nhiều từ

một lượng rất ít ban đầu [14].

Kỹ thuật PCR do Karry Mullis và các cộng sự phát minh vào năm

1985 đã tạo ra một cuộc cách mạng trong sinh học phân tử. Kỹ thuật này là

một phương pháp hoàn toàn mới trong việc nghiên cứu và phân tích các gen.

20

Các phòng thí nghiệm phân tích ADN và ngành khoa học hình sự đã có những

thành tựu vượt bậc nhờ vào kỹ thuật này [19]. ADN thu được từ hiện trường

thường ít và chất lượng không tốt do vậy nhiều mẫu sẽ không thể phân tích

được. Kỹ thuật PCR sẽ giúp khắc phục hạn chế này vì nó có thể tạo ra hàng

triệu phiên bản của một trình tự ADN khuôn ban đầu trong vòng vài giờ nhờ hai đoạn mồi oligonucleotit tương hợp với hai đầu 3' ở cả hai sợi của đoạn

ADN đích (target sequence) với sự tham gia của ADN - polymerase,

deoxynucleotide triphosphate (dNTPs), đệm PCR [15]… Phản ứng PCR là

một chuỗi nhiều chu kỳ nối tiếp nhau, mỗi chu kỳ gồm 3 bước:

Bước 1: Giai đoạn biến tính: Phân tử ADN được biến tính ở nhiệt độ thường là ở 940C - 950C trong vòng 30 giây đến 1 phút.

Bước 2: Giai đoạn lai: Nhiệt độ được hạ thấp (thấp hơn Tm của các

mồi) cho phép các mồi bắt cặp với khuôn, nhiệt độ này dao động trong khoảng 40 - 700C tuỳ thuộc Tm của các mồi sử dụng kéo dài từ 30 giây đến 1

phút.

Bước 3: Giai đoạn tổng hợp (extension): Nhiệt độ được tăng lên có thể đến 720C giúp cho ADN - polymerase hoạt động tổng hợp tốt nhất, thời gian

tùy thuộc vào độ dài của trình tự ADN cần khuếch đại. Thường kéo dài từ 30

giây đến vài phút.

Một chu kỳ bao gồm 3 bước trên sẽ được lặp đi lặp lại nhiều lần, mỗi

lần sẽ làm tăng gấp đôi lượng mẫu của lần trước. Đây là sự khuếch đại theo cấp số nhân, theo tính toán sau 30 chu kỳ sự khuếch đại sẽ là 106 so với lượng

bản mẫu của ban đầu [15].

120 mẫu ADN đã được định lượng chuyển sang tiến hành PCR Phản

ứng PCR sử dụng bộ kít AmpFlSTR® Identifiler® PCR Amplification Kit

21

của hãng Applied Biosystems - Mỹ

Bảng 2.3. Thành phần của một phản ứng PCR

Thành phần Thể tích

AmpFlSTR® PCR Reaction Mix 5,25 µl

AmpliTaq Gold ADN Polymerase 0,25 µl

Identifiler® Primer 2,75 µl

AmpFlSTR® Set

Mẫu (ADN khuôn) 1 ng/ phản ứng

Nước Tùy chỉnh

Tổng 12,5 µl

Phản ứng nhân gen (PCR) được tiến hành trên máy nhân gen PCR

9700 của hãng AB.

Bảng 2.4. Chu trình nhiệt trên máy PCR 9700

Nhiệt độ Thời gian Số chu kỳ

95°C 1 chu kỳ 11 phút

94°C 1 phút

59°C 25 chu kỳ 1 phút

72°C 1 phút

60°C 1 chu kỳ 60 phút

4°C 1 chu kỳ ∞

- Sản phẩm PCR được bảo quản ở - 200C.

2.3.4. Điện di trên máy điện di mao dẫn (Capillary Electrophoresis- CE)

* Nguyên lý

Vào cuối những năm 1980, điện di mao dẫn bắt đầu được sử dụng và

vào giữa những năm 1990 người ta bắt đầu sản xuất các máy điện di mao dẫn.

22

Kể từ đó kỹ thuật điện di mao dẫn phát triển nhanh chóng và ngày càng phổ

biến. Hiện nay đã có nhiều loại máy điện di mao dẫn được sử dụng tại các

phòng thí nghiệm sinh học phân tử cũng như các phòng giám định gen hình

sự như: ABI Prism 310 Genetic Analyzer với một mao quản, ABI Prism

3100Avant Genetic Analyzer với 4 mao quản, ABI Prism 3700 Genetic

Analyzer với 4 mao quản, ABI Prism 3130 Genetic Analyzer với 4 mao quản,

ABI Prism 3130XL Genetic Analyzer với 16 mao quản …[6]

Nguyên lý của điện di mao dẫn là dùng tia lase kích hoạt các đoạn

ADN khuôn đã được gắn huỳnh quang để thu được các phổ quang học. Điểm

khác của điện di mao dẫn là sử dụng mao quản có chứa gel, tia lase chỉ chiếu

vào một điểm cố định trên mao quản cho từng mẫu một [6, 16]. Các cặp mồi

được đánh dấu bằng các chất nhuộm huỳnh quang khác nhau vì vậy sản phẩm

sau PCR có các locus gen được gắn các chất nhuộm huỳnh quang tương ứng.

Kỹ thuật hiện màu huỳnh quang cho xác định được màu xanh da trời, xanh lá

cây, vàng, đỏ, cam tương ứng với các chất đánh dấu: 6 - FAM, VIC, NED,

PET và LIZ, dựa trên sự hấp thụ và phát xạ ánh sáng của các chất nhuộm màu

huỳnh quang này. Các hạt huỳnh quang hấp thụ năng lượng từ nguồn sáng

laze sau đó phát xạ ánh sáng ở mức năng lượng thấp hơn (bước sóng cao

hơn). Một màng lọc sáng được sử dụng để lọc ánh sáng ở những bước sóng

23

xác định hoặc một khoảng bước sóng nào đó [6].

AmpFlSTR® Identifiler™

D8S1179

D7S820

D21S11

CSF1PO

6FAM (blue)

TH01

D3S1358

D13S317 D16S539 D2S1338

VIC (green)

TPOX

D18S51

D19S433

VWA

NED (yellow)

AMEL

D5S818

FGA

PET (red)

GS500 LIZ size standard

LIZ (orange)

Hình 2. Các locus gen hệ Identifiler

* Tiến hành

Chuẩn bị mẫu trước khi điện di: Thành phần và tỷ lệ thể tích từng hỗn

hợp phản ứng như sau:

Bảng 2.5. Thành phần của hỗn hợp điện di

Thành phần Thể tích

Hi-Di™ Formamide 8,5 µl

GeneScan™ 500 LIZ® 0,3 µl

Sản phẩm PCR hoặc thang alen 1,5 µl

24

Tổng 10,3 µl

120 sản phẩm PCR được tiến hành xác định kiểu gen bằng phương

pháp điện di mao dẫn trên máy giải trình tự gen AB 3130 của hãng Applied

Biosystem. Kết quả thu được được xử lý bằng phần mềm Genemapper ID 3.2

để xác định kiểu gen của mỗi mẫu, từ đó cho ta bảng số liệu tập hợp kiểu gen

của 120 cá thể người H’Mông.

2.4. Xử lý thống kê số liệu và tính tần suất các locus gen

2.4.1. Cơ sở lý thuyết

Để số liệu nghiên cứu về các locus gen sử dụng được cho những ứng dụng cụ thể, điều cần thiết đầu tiên là cần đánh giá xem mẫu nghiên cứu với locus gen được phân tích có đảm bảo rằng cấu trúc di truyền của mẫu (tần số tương đối của các alen và tần số các kiểu gen) là ổn định hay không qua các thế hệ, nghĩa là mẫu có tuân theo định luật Hardy - Weinberg hay không? [8, 9, 29] Do đó cần kiểm tra sự phù hợp giữa mẫu với quần thể cân bằng lý thuyết thông qua đánh giá chênh lệch giữa tần số quan sát thực tế với phân bố lý thuyết của các kiểu gen của mỗi locus gen được nghiên cứu có sai khác nhau hay không [1, 29].

2.4.2. Phƣơng pháp xử lý thống kê

Kiểm định sự phù hợp phân bố tần số kiểu gen giữa mẫu và quần thể lý thuyết dựa vào tiêu chuẩn thống kê là hàm xác suất Khi bình phương 2 . [2, 29]

Đánh giá sự phù hợp giữa số liệu thực nghiệm và giả thuyết lý thuyết ta

tính tổng 2 như sau :

25

Trong đó : * k là số lớp của dãy số liệu thực nghiệm. * mi là tần số quan sát. * npi là tần số lý thuyết.

2.4.3. Các bƣớc tính toán thống kê và kiểm định tiến hành trên phần

mềm Excel:

- 120 kiểu gen của 120 cá thể người H’Mông được thống kê tần số kiểu

gen, tần số alen.

- Tính tần suất các alen của mỗi locus theo số liệu thu được trong

nghiên cứu.

- Xây dựng tổ hợp kiểu gen lý thuyết có thể có trong quần thể tự nhiên

theo số liệu alen thu được ở bước 1.

- Xác định tần số kiểu gen thực tế của mẫu nghiên cứu (số lượng quan

sát của mẫu/ tổng số quan sát).

- Xác định tần suất kiểu gen lý thuyết có thể có theo tần số các alen thu

được ở bước 1.

- Tính khi bình phương thành phần theo mỗi phương trình so sánh giữa

tần số lý thuyết và tần số thực tế.

26

- Tính tổng 2 của các phương trình so sánh trên. - Tính khi bình phương tiêu chuẩn (α) theo mức xác suất p=0.05. - So sánh giá trị khi bình phương tính được với khi bình phương tiêu chuẩn: Nếu khi bình phương tính được nhỏ hơn 2 tiêu chuẩn thì phân bố thực tế phù hợp với phân phối lý thuyết, nghĩa là mẫu phù hợp với quần thể lý thuyết [1, 2, 9, 10, 11]. Chương II đã tiến hành thu mẫu tế bào niêm mạc miệng của 120 cá thể người H’mông có đánh số ký hiệu từ HM1 đến HM120 sau đó tiến hành: tách chiết 120 mẫu tế bào này, định lượng, nhân bội ADN và điện di trên máy điện di mao dẫn -> thu được kiểu gen, từ đó xử lý số liệu thống kê, kiểm định tần suất kiểu gen giữa kết quả thực tế và tính toán lý thuyết với độ tin cậy p = 0.05; tính toán và đưa ra bảng tần suất các Alen của các locus gen theo hệ Identifiler của 120 cá thể người H’mông.

CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN

1. Kết quả

1.1. Thu mẫu

Tổng số mẫu cá thể đã nghiên cứu: gồm 120 mẫu tế bào niêm mạc miệng thu của 120 cá thể người H’Mông. Các mẫu thu được đảm bảo phân bố ngẫu nhiên, không có quan hệ huyết thống trong vòng 3 đời. (Xem bảng 1 - phụ lục).

1.2. Phân tích mẫu thu đƣợc kiểu gen theo yêu cầu và lập đƣợc bảng

kiểu gen của 120 cá thể. (Xem bảng 3 - phụ lục)

1.3. Xử lý số liệu thống kê (Xem bảng 3.1 đến 3.15); tính đƣợc bảng tần

suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30); và so sánh với

một số quần thể ngƣời Việt và ngƣời nƣớc ngoài (Xem bảng 3.31 đến

3.45).

1.3.1. Xử lý số liệu thống kê

Bảng kết quả xử lý số liệu theo tiêu chuẩn Khi bình phƣơng (2), số lƣợng kiểu gen và tần suất phân bố các alen hệ Identifiler: thể hiện ở các bảng sau: bảng 3.1 đến 3.15.

Bảng 3.1 Locus D8S1179

Locus D8

Số mẫu

120 người

Số alen

8

số kiểu gen

23

Số tổ hợp kiểu gen lý thuyết

36

2

1.653506

df = 11

p = 0.05

19.68

D8a

D8b

2

Tần suất lý thuyết

10 10 10 10 10 10

10 11 12 13 14 15

Tần số kiểu gen 7 19 4 4 5 17

0.073351 0.11059 0.027083 0.069965 0.038368 0.121875

Tần suất thực tế 0.058333 0.158333 0.033333 0.033333 0.041667 0.141667

0.003075 0.020611 0.001442 0.01918 0.000284 0.003214

27

10 10 11 11 11 11 11 11 11 12 12 12 12 12 12 13 13 13 13 13 14 14 14 14 15 15 15 16 16 17

16 17 11 12 13 14 15 16 17 12 13 14 15 16 17 13 14 15 16 17 14 15 16 17 15 16 17 16 17 17

2 0 5 0 6 0 9 5 0 0 3 0 2 1 0 4 2 8 1 0 1 7 0 0 6 1 0 0 0 1

0.016667 0 0.041667 0 0.05 0 0.075 0.041667 0.041667 0 0.025 0 0.016667 0.008333 0 0.033333 0.016667 0.066667 0.008333 0 0.008333 0.058333 0 0.0000 0.05 0.008333 0 0 0 0.008333

0.02257 0.004514 0.041684 0.020417 0.052743 0.028924 0.091875 0.017014 0.003403 0.0025 0.012917 0.007083 0.0225 0.004167 0.000833 0.016684 0.018299 0.058125 0.010764 0.002153 0.005017 0.031875 0.005903 0.001181 0.050625 0.01875 0.00375 0.001736 0.000694 0.000069

0.001544 0.004514 6.93E-09 0.020417 0.000143 0.028924 0.003099 0.035722 0.430248 0.0025 0.011303 0.007083 0.001512 0.004165 0.000833 0.016614 0.000146 0.001255 0.000549 0.002153 0.002192 0.021962 0.005903 0.001181 7.72E-06 0.005787 0.00375 0.001736 0.000694 0.989764

N

1

1

1.653506

120

120

0.05

19.68

Số kiểu gen tt

25

α

Bảng 3.2 Locus D21S11

Locus D21

Số mẫu

120 người

Số alen

13

số kiểu gen

32

Số tổ hợp kiểu gen lý thuyết

91

2

1.61E-06

df = 10

p = 0.05

18.31

28

D21a D21b

2

27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 30.0 30.0 30.0 30.0 30.0 30.0 30.0 30.0

Tần số kiểu gen 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 12 4 8 7 1 4 0 6 0 0 5 1 8 10 2 2 0 5

27.0 28.0 29.0 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 28.0 29.0 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 29.0 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2

Tần suất thực tế 0 0.008333 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.05 0.1 0.033333 0.066667 0.058333 0.008333 0.033333 0 0.05 0 0 0.041667 0.008333 0.066667 0.083333 0.016667 0.016667 0 0.041667

Tần suất lý thuyết 1.74E-05 0.000208 0.001667 0.00191 0.000104 0.000833 0.001493 0.000243 0.000556 3.47E-05 0.001111 6.94E-05 6.94E-05 0.000625 0.08 0.105035 0.000313 0.02 0.064201 0.001701 0.008889 3.47E-05 0.035556 0.000139 0.000139 0.04 0.091667 0.005 0.04 0.071667 0.011667 0.026667 0.001667 0.053333 0.003333 0.003333 0.052517 0.005729 0.045833 0.082118 0.013368 0.030556 0.00191 0.061111

1.74E-05 3.17E-01 1.67E-03 1.91E-03 1.04E-04 8.33E-04 1.49E-03 2.43E-04 5.56E-04 3.47E-05 1.11E-03 6.94E-05 6.94E-05 6.25E-04 8.00E-02 1.05E-01 3.13E-04 2.00E-02 6.42E-02 1.70E-03 8.89E-03 3.47E-05 3.56E-02 1.39E-04 1.39E-04 2.50E-03 7.58E-04 1.61E-01 1.78E-02 2.48E-03 9.53E-04 1.67E-03 1.67E-03 2.08E-04 3.33E-03 3.33E-03 2.24E-03 1.18E-03 9.47E-03 1.80E-05 8.14E-04 6.31E-03 1.91E-03 6.19E-03

29

0 0 0 0 0 0 1 0 0 0 0 0 3 0 1 0 4 0 1 2 3 4 0 8 1 1 0 0 0 0 0 0 1 0 2 1 0 0 3 0 0 2 0 0 0

30.0 30.0 30.2 30.2 30.2 30.2 30.2 30.2 30.2 30.2 30.2 31.0 31.0 31.0 31.0 31.0 31.0 31.0 31.0 31.2 31.2 31.2 31.2 31.2 31.2 31.2 32.0 32.0 32.0 32.0 32.0 32.0 32.2 32.2 32.2 32.2 32.2 33.0 33.0 33.0 33.0 33.2 33.2 33.2 34.2

34.2 35.2 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 31.2 32.0 32.2 33.0 33.2 34.2 35.2 32.0 32.2 33.0 33.2 34.2 35.2 32.2 33.0 33.2 34.2 35.2 33.0 33.2 34.2 35.2 33.2 34.2 35.2 34.2

0.003819 0.003819 0.000156 0.0025 0.004479 0.000729 0.001667 0.000104 0.003333 0.000208 0.000208 0.01 0.035833 0.005833 0.013333 0.000833 0.026667 0.001667 0.001667 0.032101 0.010451 0.023889 0.001493 0.047778 0.002986 0.002986 0.000851 0.003889 0.000243 0.007778 0.000486 0.000486 0.004444 0.000556 0.017778 0.001111 0.001111 1.73611E-05 0.001111111 6.94444E-05 6.94444E-05 0.017778 0.002222 0.002222 6.94444E-05

3.82E-03 3.82E-03 1.56E-04 2.50E-03 4.48E-03 7.29E-04 2.67E-02 1.04E-04 3.33E-03 2.08E-04 2.08E-04 1.00E-02 3.28E-03 5.83E-03 1.88E-03 8.33E-04 1.67E-03 1.67E-03 2.67E-02 7.42E-03 2.03E-02 3.73E-03 1.49E-03 7.47E-03 9.57E-03 9.57E-03 8.51E-04 3.89E-03 2.43E-04 7.78E-03 4.86E-04 4.86E-04 3.40E-03 5.56E-04 6.94E-05 4.69E-02 1.11E-03 1.74E-05 5.14E-01 6.94E-05 6.94E-05 6.94E-05 2.22E-03 2.22E-03 6.94E-05

0 0 0 0 0 0 0.008333 0 0 0 0 0 0.025 0 0.008333 0 0.033333 0 0.008333 0.016667 0.025 0.033333 0 0.066667 0.008333 0.008333 0 0 0 0 0 0 0.008333 0 0.016667 0.008333 0 0 0.025 0 0 0.016667 0 0 0

30

0 0

34.2 35.2

35.2 35.2

0 0

0.000138889 6.94444E-05

1.39E-04 6.94E-05

N

120

120

1

1

1.61E-06

Số kiểu gen tt

31

0.05

18.31

α

Bảng 3.3 Locus D7S820

Locus D7

Số mẫu

120 người

Số alen

9

số kiểu gen

20

Số tổ hợp kiểu gen lý thuyết

45

2

0.260867

df = 7

p = 0.05

14.07

2

Tần suất lý thuyết

D7a 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9.1 9.1 9.1 9.1 9.1 9.1 9.1

D7b 8 9 9.1 10 11 12 13 14 15 9 9.1 10 11 12 13 14 15 9.1 10 11 12 13 14 15

Tần số kiểu gen 8 2 0 3 21 8 0 1 0 0 0 0 2 1 0 0 0 0 0 0 1 0 0 0

Tần suất thực tế 0.066667 0.016667 0 0.025 0.175 0.066667 0 0.008333 0 0 0 0 0.016667 0.008333 0 0 0 0 0 0 0.008333 0 0 0

0.041684 0.008507 0.001701 0.039132 0.192257 0.064653 0.008507 0.008507 0.001701 0.000434 0.000174 0.003993 0.019618 0.006597 0.000868 0.000868 0.000174 1.74E-05 0.000799 0.003924 0.001319 0.000174 0.000174 3.47E-05

0.014973 0.007827 0.001701 0.005104 0.001549 6.27E-05 0.008507 3.56E-06 0.001701 0.000434 0.000174 0.003993 0.000444 0.000457 0.000868 0.000868 0.000174 1.74E-05 0.000799 0.003924 0.037298 0.000174 0.000174 3.47E-05

31

10 10 10 10 10 10 11 11 11 11 11 12 12 12 12 13 13 13 14 14 15

10 11 12 13 14 15 11 12 13 14 15 12 13 14 15 13 14 15 14 15 15

0.009184 0.090243 0.030347 0.003993 0.003993 0.000799 0.221684 0.149097 0.019618 0.019618 0.003923 0.025069 0.001736 0.001736 0.000347 0.000434 0.000868 0.000174 0.000434 0.000173 1.74E-05

0.008333 0.108333 0.041667 0 0.008333 0 0.216667 0.141667 0.025 0.025 0.008333 0.008333 0.016667 0 0 0 0 0 0 0 0

1 13 5 0 1 0 26 17 3 3 1 2 2 0 0 0 0 0 0 0 0

7.89E-05 0.003626 0.004223 0.003993 0.004717 0.000799 0.000114 0.00037 0.001476 0.001476 0.004957 0.011173 0.128419 0.001736 0.000347 0.000434 0.000868 0.000174 0.000434 0.000173 1.74E-05

N

1

1

120

0.260867

Tần số kiểu gen

0.05

19

14.07

α Bảng 3.4 Locus CSF1PO

Locus CSF

Số mẫu

120 người

Số alen

6

số kiểu gen

11

Số tổ hợp kiểu gen lý thuyết

21

2

1.08E-01

df = 7

p = 0.05

14.07

2

Tần suất thực tế

Tần suất lý thuyết

CSFa 7 7 7 7 7

CSFb 7 9 10 11 12

Tần số kiểu gen 0 0 0 0 2

6.94E-05 6.94E-05 0.004236 0.001736 0.009236

0 0 0 0 0.016667

6.94E-05 6.94E-05 4.24E-03 1.74E-03 5.98E-03

32

7 9 9 9 9 9 10 10 10 10 11 11 11 12 12 13

13 9 10 11 12 13 10 11 12 13 11 12 13 12 13 13

0 0 0 1 0 0 6 7 37 5 1 11 3 37 10 0

0 0 0 0.008333 0 0 0.05 0.058333 0.308333 0.041667 0.008333 0.091667 0.025 0.308333 0.083333 0

0.00125 1.74E-05 0.002118 0.000868 0.004618 0.000625 0.064601 0.052951 0.281701 0.038125 0.010851 0.115451 0.015625 0.307101 0.083125 0.005625

1.25E-03 1.74E-05 2.12E-03 6.42E-02 4.62E-03 6.25E-04 3.30E-03 5.47E-04 2.52E-03 3.29E-04 5.84E-04 4.90E-03 5.63E-03 4.94E-06 5.20E-07 5.63E-03

N

120

1

1

1.08E-01

số kiểu gen tt

11

0.05

14.07

α

Bảng 3.5 Locus D3S1358

Locus D3

Số mẫu

120 người

Số alen

5

số kiểu gen

11

Số tổ hợp kiểu gen lý thuyết

15

2

0.073244

df = 7

p = 0.05

14.07

2

D3a 14 14 14 14 14 15 15 15 15 16

D3b 14 15 16 17 18 15 16 17 18 16

0.000278 0.010278 0.002778 0.004697 0.001528 0.001449 0.018168 0.009109 0.006356 0.006945

Tần số kiểu gen 0 0 2 2 0 10 32 17 5 10

Tần suất thực tế 0 0 0.016667 0.016667 0 0.083333 0.266667 0.141667 0.041667 0.083333

Tần suất lý thuyết 0.000278 0.010278 0.011111 0.009861 0.001528 0.095069 0.205556 0.182431 0.028264 0.111111

33

16 16 17 17 18

17 18 17 18 18

24 2 12 4 0

0.2 0.016667 0.1 0.033333 0

0.197222 0.030556 0.087517 0.027118 0.002101

3.91E-05 0.006313 0.001781 0.001424 0.002101

N

120

1

1

0.073244

số kiểu gen tt

11

0,05

14.07

α

Bảng 3.6 Locus THO1

Locus TH01

Số mẫu

120 người

Số alen

7

số kiểu gen

14

Số tổ hợp kiểu gen lý thuyết

28

2

0.373708

df = 8

p = 0.05

15.51

2

Tần suất lý thuyết

THO1a 6 6 6 6 6 6 6 6.3 6.3 6.3 6.3 6.3 6.3 7 7 7 7 7 8 8 8 8

THO1b 6 6.3 7 8 9 9.3 10 6.3 7 8 9 9.3 10 7 8 9 9.3 10 8 9 9.3 10

0.048767 0.00184 0.088333 0.007361 0.213472 0.022083 1.74E-05 0.001667 0.000139 0.004028 0.000417 0.000208 0.001667 0.04 0.006667 0.193333 0.02 0.01 0.000278 0.016111 0.001667 0.000833

Tần số kiểu gen 5 0 8 2 31 2 0 0 0 0 1 0 0 5 0 24 5 1 0 0 0 0

Tần suất thực tế 0.041667 0 0.066667 0.016667 0.258333 0.016667 0 0 0 0 0.008333 0 0 0.041667 0 0.2 0.041667 0.008333 0 0 0 0

0.001034 0.00184 0.005314 0.011765 0.009428 0.001328 1.74E-05 0.001667 0.000139 0.004028 0.150271 0.000208 0.001667 6.95E-05 0.006667 0.00023 0.023473 0.000278 0.000278 0.016111 0.001667 0.000833

34

9 9 9 9.3 9.3 10

9 9.3 10 9.3 10 10

0.233611 0.048333 0.024167 0.0025 0.0025 0.000625

3.31E-07 5.75E-05 0.024167 0.0025 0.01361 0.095061

28 6 0 0 1 1

0.233333 0.05 0 0 0.008333 0.008333

N

28

120

0.373708

120

1.0

Số kiểu gen tt

0.05

15.51

15

α

Bảng 3.7 Locus D13S317

Locus D13

Số mẫu

120 người

Số alen

7

số kiểu gen

14

Số tổ hợp kiểu gen lý thuyết

28

2

0.411646

df = 5

p = 0.05

11.07

2

0.0008

D13b 8 9 10 11 12 13 14 9 10 11 12 13 14 10 11 12 13 14 11 12 13

Tần số kiểu gen 40 21 13 19 7 2 0 0 0 6 0 0 0 1 3 2 0 1 2 2 0

Tần suất thực tế 0.333333 0.175 0.108333 0.158333 0.058333 0.016667 0 0 0 0.05 0 0 0 0.008333 0.025 0.016667 0 0.008333 0.016667 0.016667 0

D13a 8 8 8 8 8 8 8 9 9 9 9 9 9 10 10 10 10 10 11 11 11

0.013172 0.003077 0.001647 0.000309 0.000473 0.004931 0.012656 0.024375 0.01914 0.010313 0.00375 0.000938 0.000987 5.33E-05 0.004569 0.003611 0.061135 0.000292 0.002822 0.004028

Tần suất lý thuyết 0.350069 0.133125 0.128194 0.142986 0.054236 0.019722 0.004931 0.012656 0.024375 0.027188 0.010313 0.00375 0.000938 0.011736 0.026181 0.009931 0.003611 0.000903 0.014601 0.011076 0.004028

35

11 12 12 12 13 13 14

14 12 13 14 13 14 14

0 0 0 0 1 0 0

0 0 0 0 0.008333 0 0

0.001007 0.002101 0.001528 0.000382 0.000278 0.000139 1.74E-05

0.001007 0.002101 0.001528 0.000382 0.233392 0.000139 1.74E-05

N

120

1

1

0.411646

Số kiểu gen tt

14

0.05

11.07

α

Bảng 3.8 Locus D16S539

Locus D16

Số mẫu

120 người

Số alen

8

số kiểu gen

18

Số tổ hợp kiểu gen lý thuyết

36

2.42E-01

2

Df = 8

p = 0.05

15.51

2

Tần suất thực tế

D16b 8 9 10 11 12 13 14 15 9 10 11 12 13 14 15 10 11 12 13 14

Tần số kiểu gen 0 0 1 1 0 0 0 0 25 12 16 19 1 0 1 2 8 8 1 0

D16a 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10

0 0 0.008333 0.008333 0 0 0 0 0.208333 0.1 0.133333 0.158333 0.008333 0 0.008333 0.016667 0.066667 0.066667 0.008333 0

Tần suất lý thuyết 6.94E-05 0.006875 0.002361 0.003611 0.002986 0.000486 0.000139 6.94E-05 0.170156 0.116875 0.17875 0.147813 0.024063 0.006875 0.003438 0.020069 0.061389 0.050764 0.008264 0.002361

6.94E-05 6.88E-03 1.51E-02 6.17E-03 2.99E-03 4.86E-04 1.39E-04 6.94E-05 8.57E-03 2.44E-03 1.15E-02 7.49E-04 1.03E-02 6.88E-03 6.97E-03 5.77E-04 4.54E-04 4.98E-03 5.76E-07 2.36E-03

36

10 11 11 11 11 11 12 12 12 12 13 13 13 14 14 15

15 11 12 13 14 15 12 13 14 15 13 14 15 14 15 15

0 7 9 3 0 0 4 1 0 0 0 1 0 0 0 0

0 0.058333 0.075 0.025 0 0 0.033333 0.008333 0 0 0 0.008333 0 0 0 0

0.001181 0.046944 0.077639 0.012639 0.003611 0.001806 0.032101 0.010451 0.002986 0.001493 0.000851 0.000486 0.000243 6.94444E-05 6.94444E-05 1.73611E-05

1.18E-03 2.76E-03 8.97E-05 1.21E-02 3.61E-03 1.81E-03 4.73E-05 4.29E-04 2.99E-03 1.49E-03 8.51E-04 1.27E-01 2.43E-04 6.94E-05 6.94E-05 1.74E-05

N

120

1

1

2.42E-01

Số kiểu gen tt

18

0.05

15.51

α

Bảng 3.9 Locus D2S1338

Locus D2

Số mẫu

120 người

Số alen

11

số kiểu gen

32

Số tổ hợp kiểu gen lý thuyết

66

0.392402

2

df = 5

p = 0.05

11.07

2

D2a 17 17 17 17 17 17 17 17 17 17 17 18 18

D2b 17 18 19 20 21 22 23 24 25 26 27 18 19

Tần số kiểu gen 0 0 0 1 0 0 2 1 0 0 0 0 0

Tần suất thực tế 0 0 0 0.008333 0 0 0.016667 0.008333 0 0 0 0 0

Tần suất lý thuyết 0.000278 0.001111 0.005139 0.003333 0.000694 0.002917 0.009444 0.007361 0.00125 0.00125 0.000278 0.001111 0.010278

0.000278 0.001111 0.005139 0.007501 0.000694 0.002917 0.005524 0.000128 0.00125 0.00125 0.000278 0.001111 0.010278

37

18 18 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24

20 21 22 23 24 25 26 27 19 20 21 22 23 24 25 26 27 20 21 22 23 24 25 26 27 21 22 23 24 25 26 27 22 23 24 25 26 27 23 24 25 26 27 24 25

0 0 1 3 4 0 0 0 2 3 0 4 6 15 3 2 0 2 1 1 9 4 0 1 0 0 0 0 3 0 1 0 2 4 3 0 0 1 14 18 2 2 1 2 3

0.006667 0.001389 0.005833 0.018889 0.014722 0.0025 0.0025 0.000556 0.023767 0.030833 0.006424 0.026979 0.087361 0.06809 0.011563 0.011563 0.002569 0.01 0.004167 0.0175 0.056667 0.044167 0.0075 0.0075 0.001667 0.000434 0.003646 0.011806 0.009201 0.001563 0.001563 0.000347 0.007656 0.049583 0.038646 0.006563 0.006563 0.001458 0.080278 0.125139 0.02125 0.02125 0.004722 0.048767 0.016563

0 0 0.008333 0.025 0.033333 0 0 0 0.016667 0.025 0 0.033333 0.05 0.125 0.025 0.016667 0 0.016667 0.008333 0.008333 0.075 0.033333 0 0.008333 0 0 0 0 0.025 0 0.008333 0 0.016667 0.033333 0.025 0 0 0.008333 0.116667 0.15 0.016667 0.016667 0.008333 0.016667 0.025

0.006667 0.001389 0.001071 0.001977 0.023527 0.0025 0.0025 0.000556 0.002121 0.001103 0.006424 0.001496 0.015978 0.047566 0.015615 0.002253 0.002569 0.004445 0.004165 0.004802 0.005931 0.002658 0.0075 9.25E-05 0.001667 0.000434 0.003646 0.011806 0.027128 0.001563 0.029324 0.000347 0.010606 0.005326 0.004818 0.006563 0.006563 0.001458 0.016495 0.004939 0.000988 0.000988 0.002761 0.021129 0.004298

38

24 24 25 25 25 26 26 27

26 27 25 26 27 26 27 27

0 0 0 0 0 0 0 0

N

0 0 0 0 0 0 0 0 120

0.016563 0.003681 0.001406 0.002813 0.000625 0.001406 0.000625 6.94E-05 1

0.016563 0.003681 0.001406 0.002813 0.000625 0.001406 0.000625 6.94E-05 0.392402

1

Số kiểu gen tt

32

11.07

0.05

α Bảng 3.10 Locus D19S443

Locus D19

Số mẫu

120 người

Số alen

12

số kiểu gen

27

Số tổ hợp kiểu gen lý thuyết

78

2

2.88E-01

Df = 8

p = 0.05

15.51

2

D19b 11 12 13 13.2 14 14.2 15 15.2 16 16.2 17 12 13 13.2 14 14.2 15 15.2

Tần số kiểu gen 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1

D19a 11 11 11 11 11 11 11 11 11 11 11 12 12 12 12 12 12 12

1.74E-05 1.04E-04 1.73E-02 1.15E-03 1.32E-03 5.21E-04 2.43E-04 2.57E-03 3.47E-05 1.04E-04 6.94E-05 1.56E-04 6.56E-03 3.44E-03 4.84E-03 2.93E-02 7.29E-04 5.07E-05

Tần suất lý thuyết 1.74E-05 0.000104 0.002188 0.001146 0.001319 0.000521 0.000243 0.002569 3.47E-05 0.000104 6.94E-05 0.000156 0.006563 0.003438 0.003958 0.001563 0.000729 0.007708

Tần suất thực tế 0 0 0.008333 0 0 0 0 0 0 0 0 0 0 0 0.008333 0.008333 0 0.008333

39

12 12 12 13 13 13 13 13 13 13 13 13 13.2 13.2 13.2 13.2 13.2 13.2 13.2 13.2 14 14 14 14 14 14 14 14.2 14.2 14.2 14.2 14.2 14.2 15 15 15 15 15 15.2 15.2 15.2 15.2 16 16 16

16 16.2 17 13 13.2 14 14.2 15 15.2 16 16.2 17 13.2 14 14.2 15 15.2 16 16.2 17 14 14.2 15 15.2 16 16.2 17 14.2 15 15.2 16 16.2 17 15 15.2 16 16.2 17 15.2 16 16.2 17 16 16.2 17

0 0 0 8 10 10 3 1 21 0 1 0 1 10 2 1 7 0 0 0 2 2 2 9 0 0 0 1 0 4 0 0 0 1 2 0 0 0 14 0 2 2 0 0 0

0.000104 0.000313 0.000208 0.068906 0.072188 0.083125 0.032813 0.015313 0.161875 0.002188 0.006563 0.004375 0.018906 0.043542 0.017188 0.008021 0.084792 0.001146 0.003438 0.002292 0.025069 0.019792 0.009236 0.097639 0.001319 0.003958 0.002639 0.003906 0.003646 0.038542 0.000521 0.001563 0.001042 0.000851 0.017986 0.000243 0.000729 0.000486 0.095069 0.002569 0.007708 0.005139 1.73611E-05 0.000104167 6.94444E-05

0 0 0 0.066667 0.083333 0.083333 0.025 0.008333 0.175 0 0.008333 0 0.008333 0.083333 0.016667 0.008333 0.058333 0 0 0 0.016667 0.016667 0.016667 0.075 0 0 0 0.008333 0 0.033333 0 0 0 0.008333 0.016667 0 0 0 0.116667 0 0.016667 0.016667 0 0 0

1.04E-04 3.13E-04 2.08E-04 7.28E-05 1.72E-03 5.20E-07 1.86E-03 3.18E-03 1.06E-03 2.19E-03 4.77E-04 4.38E-03 5.91E-03 3.64E-02 1.58E-05 1.21E-05 8.26E-03 1.15E-03 3.44E-03 2.29E-03 2.82E-03 4.93E-04 5.98E-03 5.25E-03 1.32E-03 3.96E-03 2.64E-03 5.02E-03 3.65E-03 7.04E-04 5.21E-04 1.56E-03 1.04E-03 6.58E-02 9.67E-05 2.43E-04 7.29E-04 4.86E-04 4.91E-03 2.57E-03 1.04E-02 2.59E-02 1.74E-05 1.04E-04 6.94E-05

40

16.2 16.2 17

16.2 17 17

0 0 0

0 0 0

0.00015625 0.000208333 6.94444E-05

1.56E-04 2.08E-04 6.94E-05

N

120

1

1

2.88E-01

Số kiểu gen tt

27

0.05

15.51

α

Bảng 3.11 Locus vWA

Locus vWA

Số mẫu

120 người

Số alen

7

số kiểu gen

17

Số tổ hợp kiểu gen lý thuyết

28

2

0.080499

Df = 9

p = 0.05

16.92

2

Tần suất lý thuyết

vWAb 14 15 16 17 18 19 20 15 16 17 18 19 20 16 17 18 19 20 17 18 19 20 18 19

Tần số kiểu gen 11 1 10 10 22 4 0 0 0 0 1 0 0 3 6 6 1 0 2 14 4 0 17 7

vWAa 14 14 14 14 14 14 14 15 15 15 15 15 15 16 16 16 16 16 17 17 17 17 18 18

Tần suất thực tế 0.091667 0.008333 0.083333 0.083333 0.183333 0.033333 0 0 0 0 0.008333 0 0 0.025 0.05 0.05 0.008333 0 0.016667 0.116667 0.033333 0 0.141667 0.058333

0.082656 0.004792 0.069479 0.091042 0.203646 0.038333 0.002396 6.94E-05 0.002014 0.002639 0.005903 0.001111 6.94E-05 0.014601 0.038264 0.08559 0.016111 0.001007 0.025069 0.112153 0.021111 0.001319 0.125434 0.047222

0.000982 0.002617 0.002762 0.000653 0.002026 0.000652 0.002396 6.94E-05 0.002014 0.002639 0.001 0.001111 6.94E-05 0.007406 0.0036 0.014799 0.003755 0.001007 0.002816 0.000182 0.007076 0.001319 0.002101 0.002614

41

18 19 19 20

20 19 20 20

0.008333 0 0 0

1 0 0 0

0.002951 0.004444444 0.000555556 1.73611E-05

0.009816 0.004444 0.000556 1.74E-05

N

1

120

1

0.080499

Số kiểu gen tt

17

0,05

16.92

α Bảng 3.12 Locus TPOX

Locus TPOX

Số mẫu

120 người

Số alen

5

số kiểu gen

11

Số tổ hợp kiểu gen lý thuyết

15

2

0.035487

df = 6

p = 0.05

12.59

2

0.000801 0.008624 0.00638 4.96E-07 0.000176 0.000584 0.002604 0.01058 3.46E-05 0.000156 0.001164 0.000938 0.001229 0.000809 0.001406

Tần suất lý thuyết 0.131406 0.075521 0.009063 0.350417 0.027188 0.010851 0.002604 0.100694 0.007813 0.000156 0.012083 0.000938 0.233611 0.03625 0.001406

TPOXb 8 9 10 11 12 9 10 11 12 10 11 12 11 12 12

TPOXa 8 8 8 8 8 9 9 9 9 10 10 10 11 11 12

Tần số kiểu gen 17 6 2 42 3 1 0 16 1 0 1 0 26 5 0

Tần suất thực tế 0.141667 0.05 0.016667 0.35 0.025 0.008333 0 0.133333 0.008333 0 0.008333 0 0.216667 0.041667 0

0.035487

1

N

120

1

12.59

0.05

Số kiểu gen tt

11

α

42

Bảng 3.13 Locus D18S51

Locus D18

Số mẫu

120 người

Số alen

11

số kiểu gen

30

Số tổ hợp kiểu gen lý thuyết

66

0.707651

2

df = 9

16.92

2

p = 0.05 Tần suất thực tế

D18b 12 13 14 15 16 17 18 19 20 21 22 13 14 15 16 17 18 19 20 21 22 14 15 16 17 18 19 20 21 22 15 16

Tần số kiểu gen 0 1 1 1 0 0 0 0 0 0 0 7 13 10 7 3 1 3 0 0 0 9 12 18 1 0 3 0 1 2 2 7

D18a 12 12 12 12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 15 15

0 0.008333 0.008333 0.008333 0 0 0 0 0 0 0 0.058333 0.108333 0.083333 0.058333 0.025 0.008333 0.025 0 0 0 0.075 0.1 0.15 0.008333 0 0.025 0 0.008333 0.016667 0.016667 0.058333

Tần suất lý thuyết 0.000156 0.005521 0.006979 0.003958 0.004896 0.000625 0.000313 0.00125 0.000313 0.000313 0.000521 0.048767 0.123299 0.069931 0.086493 0.011042 0.005521 0.022083 0.005521 0.005521 0.009201 0.077934 0.088403 0.10934 0.013958 0.006979 0.027917 0.006979 0.006979 0.011632 0.025069 0.062014

0.000156 0.001432 0.000263 0.004836 0.004896 0.000625 0.000313 0.00125 0.000313 0.000313 0.000521 0.001876 0.001817 0.002568 0.009168 0.017644 0.001432 0.000385 0.005521 0.005521 0.009201 0.00011 0.001521 0.01512 0.002267 0.006979 0.000305 0.006979 0.000263 0.002179 0.002816 0.000218

43

17 18 19 20 21 22 16 17 18 19 20 21 22 17 18 19 20 21 22 18 19 20 21 22 19 20 21 22 20 21 22 21 22 22

15 15 15 15 15 15 16 16 16 16 16 16 16 17 17 17 17 17 17 18 18 18 18 18 19 19 19 19 20 20 20 21 21 22

0 0 0.016667 0 0 0.016667 0.041667 0.008333 0.016667 0.008333 0 0.008333 0 0 0 0.008333 0 0 0 0 0 0 0 0 0 0 0.008333 0.008333 0.008333 0 0 0 0 0

0.007917 0.003958 0.015833 0.003958 0.003958 0.006597 0.038351 0.009792 0.004896 0.019583 0.004896 0.004896 0.00816 0.000625 0.000625 0.0025 0.000625 0.000625 0.001042 0.000156 0.00125 0.000313 0.000313 0.000521 0.0025 0.00125 0.00125 0.002083 0.000156 0.000313 0.000521 0.000156 0.000521 0.000434 1 0.05

0.007917 0.003958 4.39E-05 0.003958 0.003958 0.015371 0.000287 0.000217 0.0283 0.006463 0.004896 0.002413 0.00816 0.000625 0.000625 0.01361 0.000625 0.000625 0.001042 0.000156 0.00125 0.000313 0.000313 0.000521 0.0025 0.00125 0.040135 0.018753 0.428611 0.000313 0.000521 0.000156 0.000521 0.000434 0.707651 16.92

0 0 2 0 0 2 5 1 2 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 120 31

N Số kiểu gen tt

1 α

44

Bảng 3.14 Locus D5S818

Locus D5

Số mẫu

120 người

Số alen

7

số kiểu gen

18

Số tổ hợp kiểu gen lý thuyết

28

3.27E-01

2

df = 9

p = 0.05

16.92

D5a

D5b

2

Tần suất thực tế

7 7 7 7 7 7 7 9 9 9 9 9 9 10 10 10 10 10 11 11 11 11 12 12 12 13 13 14

7 9 10 11 12 13 14 9 10 11 12 13 14 10 11 12 13 14 11 12 13 14 12 13 14 13 14 14

Tần số kiểu gen 0 1 0 0 1 0 0 0 1 1 1 0 0 8 22 11 10 0 13 14 11 1 10 8 1 4 2 0

0 0.008333 0 0 0.008333 0 0 0 0.008333 0.008333 0.008333 0 0 0.066667 0.183333 0.091667 0.083333 0 0.108333 0.116667 0.091667 0.008333 0.083333 0.066667 0.008333 0.033333 0.016667 0

Tần suất lý thuyết 6.94E-05 0.000278 0.004167 0.005208 0.003889 0.002708 0.000278 0.000278 0.008333 0.010417 0.007778 0.005417 0.000556 0.0625 0.15625 0.116667 0.08125 0.008333 0.097656 0.145833 0.101563 0.010417 0.054444 0.075833 0.007778 0.026406 0.005417 0.000278

6.94E-05 2.33E-01 4.17E-03 5.21E-03 5.08E-03 2.71E-03 2.78E-04 2.78E-04 0.00E+00 4.17E-04 3.96E-05 5.42E-03 5.56E-04 2.78E-04 4.69E-03 5.36E-03 5.34E-05 8.33E-03 1.17E-03 5.83E-03 9.64E-04 4.17E-04 1.53E-02 1.11E-03 3.96E-05 1.82E-03 2.34E-02 2.78E-04

120

1

1

N

3.27E-01

18

0.05

Số kiểu gen tt

16.92

α

45

Bảng 3.15 Locus FGA

Locus FGA

Số mẫu

120 người

Số alen

16

số kiểu gen

42

Số tổ hợp kiểu gen lý thuyết

136

0.981118

2

df = 8

p = 0.05

15.51

2

Tần suất thực tế

FGAa 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19

FGAb 18 19 20 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 19 20 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2

Tần số kiểu gen 0 0 0 0 0 0 1 0 2 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 2 0 0 0

0 0 0 0 0 0 0.008333 0 0.016667 0 0 0 0 0 0 0 0 0 0 0.008333 0 0 0 0 0 0 0 0.016667 0 0 0

Tần suất lý thuyết 0.000156 0.000313 0.001042 0.001667 0.002813 0.000104 0.002396 0.000417 0.006667 0.001146 0.004063 0.000833 0.002292 0.000104 0.000729 0.000104 0.000156 0.001042 0.001667 0.002813 0.000104 0.002396 0.000417 0.006667 0.001146 0.004063 0.000833 0.002292 0.000104 0.000729 0.000104

0.000156 0.000313 0.001042 0.001667 0.002813 0.000104 0.014711 0.000417 0.014999 0.001146 0.004063 0.000833 0.002292 0.000104 0.000729 0.000104 0.000156 0.001042 0.001667 0.010832 0.000104 0.002396 0.000417 0.006667 0.001146 0.004063 0.000833 0.090157 0.000104 0.000729 0.000104

46

20 20 20 20 20 20 20 20 20 20 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 22 22 22 22 22 22 22.2 22.2 22.2 22.2 22.2 22.2

20 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 22.2 23 23.2 24 24.2 25

0 2 0 1 2 0 2 0 0 1 2 0 0 0 0 2 0 0 0 6 0 2 1 1 0 1 0 2 0 1 0 10 1 6 0 2 0 1 0 0 0 0 0 0 0

0.001736 0.005556 0.009375 0.000347 0.007986 0.001389 0.022222 0.003819 0.013542 0.002778 0.007639 0.000347 0.002431 0.000347 0.004444 0.015 0.000556 0.012778 0.002222 0.035556 0.006111 0.021667 0.004444 0.012222 0.000556 0.003889 0.000556 0.012656 0.000938 0.021563 0.00375 0.06 0.010313 0.036563 0.0075 0.020625 0.000938 0.006563 0.000938 1.74E-05 0.000799 0.000139 0.002222 0.000382 0.001354

0 0.016667 0 0.008333 0.016667 0 0.016667 0 0 0.008333 0.016667 0 0 0 0 0.016667 0 0 0 0.05 0 0.016667 0.008333 0.008333 0 0.008333 0 0.016667 0 0.008333 0 0.083333 0.008333 0.05 0 0.016667 0 0.008333 0 0 0 0 0 0 0

0.001736 0.02222 0.009375 0.183793 0.009436 0.001389 0.001389 0.003819 0.013542 0.011108 0.01067 0.000347 0.002431 0.000347 0.004444 0.000185 0.000556 0.012778 0.002222 0.005868 0.006111 0.001154 0.003403 0.001237 0.000556 0.005078 0.000556 0.001271 0.000938 0.008117 0.00375 0.009074 0.00038 0.004938 0.0075 0.00076 0.000938 0.000477 0.000938 1.74E-05 0.000799 0.000139 0.002222 0.000382 0.001354

47

22.2 22.2 22.2 22.2 22.2 23 23 23 23 23 23 23 23 23 23 23.2 23.2 23.2 23.2 23.2 23.2 23.2 23.2 23.2 24 24 24 24 24 24 24 24 24.2 24.2 24.2 24.2 24.2 24.2 24.2 25 25 25 25 25 25

25.2 26 26.2 27 28.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 23.2 24 24.2 25 25.2 26 26.2 27 28.2 24 24.2 25 25.2 26 26.2 27 28.2 24.2 25 25.2 26 26.2 27 28.2 25 25.2 26 26.2 27 28.2

0 0 0 0 0 2 0 3 5 6 0 2 0 2 0 0 0 0 0 0 0 0 0 0 8 3 9 4 7 0 2 0 2 0 0 3 0 0 0 3 2 3 0 0 1

0.000278 0.000764 3.47E-05 0.000243 3.47E-05 0.009184 0.003194 0.051111 0.008785 0.031146 0.006389 0.017569 0.000799 0.00559 0.000799 0.000278 0.008889 0.001528 0.005417 0.001111 0.003056 0.000139 0.000972 0.000139 0.071111 0.024444 0.086667 0.017778 0.048889 0.002222 0.015556 0.002222 0.002101 0.014896 0.003056 0.008403 0.000382 0.002674 0.000382 0.026406 0.010833 0.029792 0.001354 0.009479 0.001354

0 0 0 0 0 0.016667 0 0.025 0.041667 0.05 0 0.016667 0 0.016667 0 0 0 0 0 0 0 0 0 0 0.066667 0.025 0.075 0.033333 0.058333 0 0.016667 0 0.016667 0 0 0.025 0 0 0 0.025 0.016667 0.025 0 0 0.008333

0.000278 0.000764 3.47E-05 0.000243 3.47E-05 0.006097 0.003194 0.013339 0.123076 0.011413 0.006389 4.63E-05 0.000799 0.02195 0.000799 0.000278 0.008889 0.001528 0.005417 0.001111 0.003056 0.000139 0.000972 0.000139 0.000278 1.26E-05 0.001571 0.01361 0.001824 0.002222 7.93E-05 0.002222 0.100984 0.014896 0.003056 0.032781 0.000382 0.002674 0.000382 7.49E-05 0.003142 0.000771 0.001354 0.009479 0.035972

48

25.2 25.2 25.2 25.2 25.2 26 26 26 26 27 27 28.2

25.2 26 26.2 27 28.2 26 26.2 27 28.2 27 28.2 28.2

0 0 0 0 0 0.008333 0 0 0 0 0 0

N

0 0 0 0 0 1 0 0 0 0 0 0 120

1

0.001111 0.006111 0.000278 0.001944 0.000278 0.008403 0.000763889 0.005347222 0.000763889 0.000850694 0.000243056 1.73611E-05 1

0.001111 0.006111 0.000278 0.001944 0.000278 5.83E-07 0.000764 0.005347 0.000764 0.000851 0.000243 1.74E-05 0.981118

Số kiểu gen TT

42

0.05

15.51

α

Kết quả số liệu ở các bảng trên cho thấy phân tích thống kê, kiểm định tần số alen và số kiểu gen giữa mẫu thực tế phù hợp với quần thể theo lý thuyết ở tất cả 15 locus gen. Tần suất phân bố alen của các locus gen hệ Identifiler trên 120 cá thể người H’Mông là tin cậy và sử dụng được trong tính toán, giám định ADN. 1.3.2. Bảng tần suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30) Bảng kết quả và thảo luận cơ sở dữ liệu tần suất phân bố các alen của 15

locus gen (gồm bảng 3.16 đến bảng 3.30)

Bảng 3.16 Locus D8S1179

Đồng hợp tử: 24 Dị hợp tử: 96 Tổng số : 120

Alen Số lượng quan sát Tần suất

10 65 0.270833

11 49 0.204167

12 12 0.05

13 31 0.129167

14 17 0.070833

15 54 0.225

16 10 0.041667

17 2 0.008333

49

Tổng: 8 2n = 240 1

Bảng 3.17 Locus D21S11

Đồng hợp tử: 16 Dị hợp tử: 104 Tổng số : 120

Alen Số lượng quan sát Tần suất

27 1 0.004167

28 6 0.025

29 48 0.2

30 55 0.229167

30.2 3 0.0125

31 24 0.1

31.2 43 0.179167

32 7 0.029167

32.2 16 0.066667

33 1 0.004167

33.2 32 0.133333

34.2 2 0.008333

35.2 2 0.008333

1 Tổng:13 2n = 240

Bảng 3.18 Locus D7S820

Đồng hợp tử: 29 Dị hợp tử: 91 Tổng số : 120

Alen 8 9 Tần suất 0.204167 0.020833 Số lượng quan sát 49 5

9.1 1 0.004167

10 23 0.095833

11 113 0.470833

12 13 14 38 5 5 0.158333 0.020833 0.020833

15 1 0.004167

50

Tổng: 9 2n = 240 1

Bảng 3.19 Locus CSF1PO

Đồng hợp tử: 44 Dị hợp tử: 76 Tổng số : 120

Alen Số lượng quan sát Tần suất

7 2 0.008333

9 1 0.004167

10 61 0.254167

11 25 0.104167

12 133 0.554167

13 18 0.075

Tổng:6 2n = 240

1 Bảng 3.20 Locus D3S1358

Đồng hợp tử: 42 Dị hợp tử: 78 Tổng số : 120

Alen 14 15 16 17 18 Tổng: 5 Số lượng quan sát 4 74 80 71 11 2n = 240 Tần suất 0.016667 0.308333 0.333333 0.295833 0.045833 1

Bảng 3.21 Locus TH01

Đồng hợp tử: 39 Dị hợp tử: 81 Tổng số : 120

51

Alen 6 6.3 7 8 9 9.3 10 Tổng: 7 Số lượng quan sát 53 1 48 4 116 12 6 2n = 240 Tần suất 0.220833 0.004167 0.2 0.016667 0.483333 0.05 0.025 1

Bảng 3.22 Locus D13S317

Đồng hợp tử: 44 Dị hợp tử: 76 Tổng số : 120

Alen 8 Số lượng quan sát 142 Tần suất 0.591667

0.1125

9 10 11 12 13 14 0.108333 0.120833 0.045833 0.016667 0.004167 27 26 29 11 4 1

Tổng: 7 2n = 240 1

Bảng 3.23 Locus D16S539

Đồng hợp tử: 38 Dị hợp tử: 82 Tổng số : 120

Alen Số lượng quan sát Tần suất

8 0.008333 2

9 0.4125 99

10 0.141667 34

11 0.216667 52

12 0.179167 43

13 0.029167 7

14 0.008333 2

15 0.004167 1

1 Tổng: 8 2n = 240

Bảng 3.24 Locus D2S1338

Đồng hợp tử: 22 Dị hợp tử: 98 Tổng số : 120

Alen Số lượng quan sát

Tần suất 0.016667 17 4

0.033333 18 8

52

0.154167 19 37

0.1 20 24

0.020833 21 5

0.0875 22 21

0.283333 23 68

0.220833 24 53

0.0375 25 9

0.0375 26 9

0.008333 27 2

Tổng:8 2n = 240 1

Bảng 3.25 LocusD19S443

Đồng hợp tử: 27 Dị hợp tử: 93 Tổng số : 120

Alen Số lượng quan sát Tần suất

11 1 0.004167

12 3 0.0125

13 63 0.2625

13.2 33 0.1375

14 38 0.158333

14.2 15 0.0625

15 15.2 7 73 0.029167 0.304167

16 1 0.004167

16.2 3 0.0125

17 2 0.008333

53

Tổng:11 2n = 240 1

Bảng 3.26 Locus vWA

Đồng hợp tử: 33 Dị hợp tử: 87 Tổng số : 120

Alen Số lượng quan sát Tần suất

0.2875 14 69

15 2 0.008333

16 29 0.120833

17 38 0.158333

18 85 0.354167

19 16 0.066667

20 1 0.004167

1 Tổng:7 2n = 240

Bảng 3.27 Locus TPOX

Đồng hợp tử: 44 Dị hợp tử: 76 Tổng số : 120

Alen Số lượng quan sát Tần suất

8 87 0.3625

9 25 0.104167

10 3 0.0125

11 116 0.483333

12 9 0.0375

1 Tổng: 5 2n = 240

Bảng 3.28 Locus D18S51

Đồng hợp tử: 24 Dị hợp tử: 96 Tổng số : 120

Tần suất Alen Số lượng quan sát

12 3 0.0125

13 53 0.220833

54

14 67 0.279167

15 38 0.158333

16 47 0.195833

17 6 0.025

19 15 0.0625

20 3 0.0125

21 3 0.0125

22 5 0.020833

Tổng: 10 2n = 240 1

Bảng 3.29 Locus D5S818

Đồng hợp tử: 35 Dị hợp tử: 85 Tổng số : 120

Alen Số lượng quan sát Tần suất

7 2 0.008333

9 4 0.016667

10 60 0.25

11 75 0.3125

12 56 0.233333

13 39 0.1625

14 4 0.016667

1 Tổng: 7 2n = 240

Bảng 3.30 Locus FGA

Đồng hợp tử: 18 Dị hợp tử: 102 Tổng số : 120

Tần suất

55

0.0125 0.0125 0.041667 0.066667 0.1125 0.004167 Alen 18 19 20 21 22 22.2 Số lượng quan sát 3 3 10 16 27 1

23 23.2 24 24.3 23 4 64 11 0.095833 0.016667 0.266667 0.045833

25 39 0.1625

25.2 8 0.033333

26 22 0.091667

26.2 1 0.004167

27 7 0.029167

28.2 1 0.004167

Tổng:16 2n = 240 1

1.3.3. Kết quả so sánh tần suất alen của ngƣời H Mông với một số ngƣời

tộc ngƣời (xem Bảng từ 3.31 đến 3.45) và biện luận :

Bảng 3.31 Locus D8S1179

Alen Tộc ngƣời

Ngƣời Việt Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông

(n=110) (n=210) (n=120) (Kinh) (n=170)

8 0.0059 - - 0.009

10 0.1706 0.148 0.136 0.270833

11 0.1500 0.117 0.082 0.204167

12 0.1471 0.126 0.105 0.05

13 0.1471 0.167 0.186 0.129167

14 0.1559 0.169 0.177 0.070833

56

15 0.1176 0.167 0.195 0.225

16 0.0706 0.1 0.083 0.041667

17 0.0294 0.005 0.017 0.008333

17.2 - - 0.007 -

18 0.0059 0.005 - -

TS 10 10 9 8

ở người H’Mông chỉ thấy xuất hiện có 8 alen từ alen 8 đến alen 17.

Bảng 3.32 Locus D21S11

Alen Tộc ngƣời

Ngƣời Việt

Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông

(Kinh) (n=170) (n=110) (n=210) (n=120)

26 0.00294 0.005 - -

0.00416 27 0.00588 0.005 0.005 7

28 0.05588 0.077 0.064 0.025

- - 28.2 0.00294 -

0.2 29 0.25882 0.273 0.25

- - 29.2 0.00294 -

0.22916 30 0.25 0.173 0.252 7

30.2 0.02059 0.023 0.048 0.0125

31 0.08235 0.105 0.079 0.1

0.17916 31.2 0.05588 0.1 0.071 7

0.02916 32 0.02353 0.041 0.026 7

57

32.2 0.18235 0.15 0.124 0.08235

33 0.00294 - 0.05588 -

33.2 0.04706 0.036 0.064 0.02353

0.005 - - 34 -

34.2 0.05588 0.009 0.017 0.18235

- 35.2 - - 0.00294

TS 15 13 11 13

Alen 35.2 là alen đặc trưng mới chỉ xuất hiện ở người H’Mông; chưa

thấy xuất hiện ở người Thái lan, Malaixia, người Việt (Kinh).

Bảng 3.33 Locus D7S820

Alen Tộc ngƣời

Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)

7 0.00882 0.01 0.018

8 0.14706 0.162 0.204167 0.232

9 0.05588 0.055 0.020833 0.073

9.1 0.00294 - 0.004167 -

10 0.20588 0.193 0.095833 0.164

11 0.34412 0.338 0.470833 0.345

12 0.20294 0.205 0.158333 0.141

13 0.02353 0.036 0.020833 0.027

14 0.00882 0.002 0.020833 -

15 0.004167

TS 9 8 9 7

Alen 15 chỉ xuất hiện ở người H’Mông. Alen 9.1 là alen đặc trưng, mới

58

chỉ xuất hiện ở người H’Mông và người Việt (Kinh).

Bảng 3.34 Locus CSF1PO

Alen Tộc ngƣời

Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)

0.00588 0.005 7 - 0.008333

8 - - 0.002

9 0.04706 0.009 0.019 0.004167

10 0.24706 0.245 0.214 0.254167

11 0.25882 0.314 0.298 0.104167

12 0.34706 0.355 0.376 0.554167

13 0.06765 0.059 0.079 0.075

14 0.02059 0.005 0.01

15 0.00588 0.009 0.002

TS 8 8 8 6

Số lượng alen xuất hiện ở quần thể người H’Mông ít hơn hẳn so với 3

quần thể còn lại và tập trung ở những locus ngắn.

Bảng 3.35 Locus D3S1358

Alen Tộc ngƣời

Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)

11 - 0.009 - -

12 - 0.005 - -

13 - - 0.005

14 0.03824 0.045 0.031 0.016667

15 0.31471 0.25 0.286 0.308333

16 0.35 0.332 0.376 0.333333

59

17 0.20294 0.25 0.217 0.295833

18 0.08235 0.109 0.079 0.045833

19 0.00882 - 0.007

20 0.00294 - - -

TS 7 7 7 5

Có 5 alen xuất hiện ở người H’Mông, ít hẳn so với các quần thể khác

và tập trung ở các alen 15, 16, 17.

Bảng 3.36 Locus THO1

Alen Tộc ngƣời

Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)

6 6.3 7 8 9 9.3 10 11 TS 0.14118 0.36176 0.06765 0.32647 0.03824 0.05882 0.00588 7 0.109 0.345 0.095 0.286 0.095 0.068 - 6 0.107 0.31 0.052 0.355 0.081 0.095 - 6 0.220833 0.004167 0.2 0.016667 0.483333 0.05 0.025 - 8

Alen 6.3 là alen đặc trưng, mới chỉ xuất hiện ở người H’Mông; chưa

thấy xuất hiện ở người Thái lan, Malaixia, người Việt(Kinh).

Bảng 3.37 Locus D13S317

Alen Tộc ngƣời

Ngƣời Việt

Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông

(Kinh) (n=170) (n=110) (n=210) (n=120)

0.00294 7 0.005 0.002 -

60

0.34118 8 0.236 0.293 0.591667

9 0.13235 0.127 0.167 0.1125

10 0.12353 0.109 0.129 0.108333

11 0.22353 0.318 0.229 0.120833

12 0.13529 0.15 0.133 0.045833

13 0.02941 0.05 0.038 0.016667

14 0.01176 0.005 0.01 0.004167

TS 8 8 8 7

Không thấy alen 7 xuất hiện ở người H’Mông, alen 8 xuất hiện với tần

suất rất cao, vượt mức bình thường.

Bảng 3.38 Locus D16S539

Alen Tộc ngƣời

Ngƣời Việt Ngƣời Ngƣời Thái Ngƣời

(Kinh) Malaixia lan H Mông

(n=170) (n=110) (n=210) (n=120)

7 - - - 0.009

8 0.007 0.008333 0.0058824 0.018

9 0.217 0.4125 0.2205882 0.109

10 0.171 0.141667 0.1117647 0.182

11 0.298 0.216667 0.2970588 0.271

12 0.19 0.179167 0.2323529 0.259

13 0.105 0.029167 0.1117647 0.109

14 0.012 0.008333 0.0205882 0.023

15 - 0.004167 - -

TS 7 8 7 8

61

Alen 15 chỉ thấy xuất hiện ở người H’Mông.

Bảng 3.39 Locus D2S1338

Alen Tộc ngƣời

Ngƣời Việt (Kinh) (n=170) 0.01176 0.11471 0.07353 0.23529 0.11765 0.04706 0.05 0.173 0.13235 0.03824 0.00588 11 Ngƣời Malaixia (n=110) 0.018 0.095 0.091 0.2 0.132 0.018 0.068 0.173 0.123 0.073 0.009 11 Ngƣời Thái lan (n=210) 0.021 0.086 0.069 0.226 0.136 0.062 0.038 0.164 0.15 0.043 0.005 11 16 17 18 19 20 21 22 23 24 25 26 27 TS Ngƣời H Mông (n=120) - 0.016667 0.033333 0.154167 0.1 0.020833 0.0875 0.283333 0.220833 0.0375 0.0375 0.008333 8

Ở quần thể người H’Mông trong khảo sát này chỉ có alen 27 xuất hiện,

62

mang tính đặc trưng cho quần thể.

Bảng 3.40 Locus D19S443

Alen Tộc ngƣời

Ngƣời Việt

Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông

(Kinh) (n=170) (n=110) (n=210) (n=120)

9 0.01471 - 0.017 -

11 0.00294 0.005 0.004167 -

11.2 - 0.005 - -

12 0.04412 0.059 0.036 0.0125

12.2 0.01176 0.009 0.002 -

13 0.23824 0.318 0.281 0.2625

13.2 0.05 0.027 0.036 0.1375

14 0.25294 0.164 0.217 0.158333

14.2 0.11471 0.073 0.093 0.0625

15 0.058 0.091 0.098 0.029167

15.2 0.15 0.218 0.174 0.304167

16 0.01471 0.018 0.014 0.004167

16.2 0.04118 0.014 0.031 0.0125

17 - - - 0.008333

17.2 0.00294 - 0.002 -

18.2 0.00294 - - -

11 TS 14 12 12

63

Alen 17 đặc trưng chỉ xuất hiện ở người H’Mông.

Bảng 3.41 Locus vWA

Alen Tộc ngƣời

Ngƣời Việt Ngƣời Ngƣời Thái Ngƣời

(Kinh) Malaixia lan H Mông

(n=170) (n=110) (n=210) (n=120)

- 13 - - 0.009

0.2875 14 0.25882 0.257 0.164

0.008333 15 0.01765 0.026 0.041

0.120833 16 0.16765 0.145 0.168

0.158333 17 0.23529 0.24 0.277

0.354167 18 0.19118 0.207 0.255

0.066667 19 0.10588 0.114 0.068

0.004167 20 0.02353 0.01 0.018

7 TS 7 7 8

Bảng 3.42 Locus TPOX

Alen Tộc ngƣời

Ngƣời Việt Ngƣời Ngƣời Thái Ngƣời

H Mông (Kinh) Malaixia lan

(n=120) (n=170) (n=110) (n=210)

- 7 - - 0.005

0.3625 8 0.59118 0.564 0.509

0.104167 9 0.10294 0.131 0.141

0.0125 10 0.02647 0.031 0.032

0.483333 11 0.25882 0.248 0.314

0.0375 12 0.02059 0.024 -

- 14 - 0.002 -

64

5 TS 5 6 5

Bảng 3.43 Locus D18S51

Alen Tộc ngƣời

Ngƣời Việt

Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông

(Kinh) (n=170) (n=110) (n=210) (n=120)

- - 0.00294 - 9

- - - 0.005 10

0.012 - 0.00882 0.018 11

0.069 0.0125 0.09412 0.077 12

0.133 0.220833 0.10882 0.095 13

0.179 0.279167 0.17647 0.195 14

0.224 0.158333 0.19412 0.227 15

0.195 0.195833 0.21471 0.155 16

0.081 0.025 0.06765 0.082 17

0.033 0.0625 0.03529 0.032 18

0.031 0.0125 0.03824 0.05 19

0.01 0.0125 0.01765 0.032 20

0.021 0.020833 0.02059 0.023 21

0.007 0.0125 0.00882 0.005 22

0.005 - 23 0.00882 -

- - 25 0.00294 -

13 11 TS 15 14

Alen ở người H’Mông xuất hiện ít hơn các quần thể khác, chỉ thấy 11

65

alen.

Bảng 3.44 Locus D5S51

Alen Tộc ngƣời

Ngƣời Việt

Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông

(Kinh) (n=170) (n=110) (n=210) (n=120)

0.02647 0.023 0.026 0.008333 7

- 0.005 - - 8

0.05882 0.073 0.069 0.016667 9

0.18824 0.255 0.214 0.25 10

0.31765 0.264 0.271 0.3125 11

0.20294 0.245 0.236 0.233333 12

0.18529 0.123 0.167 0.1625 13

0.01765 0.005 0.017 0.016667 14

0.005 - - - 15

0.00294 - - - 16

0.005 - - - 17

66

10 8 7 7 TS

Bảng 3.45 Locus FGA

Alen Tộc ngƣời

Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)

- - 16 0.00294 -

0.002 - 17 - -

0.026 0.0125 18 0.00882 0.009

0.05 0.0125 19 0.10588 0.082

0.079 0.041667 20 0.05588 0.045

0.002 - 20.2 - 0.005

0.129 0.066667 21 0.14118 0.141

- - 21.1 0.00294 -

0.021 - 21.2 0.00294 0.005

0.207 0.1125 22 0.21176 0.259

0.012 0.004167 22.2 0.02059 0.023

0.186 0.095833 23 0.13824 0.145

0.007 0.016667 23.2 0.01176 0.005

0.11 0.266667 24 0.13235 0.109

0.005 0.016667 24.2 0.01765 0.005

0.093 0.266667 25 0.06765 0.105

0.012 0.045833 25.2 0.00882 0.009

0.04 0.1625 26 0.04118 0.023

0.005 0.033333 26.2 0.00588 0.009

0.01 0.091667 27 0.01765 0.018

0.005 - 28 0.00294 0.005

- 0.004167 28.2 - -

- - 30.2 0.00294 -

67

19 16 TS 20 18

Alen 28.2 là alen đặc trưng, mới chỉ xuất hiện ở người H’Mông; chưa

thấy xuất hiện ở người Thái lan, Malaixia, người Việt (kinh).

2. Bàn luận

Qua kết quả khảo sát, chúng tôi nhận thấy một số alen đặc trưng, chỉ

thấy xuất hiện ở người H’Mông mà chưa thấy xuất hiện ở các quần thể khác.

Khi gặp được những mẫu có alen này được coi như một đặc điểm đặc biệt

giúp cho mẫu mang tính truy nguyên cao, có thể nghi là của người H’Mông,

đó là locus D21 có alen 35.2, locus D7 có alen 15, locus THO1 có alen 6.3, ở

locus D19 có alen 17, ở locus FGA có alen 28.2.

- Quần thể người H’Mông trong khảo sát này có lượng alen ở mỗi locus

thường ít hơn so với các quần thể đã so sánh khác. Nguyên nhân do tập tục

hôn nhân chủ yếu là chỉ lấy người cùng dân tộc, điều đó thể hiện qua số lượng

đồng hợp tử của các alen là rất cao (bảng 3.16 đến 3.30).

- Ứng dụng bảng tần suất các alen của các locus gen hệ Identifiler của

120 cá thể người H’Mông trong giám định gen (ADN) của Viện Khoa học

hình sự nói riêng và của các đơn vị giám định khác là một giá trị khoa học để

các giám định viên biện luận trước tòa án, đảm bảo sự khách quan, công minh

68

của pháp luật.

KẾT LUẬN VÀ KIẾN NGHỊ

1. Kết luận

Với kết quả khảo sát và xây dựng bảng cơ sở dữ liệu tần suất các alen

của các gen thuộc hệ Identifiler trong quần thể người H’Mông chúng tôi rút ra

một số kết luận như sau:

- Đã khảo sát 120 mẫu ADN để xây dựng được cơ sở dữ liệu tần suất

các alen của các gen thuộc hệ Identifiler trong quần thể người H’Mông. Quá

trình thống kê, tính toán tần suất, kiểm định đều được tính toán trên phần

mềm Exel, cho kết quả chính xác. Kết quả kiểm định cho thấy là mẫu thực

nghiệm phù hợp với quần thể lý thuyết.

- Các phương pháp, quá trình tiến hành đều theo quy trình giám định

ADN tại Viện Khoa học hình sự, kết quả đủ độ tin cậy để ứng dụng trong

giám định gen cho các cá thể người H’Mông.

- Qua nghiên cứu đã phát hiện được trên tổng số 120 mẫu nghiên cứu

có 05 alen đặc trưng, chỉ mới thấy xuất hiện trong quần thể H’Mông. Đó là

locus D21 có alen 35.2, locus D7 có alen 15, locus THO1 có alen 6.3, ở locus

D19 có alen 17, ở locus FGA có alen 28.2

Những alen này là những đặc điểm có khả năng truy nguyên cao để truy

nguyên cá thể và xác định quan hệ huyết thống cha - mẹ - con. Điều này có ý

nghĩa lớn để sàng lọc, định hướng truy tìm tội phạm xuyên quốc gia.

- Ứng dụng cơ sở dữ liệu tần suất này trong giám định gen (ADN) của

Viện Khoa học hình sự nói riêng và của các đơn vị giám định gen khác trên

toàn quốc nói chung có ý nghĩa vô cùng cấp thiết, đặc biệt trong các vụ án

truy nguyên cá thể hoặc xác định quan hệ huyết thống cha - mẹ - con, kết quả

là bằng chứng khoa học không thể chối cãi được, đặc biệt là khi tranh tụng

trước tòa. Kết quả có ý nghĩa rất lớn không chỉ trong nước mà còn rất giá trị

69

đối với các nhà giám định và nghiên cứu về gen hình sự trên thế giới.

2. Kiến nghị

Trong phạm vi đề tài nghiên cứu này, chúng tôi đã nghiên cứu số lượng

mẫu phần lớn thuộc khu vực Tây Bắc của Việt Nam. Tuy nhiên, để có kết quả

toàn diện hơn về tần suất các alen trên quần thể người H’Mông, chúng tôi có

một số kiến nghị sau:

- Mở rộng quy mô khảo sát, thống kê trên số lượng mẫu lớn hơn, kiểm

định với mức xác suất p = 0,0001

- Tiếp tục khảo sát tần suất các alen trên các dân tộc khác nhau ở Việt

Nam, đặc biệt là các quần thể như dân tộc Mường, Trung Quốc, Khơ me…

- Các alen đặc trưng cho người H’Mông cần tiếp tục được khảo sát.

- Có thể phối hợp kết quả nghiên cứu của đề tài với các nghiên cứu di

truyền khác về quần thể người dân tộc H’Mông để rút ra những đặc điểm cơ

bản về quần thể dân tộc này phục vụ các nghiên cứu về dân tộc học, khoảng

70

cách di truyền…

TÀI LIỆU THAM KHẢO

Tiếng Việt

1. Chu Văn Mẫn, Đào Hữu Hồ (1999), iáo tr nh thống k sinh học, Nhà xuất

bản Khoa học và kỹ thuật.

2. Chu Văn Mẫn (2009), Tin học trong c ng nghệ sinh học, Nhà xuất bản giáo

dục Việt nam.

3. iáo tr nh lý thuyết Thống k , NXB. Giáo dục,HN 1996

4. Hà Quốc Khanh (2002), Điều tra và xây dựng cơ sở dữ liệu tần suất các

gen hệ Nineplex người Việt (Kinh), Đề tài khoa học cấp Bộ.

5. Lê Đức Vĩnh (2006), iáo tr nh Xác suất thống k , Đại học Nông nghiệp 1

– Hà Nội.

6. TS Lê Thị Thu Thủy (2011), Khảo sát và xây dựng cơ sở dữ liệu tần suất

các alen của 15 gen hệ Identifiler trong quần thể người Kinh ứng dụng trong

giám định ADN của lực lượng Kỹ thuật h nh sự, Đề tài khoa học cấp Bộ.

7. TS Lê Thị Thu Thủy (2012), Vai trò của cơ sở dữ liệu tần suất trong giám

định tư pháp về gen (ADN), tạp chí Cảnh sát Phòng chống tội phạm, Số 31

(178).

8. Phạm Xuân Kiều (2005), iáo tr nh Xác suất và thống k , NXB GD.

9. TS Nguyễn Văn Đức (2002), Phương pháp kiểm tra thống kê Sinh học. Nhà

xuất bản khoa học và kỹ thuật.

10. Đào Hữu Hồ (1999), Xác suất thống k , nhà xuất bản đại học quốc gia Hà

Nội

11. Tăng Văn Khiên (2003), Điều tra chọn mẫu và ứng dụng trong công tác

thống k , NXB. Thống kê, Hà Nội.

12. Viện khoa học hình sự (2005), iáo tr nh iám định sinh học pháp lý, Hà

Nội.

13. Viện khoa học hình sự (2007), iáo tr nh iám định ADN, Hà Nội.

Tiếng Anh

14. ADN Technology in Forensic Science (1992) Committee on DNA

Technology in Forensic Science, National Research Council. Commission on

Life Sciences (CLS)

15. AmpFlSTR® Identifiler® PCR Amplification Kit User’s Manual.

16. Angel Carracedo (2005), Forensic DNA Typing Protocols, Humana Press

Inc.

17. Bio-Rad Cat No 143-2832 Insert. Chelex 100 and Chelex 20 Chelating

Ion Exchange Resin, Instruction Manual

18. Fung WK, Ye J, Hu L, Zhao X, Liu B, Wong DM, Law MY(2001), Allele

frequencies for nine STR loci in Beijing Chinese. Forensic Sci Int.

;121(3):207-9.

19. John M. Butler (2005), Forensic DNA Typing. Elsevier.

20. John M. Butler (2010), Fundamentals of Forensic DNA Typing, Elsevier

Inc.

21. John M. Butler (2012), Advanced Topics in Forensic DNA Typing,

Elsevier Inc.

22. John S. Buckleton, Christopher M. Triggs, Simon J. Walsh, (2005),

Forensic DNA Evidence Interpretation , CRC PRESS.

23. Lawrence Koblinsky, Thomas F. Liotti, Jamel Oeser-Sweat, (2005), DNA

forensic and legal applications,A John Wiley & Sons, Inc Publication.

24. Lawrence Kobilinsky, Louis Levine, Henrietta Margolis-Nunno (2007),

Forensic DNA Analysis, Infobase Publishing.

25. John M. Butler (2003), Forensic DNA Typing. Elsevier..

26. Maruyama S, Minaguchi K, Takezaki N, Nambiar P (2008), Population

data on 15 STR loci using AmpF/STR Identifiler kit in a Malay population

living in and around Kuala Lumpur, Malaysia. Leg Med (Tokyo) 10:160-2

27. Rerkammuaychoke B et al. Thai population data on 15 tetrameric STR

loci-D8S1179, D21S11, D7S820, CSF1PO, D3S1358, TH01, D13S317,

D16S539, D2S1338, D19S433, vWA, TPOX, D18S51, D5S818 and FGA.

Forensic Science International 158 (2006) 234 -237.

28. The Evaluation of Forensic DNA Evidence (1996) Commission on Life

Sciences (CLS)

29. Wing Kam Fung, Yue – Qing Hu (2008), Statistical DNA Forensic.