BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT
NGUYỄN NHƢ GIANG
KHẢO SÁT TẦN SUẤT CÁC ALEN TRONG CÁC LOCUS GEN (ADN) HỆ IDENTIFILER CỦA DÂN TỘC H’MÔNG PHỤC VỤ CÔNG TÁC GIÁM ĐỊNH GEN Ở VIỆT NAM
LUẬN VĂN THẠC SỸ SINH HỌC
HÀ NỘI - NĂM 2014 Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT
LUẬN VĂN THẠC SỸ SINH HỌC
Đề tài:
KHẢO SÁT TẦN SUẤT CÁC ALEN TRONG CÁC LOCUS GEN (ADN) HỆ IDENTIFILER CỦA DÂN TỘC H’MÔNG PHỤC VỤ CÔNG TÁC
GIÁM ĐỊNH GEN Ở VIỆT NAM
Học viên : Nguyễn Nhƣ Giang
Chuyên ngành : Hóa Sinh
Mã số : 60 42 01 14
Ngƣời hƣớng dẫn : PGS. TS Nguyễn Văn Hà
NĂM 2014 Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn
LỜI CẢM ƠN
Lời đầu tiên, tôi xin được gửi lời cảm ơn tới các Thầy, cô đã giảng dạy tại
Viện sinh thái và tài nguyên sinh vật - Viện hàn lâm khoa học và công nghệ Việt
Nam đã truyền đạt cho tôi những kiến thức cơ bản và chuyên sâu về lĩnh vực
Công nghệ sinh học, làm tiền đề cho tôi hoàn thành Luận văn tốt nghiệp.
Tôi cũng xin được bày tỏ lòng biết ơn sâu sắc tới PGS. TS Nguyễn Văn Hà
- Phó giám đốc Trung tâm giám định sinh học pháp lý - Viện Khoa học hình sự
đã tận tình hướng dẫn trong thời gian tôi thực hiện luận văn này.
Tôi xin cảm ơn Lãnh đạo Viện khoa học hình sự, Lãnh đạo Trung tâm giám
định sinh học pháp lý, toàn bộ tập thể cán bộ Trung tâm đã tạo mọi điều kiện
giúp đỡ tôi.
Cuối cùng, tôi xin cảm ơn gia đình đã luôn tạo điều kiện tốt nhất cho tôi
trong suốt quá trình học cũng như hoàn thành luận văn tốt nghiệp.
Hà Nội, ngày 10 tháng 12 năm 2014
Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn
Học viên Nguyễn Nhƣ Giang
ADN
Axit Deoxyribonucleic
STR
Short Tandem Repeats
PCR
Polymerase chain Reaction
D8
D8S1179
D21
D21S11
D7
D7S820
CSF
CSF1PO
D3
D3 S1358
THO1
HUMTHO1
D13
D13S317
D16
D16S539
D2
D2 S1338
D19
D19S433
D18
D18S51
D5
D5 S818
χ²
Khi bình phương thành phần thí nghiệm
Khi bình phương tiêu chuẩn
χα
Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn
CÁC KÍ HIỆU VIẾT TẮT
MỤC LỤC
MỞ ĐẦU .......................................................................................................... 1
CHƢƠNG 1. TỔNG QUAN TÀI LIỆU ........................................................ 5
1. Tình hình nghiên cứu trong và ngoài nước về khảo sát tần suất các
alen của các locus gen sử dụng trong giám định ADN. ................................. 5
1.1. Tình hình nghiên cứu trên thế giới ..................................................... 5
1.2. Tình hình nghiên cứu tại Việt nam .................................................... 5
2. Giám định gen (ADN) ....................................................................................... 6
2.1. Cơ sở khoa học của giám định gen .................................................... 6
2.1.1. Cấu trúc, chức năng của phân tử ADN ........................................... 6
2.1.2. Cơ chế phân ly độc lập và tổ hợp tự do trong sinh sản hữu tính .... 7
2.2. Lịch sử phát triển giám định ADN ................................................... 8
2.3. Khái niệm giám định gen (ADN)..................................................... 10
2.4. Khái niệm về locus và alen .............................................................. 12
2.5. Các tiêu chuẩn cho locus STR dùng trong giám định ADN ............ 13
2.6. Ý nghĩa của cơ sở dữ liệu tần suất alen của các locus STR ............ 14
CHƢƠNG 2. NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU ............ 16
1. Nội dung nghiên cứu: ....................................................................................... 16
2. Phương pháp nghiên cứu: ............................................................................... 16
2.1. Thu mẫu: ......................................................................................... 16
2.2. Hóa chất, thiết bị và dụng cụ: .......................................................... 17
2.2.1. Hóa chất và thiết bị cho tách chiết ADN ...................................... 17
2.2.2. Hóa chất và thiết bị cho định lượng ADN .................................... 18
2.2.3. Hóa chất và thiết bị cho nhân bội và điện di ................................. 18
2.3. Phân tích mẫu ................................................................................................. 18
2.3.1. Tách chiết mẫu bằng chelex ......................................................... 18
2.3.2. Định lượng ADN bằng Realtime PCR ......................................... 19
2.3.3. Nhân bội ADN (PCR) .................................................................. 20
2.3.4. Điện di trên máy điện di mao dẫn (Capillary Electrophoresis- CE)
Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn
................................................................................................................. 22
2.4. Xử lý thống kê số liệu và tính tần suất các locus gen .......................... 25
2.4.1. Cơ sở lý thuyết .............................................................................. 25
2.4.2. Phương pháp xử lý thống kê ........................................................ 25
2.4.3. Các bước tính toán thống kê và kiểm định tiến hành trên phần
mềm Excel: .............................................................................................. 26
CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN ....................... 27
1. Kết quả ................................................................................................................. 27
1.1. Thu mẫu ........................................................................................... 27
1.2. Phân tích mẫu thu được kiểu gen theo yêu cầu và lập được bảng
kiểu gen của 120 cá thể. (Xem bảng 3 - phụ lục) .......................................... 27
1.3. Xử lý số liệu thống kê (Xem bảng 3.1 đến 3.15); tính được bảng tần
suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30); và so sánh với
một số quần thể người Việt và người nước ngoài (Xem bảng 3.31 đến
3.45). ......................................................................................................................... 27
1.3.1. Xử lý số liệu thống kê ................................................................... 27
1.3.2. Bảng tần suất của các mẫu nghiên cứu ......................................... 49
Bảng kết quả và thảo luận cơ sở dữ liệu tần suất phân bố các alen của 15
locus gen (gồm bảng 3.16 đến bảng 3.30) .............................................. 49
1.3.3. Kết quả so sánh tần suất alen của người H’Mông với một số người
tộc người (xem Bảng từ 3.31 đến 3.45) và biện luận : ........................... 56
2. Bàn luận ............................................................................................................. 68
KẾT LUẬN VÀ KIẾN NGHỊ ...................................................................... 69
1. Kết luận ............................................................................................................... 69
2. Kiến nghị ............................................................................................................. 70
TÀI LIỆU THAM KHẢO
PHỤ LỤC
Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn
ỨNG DỤNG ĐỀ TÀI
DANH MỤC CÁC HÌNH, BẢNG BIỂU
Hình 1. Cấu trúc ADN trong nhân tế bào (trang 7)
Hình 2. Các locus gen hệ Identifiler (trang 24)
Bảng 2.1. Thành phần phản ứng Realtime PCR (trang 20)
Bảng 2.2. Chu trình nhiệt của phản ứng PCR trên máy realtime 7500 (trang 20)
Bảng 2.3. Thành phần của phản ứng PCR (trang 22)
Bảng 2.4. Chu trình nhiệt trên máy PCR 9700 (trang 22)
Bảng 2.5. Thành phần của hỗn hợp điện di (trang 24)
Bảng 3.1 đến 3.15. Xử lý số liệu thống kê (trang 27 đến trang 46)
Bảng 3.16 đến 3.30 Bảng tần suất alen của 120 mẫu nghiên cứu (trang 49 đến trang 55)
Bảng 3.31 đến 3.45. So sánh tần suất alen với một số quần thể (trang 56 đến trang 67)
Bảng 1: Danh sách người H’ Mông được thu mẫu (Phần phụ lục)
Bảng 2: Kết quả định lượng 120 mẫu ADN của 120 cá thể người H’Mông (Phần
phụ lục)
Bảng 3: Kết quả kiểu gen 120 cá thể người H’ Mông (kí hiệu HM1 đến HM120)
(Phần phụ lục)
Số hóa bởi trung tâm Học liệu– ĐHTN http://www.lrc.tnu.edu.vn
MỞ ĐẦU
Cơ sở khoa học, thực tiễn và tính cấp thiết của việc nghiên cứu đề tài:
Người đầu tiên đặt nền móng cho ngành di truyền học là Mendel. Ông
là người đầu tiên phát hiện ra các quy luật di truyền. Mendel đã gọi những đặc
điểm được truyền từ thế hệ này qua thế hệ khác là “nhân tố di truyền”, mà sau
này được gọi là gen.
Trong nhân tế bào, các nhiễm sắc thể sắp xếp thành 23 cặp, trong đó 22
cặp nhiễm sắc thể thường và 1 cặp nhiễm sắc thể giới tính. Các cặp nhiễm sắc
thể này quy định các tính trạng khác nhau của cơ thể, được bảo tồn duy trì
trong thế hệ và được di truyền từ thế hệ này sang thế hệ khác. Con cái được
thừa hưởng các đặc tính di truyền thông qua 23 nhiễm sắc thể từ tinh trùng
của bố và 23 nhiễm sắc thể từ tế bào trứng của mẹ. Xét nghiệm truy nguyên
cá thể người cũng như xác định huyết thống trực hệ cha - con, mẹ - con chủ
yếu được thực hiện bằng cách sử dụng các marker ADN nằm trên các NST
trong nhân tế bào. Ngoài ra phân tích các marker trên nhiễm sắc thể Y còn có
thể xác định quan hệ huyết thống theo dòng cha.
ADN thường được coi là vật liệu di truyền ở cấp độ phân tử tham gia
quyết định các tính trạng. Trong quá trình sinh sản, phân tử ADN được nhân
đôi và truyền cho thế hệ sau. Năm 1953, Watson và Crick đã xây dựng mô
hình cấu trúc không gian của phân tử ADN. Theo hai ông, ADN có cấu trúc
từ hai sợi xoắn kép có phân tử lượng rất lớn, mỗi sợi ADN là một chuỗi xoắn
nucleotid gồm 4 loại bazơ nitơ: Adenin (A), Guanin (G), Cytosin (C) và
Thymin (T) sắp xếp kế tiếp nhau, xoắn đều quanh một trục theo chiều từ trái
sang phải như một thang dây xoắn, mà 2 tay thang là các phân tử đường
(C5H10O4) và axit phôtphoric sắp xếp xen kẽ nhau, còn mỗi bậc thang là một
cặp bazơ nitric đứng đối diện và liên kết với nhau bằng các liên kết hiđrô theo
1
nguyên tắc bổ sung, nghĩa là một bazơ lớn (A hoặc G) được bù bằng một
bazơ bé (T hoặc C) hay ngược lại. Do đặc điểm cấu trúc, Adenin chỉ liên kết
với Thymin bằng 2 liên kết hiđrô và Guanin chỉ liên kết với Cytosin bằng 3
liên kết hiđrô. Do các cặp nuclêôtit liên kết với nhau theo nguyên tắc bổ sung,
chiều rộng của chuỗi xoắn kép bằng 20Å , khoảng cách giữa các bậc thang
trên chuỗi xoắn bằng 3,4Å, phân tử ADN xoắn theo chu kỳ xoắn, mỗi chu kỳ
xoắn có 10 cặp nucleotit có chiều cao 34Å.
Nghiên cứu và ứng dụng công nghệ ADN vào công tác đấu tranh
phòng chống tội phạm là một mũi nhọn đã được thực hiện ở nhiều quốc gia từ
những năm 80 của thế kỷ XX. Cùng với sự tiến bộ của khoa học công nghệ,
giám định ADN ngày càng phát triển, hoàn thiện cả về công nghệ, phương
pháp và khả năng đáp ứng nhu cầu chung của pháp luật và của cả xã hội. Kết
luận của giám định ADN mang tính quyết định đối với các vụ việc mang tính
hình sự, dân sự như truy nguyên cá thể, xác định quan hệ huyết thống, xác
định tung tích nạn nhân trong các vụ thảm họa, chiến tranh… là rất cần thiết
và cấp bách. Tuy nhiên, để bảo đảm tính khoa học và tính pháp lý thì các
phòng thí nghiệm giám định ADN cần phải có tần suất các alen của các locus
gen để sử dụng khi dùng phân tích, kết luận giám định ADN cho mỗi một
quần thể người (dân tộc). Việc nghiên cứu, khảo sát tần suất alen của các
locus gen dùng trong giám định ADN của các dân tộc trên thế giới đã được
tiến hành ở mức cơ bản. Tuy nhiên tùy thuộc vào số dân tộc ở mỗi quốc gia
cũng như phụ thuộc vào năng lực giám định ADN của mỗi nước, các công bố
về tần suất alen của các locus gen dùng trong giám định ADN ở mỗi nước
khác nhau đối với mỗi dân tộc khác nhau là khác nhau.
Trong các điều kiện cần phải có khi kết luận giám định ADN thì có một
điều kiện bắt buộc đó là phải có cơ sở dữ liệu tần suất alen của các locus gen
dùng cho giám định gen đối mỗi quần thể người (dân tộc) cụ thể. Hiện nay,
trên thế giới, các đơn vị giám định ADN đang sử dụng phổ biến các bộ Kit
2
với 16 locus gen như bộ kit Identifiler, Identifiler Plus và Identifiler Direct
(hãng AB, Mỹ) hoặc bộ kit Powerplex (hãng Promega, Mỹ)… để tính toán tần
suất xuất hiện của các alen. Trên cơ sở đó tính toán xác suất trùng nhau giữa
các mẫu khi phải truy nguyên đồng nhất hoặc xác suất quan hệ huyết thống
giữa các mẫu khi phải xác định quan hệ huyết thống trong giám định ADN.
Ở Việt Nam hiện nay, Viện Khoa học hình sự và đa số các cơ quan, tổ
chức giám định đang sử dụng các bộ kit Identifiler, Identifiler Plus, và
Identifiler Direct cho giám định ADN. Năm 2011, bảng tần suất các alen của
các locus gen của hệ Identifiler trong quần thể người Việt (Kinh) được công
bố trên tạp chí ForensicAsia. Cho đến nay, chưa có một nghiên cứu nào được
công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ
Identifiler (gồm 15 gen) trong quần thể người H’Mông. Với dân số khoảng
80.000 người (đứng thứ 8 trong tổng số 54 các dân tộc Việt Nam), dân tộc
H’Mông phân bố khắp trên các tỉnh miền núi phía Bắc Việt Nam: Quảng
Ninh, Lạng Sơn, Bắc Cạn, Cao Bằng, Hà Giang, Tuyên Quang, Yên Bái, Lào
Cai, Lai Châu, Điện Biên, Sơn La, Hoà Bình, Thanh Hoá, Nghệ An và số ít ở
Phú Thọ, cũng như các tỉnh Tây Nguyên, đây là những điểm nóng về tình
hình an ninh và trật tự xã hội, số vụ án trong cộng đồng người H’Mông có
diễn biến phức tạp với xu hướng ngày càng gia tăng. Vì vậy, việc tiến hành
triển khai đề tài nghiên cứu: “Khảo sát tần suất các alen trong các locus gen
(ADN) hệ Identifiler của dân tộc H’Mông phục vụ cho công tác giám định
gen ở Việt Nam” là một yêu cầu cấp thiết.
Mục đích của đề tài :
1. Khảo sát tần suất các alen trong các locus gen (ADN) hệ Identifiler
của dân tộc H’Mông phục vụ công tác giám định gen ở Việt Nam.
2. Trên cơ sở đó, tính tần suất xuất hiện của mỗi alen trong từng locus
của dân tộc H’Mông, làm cơ sở khoa học để phân tích, đánh giá và
đưa ra kết luận giám định truy nguyên huyết thống hoặc truy nguyên
3
cá thể.
Nội dung của đề tài, các vấn đề cần giải quyết
Đề tài sẽ bao gồm một số nội dung chính với các vấn đề cần giải quyết sau:
- Thu thập 120 mẫu tế bào niêm mạc miệng của cá thể người H’Mông
không có quan hệ họ hàng ở các tỉnh khác nhau (có thông tin cá
nhân).
- Tách chiết ADN bằng phương pháp tách chiết vô cơ, sử dụng chelex
100 (hãng Bio - Rad, Mỹ).
- Định lượng ADN bằng phương pháp Real-time PCR sử dụng bộ Kit
Quantifiler® Human DNA Quantification (hãng ABI, Mỹ).
- Nhân bội ADN trên máy tạo chu trình nhiệt ABI – 9700 bằng bộ Kit
Identifiler (hãng ABI, Mỹ).
- Điện di và phân tích kết quả trên máy Phân tích gen ABI – 3130 với
phần mềm GeneMapper ID của hàng ABI (Mỹ).
- Phân tích kiểu gen (ADN) của các locus gen hệ Identifiler (15 locus
gen) của 120 cá thể người H’Mông. Từ cơ sở đó, tính tần suất xuất
hiện của mỗi alen của từng locus trong quần thể, kiểm định tính
chính xác của số lượng mẫu trong khảo sát với độ tin cậy p = 0,05.
Kết quả là bảng tần suất các alen của các locus gen hệ Identifiler
quần thể người H’Mông làm cơ sở khoa học để các cơ quan giám
định, các cơ quan tố tụng hình sự, dân sự sử dụng phân tích và đưa
ra kết luận trong giám định gen.
Đề tài này khi được hoàn thành sẽ đáp ứng yêu cầu của giám định
gen ở Việt Nam nói chung và đóng góp vào nhiệm vụ giám định ADN
cho các lực lượng thực thi pháp luật trên toàn cầu, nhất là trong bối
4
cảnh toàn cầu hóa giữa cảnh sát các nước thông qua Interpol.
CHƢƠNG 1. TỔNG QUAN TÀI LIỆU
1. Tình hình nghiên cứu trong và ngoài nƣớc về khảo sát tần suất các
alen của các locus gen sử dụng trong giám định ADN.
1.1. Tình hình nghiên cứu trên thế giới
Trên thế giới, ở các nước có phòng giám định gen đều đã nghiên cứu,
khảo sát và công bố kết quả của mình về sự phân bố tần suất các alen của các
gen hình sự. Ví dụ như tập đoàn Applied Biosystem (Mỹ) khảo sát 15 gen của
người Mỹ - Phi, người Mỹ - Tây Ban Nha ... Kết quả khảo sát 15 gen của
người Malaixia, Philipin, Hàn quốc, Guatemala, Sudan, Thái lan, Vênêzuela,
Bănglađet, Inđônêsia... đã được công bố. Đây là những số liệu rất có giá trị
không chỉ đối với lĩnh vực giám định gen của các nước đó mà còn có giá trị
về mặt khoa học đối với các giám định viên và các nhà khoa học nghiên cứu
về gen sử dụng trong giám định ADN trên thế giới [15, 26, 27].
Trong giám định ADN, bên cạnh việc sử dụng rộng rãi bộ kít của hãng
Applied Biosystem, bộ kít của hãng Promega cũng được nhiều nơi sử dụng
[14]. Ví dụ tại Mỹ, mỗi bang có từ 1 đến nhiều phòng thí nghiệm giám định
ADN và có thể dùng kit hệ Identifiler hoặc kit PowerPlex. Để thống nhất trên
toàn nước Mỹ, cảnh sát liên bang Mỹ (FBI) hiện dùng cơ sở dữ liệu tần suất
của 13 locus gen (trùng nhau trong hệ Identifiler và hệ PowerPlex) trong phần
mềm CODIS (Combined DNA index system) - một phần mềm nổi tiếng để
truy xuất, tìm kiếm, so sánh dữ liệu trong giám định ADN. Phần mềm này
đang được triển khai ở 49 quốc gia và vùng lãnh thổ trên thế giới.
1.2. Tình hình nghiên cứu tại Việt nam
Giám định gen ở Việt Nam bắt đầu triển khai chính thức từ tháng 4 năm
1999 tại Viện Khoa học hình sự, toàn bộ quy trình giám định gen được
chuyển giao từ Viện Khoa học hình sự - Bang Victoria - c cùng đội ngũ
5
giám định viên được đào tạo cơ bản tại c. Năm 2000, đề tài cấp Bộ nghiên
cứu khảo sát và xây dựng tần suất của các gen trong hệ Nineplex (10 locus
gen, trong đó có 1 locus gen xác định giới tính) được triển khai và năm 2002
đã được nghiệm thu đưa vào sử dụng làm cơ sở tính toán kết quả giám định
ADN [4] tại Viện Khoa học hình sự.
Năm 2006, Viện Khoa học hình sự - Bộ Công an được trang bị và triển
khai sử dụng kit phân tích ADN hệ Identifiler (gồm 15 locus gen và 1 locus
gen xác định giới tính) để tăng hiệu quả phân tích gen (ADN) phục vụ cho
công tác điều tra, phá án, tìm kiếm nạn nhân trong các vụ việc cũng như trong
các vụ giám định ngoài tố tụng .... Do tần suất xuất hiện của mỗi alen của các
locus gen trong hệ Identifiler ở mỗi quần thể dân tộc khác nhau là có sự phân
bố alen khác nhau. Yêu cầu cấp thiết đặt ra là phải xây dựng được tần suất
phân bố các alen của các locus gen hệ Identifiler trong quần thể của mỗi dân
tộc sinh sống trên lãnh thổ Việt Nam [28, 29].
Đến năm 2011, một đề tài cấp bộ do Viện Khoa học hình sự chủ trì đã
hoàn thành việc khảo sát tần suất alen các locus gen hệ Identifiler trong quần
thể người Việt (Kinh) với 170 cá thể.
Ở Việt Nam, cho đến nay chưa có một nghiên cứu hoàn chỉnh nào được
công bố về khảo sát sự phân bố tần suất các alen của các locus gen hệ
Identifiler trong quần thể người H’Mông được công bố.
2. Giám định gen (ADN)
2.1. Cơ sở khoa học của giám định gen
2.1.1. Cấu trúc, chức năng của phân tử ADN
Năm 1953, hai nhà nghiên cứu khoa học James D.Watson (Mỹ) và
Francis H.C Crick (Anh) đã công bố mô hình cấu trúc chuỗi xoắn kép phân tử
ADN. Đây là dấu mốc chính thức đánh dấu sự ra đời của Sinh học phân tử.
Các nhà khoa học đã phát hiện ra bản chất di truyền nằm trên cấu trúc
6
nhiễm sắc thể. Nhiễm sắc thể được cấu trúc từ phân tử ADN kết hợp với các
protein kiềm (histon). Phân tử ADN là một chuỗi xoắn kép gồm hai mạch
đơn, mỗi mạch đơn là một chuỗi nucleotide. Mỗi nucleotide gồm nhóm
phosphate, đường deoxyribose và một trong bốn base (adenine, cytosine,
guanine và thymine). Hai mạch đơn kết hợp với nhau nhờ các liên kết hydro
hình thành giữa các base bổ xung nằm trên hai mạch: base adenine (A) liên
kết với base thymine (T) bằng hai liên kết hydro (A=T); base cytosine (C) liên
kết với base guanine (G) bằng ba liên kềt hydro (CG). Mỗi mạch đơn là một trình tự có định hướng với một đầu là đầu 5'phosphate tự do và một đầu là
3'hydroxyl tự do (hướng quy ước là 5’3'). Hướng của hai mạch đơn trong
chuỗi xoắn kép ngược nhau và là hai mạch đối song song.
Hình 1. Cấu trúc ADN
2.1.2. Cơ chế phân ly độc lập và tổ hợp tự do trong sinh sản hữu tính
Năm 1956, Joe Hin Tjio và Albert Levan đã xác định chính xác ở
người, trong nhân tế bào thể (tế bào lưỡng bội) có 46 nhiễm sắc thể (NST)
7
được xếp thành 23 cặp đồng dạng: 22 cặp nhiễm sắc thể thường và một cặp
nhiễm sắc thể giới tính. Riêng tế bào trứng và tế bào tinh trùng chỉ có 23
nhiễm sắc thể (tế bào đơn bội). Thế hệ con cái nhận từ mẹ 23 nhiễm sắc thể
thông qua tế bào trứng và 23 nhiễm sắc thể từ cha thông qua tế bào tinh trùng.
Bộ nhiễm sắc thể được bảo tồn và truyền từ thế hệ này sang thế hệ khác và
mang tính đặc trưng cho loài người [19, 20,]. Theo định luật 1 và 2 của
Mendel, các nhiễm sắc thể phân ly độc lập, tổ hợp tự do đã góp phần tạo ra sự
đa dạng của các cá thể của mỗi loài thông qua sinh sản hữu tính. Đó là cơ sở
khoa học góp phần tạo nên sự khác biệt của mỗi cá thể trong quần thể, điều
mà chúng ta sử dụng để truy nguyên cá thể, xác định quan hệ huyết thống …
trong giám định gen.
2.2. Lịch sử phát triển giám định ADN
Năm 1985, Alec Jeffreys và các cộng sự ở trường đại học Leicester nước
Anh khi nghiên cứu các đoạn ADN mã hóa cho myoglobin trong máu người
đã phát hiện ra trình tự của các bazơnitơ được lặp lại một số lần với chiều dài
đoạn lặp từ 10 - 15 bp (base pair) hoặc vài chục bp, các đoạn lặp này được gọi
là tiểu vệ tinh (minisatellite) hay VNTR (Variable Number of Tandem
Repeats). Điều đáng chú ý là số lần lặp lại các đoạn lặp này ở các cá thể khác
nhau thì khác nhau. Alec Jeffreys coi đây là đặc điểm rất quan trọng để phân
biệt sự khác nhau giữa các cá thể và có thể sử dụng để truy nguyên cá thể.
Cũng vào thời điểm năm 1985, tác giả Karry Mullis và cộng sự đã công
bố kết quả thử nghiệm thành công phản ứng chuỗi nhân gen PCR (Polymerase
Chain Reaction). Thành công này là một chìa khóa để mở ra tất cả những
hướng nghiên cứu trong sinh học phân tử [13, 16].
Năm 1991, một phương pháp mới trong giám định ADN được giới
thiệu, đó là phương pháp phân tích sử dụng các đoạn lặp lại ngắn STR (Short
8
Tandem Repeats), các STR có đoạn lặp từ 2 - 6 bp.
Các cấu trúc STR đều mang tính bảo thủ cao, được di truyền qua các thế
hệ và mang tính đặc trưng cho cá thể. Các gen này thường có tính đa hình
cao, ít đột biến, tương đối bền vững và cho phép đồng thời thực hiện được
phản ứng nhân gen của nhiều gen khác nhau.
Dựa trên tính đa hình của các cấu trúc STR về chiều dài: Một số gốc
nucleotid được lặp đi lặp lại nhiều lần trên chiều dài của đoạn ADN.
Ví dụ: tại locus D7S820 của một cá thể, các alen phân biệt nhau bằng
số đoạn lặp GATA.
Alen thứ nhất: GATA GATA... ............GATA có 8 đoạn lặp
GATA
Alen thứ hai: GATA GATA GATA... GATA 12 đoạn lặp GATA
Locus D7S820 này là dị hợp tử với các alen là: 8 - 12.
Các locus STR có ưu điểm hơn các locus VNTR vì chúng bền vững
hơn (ít bị đột biến và đứt gãy), có khả năng nhân tổ hợp được nhiều gen trong
cùng một phản ứng PCR và những mẫu đem phân tích ít nhiều có biến tính
vẫn có thể cho kết quả.
Tháng 10 năm 1990, tại Mỹ, Dự án hệ gen người (Human Genome
Project-HGP) chính thức khởi động. Đến ngày 12 tháng 02 năm 2001, HGP
và Celera đã công bố trình tự đầy đủ của hệ gen người. Đây là một sự kiện
trọng đại trong sự phát triển của sinh học phân tử nói chung và trong việc
nghiên cứu gen người nói riêng. Theo công bố này, số lượng gen trong bộ gen
người có khoảng 35000 gen, trong đó có hàng chục gen được nghiên cứu ứng
dụng để sử dụng xác định huyết thống và truy nguyên cá thể [19].
Đến những năm cuối thế kỷ 20, các nhà khoa học hình sự mới ứng
dụng công nghệ gen (DNA Technology) vào trong đấu tranh với tội phạm,
9
xác định huyết thống và định danh cá thể. Giám định gen (ADN) là một trong
những phương pháp khoa học có độ chính xác rất cao, giúp cơ quan pháp luật
xác định chính xác tội phạm, truy tìm tung tích nạn nhân cũng như xác định
quan hệ huyết thống [23, 24].
2.3. Khái niệm giám định gen (ADN)
Trong giám định kỹ thuật hình sự có nhiều phương pháp để truy
nguyên cá thể người và giám định ADN hiện nay là một trong những phương
pháp đắc lực nhất để giúp các nhà điều tra hình sự xác định chính xác tội
phạm, truy tìm tung tích nạn nhân cũng như xác định quan hệ huyết thống
[13]. Từ năm 1987 đến nay, phương pháp giám định ADN từ các mẫu vật có
nguồn gốc cơ thể người được phát triển mạnh mẽ do tính chính xác, khả năng
truy nguyên cao và đa dạng về loại mẫu vật. Tính ưu việt của giám định gen
là truy nguyên được cá thể người, xác định quan hệ huyết thống cha - con -
mẹ, xác định danh tính hài cốt... Ban đầu, giám định gen được gọi là giám
định vân tay di truyền (DNA - "fingerprinting"), về sau để tránh sự hiểu lầm
giữa giám định đường vân và giám định gen, Uỷ ban nghiên cứu quốc gia Mỹ
(NRC) đề nghị đổi là truy nguyên ADN (DNA - profiling) [14, 20].
Giám định gen (ADN) là nghiên cứu, phân tích ADN từ các dấu vết,
vật chứng có nguồn gốc cơ thể người bằng kỹ thuật gen.Thông qua phân tích
ADN để xác định truy nguyên, nhận dạng cá thể người hoặc xác định quan hệ
huyết thống [19]. Trong đó, giám định gen trong nhân tế bào trên các nhiễm
sắc thể thường là phổ biến để tính toán truy nguyên cá thể hoặc xác định quan
hệ huyết thống. Giám định gen trên nhiễm sắc thể giới tính được quan tâm
nhiều ở các locus trên nhiễm sắc thể Y nhằm truy nguyên theo dòng cha.
Giám định gen ti thể để xác định quan hệ huyết thống theo dòng mẹ, đây là
loại giám định truy nguyên theo nhóm …
Số lượng locus gen được sử dụng phân tích càng nhiều thì khi tính toán
10
xác suất xuất hiện để truy nguyên hoặc tính quan hệ huyết thống cho kết quả
có độ tin cậy càng cao. Theo tập đoàn Perkin-Elmer (Mỹ), khi phân tích tổ
hợp 9 locus gen hệ Profiler Plus thì khả năng trùng hợp ngẫu nhiên tổ hợp các
kiểu gen là vô cùng nhỏ, vì tần suất xuất hiện của chúng là khoảng 1/72 tỉ
[29].
Trong vài năm trở lại đây, trên thế giới cũng như ở Viện Khoa học hình
sự đã đưa vào sử dụng bộ kit Identifiler phân tích 16 locus gen bằng máy giải
trình tự gen ABI 3130 Genetic Analyzer [6, 15].
Đây là bộ kit phức hợp dùng nhân bội, phân tích đồng thời 16 locus
STR. Đặc điểm của các locus gen STR trong bộ kit này:
- Locus gen D8S1179 nằm trên nhiễm sắc thể số 8, dài 128 - 168 cặp
bazơ, có 12 alen
- Locus gen D21S11 nằm trên nhiễm sắc thể số 21, dài 189 - 243 cặp
bazơ, có 35 alen
- Locus gen D7S820 nằm trên nhánh dài nhiễm sắc thể số 7, dài 258 -
294 cặp bazơ, có 11 alen
- Locus CSF1PO nằm trên nhánh dài nhiễm sắc thể số 5, dài 284 - 312
cặp bazơ, có 8 alen
- Locus gen D3S1358 nằm trên nhánh ngắn nhiễm sắc thể số 3, dài 114
- 142 cặp bazơ, có 12 alen
- Locus HUMTH01 nằm ở intron 1 của gen tyrosine hydroxylase
người, trên nhánh ngắn nhiễm sắc thể số 11, dài 168 - 192 cặp bazơ, có 7 alen
- Locus gen D13S317 nằm trên nhánh dài nhiễm sắc thể số 13, dài 206
- 234 cặp bazơ, có 9 alen
- Locus gen D16S539 nằm trên nhiễm sắc thể số 16, dài 245-269 cặp
11
bazơ, có 7 alen
- Locus gen D2S1338 nằm trên nhiễm sắc thể số 2
- Locus gen D19S433 nằm trên nhiễm sắc thể số 19
- Locus gen vWA nằm trên nhánh ngắn nhiễm sắc thể số 12, dài 157 -
197 cặp bazơ, có 13 alen
- Locus TPOX: Nằm ở intron 10 của gen thyroid peroxidase người, trên
nhánh ngắn nhiễm sắc thể số 2, dài 221 - 241 cặp bazơ, có 6 alen
- Locus gen D18S51 nằm trên nhánh dài nhiễm sắc thể số 18, dài 273 -
341cặp bazơ, có 25 alen
- Locus D5S818 (D5) nằm trên nhánh dài nhiễm sắc thể số 5, dài 135 -
171cặp bazơ, có 10 alen
Theo các nhà khoa học hình sự, khi phân tích bằng bộ kit Identifiler thì độ tin cậy đạt là: 1/ 4,62 x 1019, có nghĩa là trong số 4,62 x 1019 người thì mới
có một người trùng ngẫu nhiên với tổ hợp kiểu gen trên [15, 20].
Cùng với sự phát triển của công nghệ tự động hóa, các công đoạn giám
định ADN đã được tự động bằng các robot chuyên dụng, có khả năng phân
tích tới hàng trăm mẫu mỗi ngày trên 1 hệ thống. Về cơ bản, các hệ thống
phân tích tự động để xây dựng tàng thư ADN vẫn đang phân tích mẫu bằng
cách sử dụng các bộ kit có tổ hợp 13 locus (hệ CODIS) hoặc 16 locus hệ
Identifiler … dùng lưu trữ, tìm kiếm tội phạm và quản lý các đối tượng có
nguy cơ phạm pháp cao.
2.4. Khái niệm về locus và alen
Locus: là một đoạn ADN trên nhiễm sắc thể, dành cho một gen nhất
định [19]. Trong giám định ADN thì locus còn có thể là những đoạn ADN
không mã hóa [19].
Alen là các trạng thái khác nhau của cùng một gen. Mỗi cá thể đều có
12
hai alen cho mỗi một locus, trong đó một alen di truyền từ bố, một alen di
truyền từ mẹ. Nếu hai alen của một locus hoàn toàn giống nhau thì được gọi
là đồng hợp tử, còn khác nhau được gọi là dị hợp tử [14, 19].
2.5. Các tiêu chuẩn cho locus STR dùng trong giám định ADN
Giám định ADN hiện nay sử dụng các locus STR là chủ yếu. Phương
pháp giám định gen có độ tin cậy rất cao bởi các locus STR có tính đa alen
(tính đa hình) rất cao, mỗi alen chỉ xuất hiện trong quần thể với tần số rất thấp
[14, 24]. Locus STR ngắn nên có thể đồng thời phân tích được ba hoặc nhiều
STR hơn trong cùng một thời điểm. Việc phân tích đa hệ rất có giá trị vì
chúng có kết quả phân biệt lớn và thành công ngay cả một số trường hợp mẫu
lẫn hoặc đã bị phân hủy phần nào [13].
Một locus STR được sử dụng cho mục đích nhận dạng và xác định cá
thể phải đảm bảo các thông số sau:
- Có tính bền vững cao (tần suất đột biến thấp)
- Locus STR phải có tính đa hình và mức độ dị hợp tử cao. Điều này
giúp các nhà phân tích chỉ sử dụng một số locus tối thiểu đã đạt được sự phân
biệt cá thể một cách tốt nhất.
- Các locus STR có độ dài ngắn, trung bình từ 100 - 400 bp so với các
đoạn đa hình ngẫu nhiên khác. Các đoạn ADN ngắn có độ bền vững cao, ít bị
đứt gãy dưới tác động của điều kiện ngoại cảnh. Do vậy, khi tiến hành PCR
sẽ thu được hiệu quả tốt hơn các đoạn ADN dài.
- Các locus chứa đoạn STR phải đảm bảo yếu tố di truyền độc lập, do
vậy nên lựa chọn tổ hợp các locus nằm trên các nhiễm sắc thể khác nhau là rất
quan trọng. Các STR thông thường có rất nhiều alen, độ dài của các alen
thông thường khác nhau số đoạn lặp. Do vậy, việc sử dụng các STR có chiều
dài dưới 400 base để dễ dàng phân tích là một yêu cầu cần thiết trong quá
13
trình lựa chọn.
Nhiều đoạn đa hình có trình tự lặp lại chứa các đơn vị lặp lại từ 4
nucleotide đã được nghiên cứu và đáp ứng được yêu cầu của quy trình phân
tích cá thể người. Các đoạn này có đặc tính như sau:
- Có tính đa hình và mức độ dị hợp tử cao (>70%).
- Dễ dàng phối hợp thành bộ phức khi thực hiện PCR.
- Sản phẩm PCR ổn định, ít xảy ra trường hợp khi PCR đoạn lặp bị
thiếu.
2.6. Ý nghĩa của cơ sở dữ liệu tần suất alen của các locus STR
Mỗi cá thể người có cấu trúc di truyền riêng không ai giống ai, trừ
những trường hợp sinh ra cùng một trứng [4]. Nếu xét rộng trong cả một quần
thể thì một số đặc điểm di truyền (ADN) ở các cá thể khác nhau vẫn có thể
giống nhau (trùng lặp). Mặt khác mỗi một quần thể người (tộc người) khác
nhau cũng có những đặc điểm di truyền đặc trưng thể hiện bằng sự phân bố
tần suất alen trong mỗi quần thể [22, 29]. Do vậy, trong giám định ADN các
nhà khoa học hình sự ngoài lựa chọn, nghiên cứu những locus (vị trí trên
nhiễm sắc thể) có tính đa alen (đa hình) cao thì cần khảo sát tần suất phân bố
các alen trong quần thể của từng locus để sử dụng trong tính toán và kết luận
giám định. Quần thể được nghiên cứu khảo sát phải đạt được các yêu cầu
trong thống kê, di truyền như: các mẫu dùng trong nghiên cứu phải đảm bảo
tính ngẫu nhiên, không có quan hệ huyết thống trong 3 đời [17, 28].
Để có được tần suất của mỗi alen, trước hết phải tìm được số lần xuất
hiện của mỗi alen trong quần thể nghiên cứu sau đó tính tần suất lý thuyết của
alen đó theo định luật di truyền quần thể [29]. Khi có được tần suất thực tế và
tần suất lý thuyết của mỗi alen, chúng ta tiến hành kiểm định xem tần suất
14
alen có được chấp nhận với mức xác suất đã chọn.
Giám định gen (ADN) đòi hỏi cơ sở khoa học vững chắc để tính toán
xác suất một người ngẫu nhiên trong quần thể là người có cấu trúc di truyền
đặc trưng trùng lặp với ADN trong các mẫu vật (thu thập được trong quá trình
điều tra, phá án) [7, 21, 23]. Nếu không có tần suất alen thì không tính toán
được tần suất xuất hiện của một kiểu gen nào đó trong một quần thể nhất định
[7, 29].
Trong trường hợp cần xác định huyết thống, để kết luận một người có
phải là cha đẻ hoặc mẹ đẻ của người con không, phải dựa vào khả năng cho
nhận của các alen và phải căn cứ vào tần suất alen để tính ra chỉ số quan hệ
huyết thống (Paternity Index - PI). Từ đó tính độ tin cậy đạt được. Mặt khác,
đó cũng là cơ sở khoa học để so sánh độ tin cậy trong trường hợp phân tích
được nhiều locus gen hoặc ít locus gen hơn [7, 21, 24].
Như vậy Chương I đã trình bày tình hình nghiên cứu, giám định ADN
trong, ngoài nước và tại Viện Khoa học hình sự. Cơ sở khoa học, khái niệm
giám định ADN và các phương pháp giám định ADN. Giám định ADN hiện
nay sử dụng các locus STR là chủ yếu, có độ tin cậy rất cao, mỗi alen chỉ
xuất hiện trong quần thể với tần số rất thấp [14, 24]. Việc xác định tần suất
các alen trong giám định ADN là cần thiết, là cơ sở khoa học để cơ quan
giám định sử dụng để phân tích và đưa ra kết luận trong giám định gen. Hiện
nay đã có một số công trình nghiên cứu tần suất các alen hệ Identifiler của
quần thể một số dân tộc tại Việt Nam song chưa có công trình nào nghiên
cứu tần suất các alen hệ Identifiler của quần thể người H’Mông nên việc lựa
chọn đề tài nghiên cứu tần suất các alen trong các locus gen hệ Identifiler
với quần thể người dân tộc H’Mông là cần thiết và có ý nghĩa cao cả về khoa
15
học và thực tiễn.
CHƢƠNG 2. NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU
1. Nội dung nghiên cứu:
- Thu 120 mẫu tế bào của 120 cá thể người H’Mông.
- Phân tích mẫu bao gồm các bước tách chiết ADN, định lượng ADN,
nhân bội ADN, điện di trên máy điện di mao dẫn, kết quả lập được bảng kiểu
gen của các mẫu nghiên cứu.
- Xử lý số liệu thống kê, kiểm định tần suất kiểu gen giữa kết quả thực
tế và tính toán lý thuyết với độ tin cậy p = 0,05. Tính toán và đưa ra bảng tần
suất các alen của các locus gen hệ Identifiler cho 120 cá thể người H’Mông.
2. Phƣơng pháp nghiên cứu:
2.1. Thu mẫu:
Mục tiêu nhằm thu đủ số lượng mẫu 120 của 120 cá thể người H’Mông
đã được phê duyệt. Các mẫu không có quan hệ họ hàng huyết thống (trong
vòng 3 đời).
Cách thu: Thu mẫu tế bào trực tiếp của những người cho mẫu bằng tăm
bông vô trùng, lấy ngẫu nhiên (120 mẫu tế bào của 120 cá thể người H’Mông
được thu bằng cách này). (Xem phụ lục bảng 1. Thu thập mẫu)
- Mẫu thu đảm bảo chất lượng, không bị lẫn, nhiễm, phơi khô tự nhiên,
đóng gói riêng rẽ, ghi ký hiệu cho mẫu từ HM1 đến HM120.
Sau khi thu mẫu chúng tôi tiến hành xử lí và phân tích theo sơ đồ
16
nghiên cứu tổng quát dưới đây:
Tách chiết ADN bằng phương pháp vô cơ
Định lượng ADN bằng phương pháp
Realtime PCR
Nhân bội ADN (PCR) bằng Kit
Identifiler
Điện di ADN trên máy AB 3130
Phân tích kết quả trên phần mềm
Genmapper ID 3.2
2.2. Hóa chất, thiết bị và dụng cụ:
2.2.1. Hóa chất và thiết bị cho tách chiết ADN
STT Tên hoá chất, thiết bị
Block nhiệt khô cho ống 1,5ml (1000C) kèm nhiệt kế
Tủ an toàn sinh học
17
1 Dung dịch Chelex 100, tỷ lệ 5% 2 3 Máy li tâm ống 1,5ml 14.000v/p 4 5 Ống tách chiết 1,5ml 6 Các đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng
2.2.2. Hóa chất và thiết bị cho định lƣợng ADN
STT Tên hoá chất thiết bị
1 Kit Human DNA quantification (Quantifiler- hãng Applied
biosystems)
2 Optical plate 96 well 3 Optical seal 4 Máy Realtime PCR 7500 (Applied biosystems) 5 Các loại đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng
2.2.3. Hóa chất và thiết bị cho nhân bội và điện di
STT Tên hoá chất thiết bị
1 Máy giải trình tự Applied biosystems
2 Máy PCR 9700 96 well Applied biosystems
3 Kit Identifiler của hãng Applied biosystems
POP 4 (ABI) Liz 500 Gene scan
Buffer 10X for AB - 3130 Capilary 3130 (36cm x 50µl)
4 5 6 HIDI formamide 7 8 9 Optical plate 96 well 10 Septa 11 Ống PCR (0,25 ml) và điện di (0,5 ml) 12 Các loại đầu típ 10 µl, 200 µl và 1000 µl cùng pipet tương ứng.
2.3. Phân tích mẫu
2.3.1. Tách chiết mẫu bằng chelex
Chelex là một loại nhựa tạo phức có ái lực cao đối với các ion kim loại
đa hoá trị. Nó là hợp chất trùng ngưng styrene divinylbenzene có chứa các
18
cặp ion imminodiaxetat hoạt động là nhóm tạo phức. Sự có mặt của chelex ở nhiệt độ 1000C sẽ ngăn cản sự biến tính của ADN vì nó gắn được với các ion
kim loại đa hoá trị như magnesium (Mg++). Nhờ việc loại bỏ Mg++ ra khỏi
phản ứng thì các enzym phân huỷ ADN (nuclease) sẽ bị bất hoạt và do vậy
mà các phân tử ADN được bảo vệ [17].
Tách chiết ADN bằng chelex là phương pháp vô cơ, có ưu điểm thao
tác đơn giản, ít bị nhiễm và tốn ít thời gian.
120 mẫu tế bào của 120 cá thể người H’Mông được tách chiết bằng
Chelex theo quy trình dưới đây:
* Tách chiết tế bào niêm mạc từ que tăm bông thu tế bào niêm mạc
miệng
1. Sử dụng kéo sạch cho mỗi mẫu khác nhau, cắt một miếng bông (với
diện tích khoảng 5 mm x 5 mm) trên que tăm bông. Để vào trong ống tách
chiết 1,5 ml vô trùng.
2. Thêm 500 ul Chelex 5%. Lắc trộn trong 10 giây. 3. Ủ trong block nhiệt 56oC trong 30 phút.
4. Lắc trộn ống trong 10 giây. 5. Ủ trong block nhiệt 100 oC trong 8 phút.
6. Lắc trộn ống trong 10 giây.
7. Li tâm ống ở tốc độ cao nhất trong 3 phút.
8. Chuyển dịch nổi sang ống tách chiết khác để sử dụng cho quá trình
định lượng.
9. Bảo quản mẫu ở - 20 oC.
2.3.2. Định lƣợng ADN bằng Realtime PCR
Định lượng ADN trên máy Realtime PCR là công nghệ sử dụng kỹ
thuật PCR có gắn mồi huỳnh quang, mục đích để phát hiện chính xác số
19
lượng ADN người có trong mẫu cần phân tích.
120 mẫu ADN đã được tách chiết của 120 cá thể người H’Mông được
tiến hành định lượng để xác định chính xác nồng độ ADN trước khi PCR
bằng kit Identifiler theo phản ứng và chu trình nhiệt dưới đây
Bảng 2.1. Thành phần phản ứng Realtime PCR
Thành phần Thể tích
PCR Reaction Mix 12,5 µl
Human Primer Mix 10,5 µl
2 µl / phản ứng
Mẫu (ADN khuôn hoặc ADN chuẩn)
Tổng 25 µl
Bảng 2.2. Chu trình nhiệt của phản ứng PCR trên máy realtime 7500
Nhiệt độ Thời gian Số chu kỳ
50°C 2 phút 1 chu kỳ
95°C 10 phút 1 chu kỳ
95°C 15 giây 40 chu kỳ 60°C 1 phút
Quá trình định lượng được thực hiện trên máy Realtime PCR 7500 của
hãng AB.
2.3.3. Nhân bội ADN (PCR)
Nhân bội ADN (PCR) nghĩa là làm tăng lượng ADN lên rất nhiều từ
một lượng rất ít ban đầu [14].
Kỹ thuật PCR do Karry Mullis và các cộng sự phát minh vào năm
1985 đã tạo ra một cuộc cách mạng trong sinh học phân tử. Kỹ thuật này là
một phương pháp hoàn toàn mới trong việc nghiên cứu và phân tích các gen.
20
Các phòng thí nghiệm phân tích ADN và ngành khoa học hình sự đã có những
thành tựu vượt bậc nhờ vào kỹ thuật này [19]. ADN thu được từ hiện trường
thường ít và chất lượng không tốt do vậy nhiều mẫu sẽ không thể phân tích
được. Kỹ thuật PCR sẽ giúp khắc phục hạn chế này vì nó có thể tạo ra hàng
triệu phiên bản của một trình tự ADN khuôn ban đầu trong vòng vài giờ nhờ hai đoạn mồi oligonucleotit tương hợp với hai đầu 3' ở cả hai sợi của đoạn
ADN đích (target sequence) với sự tham gia của ADN - polymerase,
deoxynucleotide triphosphate (dNTPs), đệm PCR [15]… Phản ứng PCR là
một chuỗi nhiều chu kỳ nối tiếp nhau, mỗi chu kỳ gồm 3 bước:
Bước 1: Giai đoạn biến tính: Phân tử ADN được biến tính ở nhiệt độ thường là ở 940C - 950C trong vòng 30 giây đến 1 phút.
Bước 2: Giai đoạn lai: Nhiệt độ được hạ thấp (thấp hơn Tm của các
mồi) cho phép các mồi bắt cặp với khuôn, nhiệt độ này dao động trong khoảng 40 - 700C tuỳ thuộc Tm của các mồi sử dụng kéo dài từ 30 giây đến 1
phút.
Bước 3: Giai đoạn tổng hợp (extension): Nhiệt độ được tăng lên có thể đến 720C giúp cho ADN - polymerase hoạt động tổng hợp tốt nhất, thời gian
tùy thuộc vào độ dài của trình tự ADN cần khuếch đại. Thường kéo dài từ 30
giây đến vài phút.
Một chu kỳ bao gồm 3 bước trên sẽ được lặp đi lặp lại nhiều lần, mỗi
lần sẽ làm tăng gấp đôi lượng mẫu của lần trước. Đây là sự khuếch đại theo cấp số nhân, theo tính toán sau 30 chu kỳ sự khuếch đại sẽ là 106 so với lượng
bản mẫu của ban đầu [15].
120 mẫu ADN đã được định lượng chuyển sang tiến hành PCR Phản
ứng PCR sử dụng bộ kít AmpFlSTR® Identifiler® PCR Amplification Kit
21
của hãng Applied Biosystems - Mỹ
Bảng 2.3. Thành phần của một phản ứng PCR
Thành phần Thể tích
AmpFlSTR® PCR Reaction Mix 5,25 µl
AmpliTaq Gold ADN Polymerase 0,25 µl
Identifiler® Primer 2,75 µl
AmpFlSTR® Set
Mẫu (ADN khuôn) 1 ng/ phản ứng
Nước Tùy chỉnh
Tổng 12,5 µl
Phản ứng nhân gen (PCR) được tiến hành trên máy nhân gen PCR
9700 của hãng AB.
Bảng 2.4. Chu trình nhiệt trên máy PCR 9700
Nhiệt độ Thời gian Số chu kỳ
95°C 1 chu kỳ 11 phút
94°C 1 phút
59°C 25 chu kỳ 1 phút
72°C 1 phút
60°C 1 chu kỳ 60 phút
4°C 1 chu kỳ ∞
- Sản phẩm PCR được bảo quản ở - 200C.
2.3.4. Điện di trên máy điện di mao dẫn (Capillary Electrophoresis- CE)
* Nguyên lý
Vào cuối những năm 1980, điện di mao dẫn bắt đầu được sử dụng và
vào giữa những năm 1990 người ta bắt đầu sản xuất các máy điện di mao dẫn.
22
Kể từ đó kỹ thuật điện di mao dẫn phát triển nhanh chóng và ngày càng phổ
biến. Hiện nay đã có nhiều loại máy điện di mao dẫn được sử dụng tại các
phòng thí nghiệm sinh học phân tử cũng như các phòng giám định gen hình
sự như: ABI Prism 310 Genetic Analyzer với một mao quản, ABI Prism
3100Avant Genetic Analyzer với 4 mao quản, ABI Prism 3700 Genetic
Analyzer với 4 mao quản, ABI Prism 3130 Genetic Analyzer với 4 mao quản,
ABI Prism 3130XL Genetic Analyzer với 16 mao quản …[6]
Nguyên lý của điện di mao dẫn là dùng tia lase kích hoạt các đoạn
ADN khuôn đã được gắn huỳnh quang để thu được các phổ quang học. Điểm
khác của điện di mao dẫn là sử dụng mao quản có chứa gel, tia lase chỉ chiếu
vào một điểm cố định trên mao quản cho từng mẫu một [6, 16]. Các cặp mồi
được đánh dấu bằng các chất nhuộm huỳnh quang khác nhau vì vậy sản phẩm
sau PCR có các locus gen được gắn các chất nhuộm huỳnh quang tương ứng.
Kỹ thuật hiện màu huỳnh quang cho xác định được màu xanh da trời, xanh lá
cây, vàng, đỏ, cam tương ứng với các chất đánh dấu: 6 - FAM, VIC, NED,
PET và LIZ, dựa trên sự hấp thụ và phát xạ ánh sáng của các chất nhuộm màu
huỳnh quang này. Các hạt huỳnh quang hấp thụ năng lượng từ nguồn sáng
laze sau đó phát xạ ánh sáng ở mức năng lượng thấp hơn (bước sóng cao
hơn). Một màng lọc sáng được sử dụng để lọc ánh sáng ở những bước sóng
23
xác định hoặc một khoảng bước sóng nào đó [6].
AmpFlSTR® Identifiler™
D8S1179
D7S820
D21S11
CSF1PO
6FAM (blue)
TH01
D3S1358
D13S317 D16S539 D2S1338
VIC (green)
TPOX
D18S51
D19S433
VWA
NED (yellow)
AMEL
D5S818
FGA
PET (red)
GS500 LIZ size standard
LIZ (orange)
Hình 2. Các locus gen hệ Identifiler
* Tiến hành
Chuẩn bị mẫu trước khi điện di: Thành phần và tỷ lệ thể tích từng hỗn
hợp phản ứng như sau:
Bảng 2.5. Thành phần của hỗn hợp điện di
Thành phần Thể tích
Hi-Di™ Formamide 8,5 µl
GeneScan™ 500 LIZ® 0,3 µl
Sản phẩm PCR hoặc thang alen 1,5 µl
24
Tổng 10,3 µl
120 sản phẩm PCR được tiến hành xác định kiểu gen bằng phương
pháp điện di mao dẫn trên máy giải trình tự gen AB 3130 của hãng Applied
Biosystem. Kết quả thu được được xử lý bằng phần mềm Genemapper ID 3.2
để xác định kiểu gen của mỗi mẫu, từ đó cho ta bảng số liệu tập hợp kiểu gen
của 120 cá thể người H’Mông.
2.4. Xử lý thống kê số liệu và tính tần suất các locus gen
2.4.1. Cơ sở lý thuyết
Để số liệu nghiên cứu về các locus gen sử dụng được cho những ứng dụng cụ thể, điều cần thiết đầu tiên là cần đánh giá xem mẫu nghiên cứu với locus gen được phân tích có đảm bảo rằng cấu trúc di truyền của mẫu (tần số tương đối của các alen và tần số các kiểu gen) là ổn định hay không qua các thế hệ, nghĩa là mẫu có tuân theo định luật Hardy - Weinberg hay không? [8, 9, 29] Do đó cần kiểm tra sự phù hợp giữa mẫu với quần thể cân bằng lý thuyết thông qua đánh giá chênh lệch giữa tần số quan sát thực tế với phân bố lý thuyết của các kiểu gen của mỗi locus gen được nghiên cứu có sai khác nhau hay không [1, 29].
2.4.2. Phƣơng pháp xử lý thống kê
Kiểm định sự phù hợp phân bố tần số kiểu gen giữa mẫu và quần thể lý thuyết dựa vào tiêu chuẩn thống kê là hàm xác suất Khi bình phương 2 . [2, 29]
Đánh giá sự phù hợp giữa số liệu thực nghiệm và giả thuyết lý thuyết ta
tính tổng 2 như sau :
25
Trong đó : * k là số lớp của dãy số liệu thực nghiệm. * mi là tần số quan sát. * npi là tần số lý thuyết.
2.4.3. Các bƣớc tính toán thống kê và kiểm định tiến hành trên phần
mềm Excel:
- 120 kiểu gen của 120 cá thể người H’Mông được thống kê tần số kiểu
gen, tần số alen.
- Tính tần suất các alen của mỗi locus theo số liệu thu được trong
nghiên cứu.
- Xây dựng tổ hợp kiểu gen lý thuyết có thể có trong quần thể tự nhiên
theo số liệu alen thu được ở bước 1.
- Xác định tần số kiểu gen thực tế của mẫu nghiên cứu (số lượng quan
sát của mẫu/ tổng số quan sát).
- Xác định tần suất kiểu gen lý thuyết có thể có theo tần số các alen thu
được ở bước 1.
- Tính khi bình phương thành phần theo mỗi phương trình so sánh giữa
tần số lý thuyết và tần số thực tế.
26
- Tính tổng 2 của các phương trình so sánh trên. - Tính khi bình phương tiêu chuẩn (α) theo mức xác suất p=0.05. - So sánh giá trị khi bình phương tính được với khi bình phương tiêu chuẩn: Nếu khi bình phương tính được nhỏ hơn 2 tiêu chuẩn thì phân bố thực tế phù hợp với phân phối lý thuyết, nghĩa là mẫu phù hợp với quần thể lý thuyết [1, 2, 9, 10, 11]. Chương II đã tiến hành thu mẫu tế bào niêm mạc miệng của 120 cá thể người H’mông có đánh số ký hiệu từ HM1 đến HM120 sau đó tiến hành: tách chiết 120 mẫu tế bào này, định lượng, nhân bội ADN và điện di trên máy điện di mao dẫn -> thu được kiểu gen, từ đó xử lý số liệu thống kê, kiểm định tần suất kiểu gen giữa kết quả thực tế và tính toán lý thuyết với độ tin cậy p = 0.05; tính toán và đưa ra bảng tần suất các Alen của các locus gen theo hệ Identifiler của 120 cá thể người H’mông.
CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN
1. Kết quả
1.1. Thu mẫu
Tổng số mẫu cá thể đã nghiên cứu: gồm 120 mẫu tế bào niêm mạc miệng thu của 120 cá thể người H’Mông. Các mẫu thu được đảm bảo phân bố ngẫu nhiên, không có quan hệ huyết thống trong vòng 3 đời. (Xem bảng 1 - phụ lục).
1.2. Phân tích mẫu thu đƣợc kiểu gen theo yêu cầu và lập đƣợc bảng
kiểu gen của 120 cá thể. (Xem bảng 3 - phụ lục)
1.3. Xử lý số liệu thống kê (Xem bảng 3.1 đến 3.15); tính đƣợc bảng tần
suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30); và so sánh với
một số quần thể ngƣời Việt và ngƣời nƣớc ngoài (Xem bảng 3.31 đến
3.45).
1.3.1. Xử lý số liệu thống kê
Bảng kết quả xử lý số liệu theo tiêu chuẩn Khi bình phƣơng (2), số lƣợng kiểu gen và tần suất phân bố các alen hệ Identifiler: thể hiện ở các bảng sau: bảng 3.1 đến 3.15.
Bảng 3.1 Locus D8S1179
Locus D8
Số mẫu
120 người
Số alen
8
số kiểu gen
23
Số tổ hợp kiểu gen lý thuyết
36
2
1.653506
df = 11
p = 0.05
19.68
D8a
D8b
2
Tần suất lý thuyết
10 10 10 10 10 10
10 11 12 13 14 15
Tần số kiểu gen 7 19 4 4 5 17
0.073351 0.11059 0.027083 0.069965 0.038368 0.121875
Tần suất thực tế 0.058333 0.158333 0.033333 0.033333 0.041667 0.141667
0.003075 0.020611 0.001442 0.01918 0.000284 0.003214
27
10 10 11 11 11 11 11 11 11 12 12 12 12 12 12 13 13 13 13 13 14 14 14 14 15 15 15 16 16 17
16 17 11 12 13 14 15 16 17 12 13 14 15 16 17 13 14 15 16 17 14 15 16 17 15 16 17 16 17 17
2 0 5 0 6 0 9 5 0 0 3 0 2 1 0 4 2 8 1 0 1 7 0 0 6 1 0 0 0 1
0.016667 0 0.041667 0 0.05 0 0.075 0.041667 0.041667 0 0.025 0 0.016667 0.008333 0 0.033333 0.016667 0.066667 0.008333 0 0.008333 0.058333 0 0.0000 0.05 0.008333 0 0 0 0.008333
0.02257 0.004514 0.041684 0.020417 0.052743 0.028924 0.091875 0.017014 0.003403 0.0025 0.012917 0.007083 0.0225 0.004167 0.000833 0.016684 0.018299 0.058125 0.010764 0.002153 0.005017 0.031875 0.005903 0.001181 0.050625 0.01875 0.00375 0.001736 0.000694 0.000069
0.001544 0.004514 6.93E-09 0.020417 0.000143 0.028924 0.003099 0.035722 0.430248 0.0025 0.011303 0.007083 0.001512 0.004165 0.000833 0.016614 0.000146 0.001255 0.000549 0.002153 0.002192 0.021962 0.005903 0.001181 7.72E-06 0.005787 0.00375 0.001736 0.000694 0.989764
N
1
1
1.653506
120
120
0.05
19.68
Số kiểu gen tt
25
α
Bảng 3.2 Locus D21S11
Locus D21
Số mẫu
120 người
Số alen
13
số kiểu gen
32
Số tổ hợp kiểu gen lý thuyết
91
2
1.61E-06
df = 10
p = 0.05
18.31
28
D21a D21b
2
27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 27.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 28.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 29.0 30.0 30.0 30.0 30.0 30.0 30.0 30.0 30.0
Tần số kiểu gen 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 12 4 8 7 1 4 0 6 0 0 5 1 8 10 2 2 0 5
27.0 28.0 29.0 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 28.0 29.0 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 29.0 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 30.0 30.2 31.0 31.2 32.0 32.2 33.0 33.2
Tần suất thực tế 0 0.008333 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.05 0.1 0.033333 0.066667 0.058333 0.008333 0.033333 0 0.05 0 0 0.041667 0.008333 0.066667 0.083333 0.016667 0.016667 0 0.041667
Tần suất lý thuyết 1.74E-05 0.000208 0.001667 0.00191 0.000104 0.000833 0.001493 0.000243 0.000556 3.47E-05 0.001111 6.94E-05 6.94E-05 0.000625 0.08 0.105035 0.000313 0.02 0.064201 0.001701 0.008889 3.47E-05 0.035556 0.000139 0.000139 0.04 0.091667 0.005 0.04 0.071667 0.011667 0.026667 0.001667 0.053333 0.003333 0.003333 0.052517 0.005729 0.045833 0.082118 0.013368 0.030556 0.00191 0.061111
1.74E-05 3.17E-01 1.67E-03 1.91E-03 1.04E-04 8.33E-04 1.49E-03 2.43E-04 5.56E-04 3.47E-05 1.11E-03 6.94E-05 6.94E-05 6.25E-04 8.00E-02 1.05E-01 3.13E-04 2.00E-02 6.42E-02 1.70E-03 8.89E-03 3.47E-05 3.56E-02 1.39E-04 1.39E-04 2.50E-03 7.58E-04 1.61E-01 1.78E-02 2.48E-03 9.53E-04 1.67E-03 1.67E-03 2.08E-04 3.33E-03 3.33E-03 2.24E-03 1.18E-03 9.47E-03 1.80E-05 8.14E-04 6.31E-03 1.91E-03 6.19E-03
29
0 0 0 0 0 0 1 0 0 0 0 0 3 0 1 0 4 0 1 2 3 4 0 8 1 1 0 0 0 0 0 0 1 0 2 1 0 0 3 0 0 2 0 0 0
30.0 30.0 30.2 30.2 30.2 30.2 30.2 30.2 30.2 30.2 30.2 31.0 31.0 31.0 31.0 31.0 31.0 31.0 31.0 31.2 31.2 31.2 31.2 31.2 31.2 31.2 32.0 32.0 32.0 32.0 32.0 32.0 32.2 32.2 32.2 32.2 32.2 33.0 33.0 33.0 33.0 33.2 33.2 33.2 34.2
34.2 35.2 30.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 31.0 31.2 32.0 32.2 33.0 33.2 34.2 35.2 31.2 32.0 32.2 33.0 33.2 34.2 35.2 32.0 32.2 33.0 33.2 34.2 35.2 32.2 33.0 33.2 34.2 35.2 33.0 33.2 34.2 35.2 33.2 34.2 35.2 34.2
0.003819 0.003819 0.000156 0.0025 0.004479 0.000729 0.001667 0.000104 0.003333 0.000208 0.000208 0.01 0.035833 0.005833 0.013333 0.000833 0.026667 0.001667 0.001667 0.032101 0.010451 0.023889 0.001493 0.047778 0.002986 0.002986 0.000851 0.003889 0.000243 0.007778 0.000486 0.000486 0.004444 0.000556 0.017778 0.001111 0.001111 1.73611E-05 0.001111111 6.94444E-05 6.94444E-05 0.017778 0.002222 0.002222 6.94444E-05
3.82E-03 3.82E-03 1.56E-04 2.50E-03 4.48E-03 7.29E-04 2.67E-02 1.04E-04 3.33E-03 2.08E-04 2.08E-04 1.00E-02 3.28E-03 5.83E-03 1.88E-03 8.33E-04 1.67E-03 1.67E-03 2.67E-02 7.42E-03 2.03E-02 3.73E-03 1.49E-03 7.47E-03 9.57E-03 9.57E-03 8.51E-04 3.89E-03 2.43E-04 7.78E-03 4.86E-04 4.86E-04 3.40E-03 5.56E-04 6.94E-05 4.69E-02 1.11E-03 1.74E-05 5.14E-01 6.94E-05 6.94E-05 6.94E-05 2.22E-03 2.22E-03 6.94E-05
0 0 0 0 0 0 0.008333 0 0 0 0 0 0.025 0 0.008333 0 0.033333 0 0.008333 0.016667 0.025 0.033333 0 0.066667 0.008333 0.008333 0 0 0 0 0 0 0.008333 0 0.016667 0.008333 0 0 0.025 0 0 0.016667 0 0 0
30
0 0
34.2 35.2
35.2 35.2
0 0
0.000138889 6.94444E-05
1.39E-04 6.94E-05
N
120
120
1
1
1.61E-06
Số kiểu gen tt
31
0.05
18.31
α
Bảng 3.3 Locus D7S820
Locus D7
Số mẫu
120 người
Số alen
9
số kiểu gen
20
Số tổ hợp kiểu gen lý thuyết
45
2
0.260867
df = 7
p = 0.05
14.07
2
Tần suất lý thuyết
D7a 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9.1 9.1 9.1 9.1 9.1 9.1 9.1
D7b 8 9 9.1 10 11 12 13 14 15 9 9.1 10 11 12 13 14 15 9.1 10 11 12 13 14 15
Tần số kiểu gen 8 2 0 3 21 8 0 1 0 0 0 0 2 1 0 0 0 0 0 0 1 0 0 0
Tần suất thực tế 0.066667 0.016667 0 0.025 0.175 0.066667 0 0.008333 0 0 0 0 0.016667 0.008333 0 0 0 0 0 0 0.008333 0 0 0
0.041684 0.008507 0.001701 0.039132 0.192257 0.064653 0.008507 0.008507 0.001701 0.000434 0.000174 0.003993 0.019618 0.006597 0.000868 0.000868 0.000174 1.74E-05 0.000799 0.003924 0.001319 0.000174 0.000174 3.47E-05
0.014973 0.007827 0.001701 0.005104 0.001549 6.27E-05 0.008507 3.56E-06 0.001701 0.000434 0.000174 0.003993 0.000444 0.000457 0.000868 0.000868 0.000174 1.74E-05 0.000799 0.003924 0.037298 0.000174 0.000174 3.47E-05
31
10 10 10 10 10 10 11 11 11 11 11 12 12 12 12 13 13 13 14 14 15
10 11 12 13 14 15 11 12 13 14 15 12 13 14 15 13 14 15 14 15 15
0.009184 0.090243 0.030347 0.003993 0.003993 0.000799 0.221684 0.149097 0.019618 0.019618 0.003923 0.025069 0.001736 0.001736 0.000347 0.000434 0.000868 0.000174 0.000434 0.000173 1.74E-05
0.008333 0.108333 0.041667 0 0.008333 0 0.216667 0.141667 0.025 0.025 0.008333 0.008333 0.016667 0 0 0 0 0 0 0 0
1 13 5 0 1 0 26 17 3 3 1 2 2 0 0 0 0 0 0 0 0
7.89E-05 0.003626 0.004223 0.003993 0.004717 0.000799 0.000114 0.00037 0.001476 0.001476 0.004957 0.011173 0.128419 0.001736 0.000347 0.000434 0.000868 0.000174 0.000434 0.000173 1.74E-05
N
1
1
120
0.260867
Tần số kiểu gen
0.05
19
14.07
α Bảng 3.4 Locus CSF1PO
Locus CSF
Số mẫu
120 người
Số alen
6
số kiểu gen
11
Số tổ hợp kiểu gen lý thuyết
21
2
1.08E-01
df = 7
p = 0.05
14.07
2
Tần suất thực tế
Tần suất lý thuyết
CSFa 7 7 7 7 7
CSFb 7 9 10 11 12
Tần số kiểu gen 0 0 0 0 2
6.94E-05 6.94E-05 0.004236 0.001736 0.009236
0 0 0 0 0.016667
6.94E-05 6.94E-05 4.24E-03 1.74E-03 5.98E-03
32
7 9 9 9 9 9 10 10 10 10 11 11 11 12 12 13
13 9 10 11 12 13 10 11 12 13 11 12 13 12 13 13
0 0 0 1 0 0 6 7 37 5 1 11 3 37 10 0
0 0 0 0.008333 0 0 0.05 0.058333 0.308333 0.041667 0.008333 0.091667 0.025 0.308333 0.083333 0
0.00125 1.74E-05 0.002118 0.000868 0.004618 0.000625 0.064601 0.052951 0.281701 0.038125 0.010851 0.115451 0.015625 0.307101 0.083125 0.005625
1.25E-03 1.74E-05 2.12E-03 6.42E-02 4.62E-03 6.25E-04 3.30E-03 5.47E-04 2.52E-03 3.29E-04 5.84E-04 4.90E-03 5.63E-03 4.94E-06 5.20E-07 5.63E-03
N
120
1
1
1.08E-01
số kiểu gen tt
11
0.05
14.07
α
Bảng 3.5 Locus D3S1358
Locus D3
Số mẫu
120 người
Số alen
5
số kiểu gen
11
Số tổ hợp kiểu gen lý thuyết
15
2
0.073244
df = 7
p = 0.05
14.07
2
D3a 14 14 14 14 14 15 15 15 15 16
D3b 14 15 16 17 18 15 16 17 18 16
0.000278 0.010278 0.002778 0.004697 0.001528 0.001449 0.018168 0.009109 0.006356 0.006945
Tần số kiểu gen 0 0 2 2 0 10 32 17 5 10
Tần suất thực tế 0 0 0.016667 0.016667 0 0.083333 0.266667 0.141667 0.041667 0.083333
Tần suất lý thuyết 0.000278 0.010278 0.011111 0.009861 0.001528 0.095069 0.205556 0.182431 0.028264 0.111111
33
16 16 17 17 18
17 18 17 18 18
24 2 12 4 0
0.2 0.016667 0.1 0.033333 0
0.197222 0.030556 0.087517 0.027118 0.002101
3.91E-05 0.006313 0.001781 0.001424 0.002101
N
120
1
1
0.073244
số kiểu gen tt
11
0,05
14.07
α
Bảng 3.6 Locus THO1
Locus TH01
Số mẫu
120 người
Số alen
7
số kiểu gen
14
Số tổ hợp kiểu gen lý thuyết
28
2
0.373708
df = 8
p = 0.05
15.51
2
Tần suất lý thuyết
THO1a 6 6 6 6 6 6 6 6.3 6.3 6.3 6.3 6.3 6.3 7 7 7 7 7 8 8 8 8
THO1b 6 6.3 7 8 9 9.3 10 6.3 7 8 9 9.3 10 7 8 9 9.3 10 8 9 9.3 10
0.048767 0.00184 0.088333 0.007361 0.213472 0.022083 1.74E-05 0.001667 0.000139 0.004028 0.000417 0.000208 0.001667 0.04 0.006667 0.193333 0.02 0.01 0.000278 0.016111 0.001667 0.000833
Tần số kiểu gen 5 0 8 2 31 2 0 0 0 0 1 0 0 5 0 24 5 1 0 0 0 0
Tần suất thực tế 0.041667 0 0.066667 0.016667 0.258333 0.016667 0 0 0 0 0.008333 0 0 0.041667 0 0.2 0.041667 0.008333 0 0 0 0
0.001034 0.00184 0.005314 0.011765 0.009428 0.001328 1.74E-05 0.001667 0.000139 0.004028 0.150271 0.000208 0.001667 6.95E-05 0.006667 0.00023 0.023473 0.000278 0.000278 0.016111 0.001667 0.000833
34
9 9 9 9.3 9.3 10
9 9.3 10 9.3 10 10
0.233611 0.048333 0.024167 0.0025 0.0025 0.000625
3.31E-07 5.75E-05 0.024167 0.0025 0.01361 0.095061
28 6 0 0 1 1
0.233333 0.05 0 0 0.008333 0.008333
N
28
120
0.373708
120
1.0
Số kiểu gen tt
0.05
15.51
15
α
Bảng 3.7 Locus D13S317
Locus D13
Số mẫu
120 người
Số alen
7
số kiểu gen
14
Số tổ hợp kiểu gen lý thuyết
28
2
0.411646
df = 5
p = 0.05
11.07
2
0.0008
D13b 8 9 10 11 12 13 14 9 10 11 12 13 14 10 11 12 13 14 11 12 13
Tần số kiểu gen 40 21 13 19 7 2 0 0 0 6 0 0 0 1 3 2 0 1 2 2 0
Tần suất thực tế 0.333333 0.175 0.108333 0.158333 0.058333 0.016667 0 0 0 0.05 0 0 0 0.008333 0.025 0.016667 0 0.008333 0.016667 0.016667 0
D13a 8 8 8 8 8 8 8 9 9 9 9 9 9 10 10 10 10 10 11 11 11
0.013172 0.003077 0.001647 0.000309 0.000473 0.004931 0.012656 0.024375 0.01914 0.010313 0.00375 0.000938 0.000987 5.33E-05 0.004569 0.003611 0.061135 0.000292 0.002822 0.004028
Tần suất lý thuyết 0.350069 0.133125 0.128194 0.142986 0.054236 0.019722 0.004931 0.012656 0.024375 0.027188 0.010313 0.00375 0.000938 0.011736 0.026181 0.009931 0.003611 0.000903 0.014601 0.011076 0.004028
35
11 12 12 12 13 13 14
14 12 13 14 13 14 14
0 0 0 0 1 0 0
0 0 0 0 0.008333 0 0
0.001007 0.002101 0.001528 0.000382 0.000278 0.000139 1.74E-05
0.001007 0.002101 0.001528 0.000382 0.233392 0.000139 1.74E-05
N
120
1
1
0.411646
Số kiểu gen tt
14
0.05
11.07
α
Bảng 3.8 Locus D16S539
Locus D16
Số mẫu
120 người
Số alen
8
số kiểu gen
18
Số tổ hợp kiểu gen lý thuyết
36
2.42E-01
2
Df = 8
p = 0.05
15.51
2
Tần suất thực tế
D16b 8 9 10 11 12 13 14 15 9 10 11 12 13 14 15 10 11 12 13 14
Tần số kiểu gen 0 0 1 1 0 0 0 0 25 12 16 19 1 0 1 2 8 8 1 0
D16a 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10
0 0 0.008333 0.008333 0 0 0 0 0.208333 0.1 0.133333 0.158333 0.008333 0 0.008333 0.016667 0.066667 0.066667 0.008333 0
Tần suất lý thuyết 6.94E-05 0.006875 0.002361 0.003611 0.002986 0.000486 0.000139 6.94E-05 0.170156 0.116875 0.17875 0.147813 0.024063 0.006875 0.003438 0.020069 0.061389 0.050764 0.008264 0.002361
6.94E-05 6.88E-03 1.51E-02 6.17E-03 2.99E-03 4.86E-04 1.39E-04 6.94E-05 8.57E-03 2.44E-03 1.15E-02 7.49E-04 1.03E-02 6.88E-03 6.97E-03 5.77E-04 4.54E-04 4.98E-03 5.76E-07 2.36E-03
36
10 11 11 11 11 11 12 12 12 12 13 13 13 14 14 15
15 11 12 13 14 15 12 13 14 15 13 14 15 14 15 15
0 7 9 3 0 0 4 1 0 0 0 1 0 0 0 0
0 0.058333 0.075 0.025 0 0 0.033333 0.008333 0 0 0 0.008333 0 0 0 0
0.001181 0.046944 0.077639 0.012639 0.003611 0.001806 0.032101 0.010451 0.002986 0.001493 0.000851 0.000486 0.000243 6.94444E-05 6.94444E-05 1.73611E-05
1.18E-03 2.76E-03 8.97E-05 1.21E-02 3.61E-03 1.81E-03 4.73E-05 4.29E-04 2.99E-03 1.49E-03 8.51E-04 1.27E-01 2.43E-04 6.94E-05 6.94E-05 1.74E-05
N
120
1
1
2.42E-01
Số kiểu gen tt
18
0.05
15.51
α
Bảng 3.9 Locus D2S1338
Locus D2
Số mẫu
120 người
Số alen
11
số kiểu gen
32
Số tổ hợp kiểu gen lý thuyết
66
0.392402
2
df = 5
p = 0.05
11.07
2
D2a 17 17 17 17 17 17 17 17 17 17 17 18 18
D2b 17 18 19 20 21 22 23 24 25 26 27 18 19
Tần số kiểu gen 0 0 0 1 0 0 2 1 0 0 0 0 0
Tần suất thực tế 0 0 0 0.008333 0 0 0.016667 0.008333 0 0 0 0 0
Tần suất lý thuyết 0.000278 0.001111 0.005139 0.003333 0.000694 0.002917 0.009444 0.007361 0.00125 0.00125 0.000278 0.001111 0.010278
0.000278 0.001111 0.005139 0.007501 0.000694 0.002917 0.005524 0.000128 0.00125 0.00125 0.000278 0.001111 0.010278
37
18 18 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 20 20 20 20 20 20 20 20 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24
20 21 22 23 24 25 26 27 19 20 21 22 23 24 25 26 27 20 21 22 23 24 25 26 27 21 22 23 24 25 26 27 22 23 24 25 26 27 23 24 25 26 27 24 25
0 0 1 3 4 0 0 0 2 3 0 4 6 15 3 2 0 2 1 1 9 4 0 1 0 0 0 0 3 0 1 0 2 4 3 0 0 1 14 18 2 2 1 2 3
0.006667 0.001389 0.005833 0.018889 0.014722 0.0025 0.0025 0.000556 0.023767 0.030833 0.006424 0.026979 0.087361 0.06809 0.011563 0.011563 0.002569 0.01 0.004167 0.0175 0.056667 0.044167 0.0075 0.0075 0.001667 0.000434 0.003646 0.011806 0.009201 0.001563 0.001563 0.000347 0.007656 0.049583 0.038646 0.006563 0.006563 0.001458 0.080278 0.125139 0.02125 0.02125 0.004722 0.048767 0.016563
0 0 0.008333 0.025 0.033333 0 0 0 0.016667 0.025 0 0.033333 0.05 0.125 0.025 0.016667 0 0.016667 0.008333 0.008333 0.075 0.033333 0 0.008333 0 0 0 0 0.025 0 0.008333 0 0.016667 0.033333 0.025 0 0 0.008333 0.116667 0.15 0.016667 0.016667 0.008333 0.016667 0.025
0.006667 0.001389 0.001071 0.001977 0.023527 0.0025 0.0025 0.000556 0.002121 0.001103 0.006424 0.001496 0.015978 0.047566 0.015615 0.002253 0.002569 0.004445 0.004165 0.004802 0.005931 0.002658 0.0075 9.25E-05 0.001667 0.000434 0.003646 0.011806 0.027128 0.001563 0.029324 0.000347 0.010606 0.005326 0.004818 0.006563 0.006563 0.001458 0.016495 0.004939 0.000988 0.000988 0.002761 0.021129 0.004298
38
24 24 25 25 25 26 26 27
26 27 25 26 27 26 27 27
0 0 0 0 0 0 0 0
N
0 0 0 0 0 0 0 0 120
0.016563 0.003681 0.001406 0.002813 0.000625 0.001406 0.000625 6.94E-05 1
0.016563 0.003681 0.001406 0.002813 0.000625 0.001406 0.000625 6.94E-05 0.392402
1
Số kiểu gen tt
32
11.07
0.05
α Bảng 3.10 Locus D19S443
Locus D19
Số mẫu
120 người
Số alen
12
số kiểu gen
27
Số tổ hợp kiểu gen lý thuyết
78
2
2.88E-01
Df = 8
p = 0.05
15.51
2
D19b 11 12 13 13.2 14 14.2 15 15.2 16 16.2 17 12 13 13.2 14 14.2 15 15.2
Tần số kiểu gen 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1
D19a 11 11 11 11 11 11 11 11 11 11 11 12 12 12 12 12 12 12
1.74E-05 1.04E-04 1.73E-02 1.15E-03 1.32E-03 5.21E-04 2.43E-04 2.57E-03 3.47E-05 1.04E-04 6.94E-05 1.56E-04 6.56E-03 3.44E-03 4.84E-03 2.93E-02 7.29E-04 5.07E-05
Tần suất lý thuyết 1.74E-05 0.000104 0.002188 0.001146 0.001319 0.000521 0.000243 0.002569 3.47E-05 0.000104 6.94E-05 0.000156 0.006563 0.003438 0.003958 0.001563 0.000729 0.007708
Tần suất thực tế 0 0 0.008333 0 0 0 0 0 0 0 0 0 0 0 0.008333 0.008333 0 0.008333
39
12 12 12 13 13 13 13 13 13 13 13 13 13.2 13.2 13.2 13.2 13.2 13.2 13.2 13.2 14 14 14 14 14 14 14 14.2 14.2 14.2 14.2 14.2 14.2 15 15 15 15 15 15.2 15.2 15.2 15.2 16 16 16
16 16.2 17 13 13.2 14 14.2 15 15.2 16 16.2 17 13.2 14 14.2 15 15.2 16 16.2 17 14 14.2 15 15.2 16 16.2 17 14.2 15 15.2 16 16.2 17 15 15.2 16 16.2 17 15.2 16 16.2 17 16 16.2 17
0 0 0 8 10 10 3 1 21 0 1 0 1 10 2 1 7 0 0 0 2 2 2 9 0 0 0 1 0 4 0 0 0 1 2 0 0 0 14 0 2 2 0 0 0
0.000104 0.000313 0.000208 0.068906 0.072188 0.083125 0.032813 0.015313 0.161875 0.002188 0.006563 0.004375 0.018906 0.043542 0.017188 0.008021 0.084792 0.001146 0.003438 0.002292 0.025069 0.019792 0.009236 0.097639 0.001319 0.003958 0.002639 0.003906 0.003646 0.038542 0.000521 0.001563 0.001042 0.000851 0.017986 0.000243 0.000729 0.000486 0.095069 0.002569 0.007708 0.005139 1.73611E-05 0.000104167 6.94444E-05
0 0 0 0.066667 0.083333 0.083333 0.025 0.008333 0.175 0 0.008333 0 0.008333 0.083333 0.016667 0.008333 0.058333 0 0 0 0.016667 0.016667 0.016667 0.075 0 0 0 0.008333 0 0.033333 0 0 0 0.008333 0.016667 0 0 0 0.116667 0 0.016667 0.016667 0 0 0
1.04E-04 3.13E-04 2.08E-04 7.28E-05 1.72E-03 5.20E-07 1.86E-03 3.18E-03 1.06E-03 2.19E-03 4.77E-04 4.38E-03 5.91E-03 3.64E-02 1.58E-05 1.21E-05 8.26E-03 1.15E-03 3.44E-03 2.29E-03 2.82E-03 4.93E-04 5.98E-03 5.25E-03 1.32E-03 3.96E-03 2.64E-03 5.02E-03 3.65E-03 7.04E-04 5.21E-04 1.56E-03 1.04E-03 6.58E-02 9.67E-05 2.43E-04 7.29E-04 4.86E-04 4.91E-03 2.57E-03 1.04E-02 2.59E-02 1.74E-05 1.04E-04 6.94E-05
40
16.2 16.2 17
16.2 17 17
0 0 0
0 0 0
0.00015625 0.000208333 6.94444E-05
1.56E-04 2.08E-04 6.94E-05
N
120
1
1
2.88E-01
Số kiểu gen tt
27
0.05
15.51
α
Bảng 3.11 Locus vWA
Locus vWA
Số mẫu
120 người
Số alen
7
số kiểu gen
17
Số tổ hợp kiểu gen lý thuyết
28
2
0.080499
Df = 9
p = 0.05
16.92
2
Tần suất lý thuyết
vWAb 14 15 16 17 18 19 20 15 16 17 18 19 20 16 17 18 19 20 17 18 19 20 18 19
Tần số kiểu gen 11 1 10 10 22 4 0 0 0 0 1 0 0 3 6 6 1 0 2 14 4 0 17 7
vWAa 14 14 14 14 14 14 14 15 15 15 15 15 15 16 16 16 16 16 17 17 17 17 18 18
Tần suất thực tế 0.091667 0.008333 0.083333 0.083333 0.183333 0.033333 0 0 0 0 0.008333 0 0 0.025 0.05 0.05 0.008333 0 0.016667 0.116667 0.033333 0 0.141667 0.058333
0.082656 0.004792 0.069479 0.091042 0.203646 0.038333 0.002396 6.94E-05 0.002014 0.002639 0.005903 0.001111 6.94E-05 0.014601 0.038264 0.08559 0.016111 0.001007 0.025069 0.112153 0.021111 0.001319 0.125434 0.047222
0.000982 0.002617 0.002762 0.000653 0.002026 0.000652 0.002396 6.94E-05 0.002014 0.002639 0.001 0.001111 6.94E-05 0.007406 0.0036 0.014799 0.003755 0.001007 0.002816 0.000182 0.007076 0.001319 0.002101 0.002614
41
18 19 19 20
20 19 20 20
0.008333 0 0 0
1 0 0 0
0.002951 0.004444444 0.000555556 1.73611E-05
0.009816 0.004444 0.000556 1.74E-05
N
1
120
1
0.080499
Số kiểu gen tt
17
0,05
16.92
α Bảng 3.12 Locus TPOX
Locus TPOX
Số mẫu
120 người
Số alen
5
số kiểu gen
11
Số tổ hợp kiểu gen lý thuyết
15
2
0.035487
df = 6
p = 0.05
12.59
2
0.000801 0.008624 0.00638 4.96E-07 0.000176 0.000584 0.002604 0.01058 3.46E-05 0.000156 0.001164 0.000938 0.001229 0.000809 0.001406
Tần suất lý thuyết 0.131406 0.075521 0.009063 0.350417 0.027188 0.010851 0.002604 0.100694 0.007813 0.000156 0.012083 0.000938 0.233611 0.03625 0.001406
TPOXb 8 9 10 11 12 9 10 11 12 10 11 12 11 12 12
TPOXa 8 8 8 8 8 9 9 9 9 10 10 10 11 11 12
Tần số kiểu gen 17 6 2 42 3 1 0 16 1 0 1 0 26 5 0
Tần suất thực tế 0.141667 0.05 0.016667 0.35 0.025 0.008333 0 0.133333 0.008333 0 0.008333 0 0.216667 0.041667 0
0.035487
1
N
120
1
12.59
0.05
Số kiểu gen tt
11
α
42
Bảng 3.13 Locus D18S51
Locus D18
Số mẫu
120 người
Số alen
11
số kiểu gen
30
Số tổ hợp kiểu gen lý thuyết
66
0.707651
2
df = 9
16.92
2
p = 0.05 Tần suất thực tế
D18b 12 13 14 15 16 17 18 19 20 21 22 13 14 15 16 17 18 19 20 21 22 14 15 16 17 18 19 20 21 22 15 16
Tần số kiểu gen 0 1 1 1 0 0 0 0 0 0 0 7 13 10 7 3 1 3 0 0 0 9 12 18 1 0 3 0 1 2 2 7
D18a 12 12 12 12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 15 15
0 0.008333 0.008333 0.008333 0 0 0 0 0 0 0 0.058333 0.108333 0.083333 0.058333 0.025 0.008333 0.025 0 0 0 0.075 0.1 0.15 0.008333 0 0.025 0 0.008333 0.016667 0.016667 0.058333
Tần suất lý thuyết 0.000156 0.005521 0.006979 0.003958 0.004896 0.000625 0.000313 0.00125 0.000313 0.000313 0.000521 0.048767 0.123299 0.069931 0.086493 0.011042 0.005521 0.022083 0.005521 0.005521 0.009201 0.077934 0.088403 0.10934 0.013958 0.006979 0.027917 0.006979 0.006979 0.011632 0.025069 0.062014
0.000156 0.001432 0.000263 0.004836 0.004896 0.000625 0.000313 0.00125 0.000313 0.000313 0.000521 0.001876 0.001817 0.002568 0.009168 0.017644 0.001432 0.000385 0.005521 0.005521 0.009201 0.00011 0.001521 0.01512 0.002267 0.006979 0.000305 0.006979 0.000263 0.002179 0.002816 0.000218
43
17 18 19 20 21 22 16 17 18 19 20 21 22 17 18 19 20 21 22 18 19 20 21 22 19 20 21 22 20 21 22 21 22 22
15 15 15 15 15 15 16 16 16 16 16 16 16 17 17 17 17 17 17 18 18 18 18 18 19 19 19 19 20 20 20 21 21 22
0 0 0.016667 0 0 0.016667 0.041667 0.008333 0.016667 0.008333 0 0.008333 0 0 0 0.008333 0 0 0 0 0 0 0 0 0 0 0.008333 0.008333 0.008333 0 0 0 0 0
0.007917 0.003958 0.015833 0.003958 0.003958 0.006597 0.038351 0.009792 0.004896 0.019583 0.004896 0.004896 0.00816 0.000625 0.000625 0.0025 0.000625 0.000625 0.001042 0.000156 0.00125 0.000313 0.000313 0.000521 0.0025 0.00125 0.00125 0.002083 0.000156 0.000313 0.000521 0.000156 0.000521 0.000434 1 0.05
0.007917 0.003958 4.39E-05 0.003958 0.003958 0.015371 0.000287 0.000217 0.0283 0.006463 0.004896 0.002413 0.00816 0.000625 0.000625 0.01361 0.000625 0.000625 0.001042 0.000156 0.00125 0.000313 0.000313 0.000521 0.0025 0.00125 0.040135 0.018753 0.428611 0.000313 0.000521 0.000156 0.000521 0.000434 0.707651 16.92
0 0 2 0 0 2 5 1 2 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 120 31
N Số kiểu gen tt
1 α
44
Bảng 3.14 Locus D5S818
Locus D5
Số mẫu
120 người
Số alen
7
số kiểu gen
18
Số tổ hợp kiểu gen lý thuyết
28
3.27E-01
2
df = 9
p = 0.05
16.92
D5a
D5b
2
Tần suất thực tế
7 7 7 7 7 7 7 9 9 9 9 9 9 10 10 10 10 10 11 11 11 11 12 12 12 13 13 14
7 9 10 11 12 13 14 9 10 11 12 13 14 10 11 12 13 14 11 12 13 14 12 13 14 13 14 14
Tần số kiểu gen 0 1 0 0 1 0 0 0 1 1 1 0 0 8 22 11 10 0 13 14 11 1 10 8 1 4 2 0
0 0.008333 0 0 0.008333 0 0 0 0.008333 0.008333 0.008333 0 0 0.066667 0.183333 0.091667 0.083333 0 0.108333 0.116667 0.091667 0.008333 0.083333 0.066667 0.008333 0.033333 0.016667 0
Tần suất lý thuyết 6.94E-05 0.000278 0.004167 0.005208 0.003889 0.002708 0.000278 0.000278 0.008333 0.010417 0.007778 0.005417 0.000556 0.0625 0.15625 0.116667 0.08125 0.008333 0.097656 0.145833 0.101563 0.010417 0.054444 0.075833 0.007778 0.026406 0.005417 0.000278
6.94E-05 2.33E-01 4.17E-03 5.21E-03 5.08E-03 2.71E-03 2.78E-04 2.78E-04 0.00E+00 4.17E-04 3.96E-05 5.42E-03 5.56E-04 2.78E-04 4.69E-03 5.36E-03 5.34E-05 8.33E-03 1.17E-03 5.83E-03 9.64E-04 4.17E-04 1.53E-02 1.11E-03 3.96E-05 1.82E-03 2.34E-02 2.78E-04
120
1
1
N
3.27E-01
18
0.05
Số kiểu gen tt
16.92
α
45
Bảng 3.15 Locus FGA
Locus FGA
Số mẫu
120 người
Số alen
16
số kiểu gen
42
Số tổ hợp kiểu gen lý thuyết
136
0.981118
2
df = 8
p = 0.05
15.51
2
Tần suất thực tế
FGAa 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19
FGAb 18 19 20 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 19 20 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2
Tần số kiểu gen 0 0 0 0 0 0 1 0 2 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 2 0 0 0
0 0 0 0 0 0 0.008333 0 0.016667 0 0 0 0 0 0 0 0 0 0 0.008333 0 0 0 0 0 0 0 0.016667 0 0 0
Tần suất lý thuyết 0.000156 0.000313 0.001042 0.001667 0.002813 0.000104 0.002396 0.000417 0.006667 0.001146 0.004063 0.000833 0.002292 0.000104 0.000729 0.000104 0.000156 0.001042 0.001667 0.002813 0.000104 0.002396 0.000417 0.006667 0.001146 0.004063 0.000833 0.002292 0.000104 0.000729 0.000104
0.000156 0.000313 0.001042 0.001667 0.002813 0.000104 0.014711 0.000417 0.014999 0.001146 0.004063 0.000833 0.002292 0.000104 0.000729 0.000104 0.000156 0.001042 0.001667 0.010832 0.000104 0.002396 0.000417 0.006667 0.001146 0.004063 0.000833 0.090157 0.000104 0.000729 0.000104
46
20 20 20 20 20 20 20 20 20 20 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 22 22 22 22 22 22 22.2 22.2 22.2 22.2 22.2 22.2
20 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 21 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 22 22.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 22.2 23 23.2 24 24.2 25
0 2 0 1 2 0 2 0 0 1 2 0 0 0 0 2 0 0 0 6 0 2 1 1 0 1 0 2 0 1 0 10 1 6 0 2 0 1 0 0 0 0 0 0 0
0.001736 0.005556 0.009375 0.000347 0.007986 0.001389 0.022222 0.003819 0.013542 0.002778 0.007639 0.000347 0.002431 0.000347 0.004444 0.015 0.000556 0.012778 0.002222 0.035556 0.006111 0.021667 0.004444 0.012222 0.000556 0.003889 0.000556 0.012656 0.000938 0.021563 0.00375 0.06 0.010313 0.036563 0.0075 0.020625 0.000938 0.006563 0.000938 1.74E-05 0.000799 0.000139 0.002222 0.000382 0.001354
0 0.016667 0 0.008333 0.016667 0 0.016667 0 0 0.008333 0.016667 0 0 0 0 0.016667 0 0 0 0.05 0 0.016667 0.008333 0.008333 0 0.008333 0 0.016667 0 0.008333 0 0.083333 0.008333 0.05 0 0.016667 0 0.008333 0 0 0 0 0 0 0
0.001736 0.02222 0.009375 0.183793 0.009436 0.001389 0.001389 0.003819 0.013542 0.011108 0.01067 0.000347 0.002431 0.000347 0.004444 0.000185 0.000556 0.012778 0.002222 0.005868 0.006111 0.001154 0.003403 0.001237 0.000556 0.005078 0.000556 0.001271 0.000938 0.008117 0.00375 0.009074 0.00038 0.004938 0.0075 0.00076 0.000938 0.000477 0.000938 1.74E-05 0.000799 0.000139 0.002222 0.000382 0.001354
47
22.2 22.2 22.2 22.2 22.2 23 23 23 23 23 23 23 23 23 23 23.2 23.2 23.2 23.2 23.2 23.2 23.2 23.2 23.2 24 24 24 24 24 24 24 24 24.2 24.2 24.2 24.2 24.2 24.2 24.2 25 25 25 25 25 25
25.2 26 26.2 27 28.2 23 23.2 24 24.2 25 25.2 26 26.2 27 28.2 23.2 24 24.2 25 25.2 26 26.2 27 28.2 24 24.2 25 25.2 26 26.2 27 28.2 24.2 25 25.2 26 26.2 27 28.2 25 25.2 26 26.2 27 28.2
0 0 0 0 0 2 0 3 5 6 0 2 0 2 0 0 0 0 0 0 0 0 0 0 8 3 9 4 7 0 2 0 2 0 0 3 0 0 0 3 2 3 0 0 1
0.000278 0.000764 3.47E-05 0.000243 3.47E-05 0.009184 0.003194 0.051111 0.008785 0.031146 0.006389 0.017569 0.000799 0.00559 0.000799 0.000278 0.008889 0.001528 0.005417 0.001111 0.003056 0.000139 0.000972 0.000139 0.071111 0.024444 0.086667 0.017778 0.048889 0.002222 0.015556 0.002222 0.002101 0.014896 0.003056 0.008403 0.000382 0.002674 0.000382 0.026406 0.010833 0.029792 0.001354 0.009479 0.001354
0 0 0 0 0 0.016667 0 0.025 0.041667 0.05 0 0.016667 0 0.016667 0 0 0 0 0 0 0 0 0 0 0.066667 0.025 0.075 0.033333 0.058333 0 0.016667 0 0.016667 0 0 0.025 0 0 0 0.025 0.016667 0.025 0 0 0.008333
0.000278 0.000764 3.47E-05 0.000243 3.47E-05 0.006097 0.003194 0.013339 0.123076 0.011413 0.006389 4.63E-05 0.000799 0.02195 0.000799 0.000278 0.008889 0.001528 0.005417 0.001111 0.003056 0.000139 0.000972 0.000139 0.000278 1.26E-05 0.001571 0.01361 0.001824 0.002222 7.93E-05 0.002222 0.100984 0.014896 0.003056 0.032781 0.000382 0.002674 0.000382 7.49E-05 0.003142 0.000771 0.001354 0.009479 0.035972
48
25.2 25.2 25.2 25.2 25.2 26 26 26 26 27 27 28.2
25.2 26 26.2 27 28.2 26 26.2 27 28.2 27 28.2 28.2
0 0 0 0 0 0.008333 0 0 0 0 0 0
N
0 0 0 0 0 1 0 0 0 0 0 0 120
1
0.001111 0.006111 0.000278 0.001944 0.000278 0.008403 0.000763889 0.005347222 0.000763889 0.000850694 0.000243056 1.73611E-05 1
0.001111 0.006111 0.000278 0.001944 0.000278 5.83E-07 0.000764 0.005347 0.000764 0.000851 0.000243 1.74E-05 0.981118
Số kiểu gen TT
42
0.05
15.51
α
Kết quả số liệu ở các bảng trên cho thấy phân tích thống kê, kiểm định tần số alen và số kiểu gen giữa mẫu thực tế phù hợp với quần thể theo lý thuyết ở tất cả 15 locus gen. Tần suất phân bố alen của các locus gen hệ Identifiler trên 120 cá thể người H’Mông là tin cậy và sử dụng được trong tính toán, giám định ADN. 1.3.2. Bảng tần suất của các mẫu nghiên cứu (Xem bảng 3.16 đến 3.30) Bảng kết quả và thảo luận cơ sở dữ liệu tần suất phân bố các alen của 15
locus gen (gồm bảng 3.16 đến bảng 3.30)
Bảng 3.16 Locus D8S1179
Đồng hợp tử: 24 Dị hợp tử: 96 Tổng số : 120
Alen Số lượng quan sát Tần suất
10 65 0.270833
11 49 0.204167
12 12 0.05
13 31 0.129167
14 17 0.070833
15 54 0.225
16 10 0.041667
17 2 0.008333
49
Tổng: 8 2n = 240 1
Bảng 3.17 Locus D21S11
Đồng hợp tử: 16 Dị hợp tử: 104 Tổng số : 120
Alen Số lượng quan sát Tần suất
27 1 0.004167
28 6 0.025
29 48 0.2
30 55 0.229167
30.2 3 0.0125
31 24 0.1
31.2 43 0.179167
32 7 0.029167
32.2 16 0.066667
33 1 0.004167
33.2 32 0.133333
34.2 2 0.008333
35.2 2 0.008333
1 Tổng:13 2n = 240
Bảng 3.18 Locus D7S820
Đồng hợp tử: 29 Dị hợp tử: 91 Tổng số : 120
Alen 8 9 Tần suất 0.204167 0.020833 Số lượng quan sát 49 5
9.1 1 0.004167
10 23 0.095833
11 113 0.470833
12 13 14 38 5 5 0.158333 0.020833 0.020833
15 1 0.004167
50
Tổng: 9 2n = 240 1
Bảng 3.19 Locus CSF1PO
Đồng hợp tử: 44 Dị hợp tử: 76 Tổng số : 120
Alen Số lượng quan sát Tần suất
7 2 0.008333
9 1 0.004167
10 61 0.254167
11 25 0.104167
12 133 0.554167
13 18 0.075
Tổng:6 2n = 240
1 Bảng 3.20 Locus D3S1358
Đồng hợp tử: 42 Dị hợp tử: 78 Tổng số : 120
Alen 14 15 16 17 18 Tổng: 5 Số lượng quan sát 4 74 80 71 11 2n = 240 Tần suất 0.016667 0.308333 0.333333 0.295833 0.045833 1
Bảng 3.21 Locus TH01
Đồng hợp tử: 39 Dị hợp tử: 81 Tổng số : 120
51
Alen 6 6.3 7 8 9 9.3 10 Tổng: 7 Số lượng quan sát 53 1 48 4 116 12 6 2n = 240 Tần suất 0.220833 0.004167 0.2 0.016667 0.483333 0.05 0.025 1
Bảng 3.22 Locus D13S317
Đồng hợp tử: 44 Dị hợp tử: 76 Tổng số : 120
Alen 8 Số lượng quan sát 142 Tần suất 0.591667
0.1125
9 10 11 12 13 14 0.108333 0.120833 0.045833 0.016667 0.004167 27 26 29 11 4 1
Tổng: 7 2n = 240 1
Bảng 3.23 Locus D16S539
Đồng hợp tử: 38 Dị hợp tử: 82 Tổng số : 120
Alen Số lượng quan sát Tần suất
8 0.008333 2
9 0.4125 99
10 0.141667 34
11 0.216667 52
12 0.179167 43
13 0.029167 7
14 0.008333 2
15 0.004167 1
1 Tổng: 8 2n = 240
Bảng 3.24 Locus D2S1338
Đồng hợp tử: 22 Dị hợp tử: 98 Tổng số : 120
Alen Số lượng quan sát
Tần suất 0.016667 17 4
0.033333 18 8
52
0.154167 19 37
0.1 20 24
0.020833 21 5
0.0875 22 21
0.283333 23 68
0.220833 24 53
0.0375 25 9
0.0375 26 9
0.008333 27 2
Tổng:8 2n = 240 1
Bảng 3.25 LocusD19S443
Đồng hợp tử: 27 Dị hợp tử: 93 Tổng số : 120
Alen Số lượng quan sát Tần suất
11 1 0.004167
12 3 0.0125
13 63 0.2625
13.2 33 0.1375
14 38 0.158333
14.2 15 0.0625
15 15.2 7 73 0.029167 0.304167
16 1 0.004167
16.2 3 0.0125
17 2 0.008333
53
Tổng:11 2n = 240 1
Bảng 3.26 Locus vWA
Đồng hợp tử: 33 Dị hợp tử: 87 Tổng số : 120
Alen Số lượng quan sát Tần suất
0.2875 14 69
15 2 0.008333
16 29 0.120833
17 38 0.158333
18 85 0.354167
19 16 0.066667
20 1 0.004167
1 Tổng:7 2n = 240
Bảng 3.27 Locus TPOX
Đồng hợp tử: 44 Dị hợp tử: 76 Tổng số : 120
Alen Số lượng quan sát Tần suất
8 87 0.3625
9 25 0.104167
10 3 0.0125
11 116 0.483333
12 9 0.0375
1 Tổng: 5 2n = 240
Bảng 3.28 Locus D18S51
Đồng hợp tử: 24 Dị hợp tử: 96 Tổng số : 120
Tần suất Alen Số lượng quan sát
12 3 0.0125
13 53 0.220833
54
14 67 0.279167
15 38 0.158333
16 47 0.195833
17 6 0.025
19 15 0.0625
20 3 0.0125
21 3 0.0125
22 5 0.020833
Tổng: 10 2n = 240 1
Bảng 3.29 Locus D5S818
Đồng hợp tử: 35 Dị hợp tử: 85 Tổng số : 120
Alen Số lượng quan sát Tần suất
7 2 0.008333
9 4 0.016667
10 60 0.25
11 75 0.3125
12 56 0.233333
13 39 0.1625
14 4 0.016667
1 Tổng: 7 2n = 240
Bảng 3.30 Locus FGA
Đồng hợp tử: 18 Dị hợp tử: 102 Tổng số : 120
Tần suất
55
0.0125 0.0125 0.041667 0.066667 0.1125 0.004167 Alen 18 19 20 21 22 22.2 Số lượng quan sát 3 3 10 16 27 1
23 23.2 24 24.3 23 4 64 11 0.095833 0.016667 0.266667 0.045833
25 39 0.1625
25.2 8 0.033333
26 22 0.091667
26.2 1 0.004167
27 7 0.029167
28.2 1 0.004167
Tổng:16 2n = 240 1
1.3.3. Kết quả so sánh tần suất alen của ngƣời H Mông với một số ngƣời
tộc ngƣời (xem Bảng từ 3.31 đến 3.45) và biện luận :
Bảng 3.31 Locus D8S1179
Alen Tộc ngƣời
Ngƣời Việt Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông
(n=110) (n=210) (n=120) (Kinh) (n=170)
8 0.0059 - - 0.009
10 0.1706 0.148 0.136 0.270833
11 0.1500 0.117 0.082 0.204167
12 0.1471 0.126 0.105 0.05
13 0.1471 0.167 0.186 0.129167
14 0.1559 0.169 0.177 0.070833
56
15 0.1176 0.167 0.195 0.225
16 0.0706 0.1 0.083 0.041667
17 0.0294 0.005 0.017 0.008333
17.2 - - 0.007 -
18 0.0059 0.005 - -
TS 10 10 9 8
ở người H’Mông chỉ thấy xuất hiện có 8 alen từ alen 8 đến alen 17.
Bảng 3.32 Locus D21S11
Alen Tộc ngƣời
Ngƣời Việt
Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông
(Kinh) (n=170) (n=110) (n=210) (n=120)
26 0.00294 0.005 - -
0.00416 27 0.00588 0.005 0.005 7
28 0.05588 0.077 0.064 0.025
- - 28.2 0.00294 -
0.2 29 0.25882 0.273 0.25
- - 29.2 0.00294 -
0.22916 30 0.25 0.173 0.252 7
30.2 0.02059 0.023 0.048 0.0125
31 0.08235 0.105 0.079 0.1
0.17916 31.2 0.05588 0.1 0.071 7
0.02916 32 0.02353 0.041 0.026 7
57
32.2 0.18235 0.15 0.124 0.08235
33 0.00294 - 0.05588 -
33.2 0.04706 0.036 0.064 0.02353
0.005 - - 34 -
34.2 0.05588 0.009 0.017 0.18235
- 35.2 - - 0.00294
TS 15 13 11 13
Alen 35.2 là alen đặc trưng mới chỉ xuất hiện ở người H’Mông; chưa
thấy xuất hiện ở người Thái lan, Malaixia, người Việt (Kinh).
Bảng 3.33 Locus D7S820
Alen Tộc ngƣời
Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)
7 0.00882 0.01 0.018
8 0.14706 0.162 0.204167 0.232
9 0.05588 0.055 0.020833 0.073
9.1 0.00294 - 0.004167 -
10 0.20588 0.193 0.095833 0.164
11 0.34412 0.338 0.470833 0.345
12 0.20294 0.205 0.158333 0.141
13 0.02353 0.036 0.020833 0.027
14 0.00882 0.002 0.020833 -
15 0.004167
TS 9 8 9 7
Alen 15 chỉ xuất hiện ở người H’Mông. Alen 9.1 là alen đặc trưng, mới
58
chỉ xuất hiện ở người H’Mông và người Việt (Kinh).
Bảng 3.34 Locus CSF1PO
Alen Tộc ngƣời
Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)
0.00588 0.005 7 - 0.008333
8 - - 0.002
9 0.04706 0.009 0.019 0.004167
10 0.24706 0.245 0.214 0.254167
11 0.25882 0.314 0.298 0.104167
12 0.34706 0.355 0.376 0.554167
13 0.06765 0.059 0.079 0.075
14 0.02059 0.005 0.01
15 0.00588 0.009 0.002
TS 8 8 8 6
Số lượng alen xuất hiện ở quần thể người H’Mông ít hơn hẳn so với 3
quần thể còn lại và tập trung ở những locus ngắn.
Bảng 3.35 Locus D3S1358
Alen Tộc ngƣời
Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)
11 - 0.009 - -
12 - 0.005 - -
13 - - 0.005
14 0.03824 0.045 0.031 0.016667
15 0.31471 0.25 0.286 0.308333
16 0.35 0.332 0.376 0.333333
59
17 0.20294 0.25 0.217 0.295833
18 0.08235 0.109 0.079 0.045833
19 0.00882 - 0.007
20 0.00294 - - -
TS 7 7 7 5
Có 5 alen xuất hiện ở người H’Mông, ít hẳn so với các quần thể khác
và tập trung ở các alen 15, 16, 17.
Bảng 3.36 Locus THO1
Alen Tộc ngƣời
Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)
6 6.3 7 8 9 9.3 10 11 TS 0.14118 0.36176 0.06765 0.32647 0.03824 0.05882 0.00588 7 0.109 0.345 0.095 0.286 0.095 0.068 - 6 0.107 0.31 0.052 0.355 0.081 0.095 - 6 0.220833 0.004167 0.2 0.016667 0.483333 0.05 0.025 - 8
Alen 6.3 là alen đặc trưng, mới chỉ xuất hiện ở người H’Mông; chưa
thấy xuất hiện ở người Thái lan, Malaixia, người Việt(Kinh).
Bảng 3.37 Locus D13S317
Alen Tộc ngƣời
Ngƣời Việt
Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông
(Kinh) (n=170) (n=110) (n=210) (n=120)
0.00294 7 0.005 0.002 -
60
0.34118 8 0.236 0.293 0.591667
9 0.13235 0.127 0.167 0.1125
10 0.12353 0.109 0.129 0.108333
11 0.22353 0.318 0.229 0.120833
12 0.13529 0.15 0.133 0.045833
13 0.02941 0.05 0.038 0.016667
14 0.01176 0.005 0.01 0.004167
TS 8 8 8 7
Không thấy alen 7 xuất hiện ở người H’Mông, alen 8 xuất hiện với tần
suất rất cao, vượt mức bình thường.
Bảng 3.38 Locus D16S539
Alen Tộc ngƣời
Ngƣời Việt Ngƣời Ngƣời Thái Ngƣời
(Kinh) Malaixia lan H Mông
(n=170) (n=110) (n=210) (n=120)
7 - - - 0.009
8 0.007 0.008333 0.0058824 0.018
9 0.217 0.4125 0.2205882 0.109
10 0.171 0.141667 0.1117647 0.182
11 0.298 0.216667 0.2970588 0.271
12 0.19 0.179167 0.2323529 0.259
13 0.105 0.029167 0.1117647 0.109
14 0.012 0.008333 0.0205882 0.023
15 - 0.004167 - -
TS 7 8 7 8
61
Alen 15 chỉ thấy xuất hiện ở người H’Mông.
Bảng 3.39 Locus D2S1338
Alen Tộc ngƣời
Ngƣời Việt (Kinh) (n=170) 0.01176 0.11471 0.07353 0.23529 0.11765 0.04706 0.05 0.173 0.13235 0.03824 0.00588 11 Ngƣời Malaixia (n=110) 0.018 0.095 0.091 0.2 0.132 0.018 0.068 0.173 0.123 0.073 0.009 11 Ngƣời Thái lan (n=210) 0.021 0.086 0.069 0.226 0.136 0.062 0.038 0.164 0.15 0.043 0.005 11 16 17 18 19 20 21 22 23 24 25 26 27 TS Ngƣời H Mông (n=120) - 0.016667 0.033333 0.154167 0.1 0.020833 0.0875 0.283333 0.220833 0.0375 0.0375 0.008333 8
Ở quần thể người H’Mông trong khảo sát này chỉ có alen 27 xuất hiện,
62
mang tính đặc trưng cho quần thể.
Bảng 3.40 Locus D19S443
Alen Tộc ngƣời
Ngƣời Việt
Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông
(Kinh) (n=170) (n=110) (n=210) (n=120)
9 0.01471 - 0.017 -
11 0.00294 0.005 0.004167 -
11.2 - 0.005 - -
12 0.04412 0.059 0.036 0.0125
12.2 0.01176 0.009 0.002 -
13 0.23824 0.318 0.281 0.2625
13.2 0.05 0.027 0.036 0.1375
14 0.25294 0.164 0.217 0.158333
14.2 0.11471 0.073 0.093 0.0625
15 0.058 0.091 0.098 0.029167
15.2 0.15 0.218 0.174 0.304167
16 0.01471 0.018 0.014 0.004167
16.2 0.04118 0.014 0.031 0.0125
17 - - - 0.008333
17.2 0.00294 - 0.002 -
18.2 0.00294 - - -
11 TS 14 12 12
63
Alen 17 đặc trưng chỉ xuất hiện ở người H’Mông.
Bảng 3.41 Locus vWA
Alen Tộc ngƣời
Ngƣời Việt Ngƣời Ngƣời Thái Ngƣời
(Kinh) Malaixia lan H Mông
(n=170) (n=110) (n=210) (n=120)
- 13 - - 0.009
0.2875 14 0.25882 0.257 0.164
0.008333 15 0.01765 0.026 0.041
0.120833 16 0.16765 0.145 0.168
0.158333 17 0.23529 0.24 0.277
0.354167 18 0.19118 0.207 0.255
0.066667 19 0.10588 0.114 0.068
0.004167 20 0.02353 0.01 0.018
7 TS 7 7 8
Bảng 3.42 Locus TPOX
Alen Tộc ngƣời
Ngƣời Việt Ngƣời Ngƣời Thái Ngƣời
H Mông (Kinh) Malaixia lan
(n=120) (n=170) (n=110) (n=210)
- 7 - - 0.005
0.3625 8 0.59118 0.564 0.509
0.104167 9 0.10294 0.131 0.141
0.0125 10 0.02647 0.031 0.032
0.483333 11 0.25882 0.248 0.314
0.0375 12 0.02059 0.024 -
- 14 - 0.002 -
64
5 TS 5 6 5
Bảng 3.43 Locus D18S51
Alen Tộc ngƣời
Ngƣời Việt
Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông
(Kinh) (n=170) (n=110) (n=210) (n=120)
- - 0.00294 - 9
- - - 0.005 10
0.012 - 0.00882 0.018 11
0.069 0.0125 0.09412 0.077 12
0.133 0.220833 0.10882 0.095 13
0.179 0.279167 0.17647 0.195 14
0.224 0.158333 0.19412 0.227 15
0.195 0.195833 0.21471 0.155 16
0.081 0.025 0.06765 0.082 17
0.033 0.0625 0.03529 0.032 18
0.031 0.0125 0.03824 0.05 19
0.01 0.0125 0.01765 0.032 20
0.021 0.020833 0.02059 0.023 21
0.007 0.0125 0.00882 0.005 22
0.005 - 23 0.00882 -
- - 25 0.00294 -
13 11 TS 15 14
Alen ở người H’Mông xuất hiện ít hơn các quần thể khác, chỉ thấy 11
65
alen.
Bảng 3.44 Locus D5S51
Alen Tộc ngƣời
Ngƣời Việt
Ngƣời Malaixia Ngƣời Thái lan Ngƣời H Mông
(Kinh) (n=170) (n=110) (n=210) (n=120)
0.02647 0.023 0.026 0.008333 7
- 0.005 - - 8
0.05882 0.073 0.069 0.016667 9
0.18824 0.255 0.214 0.25 10
0.31765 0.264 0.271 0.3125 11
0.20294 0.245 0.236 0.233333 12
0.18529 0.123 0.167 0.1625 13
0.01765 0.005 0.017 0.016667 14
0.005 - - - 15
0.00294 - - - 16
0.005 - - - 17
66
10 8 7 7 TS
Bảng 3.45 Locus FGA
Alen Tộc ngƣời
Ngƣời Việt (Kinh) (n=170) Ngƣời Malaixia (n=110) Ngƣời Thái lan (n=210) Ngƣời H Mông (n=120)
- - 16 0.00294 -
0.002 - 17 - -
0.026 0.0125 18 0.00882 0.009
0.05 0.0125 19 0.10588 0.082
0.079 0.041667 20 0.05588 0.045
0.002 - 20.2 - 0.005
0.129 0.066667 21 0.14118 0.141
- - 21.1 0.00294 -
0.021 - 21.2 0.00294 0.005
0.207 0.1125 22 0.21176 0.259
0.012 0.004167 22.2 0.02059 0.023
0.186 0.095833 23 0.13824 0.145
0.007 0.016667 23.2 0.01176 0.005
0.11 0.266667 24 0.13235 0.109
0.005 0.016667 24.2 0.01765 0.005
0.093 0.266667 25 0.06765 0.105
0.012 0.045833 25.2 0.00882 0.009
0.04 0.1625 26 0.04118 0.023
0.005 0.033333 26.2 0.00588 0.009
0.01 0.091667 27 0.01765 0.018
0.005 - 28 0.00294 0.005
- 0.004167 28.2 - -
- - 30.2 0.00294 -
67
19 16 TS 20 18
Alen 28.2 là alen đặc trưng, mới chỉ xuất hiện ở người H’Mông; chưa
thấy xuất hiện ở người Thái lan, Malaixia, người Việt (kinh).
2. Bàn luận
Qua kết quả khảo sát, chúng tôi nhận thấy một số alen đặc trưng, chỉ
thấy xuất hiện ở người H’Mông mà chưa thấy xuất hiện ở các quần thể khác.
Khi gặp được những mẫu có alen này được coi như một đặc điểm đặc biệt
giúp cho mẫu mang tính truy nguyên cao, có thể nghi là của người H’Mông,
đó là locus D21 có alen 35.2, locus D7 có alen 15, locus THO1 có alen 6.3, ở
locus D19 có alen 17, ở locus FGA có alen 28.2.
- Quần thể người H’Mông trong khảo sát này có lượng alen ở mỗi locus
thường ít hơn so với các quần thể đã so sánh khác. Nguyên nhân do tập tục
hôn nhân chủ yếu là chỉ lấy người cùng dân tộc, điều đó thể hiện qua số lượng
đồng hợp tử của các alen là rất cao (bảng 3.16 đến 3.30).
- Ứng dụng bảng tần suất các alen của các locus gen hệ Identifiler của
120 cá thể người H’Mông trong giám định gen (ADN) của Viện Khoa học
hình sự nói riêng và của các đơn vị giám định khác là một giá trị khoa học để
các giám định viên biện luận trước tòa án, đảm bảo sự khách quan, công minh
68
của pháp luật.
KẾT LUẬN VÀ KIẾN NGHỊ
1. Kết luận
Với kết quả khảo sát và xây dựng bảng cơ sở dữ liệu tần suất các alen
của các gen thuộc hệ Identifiler trong quần thể người H’Mông chúng tôi rút ra
một số kết luận như sau:
- Đã khảo sát 120 mẫu ADN để xây dựng được cơ sở dữ liệu tần suất
các alen của các gen thuộc hệ Identifiler trong quần thể người H’Mông. Quá
trình thống kê, tính toán tần suất, kiểm định đều được tính toán trên phần
mềm Exel, cho kết quả chính xác. Kết quả kiểm định cho thấy là mẫu thực
nghiệm phù hợp với quần thể lý thuyết.
- Các phương pháp, quá trình tiến hành đều theo quy trình giám định
ADN tại Viện Khoa học hình sự, kết quả đủ độ tin cậy để ứng dụng trong
giám định gen cho các cá thể người H’Mông.
- Qua nghiên cứu đã phát hiện được trên tổng số 120 mẫu nghiên cứu
có 05 alen đặc trưng, chỉ mới thấy xuất hiện trong quần thể H’Mông. Đó là
locus D21 có alen 35.2, locus D7 có alen 15, locus THO1 có alen 6.3, ở locus
D19 có alen 17, ở locus FGA có alen 28.2
Những alen này là những đặc điểm có khả năng truy nguyên cao để truy
nguyên cá thể và xác định quan hệ huyết thống cha - mẹ - con. Điều này có ý
nghĩa lớn để sàng lọc, định hướng truy tìm tội phạm xuyên quốc gia.
- Ứng dụng cơ sở dữ liệu tần suất này trong giám định gen (ADN) của
Viện Khoa học hình sự nói riêng và của các đơn vị giám định gen khác trên
toàn quốc nói chung có ý nghĩa vô cùng cấp thiết, đặc biệt trong các vụ án
truy nguyên cá thể hoặc xác định quan hệ huyết thống cha - mẹ - con, kết quả
là bằng chứng khoa học không thể chối cãi được, đặc biệt là khi tranh tụng
trước tòa. Kết quả có ý nghĩa rất lớn không chỉ trong nước mà còn rất giá trị
69
đối với các nhà giám định và nghiên cứu về gen hình sự trên thế giới.
2. Kiến nghị
Trong phạm vi đề tài nghiên cứu này, chúng tôi đã nghiên cứu số lượng
mẫu phần lớn thuộc khu vực Tây Bắc của Việt Nam. Tuy nhiên, để có kết quả
toàn diện hơn về tần suất các alen trên quần thể người H’Mông, chúng tôi có
một số kiến nghị sau:
- Mở rộng quy mô khảo sát, thống kê trên số lượng mẫu lớn hơn, kiểm
định với mức xác suất p = 0,0001
- Tiếp tục khảo sát tần suất các alen trên các dân tộc khác nhau ở Việt
Nam, đặc biệt là các quần thể như dân tộc Mường, Trung Quốc, Khơ me…
- Các alen đặc trưng cho người H’Mông cần tiếp tục được khảo sát.
- Có thể phối hợp kết quả nghiên cứu của đề tài với các nghiên cứu di
truyền khác về quần thể người dân tộc H’Mông để rút ra những đặc điểm cơ
bản về quần thể dân tộc này phục vụ các nghiên cứu về dân tộc học, khoảng
70
cách di truyền…
TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Chu Văn Mẫn, Đào Hữu Hồ (1999), iáo tr nh thống k sinh học, Nhà xuất
bản Khoa học và kỹ thuật.
2. Chu Văn Mẫn (2009), Tin học trong c ng nghệ sinh học, Nhà xuất bản giáo
dục Việt nam.
3. iáo tr nh lý thuyết Thống k , NXB. Giáo dục,HN 1996
4. Hà Quốc Khanh (2002), Điều tra và xây dựng cơ sở dữ liệu tần suất các
gen hệ Nineplex người Việt (Kinh), Đề tài khoa học cấp Bộ.
5. Lê Đức Vĩnh (2006), iáo tr nh Xác suất thống k , Đại học Nông nghiệp 1
– Hà Nội.
6. TS Lê Thị Thu Thủy (2011), Khảo sát và xây dựng cơ sở dữ liệu tần suất
các alen của 15 gen hệ Identifiler trong quần thể người Kinh ứng dụng trong
giám định ADN của lực lượng Kỹ thuật h nh sự, Đề tài khoa học cấp Bộ.
7. TS Lê Thị Thu Thủy (2012), Vai trò của cơ sở dữ liệu tần suất trong giám
định tư pháp về gen (ADN), tạp chí Cảnh sát Phòng chống tội phạm, Số 31
(178).
8. Phạm Xuân Kiều (2005), iáo tr nh Xác suất và thống k , NXB GD.
9. TS Nguyễn Văn Đức (2002), Phương pháp kiểm tra thống kê Sinh học. Nhà
xuất bản khoa học và kỹ thuật.
10. Đào Hữu Hồ (1999), Xác suất thống k , nhà xuất bản đại học quốc gia Hà
Nội
11. Tăng Văn Khiên (2003), Điều tra chọn mẫu và ứng dụng trong công tác
thống k , NXB. Thống kê, Hà Nội.
12. Viện khoa học hình sự (2005), iáo tr nh iám định sinh học pháp lý, Hà
Nội.
13. Viện khoa học hình sự (2007), iáo tr nh iám định ADN, Hà Nội.
Tiếng Anh
14. ADN Technology in Forensic Science (1992) Committee on DNA
Technology in Forensic Science, National Research Council. Commission on
Life Sciences (CLS)
15. AmpFlSTR® Identifiler® PCR Amplification Kit User’s Manual.
16. Angel Carracedo (2005), Forensic DNA Typing Protocols, Humana Press
Inc.
17. Bio-Rad Cat No 143-2832 Insert. Chelex 100 and Chelex 20 Chelating
Ion Exchange Resin, Instruction Manual
18. Fung WK, Ye J, Hu L, Zhao X, Liu B, Wong DM, Law MY(2001), Allele
frequencies for nine STR loci in Beijing Chinese. Forensic Sci Int.
;121(3):207-9.
19. John M. Butler (2005), Forensic DNA Typing. Elsevier.
20. John M. Butler (2010), Fundamentals of Forensic DNA Typing, Elsevier
Inc.
21. John M. Butler (2012), Advanced Topics in Forensic DNA Typing,
Elsevier Inc.
22. John S. Buckleton, Christopher M. Triggs, Simon J. Walsh, (2005),
Forensic DNA Evidence Interpretation , CRC PRESS.
23. Lawrence Koblinsky, Thomas F. Liotti, Jamel Oeser-Sweat, (2005), DNA
forensic and legal applications,A John Wiley & Sons, Inc Publication.
24. Lawrence Kobilinsky, Louis Levine, Henrietta Margolis-Nunno (2007),
Forensic DNA Analysis, Infobase Publishing.
25. John M. Butler (2003), Forensic DNA Typing. Elsevier..
26. Maruyama S, Minaguchi K, Takezaki N, Nambiar P (2008), Population
data on 15 STR loci using AmpF/STR Identifiler kit in a Malay population
living in and around Kuala Lumpur, Malaysia. Leg Med (Tokyo) 10:160-2
27. Rerkammuaychoke B et al. Thai population data on 15 tetrameric STR
loci-D8S1179, D21S11, D7S820, CSF1PO, D3S1358, TH01, D13S317,
D16S539, D2S1338, D19S433, vWA, TPOX, D18S51, D5S818 and FGA.
Forensic Science International 158 (2006) 234 -237.
28. The Evaluation of Forensic DNA Evidence (1996) Commission on Life
Sciences (CLS)
29. Wing Kam Fung, Yue – Qing Hu (2008), Statistical DNA Forensic.