BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Nguyễn Doãn Tình
NGHIÊN CỨU ĐẶC ĐIỂM ĐA HÌNH NUCLEOTIDE ĐƠN Ở HAI VÙNG SIÊU BIẾN HVS-I VÀ HVS-II TRÊN D-LOOP TY THỂ CỦA MỘT SỐ DÂN TỘC VIỆT NAM
LUẬN VĂN THẠC SĨ : CÔNG NGHỆ SINH HỌC
Hà Nội, 2020
BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Nguyễn Doãn Tình
NGHIÊN CỨU ĐẶC ĐIỂM ĐA HÌNH NUCLEOTIDE ĐƠN Ở HAI VÙNG SIÊU BIẾN HVS-I VÀ HVS-II TRÊN D-LOOP TY THỂ CỦA MỘT SỐ DÂN TỘC VIỆT NAM
Chuyên ngành: Sinh học thực nghiệm
Mã số: 8420114
LUẬN VĂN THẠC SĨ CÔNG NGHỆ SINH HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
Hướng dẫn 1: TS. Nguyễn Thùy Dương
Hà Nội, 2020
i
Lời cam đoan
Tôi xin cam đoan:
Đây là công trình nghiên cứu của tôi và một số kết quả cùng cộng tác
với các cộng sự khác;
Các số liệu và kết quả trình bày trong luận văn là trung thực, một phần đã được công bố tại hội nghị khoa học chuyên ngành với sự đồng ý và cho phép của các đồng tác giả;
Phần còn lại chưa được ai công bố trong bất kỳ công trình nào khác.
Tác giả
Nguyễn Doãn Tình
ii
Lời cảm ơn
Để thực hiện thành công luận văn thạc sĩ này, tôi xin gửi lời cảm ơn sâu sắc và chân thành đến TS. Nguyễn Thùy Dương (Trưởng phòng Hệ gen học người - Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam), người đã trực tiếp hướng dẫn, chỉ bảo tận tình trong suốt thời gian tôi thực hiện đề tài. Cô là người đã tạo điều kiện cũng như truyền cho tôi những kinh nghiệm quý báu trong nghiên cứu khoa học.
Tôi cũng xin được bày tỏ lòng biết ơn của mình đến PGS. TS. Nông Văn Hải (Chủ tịch Hội đồng Khoa học, Viện Nghiên cứu hệ gen), tập thể cán bộ Phòng Hệ gen học người và các cán bộ Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tạo điều kiện thuận lợi và tận tình hướng dẫn, trợ giúp tôi thực hiện tốt đề tài nghiên cứu này.
Tôi xin chân thành cảm ơn các thầy cô thuộc Khoa Công nghệ sinh học, Học viện Khoa học và Công nghệ đã tạo điều kiện tốt nhất cho tôi để hoàn thành luận văn này.
Luận văn được thực hiện trong khuôn khổ của đề tài “Xây dựng cơ sở dữ liệu hệ gen biên thể ty thể và nhiễm sắc thể Y của một số dân tộc người Việt Nam” mã số ĐTĐL.CN-60/19 thuộc Bộ Khoa học và Công nghệ.
Tác giả
Nguyễn Doãn Tình
iii
Danh mục các ký hiệu và chữ viết tắt
Chữ viết tắt Tên đầy đủ
Tên tiếng việt
Cặp bazơ
bp
Base pair
Axit Deoxyribonucleic
DNA
Deoxyribonucleic acid
Dideoxynucleoside
ddNTP
triphosphate
Dideoxynucleoside triphosphate
Deoxynucleoside triphosphate
dNTP
Deoxynucleoside triphosphate
Axit ethylene diamine tetra-
EDTA
acetic
Ethylene diamine tetra-acetic acid
Etanol
EtOH
Ethanol
Đoạn siêu biến 1
HVS-I
Hypervariable segment 1
Đoạn siêu biến 2
HVS-II
Hypervariable segment 2
Phản ứng chuỗi polymerase
PCR
Polymerase chain reaction
Axit ribonucleic
Ribonucleic acid
RNA
RFLP
Đa hình chiều dài đoạn cắt giới hạn
Restriction Fragment Length Polymorphism
Tris – acetate – EDTA
Tris – acetate – EDTA
TAE
Đa hình nucleotide đơn
nucleotide
SNP
Single polymorphism
iv
Danh mục các bảng
Bảng 2.1. Danh sách mẫu nghiên cứu của mỗi dân tộc Kinh ......................... 19
Bảng 3.1. Thống kê các đa hình xuất hiện ở 2 vùng trình tự HVS-I và HVS-II ở 120 mẫu nghiên cứu ..................................................................................... 47
Bảng 3.2. Số lượng các đa hình trung bình phát hiện được trong từng dân tộc ......................................................................................................................... 52
Bảng 3.3. Tần suất các đa hình trình tự vùng siêu biến D-loop thuộc hệ gen ty thể ở ba nhóm cá thể thuộc các tộc người Kinh, Cờ Lao và Phù Lá .............. 53
Bảng 3.4. Các đa hình có phân bố khác biệt ở các tộc người trong nghiên cứu ......................................................................................................................... 54
Bảng 3.5. Khoảng cách di truyền giữa các dân tộc trong nghiên cứu ............ 56
v
Danh mục các hình vẽ, đồ thị
Hình 1.1. Cách thiết lập bản đồ SNP ................................................................ 5
Hình 1.2. Vị trí các gen trên DNA ty thể .......................................................... 8
Hình 1.3. Cấu trúc vùng điều khiển (D-loop) DNA ty thể ............................. 11
Hình 3.1. Kết quả điện di DNA tổng số 51 mẫu dân tộc Kinh. ...................... 26
Hình 3.2. Kết quả điện di DNA tổng số 34 mẫu dân tộc Cờ Lao ................... 26
Hình 3.3. Kết quả điện di DNA tổng số 35 mẫu dân tộc Phù Lá.................... 27
Hình 3.4. Kết quả PCR nhân vùng trình tự HVS-I ở 120 mẫu dân tộc Kinh, Cờ Lao và Phù Lá. ........................................................................................... 28
Hình 3.5. Kết quả PCR nhân vùng trình tự HVS-II ở 120 mẫu dân tộc Kinh, Cờ Lao và Phù Lá ............................................................................................ 30
Hình 3.6. Kết quả giải trình tự một số mẫu đại diện chứa một số đa hình trên đoạn HVS-II .................................................................................................... 31
Hình 3.7. Kết quả so sánh trình tự vùng HVS-II với trình tự chuẩn rCRS của 120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá ................................................ 38
Hình 3.8. Kết quả so sánh trình tự vùng HVS-I với trình tự chuẩn rCRS của 120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá ................................................ 46
vi
MỤC LỤC
MỞ ĐẦU .......................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU................................................ 2 1.1. TỔNG QUAN VỀ ĐA HÌNH NUCLEOTIDE ĐƠN ................................ 2 1.1.1. Đặc điểm của đa hình nucleotide đơn ............................................................ 2 1.1.2. Tầm quan trọng và ứng dụng của đa hình nucleotide đơn ....................... 4 1.1.2.1. Bản đồ SNP ........................................................................................................ 4 1.1.2.2. Phát triển SNP và y học .................................................................................... 5 1.1.2.3. Phát triển SNP và dược phẩm .......................................................................... 6 1.2. HỆ GEN TY THỂ ...................................................................................... 7 1.2.1. Đặc điểm cấu trúc và di truyền hệ gen ty thể ............................................... 7 1.2.1.1. Cấu trúc hệ gen ty thể ....................................................................................... 7 1.2.1.2. Đặc điểm di truyền hệ gen ty thể ...................................................................... 9 1.2.2. Đặc điểm vùng điều khiển (D-loop) trên ty thể .......................................... 10 1.2.3. Tình hình nghiên cứu hệ gen ty thể trên thế giới và ở Việt Nam ............ 12 1.2.3.1. Tình hình nghiên cứu trên thế giới ................................................................. 12 1.2.3.2. Tình hình nghiên cứu DNA ty thể tại Việt Nam ............................................ 13 1.3. ĐẶC ĐIỂM DÂN TỘC HỌC CỦA CÁC DÂN TỘC TRONG NGHIÊN CỨU ................................................................................................................ 15 1.3.1. Người Kinh ........................................................................................................ 15 1.3.2. Người Cờ Lao .................................................................................................... 16 1.3.3. Người Phù Lá .................................................................................................... 17
CHƯƠNG 2. NGUYÊN VẬT LIỆU, PHƯƠNG PHÁP NGHIÊN CỨU . 19
2.1. VẬT TƯ, THIẾT BỊ ................................................................................ 19 2.1.1. Nguyên vật liệu .................................................................................................. 19 2.1.2. Hóa chất .............................................................................................................. 18 2.1.3. Thiết bị ................................................................................................................ 19 2.2. PHƯƠNG PHÁP NGHIÊN CỨU ............................................................ 21 2.2.1. Tách chiết DNA tổng số .................................................................................. 21 2.2.2. Phương pháp điện di kiểm tra trên gel agarose ......................................... 22
vii
2.2.3. Phương pháp khuếch đại 2 vùng siêu biến DNA HVS–I và HVS–II bằng phản ứng PCR ................................................................................................... 23 2.2.4. Phương pháp tinh sạch sản phẩm PCR ...................................................... 24 2.2.5. Phương pháp giải trình tự DNA .................................................................... 25 2.2.4. Phương pháp xử lý số liệu thống kê và so sánh
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN ............................................. 196
3.1. TÁCH CHIẾT DNA TỔNG SỐ TỪ CÁC MẪU MÁU ......................... 24 3.2. KHUẾCH ĐẠI 2 VÙNG SIÊU BIẾN HVS-I VÀ HVS-II BẰNG PHẢN ỨNG PCR ....................................................................................................... 27 3.3. XÁC ĐỊNH CÁC ĐA HÌNH THUỘC HAI VÙNG SIÊU BIẾN HVS-I VÀ HVS-II TRÊN TY THỂ Ở CÁC MẪU NGHIÊN CỨU. ......................... 30 3.4. PHÂN TÍCH THỐNG KÊ SO SÁNH ĐA HÌNH VÀ TÍNH TOÁN KHOẢNG CÁCH DI TRUYỀN GIỮA 3 DÂN TỘC KINH, CỜ LAO VÀ PHÙ LÁ. .......................................................................................................... 52
KẾT LUẬN .................................................................................................... 57
KIẾN NGHỊ ................................................................................................... 58
TÀI LIỆU THAM KHẢO ............................................................................ 59
DANH MỤC PHỤ LỤC ................................................................................ 63
PHỤ LỤC ....................................................................................................... 62
1
MỞ ĐẦU
Ty thể là bào quan đóng vai trò trung tâm trong tổng hợp năng lượng tế bào. Chúng tham gia chuyển hóa vật chất hữu cơ thành năng lượng nội bào thông qua quá trình phosphoryl hóa và vận chuyển electron. Ty thể sở hữu hệ thống vật chất di truyền riêng, tồn tại độc lập với hệ gen nhân dưới dạng DNA mạch vòng kép. Tuy có kích thước bé (tương đương 0,0005% kích thước hệ gen nhân) nhưng hệ gen ty thể có những đặc trưng quan trọng, rất thuận lợi cho nghiên cứu di truyền như di truyền chủ yếu theo dòng mẹ, không hoặc rất ít xảy ra trao đổi chéo… Ngoài ra, trên DNA ty thể tồn tại 2 đoạn siêu biến HVS-I và HVS-II với mật độ xuất hiện các đa hình cao. Đây là những khu vực chứa nhiều điểm đa hình, có trình tự thay đổi theo thời gian và tương đối khác biệt giữa các nhóm người thuộc các dân tộc và khu vực địa lý khác nhau. Do đó, chúng được xem là những đối tượng phù hợp và được sử dụng rộng rãi trong nhiều nghiên cứu nhân chủng học, xác định nguồn gốc và mối quan hệ giữa các dân tộc [1].
Việt Nam là một quốc gia đa dân tộc với 54 dân tộc anh em cùng chung sống [2]. Hiện đã có nhiều nghiên cứu về các đặc điểm văn hóa, phong tục tập quán ở 54 dân tộc được tiến hành. Tuy nhiên, tính đến nay, số lượng những nghiên cứu dựa trên nền tảng di truyền nhằm xác định nguồn gốc cũng như mối quan hệ giữa các dân tộc vẫn rất ít ỏi, đặc biệt đối với các dân tộc ít người [3-5]. Nhận thức rõ tầm quan trọng của vấn đề này, chúng tôi đã tiến hành thực hiện đề tài “Nghiên cứu đặc điểm đa hình nucleotide đơn ở hai vùng siêu biến HVS-I và HVS-II trên D-loop ty thể của một số dân tộc Việt Nam” với mục đích khai thác nguồn dữ liệu di truyền ty thể ở 3 dân tộc Cờ Lao, Phù Lá và Kinh đồng thời đánh giá làm rõ sự tương đồng và khác biệt di truyền giữa 3 dân tộc.
Các mục tiêu chính của nghiên cứu bao gồm:
1. Xác định được các đa hình nucleotide đơn ở 2 vùng siêu biến HVS-I
và HVS-II trên ty thể của các mẫu thuộc 3 dân tộc Kinh, Cờ Lao và Phù Lá.
2. Phân tích đánh giá các đặc điểm đa hình cũng như sự khác biệt di
truyền dựa trên trình tự 2 vùng siêu biến của các mẫu thuộc 3 dân tộc.
2
CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU
1.1. TỔNG QUAN VỀ ĐA HÌNH NUCLEOTIDE ĐƠN
1.1.1. Đặc điểm của đa hình nucleotide đơn
Đa hình nucleotide đơn hay SNP (“Single Nucleotide Polymorphisms”) là những biến thể trình tự DNA xảy ra khi một đơn nucleotide (A, T, C, G) trong trình tự hệ gen bị thay đổi so với các cá thể khác trong cùng loài sinh học hoặc so với NST còn lại trong cặp NST tương đồng [6]. Ví dụ: SNP rs4680 (G>A) ở vị trí chr22:19963748 làm thay đổi trình tự DNA từ GGCGTGAAG thành GGCATGAAG. Xét về nguyên lý, sự phát sinh đa hình đơn nucleotide hoàn toàn giống với đột biến điểm. Hai loại biến thể này chỉ khác nhau ở tần suất xuất hiện trong quần thể. Trong khi SNP phải xảy ra trong ít nhất 1% dân số thì đột biến điểm chỉ xảy ra với tần suất bé hơn 1% [6].
Trung bình cứ mỗi 1000 nucleotide sẽ xuất hiện 1 SNP, do đó sẽ có khoảng 4 đến 5 triệu SNP trong mỗi một hệ gen. Tính đến nay, các nhà khoa học đã thiết lập nhận diện được hơn 100 triệu SNP ở các cá thể thuộc nhiều dân tộc khác nhau trên thế giới [7].
Hầu hết các đa hình SNP đã được xác định nằm ở các vùng không mã hóa và xuất hiện ít hơn trong các vùng mã hóa [8]. SNP nằm ở vùng không mã hóa không làm thay đổi trình tự protein, có thể đóng vai trò là các chỉ thị di truyền và vật lý quan trọng cho các nghiên cứu so sánh và nhân chủng học tiến hóa. Trong khi đó, các SNP nằm ở vùng điều hòa có thể ảnh hưởng đến quá trình ghép nối và tác động đến các yếu tố phiên mã, làm suy thoái RNA thông tin hoặc trình tự của RNA không mã hóa. Sự biểu hiện gen bị ảnh hưởng bởi loại SNP này được gọi là eSNP, dẫn đến sự tăng hoặc giảm biểu hiện gen. Các SNP khác ở vùng mã hóa có thể dẫn đến những thay đổi trong cấu trúc và chức năng protein. Tùy vào mức độ ảnh hưởng, SNP được phân thành 2 nhóm đồng nghĩa (không làm thay đổi trình tự chuỗi polypeptide) hoặc không đồng nghĩa (làm thay đổi trình tự chuỗi polypeptide). Các SNP không đồng nghĩa bao gồm 2 phân nhóm SNP sai nghĩa (missense) hoặc vô nghĩa (nonsense). Các SNP sai nghĩa sẽ dẫn đến việc thay thế 1 amino acid
3
trong chuỗi polypeptide. Trong khi đó, SNP vô nghĩa tạo ra stop codon, báo hiệu tế bào ngưng tổng hợp protein dẫn tới hình thành protein có chức năng không hoàn chỉnh hoặc không có chức năng. Thực tế chứng minh có tới hơn một nửa trong số những đột biến bệnh hiện nay có nguồn gốc từ các đa hình vô nghĩa [9]. Do đó chúng có thể được sử dụng như là các chỉ thị phân tử tiềm năng trong các nghiên cứu dược lý và di truyền học.
Ngoài ra, dựa vào mức độ ảnh hưởng đến chức năng cơ thể, SNP cũng được chia thành các nhóm: vô hại (không gây bệnh), có hại (gây các bệnh như tiểu đường, ung thư, bệnh tim, bệnh Huntington và chứng Haemophilia) và tiềm tàng (biến thể xảy ra trong vùng mã hóa và vùng điều khiển; không gây hại trong điều kiện bình thường nhưng khi đáp ứng một số điều kiện cụ thể có thể làm tăng khả năng phát triển thành bệnh, ví dụ như tính mẫn cảm của ung thư phổi) [10].
1.1.2. Tầm quan trọng và ứng dụng của đa hình nucleotide đơn SNP là kiểu đa hình cực kỳ phổ biến, chiếm đến 80% sự biến đổi trong hệ gen [11]. Mặt khác, chúng cũng tiến hóa ổn định, không thay đổi nhiều từ thế hệ này sang thế hệ khác. Do đó, SNP rất có giá trị trong các nghiên cứu di truyền học ở người.
1.1.2.1. Bản đồ SNP
Các nhà khoa học tin rằng việc thiết lập một bản đồ SNP sẽ đem lại tiềm năng rất lớn, cho phép xác định được các gen liên quan đến các bệnh phức tạp như ung thư hay tiểu đường. Với mục đích đó, hai nhóm nghiên cứu gồm Human Genome Project (HGP) và SNP Consortium đã tập trung vào xác định và thiết lập một bản đồ SNP. Tháng 10 năm 2000, kết quả của cả 2 nhóm đã được công bố rộng rãi trên thế giới [12, 13]. Thành quả này đã cung cấp một công cụ mới mẻ, cho phép nghiên cứu hiệu quả đặc tính của các biến thể trình tự DNA trên hệ gen người. Ngoài ra, bản đồ SNP cũng đã được sử dụng để mô tả sự đa dạng haplotype trên hệ gen, phục vụ cho các nghiên cứu tiến hóa. Hiện, rất nhiều cấu trúc haplotype hiện vẫn chưa được khám phá. Bản đồ này cho phép xác định quy mô, sự biến đổi của các haplotype giống nhau; số
4
lượng, tần số của haplotype phổ biến và sự phân bố của chúng giữa và trong các nhóm dân tộc hiện có.
Hình 1.1. Cách thiết lập bản đồ SNP: (1) Giải mã bộ gen trên số lượng lớn người, (2) So sánh bộ gen giữa các cá thể để tìm kiếm SNP, (3) Xây dựng 1 bản đồ chứa các SNP đã tìm thấy
1.1.2.2. Phát triển SNP và y học
Hiện nay nhiều chứng minh cho thấy hầu hết các SNP không chịu trách nhiệm cho một bệnh, tuy nhiên chúng có thể giúp xác định rằng ai đó có khả năng phát triển một căn bệnh cụ thể. Một ví dụ rõ ràng về cách SNP ảnh hưởng đến sự phát triển của bệnh là ảnh hưởng của chúng đến gen apolipoprotein E hoặc APOE, một trong những gen liên quan với bệnh Alzheimer [1]. Giống như các rối loạn mãn tính như bệnh tim, tiểu đường, hoặc ung thư phổ biến nhất, bệnh Alzheimer là một bệnh được gây ra bởi các biến thể trong một vài gen. Gen APOE chứa đến hai SNP trong ba alen của nó: E2, E3, E4. Mỗi allele khác nhau bởi một base DNA, và các sản phẩm protein của mỗi gen sẽ khác bởi một amino axit. Nghiên cứu cho thấy rằng một người được thừa hưởng ít nhất một E4 allele sẽ có một khả năng lớn để phát triển bệnh Alzheimer. Rõ ràng, sự thay đổi của một amino acid trong các protein E4 làm thay đổi cấu trúc và chức năng của protein và tạo điều kiện cho sự phát triển của bệnh. Còn nếu một người kế thừa allele E2 thì có ít khả năng phát triển bệnh Alzheimer. Tất nhiên, SNP không phải là chỉ số tuyệt
5
đối của sự phát triển của bệnh. Cụ thể, đối với bệnh Alzheimer nếu một người được thừa hưởng hai alen E4 sẽ không bao giờ có thể phát triển bệnh, trong khi một người đã được thừa hưởng hai alen E2 thì có thể [1, 14].
Trong chuẩn đoán bệnh, các SNP còn được sử dụng như các dấu hiệu sinh học để xác định chính xác một căn bệnh trên bản đồ hệ gen của con người, bởi chúng thường nằm gần một gen được tìm thấy có liên quan đến một căn bệnh nào đó. Thỉnh thoảng, một SNP thực sự có thể gây ra một căn bệnh,và do đó, cũng có thể được sử dụng để tìm kiếm và cô lập các gen gây bệnh. Cụ thể, để tiến hành nghiên cứu liên hệ giữa SNP và một căn bệnh, các nhà khoa học sẽ thu thập mẫu máu từ một nhóm các bệnh nhân và phân tích DNA của họ để cho ra các mẫu SNP. Tiếp theo, các nhà nghiên cứu tiếp tục phân tích DNA từ một nhóm các cá nhân không bị ảnh hưởng bởi căn bệnh này và tiến hành so sánh các mẫu thu được. Nhờ các so sánh này (còn gọi là "association study") các nhà khoa học có thể phát hiện sự khác biệt giữa các mô hình SNP của hai nhóm, thông qua đó xác định sự liên quan của SNP với gen gây bệnh. Và cuối cùng, hồ sơ SNP đặc trưng của nhiều loại bệnh khác nhau sẽ được thành lập. Sau đó, chỉ là vấn đề thời gian, các bác sĩ có thể xác định một người có thể nhạy cảm với một căn bệnh nào đó chỉ bằng cách phân tích các mẫu DNA của họ cho mô hình SNP cụ thể.
Ngoài ra các đa hình DNA như SNP cũng rất hữu ích trong việc giúp các nhà nghiên cứu xác định và hiểu lý do tại sao các cá nhân khác nhau trong khả năng của mình có thể hấp thụ các loại thuốc nhất định, cũng như xác định lý do tại sao một cá nhân có thể chịu một tác dụng phụ bất lợi cho một loại thuốc cụ thể.
Vì vậy, các nghiên cứu về SNP hứa hẹn sẽ mang đến một cuộc cách
mạng lớn trong quá trình phát hiện, phòng ngừa và chữa bệnh.
1.1.2.3. Phát triển SNP và dược phẩm
Thuốc trị bệnh đã được con người sử dụng từ hàng ngàn năm trước. Một số loại thuốc vẫn được sử dụng cho đến ngày nay như các chế phẩm làm từ anh túc để giảm đau, tiền thân cho thuốc phiện tổng hợp được sử dụng cho mục đích tương tự bởi các bác sĩ hiện đại. Ngày nay chúng vẫn được được
6
phát triển liên tục không ngừng, bao gồm các chế phẩm sinh học và tổng hợp để điều trị các bệnh mới. Tuy nhiên cho đến hiện tại, việc xác định một bệnh nhân sẽ đáp ứng với một loại thuốc cụ thể hay không vẫn là một vấn đề nan giải. Cụ thể một loại thuốc được chứng minh có hiệu quả trong các bệnh nhân “thông thường” nhưng lại không hiệu quả ở một số người khác hoặc tệ hơn nữa nó có thể đem lại các tác dụng phụ tương đối nặng nề. Do đó các công ty dược phẩm mới chỉ phát triển các sản phẩm đáp ứng các bệnh nhân "thông thường" và loại thuốc dành cho số ít bệnh nhân “bất thường” vẫn chưa được sản xuất.
Như đã đề cập ở trên, các đa hình SNP rất hữu ích cho việc nghiên cứu sự hấp thu và thanh thải cũng như tác dụng phụ của thuốc. Do đó các nhà khoa học rất kì vọng, bằng cách phân tích hồ sơ SNP của sẽ tạo ra các loại thuốc thích hợp cho từng cá nhân và phù hợp với cấu trúc di truyền của riêng từng người. Nhờ vậy sẽ cho phép các công ty dược phẩm cung ứng nhiều loại thuốc hơn cho thị trường và giúp các bác sĩ kê toa điều trị một cách hiệu quả. Các nhà khoa học dự kiến chỉ tính riêng ở Hoa Kỳ, "thuốc cá nhân hoá” sẽ có khả năng làm giảm khoảng 100.000 trường hợp tử vong và 2 triệu ca nhập viện do phản ứng phụ với thuốc xảy ra mỗi năm.
1.2 HỆ GEN TY THỂ
1.2.1. Đặc điểm cấu trúc và di truyền hệ gen ty thể 1.2.1.1. Cấu trúc hệ gen ty thể Khác với hệ gen nhân, hệ gene ty thể là một phân tử DNA dạng vòng, mạch kép, có kích thước nhỏ (khoảng 16569 bp) và không liên kết với protein histon. Hai sợi của DNA ty thể (mtDNA) được chia thành chuỗi nặng (H) và nhẹ (L) dựa trên độ nổi của chúng trong trong các gradient celsium clorua .
Chuỗi nặng nằm phía ngoài, rất giàu guanine và có chứa điểm khởi đầu sao chép OH. Bắt đầu từ điểm này, quá trình sao chép DNA ty thể được tiến hành tuần tự cho đến điểm khởi đầu sao chép của chuỗi nhẹ (OL), nằm giữa một cụm gen tRNA. Khi điểm OL nằm ở dạng sợi đơn, quá trình tổng hợp mtDNA mới bắt đầu theo hướng ngược lại. Ngoài ra, trên phân tử mtDNA chứa 3 vùng trình tự khởi đầu phiên mã (promoter) khác nhau, bao gồm 2 điểm H1 và H2 trên chuỗi nặng và L trên chuỗi nhẹ.
7
Hình 1.2. Vị trí các gen trên DNA ty thể
Có tổng cộng 37 gene mã hóa nằm trên DNA ty thể, bao gồm: 2 gen mã hóa rRNA (12S và 16S), 22 gen mã hóa tRNA và 13 gen mã hóa chuỗi polypeptide (Hình 1.2). Tất cả các chuỗi polypeptide được mã hóa đều là thành phần của phức hệ hô hấp OXPHOS (Oxidative phosphorylation):
- Bảy gene MTND1, MTND2, MTND3, MTND4L, MTND4, MTND5, MTND6 mã hóa cho 7 tiểu phần (1, 2, 3, 4L, 4, 5, 6 của phức hệ I (NADH: ubiquinone oxyoreductase) [15].
- Gen MTCYB mã hóa cho tiểu phần Cytochrome b của phức hệ III
(ubiquinol: cytochrom coxyoreductase) [16].
- Ba gene MT-COI, MT-COII, MT-COIII mã hóa cho 3 chuỗi polypeptide Cytochrom c oxyase I, II, III của phức hợp IV (cytochrom c oxyase).
- Hai gene MT-ATP6, MT-ATP8 mã hóa cho 2 tiểu phần (ATP
synthase Fo tiểu phần 6 và 8) của phức hợp V (ATP synthase).
Các gen DNA ty thể không chứa intron và có rất ít các đoạn intergenic (đoạn trình tự nằm giữa các gen). Ngoài ra, ở DNA ty thể còn có hiện tượng các gen nằm gối lên nhau (overlapping genes), tương tự như ở một số virus.
8
Một số các gen kết thúc bằng T hoặc TA mà không có một codon kết thúc đúng nghĩa. Ở các gen này, codon kết thúc chỉ được hình thành sau quá trình polyadenyl hóa của các mRNA tương ứng.
Các gen mã hóa tRNA trên ty thể thường nằm giữa mỗi hai gen mã hóa rRNA hoặc protein, thuận lợi cho quá trình xử lý RNA sau đó. Chỉ có 22 loại tRNA (tất cả được mã hóa trong mtDNA) tham gia vào quá trình tổng hợp protein của ty thể, ít hơn nhiều so với ở tế bào chất (từ 31-61 loại khác nhau). Ngoài ra, so với các tRNA tương ứng trong tế bào chất, cấu trúc của tRNA này có những sai khác nhất định. Ví dụ, phân tử tRNASer(AGY) trong ty thể thiếu hoàn toàn một cánh so với tế bào chất.
Ngoài ra, so với hệ gen nhân, mã di truyền ty thể cũng có những khác biệt. Cụ thể, mã di truyền trên DNA ty thể chỉ sử dụng 2 codon mở đầu ‘AUA’ và ‘AUU’ và 2 codon kết thúc 'AGA' và 'AGG', trong khi DNA nhân sử dụng 1 codon mở đầu AUG và 3 codon kết thúc 'UAA', 'UGA' và 'UAG'. Một số các codon cũng mã hóa những acid amin khác nhau như AUA mã hóa cho isoleucin ở nhân nhưng lại xác định methionin ở ty thể.
1.2.1.2. Đặc điểm di truyền hệ gen ty thể
Mặc dù có kích thước rất nhỏ (chỉ bằng 0,0005% kích thước bộ gene trong nhân) nhưng hệ gen ty thể có nhiều đặc điểm quan trọng, thuận lợi cho nghiên cứu di truyền quần thể và lịch sử tiến hóa.
Đầu tiên, DNA ty thể có đặc tính di truyền theo dòng mẹ, chỉ được truyền từ mẹ sang con [17]. Điều này có thể được giải thích bởi ty thể trong tinh trùng sớm biến mất trong phôi bởi sự phá hủy có chọn lọc, sự bất hoạt, hoặc đơn giản bởi số lượng áp đảo của ty thể của noãn. Như vậy, mtDNA sẽ được kế thừa theo một dòng duy nhất, không có sự tái tổ hợp. Điều này cho phép loại bỏ các ảnh hưởng gây nhiễu, tạo điều kiện thuận lợi cho quá trình nghiên cứu lịch sử di truyền theo mẫu hệ.
Các đột biến trên DNA ty thể cũng được xác định xảy ra với tốc độ nhanh hơn 5 đến 10 lần so với DNA nhân, khoảng 2% đến 4% trong một triệu năm [18]. Tốc độ đột biến này có thể do sự thiếu sót các cơ chế sửa chữa các sai hỏng DNA như ở nhân của ty thể. Mặt khác, ty thể cũng là nơi diễn ra
9
nhiều quá trình oxy hóa và do đó sản sinh ra nhiều chất oxy hóa mạnh như các gốc tự do, gây tác động và phát sinh các đột biến đến ở hệ gen ty thể.
Ngoài ra, trong tế bào cũng có thể chứa hàng trăm đến hàng ngàn ty thể. Do đó, số lượng các phân tử mtDNA trong 1 tế bào lớn gấp nhiều lần so với DNA nhân [19]. Mặt khác, DNA ty thể có kích thước bé, tồn tại ở dạng mạch vòng nên rất bền theo thời gian. Hai đặc điểm làm cho việc phân tích DNA ty thể đặc biệt có ý nghĩa trong việc phân tích các mẫu sinh phẩm cổ hoặc đã xuống cấp,
1.2.2. Đặc điểm vùng điều khiển (D-loop) trên ty thể Vùng điều khiển D-loop có kích thước 1121 bp, nằm từ vị trí 16024- 16569/0-576 và nằm giữa hai gene tRNA vận chuyển cho Phenyanalin và Prolin, chiếm 7% tổng lượng DNA ty thể (Hình 1.3). Vùng này chứa các trình tự khởi đầu cho quá trình tái bản DNA ty thể và chứa các đoạn điều khiển cho quá trình phiên mã của các gen chức năng trong vùng được mã hóa .
Vùng D-Loop ty thể được đặc trưng bởi tỉ lệ xuất hiện các đa hình cao hơn hẳn so với các khu vực khác trên DNA ty thể (khoảng 10 lần) [20, 21]. Điều này có thể được giải thích do các đột biến nằm ở các vùng mã hóa thường chịu ảnh hưởng mạnh của quy luật chọn lọc tự nhiên. Trong khi đó, vùng D-Loop ty thể là vùng không mã hóa, chỉ chịu trách nhiệm điều khiển quá trình tái bản và phiên mã DNA và do đó tích lũy nhiều đột biến hơn. Tuy nhiên, các đột biến này này phân bố không đồng đều trên khắp D-loop và chỉ tập trung chủ yếu ở 2 vùng siêu biến HVS-I (có kích thước 359 bp, nằm ở vị trí 16024 –16365) và HVS-II (kích thước 325 bp, nằm ở vị trí 57 –372) [22]. Hai vùng siêu biến này đã được Greenberg và các cộng sự xác định lần đầu tiên vào năm 1983 [23]. Ngoài ra, trên ty thể còn xuất hiện một vùng siêu biến khác, được gọi là HVS-III với tổng chiều dài 137 bp (438 - 574), chứa nhiều các đoạn trình tự lặp lại 2 nucleotide CA [19].
10
Hình 1.3. Cấu trúc vùng điều khiển (D-loop) DNA ty thể. CSB domain (Conserved Sequences Block domain): vùng các khối trình tự bảo thủ liên quan đến quá trình khởi đầu sao chép và phiên mã; Central conserved domain: Vùng trung tâm; ETAS domain (Extended Termination-associated Sequences domain): vùng trình tự liên quan đến kết thúc sao chép.
Cho đến nay, đã có nhiều trình tự hoàn chỉnh vùng D-loop của các dân tộc trên thế giới được công bố trong ngân hàng dữ liệu gen quốc tế về DNA ty thể [24]. Tổng cộng đã có hơn vài nghìn trình tự vùng D-loop được công bố - trong đó có 349 trình tự hoàn chỉnh của hệ gen ty thể người thuộc các chủng tộc khác nhau được nghiên cứu và đăng ký [23]. Số lượng các trình tự D-loop cũng như toàn bộ hệ gen ty thể của các cá thể người thuộc các dân tộc khác nhau trên thế giới được giải mã vẫn tăng lên không ngừng. Tuy nhiên với tần số đột biến cao, nhiều điểm đa hình nên hai vùng siêu biến HVS-I và HVS-II trên DNA ty thể vẫn được tập trung nghiên cứu nhiều hơn, đặc biệt đối với HVS-I. Các đa hình trên 2 khu vực này được sử dụng trong nghiên cứu với các bệnh di truyền, ung thư hoặc các hội chứng bất thường về cơ, thần kinh... Chúng cũng được sử dụng để xác định cá thể và quan hệ huyết thống, trong giám định hài cốt liệt sỹ, giám định pháp y, điều tra tội phạm... Ngoài ra, các đa hình trên mtDNA cũng được sử dụng trong các nghiên cứu nhân chủng học tiến hóa. Bằng cách sử dụng kết hợp 2 nguồn dữ liệu mtDNA (đặc trưng theo mẫu hệ) và MSY (đặc trưng cho phụ hệ), các nhà khoa học đã mở ra một bức tranh tổng thể về lịch sử tiến hóa của loài người cũng như mối liên hệ giữa các dân tộc trên toàn thế giới.
11
1.2.3. Tình hình nghiên cứu hệ gen ty thể trên thế giới và ở Việt
Nam
1.2.3.1. Tình hình nghiên cứu trên thế giới Hiện nay, phân tích biến thể hệ gen ty thể được sử dụng rộng rãi để nghiên cứu quan hệ tiến hóa của các cá nhân và quần thể, cả trong phạm vi và giữa các loài. Các nghiên cứu nhân chủng học tiến hóa gần đây về hệ gen ty thể tập trung chủ yếu vào các nhóm đơn bội (haplogroup) ty thể, được xác định dựa trên các nhóm đa hình mtDNA đặc trưng. Dựa trên việc phân loại và sắp xếp các nhóm haplogroup, cây phả hệ tiến hóa và con đường di cư theo DNA ty thể của các nhóm người sẽ được định hình. Cụ thể, nghiên cứu nhân chủng học phân tử của Li và Durbin năm 2011 cho thấy, người hiện đại bắt đầu xuất hiện ở châu Phi cách đây khoảng 200.000 năm (Hình 1.4) [25].
Nghiên cứu hoàn chỉnh trình tự hệ gen ty thể đã hỗ trợ cho việc xác định lịch sử nhân chủng học tiến hóa của loài người ở các châu lục trên thế giới. Người châu Phi đặc trưng bởi Macro-haplogroup L và 7 haplogroup (L0, L1, L2, L3, L4, L5 và L6) phân bố khắp các lục địa châu Phi. Khoảng 85.000 năm trước, haplogroup L3 di cư ra khỏi vùng Đông Phi tới các lục địa châu Á và châu Âu, các vùng rất đa dạng về môi trường, các dân tộc, các nền văn hóa và ngôn ngữ. Hai dòng ADN ty thể M và N xuất hiện từ L3 là tổ tiên của tất cả các dòng ADN ty thể trên lục địa Á, Âu. Các haplogroup phát sinh từ Macro-haplogroup M xuất hiện tại các lục địa Ấn Độ và Đông Nam Á, điều này chứng tỏ đã có một quá trình thực dân hóa rất nhanh dọc theo bờ biển phía nam châu Á vào khoảng 60.000 năm trước [26, 27]. Một sự mở rộng khác của Macro-haplogroup M theo hướng Bắc châu Á vào khoảng 45.000 năm trước đã tạo ra hơn 30 haplogroup khác. Với quần thể người châu Âu, haplogroup L3 và Macro-haplogroup N tạo nên 9 Macro-haplogroup (H, I, J, K, T, U, V, W và X), xuất hiện phổ biến rộng khắp châu lục cách đây khoảng 45.000 năm [27].Trong khi với người châu Mỹ, các nghiên cứu nhân chủng học phân tử chỉ ra họ là con cháu của người châu Á, đặc trưng bởi các Macro- haplogroup: A, B, C, D và X vào khoảng 18.000 năm trước [28].
12
Hình 1.4. Sơ đồ mô tả quá trình di cư của các nhóm đơn bội DNA ty thể người [29]
Tại châu Á, Đông Nam Á là vùng rất đa dạng về môi trường, các dân tộc, các nền văn hóa và ngôn ngữ. Các nhà khoa học hiện đang tập trung nghiên cứu về một sô vấn đề như: các dân tộc cư trú ban đầu ở khu vực Đông Á, hướng di cư giữa Đông Nam Á và Bắc Á, các mối quan hệ di truyền của Đông Á, và tác động di truyền của thực tiễn xã hội khác nhau trên dân cư Đông Á. Những hiểu biết bắt nguồn từ ADN ty thể và/hoặc dữ liệu nhiễm sắc thể Y, nghiên cứu các SNP hoặc nhiều locus dữ liệu trong tái sắp xếp toàn bộ gen, kết hợp với việc sử dụng các mô phỏng, phương pháp dựa trên mô hình để suy ra các thông số về nhân chủng học chắc chắn sẽ cung cấp thêm vào lịch sử dân số của khu vực Đông Á [28, 30].
1.2.3.2. Tình hình nghiên cứu DNA ty thể tại Việt Nam
Trước năm 2003, các nghiên cứu về DNA ty thể nói chung và trình tự vùng D-Loop nói riêng của các dân tộc Việt còn rất ít ỏi. Năm 1999, bằng phương pháp PCR –RFLP và lai phân tử, nhóm các nhà khoa học Pháp kết hợp với trường Đại học Y Hà Nội lần đầu tiên tiến hành nghiên cứu về sự đa hình DNA ty thể của 50 cá thể người Kinh sống tại Hà Nội [31]. Các tác giả đưa ra kết luận ủng hộ giả thuyết cho rằng người Kinh có nguồn gốc kép từ Trung Quốc và các nhóm quần thể Thái –Indonesia [31]. Tiếp đó, nghiên cứu
13
đầu tiên về đoạn HVS-I thuộc vùng D-loop ty thể của 35 cá thể người Việt định cư tại Mỹ đã được Oota công bố vào năm 2002 [32]. Đây là nghiên cứu nằm trong nghiên cứu đánh giá về di truyền quần thể của người Châu Á. Các nghiên cứu này đều sử dụng phương pháp PCR –RFLP để phân tích do đó các kết quả thu được vẫn còn rất nhiều hạn chế.
Từ năm 2004 trở lại đây, số lượng các nghiên cứu về đa hình vùng D- loop ty thể ở các dân tộc Việt đã tăng lên đáng kể. Năm 2005, Huỳnh Thị Thu Huệ đã công bố công trình đầu tiên phân tích trình tự vùng D-loop của 5 cá thể người Việt Nam thuộc 3 dân tộc Kinh, Tày và H’Mông [33]. Năm 2008, Nguyễn Đăng Tôn và các đồng tác giả đã phát hiện 73 đa hình mới xuất hiện khi nghiên cứu khảo sát tần số các nhóm đơn bội (haplogroup) ty thể ở 78 mẫu nghiên cứu các cá thể thuộc 3 dân tộc Kinh, Tày và Mường [4]. Năm 2016, Đỗ Mạnh Hưng đã phát hiện được 79 nhóm đơn bội khi phân tích trình tự đoạn HVS-II của 169 cá thể người Việt Nam thuộc 3 dân tộc Kinh, Mường, Jarai và Ê đê [34]. Đến năm 2017, nhóm nghiên cứu của Trần Thị Thúy Hằng cũng đã giải trình tự đoạn HVS-I và HVS-II của 100 cá thể thuộc hai dân tộc Kinh và Mường và phát hiện được 12 điểm đa hình phổ biến ở cả hai dân tộc này [3]. Cùng năm, một nghiên cứu khác về đa hình vùng D-loop của 622 cá thể người Việt Nam thuộc 6 dân tộc (Kinh, Tày, Nùng, Mông, Khơ me và Thái) đã phát hiện rất nhiều điểm tương đồng giữa hệ gen ty thể người Việt với các dân tộc láng giềng [35]. Gần đây nhất, năm 2019 nhóm nghiên cứu của tiến sĩ Nguyễn Thùy Dương đã tiến hành giải trình tự toàn bộ mtDNA của tổng cộng 609 cá thể thuộc 17 dân tộc thuộc 5 nhóm ngữ hệ ở Việt Nam bằng phương pháp giải trình tự thế hệ mới NGS [36]. Nghiên cứu này đã chỉ ra sự phức tạp của hệ gen DNA ty thể ở Việt Nam, xác định được tổng cộng 111 dòng đơn bội mtDNA mới ở Việt Nam. Đồng thời xác định được, sự phân hóa các nhóm đơn bội DNA ty thể đặc trưng của Việt Nam (đạt đỉnh vào khoảng 2,5-3 kya) có thể liên quan đến sự mở rộng văn minh lúa nước của nền văn hoá Đông Sơn đặc trưng của người Việt [36].
Có thể thấy, mặc dù số lượng các nghiên cứu về DNA ty thể nói chung và vùng D-Loop nói riêng ở Việt Nam đã có sự tăng lên nhưng vẫn chưa đáng kể. Các nghiên cứu này phần lớn được thực hiện với cỡ mẫu nhỏ và trên một
14
số lượng dân tộc hạn chế. Do đó, cần có nhiều hơn các nghiên cứu với cỡ mẫu lớn hơn và trên một nhóm đa dạng các dân tộc hơn nhằm bổ sung đầy đủ nguồn dữ liệu di truyền cho cộng đồng các dân tộc Việt Nam.
1.3. ĐẶC ĐIỂM DÂN TỘC HỌC CỦA CÁC DÂN TỘC TRONG NGHIÊN CỨU
1.3.1. Người Kinh
Người Kinh là cộng đồng dân tộc hình thành tại khu vực địa lý mà ngày nay là miền Bắc Việt Nam và miền Nam Trung Quốc. Dân tộc Kinh chiếm đa số ở Việt Nam (khoảng 86,2% dân số), sử dụng ngôn ngữ chính là tiếng Việt (thuộc nhóm ngữ hệ Việt-Mường).
Người Kinh sinh sống trên khắp lãnh thổ Việt Nam và nhiều nước khác như Mỹ, Úc…, tập trung đông nhất tại các vùng đồng bằng và thành thị trong nước. Trước đây, người Kinh sống chủ yếu bằng nghề trồng lúa nước. Lịch sử đã ghi lại nhiều hệ thống đê điều, kênh rạch phục vụ cho nông nghiệp. Ngoài ra, người Việt còn có nhiều ngành nghề khác như làm vườn, trồng dâu nuôi tằm, dệt vải, chăn nuôi. Dân cư ở khu vực duyên hải hoặc các khu vực nhiều sông ngòi còn có thêm nghề đánh bắt và nuôi trồng thủy hải sản.
Người Kinh sống theo hình thức cộng đồng, quần tụ trong các làng xã. Mỗi làng xã lại có những nét sinh hoạt cộng đồng riêng. Trong hôn nhân và gia đình, người đàn ông được coi là người chủ gia đình, là trụ cột quan trọng nhất. Người Kinh đặt tên con theo họ cha. Văn hóa của người Kinh rất đa dạng. Mỗi vùng có những nét đặc trưng riêng nhưng vẫn có những điểm chung nhất định mang đậm bản sắc của dân tộc. Về nguồn gốc của dân tộc, người Kinh cho rằng họ là con cháu của Lạc Long Quân và Âu Cơ trong truyền thuyết. Theo đó, hai người lấy nhau và sinh ra một bọc 100 trứng và nở thành 100 người con. Những người con sinh ra cùng một bọc gọi là "cùng bọc" (hay còn gọi là Đồng bào) và "đồng bào" là cách gọi của người Việt để nói rằng tất cả người Việt Nam đều cùng có chung một nguồn gốc.
Hiện nay, dưới góc nhìn khoa học, có hai luồng quan điểm về nguồn gốc người Việt. Một số nhà khoa học tin rằng những người Việt đầu tiên dịch chuyển từ quần đảo Indonesia thông qua bán đảo Mã Lai và Thái Lan cho đến
15
khi họ định cư trên vùng sông Hồng ở Đồng bằng Bắc Bộ [37] bằng cách lần theo con đường của các công cụ đá từ cuối Thế Pleistocen (600,000-12,000 trước Công nguyên) trên bán đảo Java, Malaysia, Thái Lan và phía bắc Miến Điện. Những công cụ bằng đá được cho là các công cụ con người đầu tiên được sử dụng trong khu vực Đông Nam Á. Các nhà khảo cổ tin rằng vào thời điểm này dãy Himalaya - một dãy núi ở miền bắc Miến Điện và Trung Quốc, tạo ra một rào cản cô lập người dân Đông Nam Á. Các nhà khoa học khác cho rằng người Việt đầu tiên vốn là một bộ tộc gốc Mông Cổ ở Tây Tạng, di cư xuống phía nam từ thời đồ đá cũ [38]. Nhóm dân tộc này định cư tại vùng Bắc Bộ, thượng nguồn sông Hồng ngày nay và tạo nên nền văn minh Đông Sơn. Nhóm bộ tộc này cũng có sự tương đồng rất lớn về nhân chủng, văn hóa với các tộc người ở phía Nam Trung Quốc - mà sử Trung Quốc còn gọi là cộng đồng Bách Việt.
1.3.2. Người Cờ Lao Dân tộc Cờ Lao là một trong 4 dân tộc sử dụng ngôn ngữ Ka – Đai, thuộc nhóm ngữ hệ Thái – Kađai ở Việt Nam. Người Cờ Lao định cư ở Hà Giang từ thế kỷ 18 và được gọi bằng các tên khác nhau như: Tứ Đứ, Ho Ki, Voa Đề. Dân tộc này được chia làm 3 nhóm chính: Cờ Lao Trắng, Cờ Lao Xanh và Cờ Lao Đỏ, với tổng dân số hơn 2.600 người (năm 2009).
Người Cờ Lao cư trú ở vùng núi đá chủ yếu làm nương, canh tác theo kiểu "thổ canh hốc đá". Những người sống ở các vùng núi đất canh tác ruộng bậc thang, với lúa là cây lương thực chính. Người Cờ Lao có nhiều nghề thủ công như đan lát, làm đồ gỗ; nhiều bản có thợ rèn làm và sửa chữa nông cụ. Trang phục phụ nữ được xem là điểm dễ nhận biết về dân tộc Cờ Lao. Phụ nữ Cờ Lao mặc áo cùng loại với áo người Nùng, Giáy nhưng dài quá gối. Áo được trang trí bằng những miếng vải đáp trên hò áo, ngực, tay áo. Trước đây, người Cờ Lao Trắng, Cờ Lao Xanh còn mặc thêm chiếc áo ngắn tay ra ngoài áo dài để phô những miếng vải mầu đắp trên tay áo trong, chân cuốn xà cạp..
Các bản của người Cờ Lao thường có khoảng từ 15 đến 20 gia đình, theo truyền thống phụ hệ. Nhà của người Cờ Lao thường là nhà ba gian hai chái, mái được lợp bằng cỏ gianh hoặc vầu, nứa. Kiểu nhà của người Cờ Lao Ðỏ tương tự kiểu nhà của người Pu Péo, có tường nhà bằng đất sét đập mịn.
16
Trong hôn nhân của người Cờ Lao, con của chị/em gái được phép lấy con của anh/em trai. Người Cờ Lao thờ Tổ tiên 3-4 đời. Trong đời sống tâm linh người Cờ Lao có nhiều nghi lễ như: lễ đặt tên, lễ trưởng thành, lễ cưới, lễ tang. Văn hóa của người Cờ Lao tiếp thu nhiều yếu tố văn hóa của người Hmông và người Dao cộng cư.
1.3.3. Người Phù Lá Ngôn ngữ Phù Lá thuộc nhóm Tạng – Miến (ngữ hệ Hán – Tạng). Ở Việt Nam, dân tộc Phù Lá có gần 11.000 người (năm 2009), phân bố ở 4 tỉnh: Hà Giang, Lào Cai, Yên Bái và Lai Châu. Trong đó, nhóm Phù Lá cư trú ở tả ngạn sông Hồng, còn nhóm Xá Phó (Lao Va Xơ, Bồ Khô Pạ) ở hữu ngạn. Tổ tiên của họ từ Nam Trung Quốc đến Việt Nam vào khoảng 300 - 400 năm trước. Ngoài ra một bộ phận (Phù Lá Hán) mới tới trong những năm 40 của thế kỷ 20.
Người Xá Phó thường ở nhà sàn. Người nhóm Phù Lá ở nhà trệt, kiểu nhà hai mái, tường trình. Y phục nữ đặc sắc và có sự khác nhau giữa hai nhóm. Phụ nữ Xá Phó mặc váy dài, xòe rộng, có 4 mảng hoa văn phân bố từ trên xuống; thắt lưng vải nhuộm chàm, thêu chỉ đỏ ; áo ngắn, mặc chui đầu, cổ vuông, thêu nhiều hoa văn và đính hạt thực vật; trên đầu vấn khăn dài hoặc khăn vuông thêu hoa văn. Phụ nữ nhóm Phù Lá mặc quần "chân què - lá tọa"; áo ngắn có chiết eo, cài cúc ở bên nách phải, thân sau và ống tay ghép vải màu để trang trí; đeo tạp dề hình lưỡi rìu ở trước ngực...
Trước thập niên 60 của thế kỷ 20, người Xá Phó chỉ làm nương du canh, theo lối phát, đốt, chọc lỗ tra hạt; còn ở vùng người Phù Lá đã phổ biến loại nương định canh, họ dùng cuốc và cày trong canh tác. Tùy nơi, ngô hay lúa là cây lương thực chủ đạo, bên cạnh đó còn có sắn, kê, ý dĩ, khoai sọ...
Người Xá Phó và Phù Lá đều theo chế độ phụ hệ, coi trọng thờ cúng tổ tiên. Trên cơ sở tín ngưỡng vạn vật hữu linh, họ thực hành nhiều nghi lễ nông nghiệp, để cầu mùa màng tốt tươi, vật nuôi phát triển, người khỏe mạnh. Nhóm Phù Lá tiếp thu ảnh hưởng của Đạo giáo.
17
CHƯƠNG 2. NGUYÊN VẬT LIỆU, PHƯƠNG PHÁP NGHIÊN CỨU
2.1. VẬT TƯ, THIẾT BỊ
2.1.1. Nguyên vật liệu
Đối tượng của nghiên cứu là 120 mẫu máu nam giới khỏe mạnh được lấy ở 3 dân tộc cư trú tại các tỉnh miền Bắc Việt Nam, bao gồm 51 mẫu dân tộc Kinh, 34 mẫu Cờ Lao và 35 mẫu Phù Lá (Bảng 2.1). Các nam giới được lựa chọn phải có có ông bà nội ngoại thuộc cùng một dân tộc.
Sau khi được cung cấp thông tin và giải thích về nội dung nghiên cứu, các đối tượng cho mẫu sẽ điền các thông tin xác nhận vào “Phiếu đồng ý tự nguyện tham gia nghiên cứu”. Chỉ khi có chữ ký xác nhận của người cho mẫu hoặc người được uỷ quyền, việc lấy mẫu mới được phép tiến hành.
Bảng 2.1. Danh sách mẫu nghiên cứu của mỗi dân tộc Kinh
Mã số mẫu
Dân tộc
Khu vực lấy mẫu
Tổng số
51
Kinh
(Ngôn ngữ: Việt – Mường)
Hà Nội Kinh01, Kinh02, Kinh03, Kinh04, Kinh05, Kinh06, Kinh07, Kinh08, Kinh09, Kinh10, Kinh11, Kinh12, Kinh13, Kinh14, Kinh15, Kinh16, Kinh17, Kinh18, Kinh19, Kinh20, Kinh21, Kinh22, Kinh23, Kinh24, Kinh25, Kinh26, Kinh27, Kinh28, Kinh29, Kinh30, Kinh31, Kinh32, Kinh33, Kinh34, Kinh35, Kinh36, Kinh37, Kinh38, Kinh39, Kinh40, Kinh41, Kinh42, Kinh43, Kinh44, Kinh45, Kinh46, Kinh47, Kinh48, Kinh49, Kinh50, Kinh51
34
Cờ Lao
Hà Giang CoLao01, CoLao02, CoLao03, CoLao04, CoLao05, CoLao06, CoLao07, CoLao08, CoLao09, CoLao10, CoLao11, CoLao12, CoLao13, CoLao14, CoLao15, CoLao16,
(Ngôn ngữ: Tày –
18
Thái)
CoLao17, CoLao18, CoLao19, CoLao20, CoLao21, CoLao22, CoLao23, CoLao24, CoLao25, CoLao26, CoLao27, CoLao28, CoLao29, CoLao30, CoLao31, CoLao32, CoLao33, CoLao34
35
Phù Lá (Ngôn ngữ: Hán – Tạng)
Hà Giang PhuLa01, PhuLa02, PhuLa03, PhuLa04, PhuLa05, PhuLa06, PhuLa07, PhuLa08, PhuLa09, PhuLa10, PhuLa11, PhuLa12, PhuLa13, PhuLa14, PhuLa15, PhuLa16, PhuLa17, PhuLa18, PhuLa19, PhuLa20, PhuLa21, PhuLa22, PhuLa23, PhuLa24, PhuLa25, PhuLa26, PhuLa27, PhuLa28, PhuLa29, PhuLa30, PhuLa31, PhuLa32, PhuLa33, PhuLa34, PhuLa35
Tổng số mẫu nghiên cứu
120
Vấn đề đạo đức trong Nghiên cứu Y sinh học:
Công trình này đã được Hội đồng đạo đức trong Nghiên cứu Y sinh học của Viện Nghiên cứu hệ gen thông qua và đồng ý cho phép tiến hành lấy mẫu, nghiên cứu trên người theo quyết định số 4-2015/NCHG-HDDD.
2.1.2. Hóa chất
Các loại buffer như AL, AW1,AW2, AE, Buffer Tango, Thermopol
Primer Các enzyme như proteinase K, T4 polynucleotide kinase, T4 DNA
Các dung dịch TE, dung dịch SureSect Binding, Bead “Dynabeads
Các hóa chất sử dụng cho nghiên cứu bao gồm: - H2O, Ethanol, ATP, dNTPs, - buffer, Herculase Buffer , T4 DNA ligase buffer… - - polymerase, T4 DNA ligase, Bst polymerase, Herculase Pol… - MyOne Streptavidin T1”, SureSelect Wash 2, SureSelect Wash, EBT… - Hạt bead SPRT
19
Bộ Kit DNeasy Blood & Tissue (QUIAGEN)
- Adapter… - - Kit “DNF-474 High Sensitivity NGS Fragment Analysis”
2.1.3. Thiết bị
Nghiên cứu sử dụng các thiết bị tại Viện nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam, bao gồm: tủ lạnh sâu, bể ổn nhiệt, máy voltex, hệ thống điện di Mupid- exu, máy chụp ảnh GEL-DOC, máy ly tâm Eppendorf 5424R, máy GeneAmp PCR System 9700 (ABI, Mỹ), máy giải trình tự tự động ABI PRISM 3500.
2.2. PHƯƠNG PHÁP NGHIÊN CỨU
2.2.1. Tách chiết DNA tổng số
DNA tổng số được tách chiết từ mẫu máu đông lạnh, sử dụng Kit GeneJET Whole Blood Genomic DNA Purification (Thermo Fisher Scientific Inc., Vilnius, Lithuania). Các bước thực hiện bao gồm:
Mẫu máu lưu trữ ở -20oC được lấy ra và để vào tủ ấm 37 oC cho đến khi
- máu tan hoàn toàn.
Thêm 20 µl Proteinase K vào 200 µl máu, mix đều bằng vortex. Thêm
- 400 µl dung dịch Lysis, tiếp tục mix đều dung dịch bằng vortex hoặc pipet.
Ủ mẫu ở 56oC trong 30 phút và thỉnh thoảng vortex hoặc sử dụng bể lắc
- đến dung dịch mẫu tan hoàn toàn.
-
Thêm 200 µl ethanol (96-100%) và mix đều bằng pipet.
Chuyển dung dịch mẫu vào cột ly tâm. Ly tâm ở tốc độ 8000 vòng/phút
- trong vòng 1 phút.
Loại bỏ dịch sau khi ly tâm. Chuyển cột vào một ống 2ml mới.
Thêm 500 µl Wash Buffer I (đã thêm ethanol). Ly tâm 10.000
- vòng/phút trong 1 phút. Loại bỏ dịch sau khi ly tâm.
- Thêm 500 µl Wash Buffer II vào cột. Ly tâm ở tốc độ tối đa trong 3 phút (12.000 – 14.000 vòng/phút). Loại bỏ dịch sau khi ly tâm. Chuyển cột vào ống 1,5ml mới.
20
Thêm 200µl Elution Buffer. Ủ ở nhiệt độ phòng trong 2 phút và ly tâm
- 10.000 vòng/phút trong 1 phút.
-
Bỏ cột. Thu dung dịch DNA.
Các mẫu DNA sau đó được tiến hành điện di kiểm tra chất lượng trên
gel agarose 1% và bảo quản ở -20oC.
2.2.2. Phương pháp điện di kiểm tra trên gel agarose
Phương pháp điện di dựa vào đặc tính cấu trúc của các axit nucleic. ADN là các đại phân tử tích điện âm đồng đều trên khắp bề mặt (ở độ pH ~7), nên khi chịu tác động của một điện trường có điện thế và cường độ thích hợp chúng sẽ di chuyển về cực dương của điện trường.
- 0,8g agarose được hòa trong 100ml TAE 1X, hỗn hợp được đun sôi trong lò vi sóng cho tan hoàn toàn. Hỗn hợp được làm nguội đến nhiệt độ khoảng 50 oC được đổ vào khuôn có đặt sẵn răng lược thích hợp. Thạch được đông và ổn định trong vòng 1 giờ. Sau đó, răng lược được bỏ ra và gel được đặt vào hộp điện di. Đệm TAE 1X được đổ sao cho mức đệm cao hơn mặt gel từ 1 - 2mm; - Một lượng mẫu thích hợp được trộn với đệm tra mẫu (glycerol 20%; Tris-Cl 0,1M pH 8; EDTA 0,01M pH 8; bromophenol blue 0,25%). Mẫu được hút và chuyển vào giếng điện di với điều kiện dòng điện một chiều có hiệu điện thế 100V, dòng 60 - 80mA, trong thời gian khoảng 30 phút;
-
Gel được nhuộm bằng ethidium bromide 10g/ml trong khoảng 10 phút
trên máy lắc, sau đó mẫu được rửa sạch; Kết quả được quan sát và chụp ảnh trên máy GEL - DOC.
2.2.3. Phương pháp khuếch đại 2 vùng siêu biến DNA HVS–I và
HVS–II bằng phản ứng PCR
Hai vùng siêu biến trên ty thể HVS–I và HVS–II được khuếch đại bằng phản ứng chuỗi polymerase (Polymerase Chain Reaction - PCR) sử dụng 2 cặp mồi đặc hiệu:
HVSI-F: 5’- CTC CAC CAT TAG CAC CCA AAG C -3’
HVSI-R: 5’- CCT GAA GTA GGA ACC AGA TG -3’
21
HVSII-F: 5’- GGT CTA TCA CCC TAT TAA CCA C -3’
HVSII-R: 5’- CTG TTA AAA GTG CAT ACC GCC A -3
Thành phần của phản ứng PCR bao gồm: 3µl buffer PCR 10X; 1,5 µl dNTP 2,5mM; 0,45 µl mồi xuôi và ngược (10pmol); 0,15 µl Taq polymerase; 6 µl tDNA (và H2O, tổng thể tích 30µl. Chu trình nhiệt của phản ứng: 95oC/5 phút, 95oC/30 giây, 58oC/30 giây, 72oC/30 giây, 72oC/5 phút (40 chu kì).
2.2.4. Phương pháp tinh sạch sản phẩm PCR
Sản phẩm PCR nhân 2 vùng gen được tinh sạch bằng kit GeneJET PCR Purification của Thermo Fisher nhằm loại bỏ mồi, dNTPs và các thành phần dư thừa khác. Các bước thực hiện bao gồm:
Bước 1: Chuyển toàn bộ thể tích sản phẩm PCR sang ống eppendorf
1,5 ml. Bổ sung Binding Buffer với tỉ lệ thể tích 1:1. Mix đều bằng pipet.
Chú thích: kiểm tra màu của dung dịch. Màu vàng biểu thị độ pH tối ưu cho DNA. Nếu màu của dung dịch là màu cam hoặc tím, thêm 10 µl dung dịch natri axetat 3 M, dung dịch pH 5,2 và mix đều.
Bước 2: Chuyển toàn bộ dung dịch thu được lên cột và ly tâm 10.000 vòng/phút trong 1phút ở nhiệt độ phòng. Đổ bỏ dịch trong ống thu sau ly tâm và đặt lại cột vào ống thu.
Bước 3: Bổ sung 700 µl dung dịch Wash buffer và ly tâm với tốc độ 10.000 vòng/phút trong thời gian 2 phút ở nhiệt độ phòng. Đổ bỏ dịch trong ống thu sau ly tâm và đặt lại cột vào ống thu.
Bước 4: Tiếp tục ly tâm 14.000 vòng/phút trong 1 phút để loại bỏ hết
buffer. Bỏ ống thu.
Bước 5: Chuyển cột sang ống eppendorf 1,5ml mới và bổ sung 10µl elution buffer vào trung tâm của màng cột, ủ 2 phút ở nhiệt độ phòng và ly tâm 10.000 vòng/phút trong 1 phút. Loại bỏ cột, thu dịch DNA ở ống eppendorf 1,5ml.
Điện di kiểm tra 2µl sản phẩm thu được trên gel agarose 1%.
2.2.5. Phương pháp giải trình tự DNA
22
Trình tự nucleotide quan tâm được xác định trên nguyên tắc của phương pháp Sanger: tạo ra các đoạn DNA một sợi hơn kém nhau một nucleotide, kết thúc bởi các ddNTP đã được đánh dấu huỳnh quang. Để tạo ra các đoạn kết thúc bằng các ddNTP khác nhau, các mẫu được tiến hành giải trình tự trên máy đọc trình tự tự động_ABI PRISM 3500 Avant Genetic Analyzer - sử dụng BigDye Terminator v3.1 Cycle Sequencing Kit đã có sẵn các hóa chất cần thiết của phản ứng nhân gen để xác định trình tự như dNTP, ddNTPs, DNA polymerase... Do đó, chỉ cần bổ sung thêm DNA khuôn (sản phẩm PCR) và mồi phù hợp. Phản ứng được thực hiện trong một ống vì 4 loại ddNTP đã được đánh dấu bằng các màu khác nhau.
Thành phần của phản ứng khuếch đại gen để đọc trình tự bao gồm: Mồi 1,6 pM, DNA plasmid 200 ng, BigDye và đệm tương ứng với tổng thể tích 10μl.
Chu trình nhiệt cho phản ứng PCR trong máy GenAmp® PCR System 9700 như sau: 96oC – 1 phút; (96oC – 10 giây; 50oC – 5 giây; 60oC – 4 phút) x 25 chu kỳ. Sau đó giữ sản phẩm ở 4oC.
Sản phẩm PCR được tinh sạch bằng phương pháp EtOH/EDTA. Sau đó, nguyên liệu được đưa vào máy đọc trình tự tự động ABI PRISM 3500 Avant Genetic Analyzer . Các ống được điện di trong ống vi mao quản 80 cm x 50 μl. Kết quả được thu nhận và xử lý bằng phần mềm 3500 Series Data Collection Software và DNA Sequencing Analysis.
2.2.6. Phương pháp xử lý số liệu thống kê và so sánh
Trình tự các đoạn gen mang các đa hình sau khi được xác định trên máy giải trình tự tự động ABI PRISM 3500 Avant Genetic Analyzer sẽ được kiểm tra, xử lý thô và so sánh với trình tự chuẩn rCRS bằng BioEdit nhằm xác định các đa hình ở 2 vùng siêu biến HVS-I và HVS-II ở 3 dân tộc. Đây là trình tự DNA ty thể chuẩn được sửa đổi từ trình tự gốc được công bố vào năm 1981 của Anderson.
Các đa hình xuất hiện với tần suất ít nhất 10% ở 1 trong 3 dân tộc sẽ được lựa chọn để thực hiện các phân tích thống kê nhằm đánh giá sự khác biệt di truyền. Các phân tích thống kê được thực hiên trên phần mềm SPSS bản
23
23.0 và phần mềm excel bản Office 2010, sử dụng kiểm định Fisher-exact (2 phía). Mức ý nghĩa được lấy với α = 0,05. Ngoài ra, trình tự vùng siêu biến của các cá thể cũng được sử dụng để ước tính khoảng cách di truyền bằng phần mềm MEGA X. Nhóm đơn bội của các cá thể được xác định bằng Haplogrep2 và PhyloTree Build 17.
24
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN
3.1. TÁCH CHIẾT DNA TỔNG SỐ TỪ CÁC MẪU MÁU
Sau khi tách chiết bằng kit, DNA tổng số từ 120 mẫu máu của 3 dân tộc Kinh, Cờ Lao và Phù Lá được điện di trên gel agarose 1% nhằm kiểm tra chất lượng. Kết quả điện di của tất cả các mẫu DNA đều cho một băng sáng, rõ nét và không xuất hiện smear (Hình 3.1, 3.2 và 3.3). Ngoàı ra, các mẫu đều được đo nồng độ bằng máy Nanodrop, thu được nồng độ trong khoảng từ 15-20 ng/µl. Như vậy, 120 mẫu DNA tổng số của 3 dân tộc đều đã được tách chiết tốt, đảm bảo đủ chất lượng và nồng độ để thực hiện các thí nghiệm tiếp theo.
Hình 3.1. Kết quả điện di DNA tổng số 51 mẫu dân tộc Kinh; K01 – K51: mẫu Kinh01 - Kinh51
Hình 3.2. Kết quả điện di DNA tổng số 34 mẫu dân tộc Cờ Lao; C01 - C34: mẫu Colao01 – Colao34
25
Hình 3.3. Kết quả điện di DNA tổng số 35 mẫu dân tộc Phù Lá; P01 - P35: mẫu Phula01 – Phula35
3.2. KHUẾCH ĐẠI 2 VÙNG SIÊU BIẾN HVS-I VÀ HVS-II BẰNG PHẢN ỨNG PCR
120 mẫu DNA tổng số sau đó được sử dụng làm khuôn mẫu cho phản ứng PCR khuếch đại 2 vùng siêu biến HVS-I và HVS- II trên ty thể. Sản phẩm PCR sau tổng hợp được điện di trên gel agarose 1% nhằm kiểm tra chất lượng. Kết quả điện di các mẫu đều cho các băng đặc hiệu, sắc nét với kích thước tương ứng với kích thước tính toán lý thuyết (Hình 3.4 và 3.5). Như vậy, sản phẩm PCR khuếch đại 2 vùng HVS- I và HVS- II của 120 mẫu dẫn tộc đều có chất lượng tốt và đã được nhân lên chính xác. Các sản phẩm này sau đó được tinh sạch bằng kit GeneJET PCR Purification (Thermo Fisher) và sử dụng trực tiếp cho phản ứng giải trình tự Sanger.
26
Hình 3.4. Kết quả PCR nhân vùng trình tự HVS-I ở 120 mẫu dân tộc Kinh, Cờ Lao và Phù Lá; M: Marker 1kb; C01-C34: 34 mẫu dân tộc Cờ Lao; K01- K51: 51 mẫu dân tộc Kinh 01; P01-P35: 35 mẫu dân tộc Phù Lá; ĐC: đối chứng âm
27
28
Hình 3.5. Kết quả PCR nhân vùng trình tự HVS-II ở 120 mẫu dân tộc Kinh, Cờ Lao và Phù Lá; M: Marker 1kb; K01-K51: 51 mẫu dân tộc Kinh 01; C01- C34: 34 mẫu dân tộc Cờ Lao; P01-P35: 35 mẫu dân tộc Phù Lá; ĐC: đối chứng âm
3.3. XÁC ĐỊNH CÁC ĐA HÌNH THUỘC HAI VÙNG SIÊU BIẾN HVS-I VÀ HVS-II TRÊN TY THỂ Ở CÁC MẪU NGHIÊN CỨU
Hai vùng siêu biến HVS-I, HVS-II của tất cả các mẫu được giải trình tự bằng phương pháp đọc trực tiếp từ mẫu PCR tinh sạch, sử dụng 2 mồi xuôi HVSI-F và HVSII-F. Kết quả đọc trình tự cho thấy tín hiệu rõ ràng, đẹp và không bị nhiễu (Hình 3.6).
61A
61C
B
A
29
103A
103G
D
C
150C
150T
E
F
Hình 3.6. Kết quả giải trình tự một số mẫu đại diện chứa một số đa hình trên đoạn HVS-II. A, C, E: Các đoạn trình tự của đoạn HVS-II giống với trình tự tham chiếu rCRS đọc từ sản phẩm PCR của các cá thể tương ứng CoLao05, Kinh23 và PhuLa01. B. D, F: Các đoạn trình tự của đoạn HVS-II khác với trình tự tham chiếu rCRS đọc từ sản phẩm PCR của các cá thể tương ứng CoLao06, Kinh24 và PhuLa02.
Các trình tự này được so sánh với trình tự ty thể chuẩn (rCRS trên
MITOMAP) nhằm xác định sự xuất hiện của các đa hình (Hình 3.7 và 3.8)
30
31
32
33
34
35
36
Hình 3.7. Kết quả so sánh trình tự vùng HVS-II với trình tự chuẩn rCRS của 120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá;
K01-K51: 51 mẫu dân tộc Kinh 01; C01-C34: 34 mẫu dân tộc Cờ Lao; P01- P35: 35 mẫu dân tộc Phù Lá (.): Nucleotide trùng với nucleotide trên trình tự chuẩn (-): nucleotide bị khuyết
37
38
39
40
41
42
43
44
Hình 3.8. Kết quả so sánh trình tự vùng HVS-I với trình tự chuẩn rCRS của 120 mẫu dân tộc tộc Kinh, Cờ Lao và Phù Lá;
K01-K51: 51 mẫu dân tộc Kinh 01; C01-C34: 34 mẫu dân tộc Cờ Lao; P01- P35: 35 mẫu dân tộc Phù Lá (.): Nucleotide trùng với nucleotide trên trình tự chuẩn (-): nucleotide bị khuyết
Kết quả đã phát hiện được tổng cộng 109 điểm đa hình (có trình tự khác với trình tự tham chiếu) ở 3 dân tộc, bao gồm 71 điểm nằm trên HVS-I và 39 điểm trên HVS-II (Bảng 3.1). Như vậy, trung bình cứ mỗi 5 nucleotide trên vùng HVS-I và 9 nucleotide trên HVS-II sẽ xuất hiện 1 điểm đa hình. Kết quả này cao hơn nhiều so với trung bình toàn bộ hệ gen (cứ mỗi 1000 nucleotide mới xuất hiện 1 SNP), cho thấy tốc độ đột biến rất cao ở 2 khu vực này, đặc biệt là vùng siêu biến HVS-I.
Hầu hết các đa hình được phát hiện (108/109) là các đa hình dạng thay thế nucleotide. Hơn 1 nửa trong số chúng là các đa hình dạng thay thế C>T và T>C. Chỉ có duy nhất 1 đa hình thêm nucleotide là -315T,C. Đa hình này được phát hiện với tần số rất cao (xấp xỉ 90%) ở cả 3 dân tộc. Ngoài ra còn có 2 đa hình khác cũng xuất hiện với tần số rất cao ở cả 3 dân tộc là A73G và A263G. Đáng chú ý, đa hình A73G xuất hiện với tần số 100% ở 3 dân tộc trong nghiên cứu. Đa hình này cũng xuất hiện với tần số 100% trong các nghiên cứu trước về hệ gen ty thể ở các tộc người ở Việt Nam như Mường, Thái, Tày, Mông và Mảng [5]. A73G cũng phổ biến ở một số quốc gia châu Á láng giềng như người Makrani ở Pakistan [37], người Quảng Tây ở Trung Quốc và người Thái Lan [38].
Bảng 3.1. Thống kê các đa hình xuất hiện ở 2 vùng trình tự HVS-I và HVS-II ở 120 mẫu nghiên cứu
45
STT
Kinh
Cờ Lao
Phù Lá
SNP
Tổng số
Số lượng
Tần số
Số lượng Tần số
Số lượng Tần số
0.00%
0
1
1 C61A
1
2.94%
0
0.00%
0.00%
0
1
2 G62A
1
2.94%
0
0.00%
0.00%
0
2
3 T63C
2
5.88%
0
0.00%
0.00%
0
4
4 C64T
3
8.82%
1
2.86%
0.00%
0
2
5 G66A
2
5.88%
0
0.00%
6 A73G
120
51
100.00%
34 100.00%
35 100.00%
0.00%
0
2
7 G94A
1
2.94%
1
2.86%
1.96%
1
1
8 G103A
0
0.00%
0
0.00%
1.96%
1
3
9 C114T
1
2.94%
1
2.86%
1.96%
1
1
10 T131C
0
0.00%
0
0.00%
1.96%
1
1
11 G143A
0
0.00%
0
0.00%
15.69%
8
14
12 T146C,A
4
11.76%
2
5.71%
14
27.45%
29
13 C150T
8
23.53%
7
20.00%
3.92%
2
2
14 C151T
0
0.00%
0
0.00%
9.80%
5
16
15 T152C
3
8.82%
8
22.86%
1.96%
1
1
16 A153G
0
0.00%
0
0.00%
0.00%
0
1
17 A183G
1
2.94%
0
0.00%
3.92%
2
3
18 G185A
0
0.00%
1
2.86%
3.92%
2
5
19 A189G
2
5.88%
1
2.86%
7.84%
4
7
20 T195C
2
5.88%
1
2.86%
21 T199C
18
10
19.61%
3
8.82%
5
14.29%
46
0.00%
0
0
0.00%
3
8.57%
22 A200G
3
9.80%
5
0
0.00%
4
11.43%
23 T204C
9
3.92%
2
1
2.94%
4
11.43%
24 G207A
7
9.80%
5
7
20.59%
1
2.86%
25 A210G
13
1.96%
1
2
5.88%
0
0.00%
26 A215G
3
1.96%
1
0
0.00%
0
0.00%
27 T226C
1
1.96%
1
0
0.00%
1
2.86%
28 A234G
2
0.00%
0
1
2.94%
6
17.14%
29 A235G
7
1.96%
1
0
0.00%
0
0.00%
30 A249G
1
0.00%
0
1
2.94%
0
0.00%
31 T252C
1
1.96%
1
0
0.00%
0
0.00%
32 G255A
1
33 A263G
118
50
98.04%
33
97.06%
35 100.00%
1
34 T279C
1
1.96%
0
0.00%
0
0.00%
112
35
-315T,C
48
94.12%
30
88.24%
34
97.14%
36 T316C
101
40
78.43%
30
88.24%
31
88.57%
1.96%
1
0
0.00%
0
0.00%
37 T324C
1
0.00%
0
1
2.94%
0
0.00%
38 A356C
1
0.00%
0
3
8.82%
0
0.00%
39 A16062G
3
1.96%
1
0
0.00%
0
0.00%
40 T16099C
1
1.96%
1
1
2.94%
13
37.14%
41 T16110C
15
5.88%
3
1
2.94%
1
2.86%
42 T16116C
5
13.73%
7
2
5.88%
2
5.71%
43 T16117C
11
3.92%
2
2
5.88%
1
2.86%
44 C16132T
5
47
1.96%
1
5.88%
2
0
0.00%
45 C16135T
3
0.00%
0
0.00%
0
2
5.71%
46 T16148C
2
47 G16153A
15
29.41%
17.65%
6
6
17.14%
27
5.88%
3
2.94%
1
0
0.00%
48 T16160C
4
17.65%
9
20.59%
7
3
8.57%
49 T16164C
19
1.96%
1
0.00%
0
0
0.00%
50 C16171T
1
1.96%
1
0.00%
0
1
2.86%
51 C16172T
2
1.96%
1
0.00%
0
0
0.00%
52 T16181C
1
1.96%
1
8.82%
3
1
2.86%
53 A16186G
5
1.96%
1
0.00%
0
0
0.00%
54 A16190G
1
0.00%
0
1
2.94%
10
28.57%
55 C16191T
11
6
5
2
5.71%
11.76%
14.71%
56 T16196C
13
1.96%
1
0.00%
0
0
0.00%
57 C16198T
1
3.92%
2
0.00%
0
0
0.00%
58 A16199G
2
0.00%
0
2.94%
1
0
0.00%
59 C16203T
1
0.00%
0
2.94%
1
0
0.00%
60 A16204C
1
0.00%
0
2.94%
1
0
0.00%
61 A16205C
1
9
6
0
0.00%
17.65%
17.65%
62 A16206C
15
5
14.29%
63 A16207C
24
47.06%
13
38.24%
42
2
5.71%
64 C16208A,T
0
0.00%
0
0.00%
2
9
25.71%
65 T16214C
29
56.86%
13
38.24%
51
2
0
0
0.00%
66 C16217T
3.92%
0.00%
2
0
0
67 A16229G
0.00%
0.00%
10
28.57%
10
48
1.96%
1
1
68 T16235C
0
0.00%
0
0.00%
0.00%
0
1
69 G16239A
1
2.94%
0
0.00%
70 T16243C
12
11.76%
11.76%
6
4
2
5.71%
3.92%
2
3
71 C16244T
1
2.94%
0
0.00%
0.00%
0
3
72 A16246C
3
8.82%
0
0.00%
73 C16249T
56
20
39.22%
19
55.88%
17
48.57%
3.92%
2
3
74 C16260T
0
0.00%
1
2.86%
0.00%
0
1
75 C16268T
1
2.94%
0
0.00%
3.92%
2
2
76 T16269C
0
0.00%
0
0.00%
3.92%
2
4
77 T16275C
0
0.00%
2
5.71%
0.00%
0
6
78 C16282T
6
17.65%
0
0.00%
0.00%
0
1
79 C16283A
1
2.94%
0
0.00%
1.96%
1
2
80 C16286T
0
0.00%
1
2.86%
9.80%
5
9
81 C16287T
4
11.76%
0
0.00%
0.00%
0
2
82 C16288T
1
2.94%
1
2.86%
1.96%
1
1
83 T16289C
0
0.00%
0
0.00%
9.80%
5
84 C16292A
13
7
20.59%
1
2.86%
1.96%
1
1
85 A16295G
0
0.00%
0
0.00%
3.92%
2
3
86 T16297C
0
0.00%
1
2.86%
1.96%
1
1
87 G16299A
0
0.00%
0
0.00%
1.96%
1
5
88 G16300A
2
5.88%
2
5.71%
3.92%
2
2
89 C16304T
0
0.00%
0
0.00%
0.00%
0
1
90 A16310G
0
0.00%
1
2.86%
49
1.96%
1
1
2.94%
6
17.14%
8
91 C16316T
0.00%
0
2
5.88%
0
0.00%
2
92 C16317T
0.00%
0
1
2.94%
1
2.86%
2
93 C16318T
1.96%
1
0
0.00%
0
0.00%
1
94 A16319T
1.96%
1
0
0.00%
0
0.00%
1
95 C16320T
5.88%
3
0
0.00%
0
0.00%
3
96 C16321T
1.96%
1
0
0.00%
0
0.00%
1
97 C16322T
11.76%
6
3
8.82%
4
11.43%
13
98 T16323C
9.80%
5
5
14.71%
4
11.43%
14
99 T16324C
3.92%
2
0
0.00%
0
0.00%
2
100 A16326G
3.92%
2
1
2.94%
0
0.00%
3
101 C16327T,G
3
102 T16330C
27
11
21.57%
8.82%
13
37.14%
3.92%
2
0
0.00%
0
0.00%
2
103 A16331G
0.00%
0
1
2.94%
0
0.00%
1
104 A16335G
7
4
13.73%
16
47.06%
11.43%
27
105 T16337C
0.00%
0
0
0.00%
10
28.57%
10
106 A16344G
0.00%
0
1
2.94%
6
17.14%
7
107 G16345A
7.84%
4
2
5.88%
2
5.71%
8
108 C16353T
1.96%
1
0
0.00%
2
5.71%
3
109 A16361G
Ngoài ra, kết quả xác định các đa hình cũng đã chỉ ra: dân tộc Kinh có tổng số các đa hình được phát hiện cao nhất trong 3 dân tộc với tổng cộng 78 điểm đa hình, bao gồm 51 đa hình HVS-I và 27 đa hình HVS-II. Trong số đó, có nhiều đa hình lần đầu tiên được phát hiện thấy khi so với các nghiên cứu trước đây, đặc biệt là 6 đa hình phổ biến (có tần số allele từ 0,1 trở lên), bao gồm: T152C (tần số allele f = 0,1); T199C (f = 0,2); T16140C (f = 0,18);
50
T16297C (f = 0,12); T16311C (f = 0,14) và T16362C (f = 0,14). Ở 2 dân tộc còn lại, số lượng đa hình được phát hiện ít hơn. Ở dân tộc Cờ Lao, chỉ có 65 điểm đa hình được phát hiện (41 đa hình HVS-I và 24 đa hình HVS-II). Trong khi đó, ở dân tộc Phù Lá, có 55 điểm đa hình, bao gồm 35 đa hình HVS-I và 24 đa hình HVS-II. Như vậy, có thể thấy trình tự 2 vùng siêu biến của dân tộc Kinh có tính đa hình cao hơn so với 2 dân tộc còn lại. Điều này có thể được giải thích do lịch sử phát triển lâu đời, dân số đông và sự phân bố rộng khắp của dân tộc Kinh. Do đó, có thể dẫn đến sự giao thoa di truyền và giải thích cho sự đa dạng di truyền cao ở dân tộc này. Tuy nhiên, số lượng đa hình trung bình trên mỗi mẫu ở cả 3 dân tộc hầu như không có sự khác biệt (Bảng 3.2).
Bảng 3.2. Số lượng các đa hình trung bình phát hiện được trong từng dân tộc
Dân tộc
Kinh
Cờ Lao
Phù Lá
51
34
35
Cỡ mẫu
Số đa hình phát hiện
9.4 ± 2.1
9.7 ± 2.3
9.5 ± 1.9
Số đa hình trên HVS-I
4.3 ± 1.9
4.6 ± 1.8
4.3 ± 1.2
Số đa hình trên HVS-II
5.1 ± 1.1
5.1 ± 1.2
5.2 ± 1.6
3.4. PHÂN TÍCH THỐNG KÊ SO SÁNH ĐA HÌNH VÀ TÍNH TOÁN KHOẢNG CÁCH DI TRUYỀN GIỮA 3 DÂN TỘC KINH, CỜ LAO VÀ PHÙ LÁ.
Sau khi xác định được các đa hình xuất hiện ở 2 vùng siêu biến, chúng tôi loại bỏ các đa hình có tần số quá thấp và tiếp tục phân tích những đa hình có tần số allele hiếm (minor allele frequency - MAF) ở ít nhất một nhóm trong ba nhóm cá thể lớn hơn hoặc bằng 0,1 (10%). Kết quả còn lại 34 đa hình, trong đó có 22 đa hình thuộc vùng HVS-I và 12 đa hình thuộc vùng HVS-II. Thông tin và tần số xuất hiện của các đa hình được lựa chọn phân tích trên từng nhóm cá thể thuộc tộc người Kinh, Cờ Lao và Phù Lá được liệt kê trong bảng 3.3.
51
Bảng 3.3. Tần suất các đa hình trình tự vùng siêu biến D-loop thuộc hệ gen ty thể ở ba nhóm cá thể thuộc các tộc người Kinh, Cờ Lao và Phù Lá
Tần số
STT
SNP
Vùng trình tự
Kinh
Cờ Lao
Phù Lá
1
A73G
HVS-II
100%
100%
100%
2
T146C,A
HVS-II
15.69%
11.76%
5.71%
3
C150T
HVS-II
27.45%
23.53%
20%
4
T152C
HVS-II
9.80%
8.82%
22.86%
5
T199C
HVS-II
19.61%
8.82%
14.29%
6
T204C
HVS-II
9.80%
0%
11.43%
7
G207A
HVS-II
3.92%
2.94%
11.43%
8
A210G
HVS-II
9.80%
20.59%
2.86%
9
A235G
HVS-II
0%
2.94%
17.14%
10
A263G
HVS-II
98.04%
97.06%
100%
11
-315T,C
HVS-II
94.12%
88.24%
97.14%
12
T316C
HVS-II
78.43%
88.24%
88.57%
13
T16110C
HVS-I
1.96%
2.94%
37.14%
14
T16117C
HVS-I
13.73%
5.88%
5.71%
15
G16153A
HVS-I
29.41%
17.65%
17.14%
16
T16164C
HVS-I
17.65%
20.59%
8.57%
17
C16191T
HVS-I
0%
2.94%
28.57%
18
T16196C
HVS-I
11.76%
14.71%
5.71%
19
A16206C
HVS-I
17.65%
17.65%
0%
52
20
A16207C
HVS-I
47.06%
38.24%
14.29%
21
T16214C
HVS-I
56.86%
38.24%
25.71%
22
A16229G
HVS-I
0%
0%
28.57%
23
T16243C
HVS-I
11.76%
11.76%
5.71%
24
C16249T
HVS-I
39.22%
55.88%
48.57%
25
C16282T
HVS-I
0%
17.65%
0%
26
C16287T
HVS-I
9.80%
11.76%
0%
27
C16292A
HVS-I
9.80%
20.59%
2.86%
28
C16316T
HVS-I
1.96%
2.94%
17.14%
29
T16323C
HVS-I
11.76%
8.82%
11.43%
30
T16324C
HVS-I
9.80%
14.71%
11.43%
31
T16330C
HVS-I
21.57%
8.82%
37.14%
32
T16337C
HVS-I
13.73%
47.06%
11.43%
33
A16344G
HVS-I
0%
28.57%
0%
34
G16345A
HVS-I
2.94%
17.14%
0%
Các đa hình này sẽ được phân tích thống kê, sử dụng kiểm định Fisher exact từng đôi một giữa các nhóm tộc người nhằm xác định liệu có sự phân bố khác nhau giữa các nhóm hay không. Kết quả thu được đã cho thấy: có 14 trong tổng số 34 đa hình có sự khác biệt có ý nghĩa thống kê giữa các nhóm với giá trị p<0,05. Hầu hết chúng nằm trên vùng siêu biến HVS-I, chỉ có duy nhất 2 đa hình A210G và A235G xuất hiện ở HVS-II (Bảng 3.4).
Bảng 3.4. Các đa hình có phân bố khác biệt ở các tộc người trong nghiên cứu
Đa hình Kinh – Cờ Lao* Kinh – Phù Lá* Cờ Lao – Phù Lá*
A210G
-
-
0.028
53
0.003
A235G
-
-
<0.001
T16110C
-
0.001
<0.001
C16191T
-
0.006
0.014
A16206C
-
0.011
0.003
A16207C
-
0.03
0.008
T16214C
-
-
<0.001
A16229G
-
0.001
-
C16282T
0.003
0.011
-
C16292A
-
0.028
0.031
C16316T
-
-
-
T16337C
0.001
0.001
<0.001
A16344G
-
0.001
0.003
G16345A
-
-
(*)Giá trị p được tính bằng kiểm định Fisher exact (2 phía) bằng phần
mềm SPSS version 23.
Kết quả cũng chỉ ra: trong 3 dân tộc, người Kinh và người Cờ Lao có nhiều sự tương đồng hơn. Chỉ có 2 đa hình C16282T và T16337C thể hiện sự khác biệt giữa 2 dân tộc này. Đáng chú ý, 2 đa hình này cũng có thể được xem là các đa hình đặc trưng cho người Cờ Lao (giá trị p thu được khi so sánh với 2 dân tộc còn lại đều <0,05). Cụ thể, trong khi đa hình C16282T chỉ xuất hiện ở người Cờ Lao với tần số 17.65% thì đa hình T16337C cũng xuất hiện với tần số cao hơn hẳn (47.06% ở người Cờ Lao so với 13.73% và 11.43% ở người Kinh và người Phù Lá).
So với 2 dân tộc Kinh và Cờ Lao, người Phù Lá ít thể hiện sự tương đồng nhất. Có đến 10 đa hình thể hiện sự khác biệt có ý nghĩa thống kê giữa người Phù Lá với người Kinh. Một số lượng tương ứng đa hình cũng thể hiện sự khác biệt giữa người Phù Lá và người Cờ Lao. Trong số chúng, có 6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G và A16344G có thể được xem là đặc trưng cho người Phù Lá. Đáng chú ý, có 2 điểm đa hình chỉ
54
xuất hiện ở tộc người Phù Lá mà không xuất hiện trên các cá thể thuộc hai tộc người còn lại là A16229G và A16344G.
Nhằm làm rõ thêm sự khác biệt giữa 3 dân tộc, chúng tôi đã tiến hành tính toán khoảng cách di truyền (giá trị d) giữa các cá thể thuộc 3 nhóm tộc người bằng phần mềm MEGA X. Kết quả tính toán được thể hiện ở bảng 3.5. Kết quả này một lần nữa xác nhận có sự khác biệt di truyền giữa dân tộc Phù Lá với 2 dân tộc còn lại với giá trị d = 0,014 lớn hơn so với khoảng cách di truyền giữa 2 dân tộc Kinh và Cờ Lao.
Bảng 3.5. Khoảng cách di truyền giữa các dân tộc trong nghiên cứu
Kinh
Cờ Lao
Phù Lá
Kinh
Cờ Lao
0.01
Phù Lá
0.014
0.014
Như vậy, ở nghiên cứu này chúng tôi đã xác định được các đặc điểm số lượng, tần suất và các dạng đa hình ở 3 dân tộc Kinh, Cờ Lao và Phù Lá. Dân tộc Kinh được xem là có tính đa hình cao nhất trong số 3 dân tộc. Ngoài ra, dựa trên các phân tích thống kê cũng như tính toán khoảng cách di truyền, 2 dân tộc Kinh và Cờ Lao được xem là có sự tương đồng lớn hơn trong khi dân tộc Phù Lá lại có sự tương đồng ít hơn đối với 2 dân tộc này. Đặc biệt, chúng tôi cũng đã xác định được một số các đa hình đặc trưng cho các dân tộc, bao gồm 2 đa hình C16282T và T16337C đặc trưng cho người Cờ Lao và 6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G và A16344G đặc trưng cho người Phù Lá.
Việc xác định và làm rõ được các đặc điểm đa hình 2 vùng siêu biến HVS-I, HVS-II trên ty thể ở 120 mẫu dân tộc Kinh, Cờ Lao và Phù Lá sẽ là những cơ sơ dữ liệu ban đầu để chúng tôi có thể tiếp tục nghiên cứu sâu hơn về lịch sử di truyền và nguồn gốc tiến hóa của các tộc người Việt Nam.
55
KẾT LUẬN
Trong nghiên cứu này, chúng tôi đã tiến hành nghiên cứu đặc điểm đa hình nucleotide đơn trên 2 vùng siêu biến HVS-I và HVS-II ở 3 dân tộc cư trú tại phía Bắc Việt Nam là Kinh, Cờ Lao và Phù Lá. Nghiên cứu đã thu được các kết quả như sau:
1. Đã tách chiết được 120 mẫu DNA tổng số có chất lượng tốt từ 120 mẫu máu thuộc 3 dân tộc trong nghiên cứu.
2. Đã khuếch đại thành công 2 vùng siêu biến HVS-I và HVS-II trên ty thể của 120 mẫu thuộc 3 dân tộc bằng phương pháp PCR. Tất cả các sản phẩm PCR được tinh sạch bằng kit và sử dụng trực tiếp cho phản ứng giải trình tự Sanger.
3. Đã giải trình tự thành công 2 vùng siêu biến HVS-I và HVS-II của 120 mẫu dân tộc. Xác định được số lượng, thành phần và tần suất các đa hình nằm trên 2 vùng siêu biến của 3 dân tộc.
- Dân tộc Kinh có tính đa hình cao nhất với tổng cộng 78 điểm đa hình được xác định, bao gồm 51 đa hình HVS-I và 27 đa hình HVS-II
- Dân tộc Cờ Lao có 65 điểm đa hình: 41 đa hình HVS-I và 24 đa hình HVS-II).
- Dân tộc Phù Lá có 55 điểm đa hình: 35 đa hình HVS-I và 24 đa hình HVS-II.
4. Dựa trên phân tích thống kê các đa hình và tính toán khoảng cách di truyền, xác định được giữa 2 dân tộc Kinh và Cờ Lao có sự tương đồng lớn hơn trong khi dân tộc Phù Lá thể hiện sự tương đồng ít hơn đối với 2 dân tộc này.
Xác định được 2 đa hình C16282T và T16337C đặc trưng cho dân tộc Cờ Lao và 6 đa hình T16110C, C16191T, C16191T, A16207C, A16229G, A16344G đặc trưng cho người Phù Lá.
56
KIẾN NGHỊ
Thực hiện thêm các nghiên cứu với số lượng và cỡ mẫu lớn hơn về đa hình hệ gen ty thể nhằm làm rõ lịch sử di truyền cũng như mối quan hệ giữa các dân tộc Việt.
57
TÀI LIỆU THAM KHẢO
1. Kim, J., J.M. Basak, and D.M. Holtzman., The role of apolipoprotein E in Alzheimer's disease. Neuron, 2009. 63(3): p. 287-303.
2. Tổng điều tra dân số và nhà ở Việt Nam - Kết quả toàn bộ. Tổng điều tra dân số và nhà ở Việt Nam, 2009: p. 3-5.
3. Trần Thị Thúy Hằng., Đa hình thái đơn nucleotid vùng gen ty thể HV1 và HV2 trên người tộc người Kinh và tộc người Mường của Việt Nam. Tạp chí Nghiên cứu y học, 2017. 106: p. 33-40.
4. Nguyễn Đăng Tôn, Vũ Hải Chi, Trần Thị Ngọc Diệp, Địch Thị Kim Hương, Bùi Thị Tuyết, Nguyễn Hải Hà, Huỳnh Thị Thu Huệ, Trần Thị Phương Liên, Phan Văn Chi, Nông Văn Hải., Đa hình đơn bội ADN ty thể của các cá thể người Việt Nam. Tạp chí Công nghệ sinh học, 2008. 6(4): p. 579-590.
5. Nguyễn Thy Ngọc, Nguyễn Quang Huy, Nguyễn Đăng Tôn, Nguyễn Thùy Dương., Đa hình vùng D-loop hệ gen ty thể của các cá thể tộc người Kinh và Mảng cùng trong nhóm ngữ hệ Nam Á. Tạp chí Công nghệ sinh học, 2018. 16(2): p. 231-240.
6. Karki, R., et al., Defining "mutation" and "polymorphism" in the era of personal genomics. BMC medical genomics, 2015. 8: p. 37-37.
7. What are single nucleotide polymorphisms (SNPs)? U.S National Library of Medicine 2020.
8. Barreiro, L.B., et al., Natural selection has driven population differentiation in modern humans. Nature genetics, 2008. 40(3): p. 340.
9. Stenson, P.D., et al., The Human Gene Mutation Database: providing a comprehensive central mutation database for molecular diagnostics and personalised genomics. 2009, Springer.
58
10. Salisbury, B.A., et al., SNP and haplotype variation in the human genome. Mutation Research/Fundamental and Molecular Mechanisms of Mutagenesis, 2003. 526(1-2): p. 53-61.
11. Collins, F.S., L.D. Brooks, and A. Chakravarti, A DNA polymorphism discovery resource for research on human genetic variation. Genome Res, 1998. 8(12): p. 1229-31.
12. McPherson, J.D., et al., A physical map of the human genome. Nature, 2001. 409(6822): p. 934-941.
13. Venter, J.C., et al., The sequence of the human genome. science, 2001. 291(5507): p. 1304-1351.
14. Bekris, L.M., et al., Multiple SNPs within and surrounding the apolipoprotein E gene influence cerebrospinal fluid apolipoprotein E protein levels. Journal of Alzheimer's disease, 2008. 13(3): p. 255-266.
15. Hirst, J., Why does mitochondrial complex I have so many subunits? Biochemical Journal, 2011. 437(2): p. e1-e3.
16. Smith, P.M., J.L. Fox, and D.R. Winge, Reprint of: Biogenesis of the cytochrome bc1 complex and role of assembly factors. Biochimica et Biophysica Acta (BBA)-Bioenergetics, 2012. 1817(6): p. 872-882.
17. Giles, R.E., et al., Maternal inheritance of human mitochondrial DNA. Proc Natl Acad Sci U S A, 1980. 77(11): p. 6715-9.
18. Brown, W.M., et al., Mitochondrial DNA sequences of primates: tempo and mode of evolution. Journal of molecular evolution, 1982. 18(4): p. 225- 239.
19. Robin, E.D. and R. Wong, Mitochondrial DNA molecules and virtual number of mitochondria per cell in mammalian cells. Journal of cellular physiology, 1988. 136(3): p. 507-513.
20. Pakendorf, B. and M. Stoneking, mitochondrial DNA and human evolution. Annual Review of Genomics and Human Genetics, 2005. 6(1): p. 165-183.
59
21. Howell, N., C. Howell, and J. Elson, Time dependency of molecular rate estimates for mtDNA: this is not the time for wishful thinking. Heredity, 2008. 101(2): p. 107-108.
22. Chen, M.-H., H.-M. Lee, and C.-Y. Tzen, Polymorphism and heteroplasmy of mitochondrial DNA in the D-loop region in Taiwanese. Journal-Formosan Medical Association, 2002. 101(4): p. 268-276.
the origin of replication
23. Greenberg, B.D., J.E. Newbold, and A. Sugino, Intraspecific nucleotide sequence variability surrounding in human mitochondrial DNA. Gene, 1983. 21(1-2): p. 33-49.
24. www.mitomap.org.
25. Li, H. and R. Durbin, Inference of human population history from individual whole-genome sequences. Nature, 2011. 475(7357): p. 493-496.
26. Kutanan, W., et al., Complete mitochondrial genomes of Thai and Lao populations indicate an ancient origin of Austroasiatic groups and demic diffusion in the spread of Tai–Kadai languages. Human genetics, 2017. 136(1): p. 85-98.
27. Torroni, A., et al., Harvesting the fruit of the human mtDNA tree. Trens in Genetics, 2006. 22(6): p. 339-345.
28. Lippold, S., et al., Human paternal and maternal demographic histories: insights from high-resolution Y chromosome and mtDNA sequences. Investigative genetics, 2014. 5(1): p. 13.
29. Stewart, J.B. and P.F. Chinnery, The dynamics of mitochondrial DNA heteroplasmy: implications for human health and disease. Nature Reviews Genetics, 2015. 16(9): p. 530-542.
30. Stoneking, M. and F. Delfin, The human genetic history of East Asia: weaving a complex tapestry. Current Biology, 2010. 20(4): p. R188-R193.
31. Ivanova, R., et al., Mitochondrial DNA polymorphism in the Vietnamese population. European journal of immunogenetics, 1999. 26(6): p. 417-422.
60
32. Oota, H., et al., Extreme mtDNA homogeneity in continental Asian populations. American Journal of Physical Anthropology: The Official Publication of the American Association of Physical Anthropologists, 2002. 118(2): p. 146-153.
33. Huỳnh Thị Thu Huệ, Nguyễn Đăng Tôn, Lê Thị Thu Hiền, Nông Văn Hải., Phân tích trình tự vùng điều khiển (D-loop) trên genome ty thể của 5 cá thể người Việt Nam. Tạp chí Công nghệ sinh học, 2005. 3(1): p. 15-22.
34. Đỗ Mạnh Hưng, Phạm Nhật Khôi, Vũ Phương Nhung, Nguyễn Văn Phòng, Nguyễn Thùy Dương, Nông Văn Hải, Nguyễn Đăng Tôn., Sự đa dạng di truyền vùng HV2 hệ gen ty thể của một số nhóm người Việt. Tạp chí Công nghệ sinh học, 2016. 38(2): p. 243-249.
35. Pischedda, S., et al., Phylogeographic and genome-wide investigations of Vietnam ethnic groups reveal signatures of complex historical demographic movements. Scientific reports, 2017. 7(1): p. 1-15.
36. Duong, N.T., et al., Complete human mtDNA genome sequences from Vietnam and the phylogeography of Mainland Southeast Asia. Scientific reports, 2018. 8(1): p. 1-13.
37. Siddiqi, M.H., et al., Genetic characterization of the Makrani people of Pakistan from mitochondrial DNA control-region data. Legal Medicine, 2015. 17(2): p. 134-139.
38. Yang, X., et al., Mitochondrial DNA polymorphisms are associated with the longevity in the Guangxi Bama population of China. Molecular biology reports, 2012. 39(9): p. 9123-9131.
61
DANH MỤC PHỤ LỤC
Trang
...…63
1. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh và Cờ Lao
……77
2. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh và Phù Lá
……88
3. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Cờ Lao và Phù Lá
62
PHỤ LỤC
1. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh và Cờ Lao
Case Processing Summary
Valid Total Cases Missing N Percent N Percent N Percent
POPULATION * A73G POPULATION * T146C,A POPULATION * C150T POPULATION * T152C POPULATION * T199C POPULATION * T204C POPULATION * G207A POPULATION * A210G POPULATION * A235G POPULATION * A263G POPULATION * -315T,C POPULATION * T316C POPULATION * T16110C POPULATION * T16117C POPULATION * G16153A POPULATION * T16164C POPULATION * C16191T POPULATION * T16196C POPULATION * A16206C POPULATION * A16207C POPULATION * T16214C POPULATION * A16229G POPULATION * T16243C POPULATION * C16249T POPULATION * C16282T POPULATION * C16287T POPULATION * C16292A POPULATION * C16316T POPULATION * T16323C POPULATION * T16324C 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 85 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Case Processing Summary
Cases Missing Total Valid N Percent N Percent N Percent
0 0 0 85 85 85 100.0% 100.0% 100.0% 0.0% 0.0% 0.0% 85 85 85 100.0% 100.0% 100.0%
POPULATION * T16337C POPULATION * A16344G POPULATION * G16345A POPULATION * A73G Crosstab Total A73G 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0 34 34.0 51 51.0 85 85.0 Chi-Square Tests Value
63
Pearson Chi-Square N of Valid Cases .a 85
a. No statistics are computed because A73G is a constant. POPULATION * T146C,A Crosstab Total T146C,A 1 2 0
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 30 30.0 45 45.0 75 75.0 4 3.2 4 4.8 8 8.0 34 34.0 51 51.0 85 85.0 0 .8 2 1.2 2 2.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .435 .306 .535 .478 .535 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test N of Valid Cases 1.667a 2.370 1.370 85
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .80. POPULATION * C150T
Crosstab C150T Total 0 1
CO LAO POPULATION KINH
Total 34 34.0 51 51.0 85 85.0 Count Expected Count Count Expected Count Count Expected Count 8 8.8 14 13.2 22 22.0
26 25.2 37 37.8 63 63.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .802 .443
85
.164a .023 .165 1 1 1 .686 .879 .685 .802 .802 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .443 .443 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 8.80. b. Computed only for a 2x2 table POPULATION * T152C
Crosstab T152C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 3 3.2 5 4.8 8 8.0 34 34.0 51 51.0 85 85.0 31 30.8 46 46.2 77 77.0 Chi-Square Tests
64
Value df Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .597
85
.023a .000 .023 .879 1.000 .879 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .597 .597 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.20. b. Computed only for a 2x2 table POPULATION * T199C
Crosstab T199C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 3 5.2 10 7.8 13 13.0 34 34.0 51 51.0 85 85.0
31 28.8 41 43.2 72 72.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .227 .148
85
1 1 1 1.831a 1.094 1.947 .176 .296 .163 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .227 .227 .148 .148 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 5.20. b. Computed only for a 2x2 table POPULATION * T204C
Crosstab T204C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 0 2.0 5 3.0 5 5.0 34 34.0 51 51.0 85 85.0
34 32.0 46 48.0 80 80.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .152 .072
85
1 1 1 3.542a 1.992 5.315 .060 .158 .021 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .080 .080 .072 .072 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.00. b. Computed only for a 2x2 table POPULATION * G207A
Crosstab G207A Total
65
0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 1 1.2 2 1.8 3 3.0 34 34.0 51 51.0 85 85.0
33 32.8 49 49.2 82 82.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .650
85
.058a .000 .059 .810 1.000 .808 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .650 .650 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 1.20. b. Computed only for a 2x2 table POPULATION * A210G Crosstab A210G Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 7 4.8 5 7.2 12 12.0 34 34.0 51 51.0 85 85.0
27 29.2 46 43.8 73 73.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .208 .140
85
1.957a 1.168 1.914 .162 .280 .166 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .208 .208 .140 .140 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.80. b. Computed only for a 2x2 table POPULATION * A235G Crosstab A235G Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 1 .4 0 .6 1 1.0 34 34.0 51 51.0 85 85.0
33 33.6 51 50.4 84 84.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .400 .400
85
1.518a .042 1.850 .218 .837 .174 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .400 .400 .400 .400 N of Valid Cases a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .40.
66
b. Computed only for a 2x2 table POPULATION * A263G Crosstab A263G Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 33 33.2 50 49.8 83 83.0 34 34.0 51 51.0 85 85.0
1 .8 1 1.2 2 2.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .643
85
.085a .000 .084 1 1 1 .770 1.000 .772 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .643 .643 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .80. b. Computed only for a 2x2 table POPULATION * -315T,C Crosstab Total 0 -315T,C 1 2
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 4 4.0 6 6.0 10 10.0 30 28.8 42 43.2 72 72.0 34 34.0 51 51.0 85 85.0 0 1.2 3 1.8 3 3.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .353 .207 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .394 .330 .491 N of Valid Cases 2.083a 3.148 1.705 85
a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is 1.20. POPULATION * T316C Crosstab T316C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 30 28.0 40 42.0 70 70.0 34 34.0 51 51.0 85 85.0
4 6.0 11 9.0 15 15.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .384 .193
1.349a .759 1.407 1 1 1 .245 .384 .235 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .267 .384 .193 .193
67
N of Valid Cases 85
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 6.00. b. Computed only for a 2x2 table POPULATION * T16110C Crosstab T16110C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0 1 .8 1 1.2 2 2.0
33 33.2 50 49.8 83 83.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .643
85
.085a .000 .084 .770 1.000 .772 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .643 .643 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .80. b. Computed only for a 2x2 table POPULATION * T16117C Crosstab T16117C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0 2 3.6 7 5.4 9 9.0
32 30.4 44 45.6 76 76.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .305 .218
85
1.326a .627 1.422 .250 .429 .233 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .305 .305 .218 .218 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 3.60. b. Computed only for a 2x2 table POPULATION * G16153A Crosstab G16153A Total 0 1
CO LAO POPULATION KINH
Total 6 8.4 15 12.6 21 21.0 34 34.0 51 51.0 85 85.0 Count Expected Count Count Expected Count Count Expected Count
28 25.6 36 38.4 64 64.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided)
68
.306 .165
85
1.518a .951 1.564 .218 .329 .211 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .306 .306 .165 .165 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 8.40. b. Computed only for a 2x2 table POPULATION * T16164C Crosstab T16164C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 7 6.4 9 9.6 16 16.0 34 34.0 51 51.0 85 85.0
27 27.6 42 41.4 69 69.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .782 .473
85
.115a .003 .115 .734 .955 .735 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .782 .782 .473 .473 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 6.40. b. Computed only for a 2x2 table POPULATION * C16191T
Crosstab C16191T Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 1 .4 0 .6 1 1.0 34 34.0 51 51.0 85 85.0
33 33.6 51 50.4 84 84.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .400 .400
85
.218 .837 .174 1.518a .042 1.850 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .400 .400 .400 .400 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .40. b. Computed only for a 2x2 table POPULATION * T16196C Crosstab T16196C Total 0 1
CO LAO POPULATION KINH Count Expected Count Count Expected Count 29 29.6 45 44.4 5 4.4 6 6.6 34 34.0 51 51.0
69
Total Count Expected Count 11 11.0 85 85.0
74 74.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .748 .467
85
1 1 1 .157a .004 .155 .692 .947 .694 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .748 .748 .467 .467 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.40. b. Computed only for a 2x2 table POPULATION * A16206C Crosstab A16206C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 6 6.0 9 9.0 15 15.0 34 34.0 51 51.0 85 85.0
28 28.0 42 42.0 70 70.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .609
85
1 1 1 .000a .000 .000 1.000 1.000 1.000 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .609 .609 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 6.00. b. Computed only for a 2x2 table POPULATION * A16207C
Crosstab A16207C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 13 14.8 24 22.2 37 37.0 34 34.0 51 51.0 85 85.0
21 19.2 27 28.8 48 48.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .505 .281
85
1 1 1 .646a .337 .649 .422 .562 .420 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .505 .505 .281 .281 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 14.80. b. Computed only for a 2x2 table POPULATION * T16214C Crosstab T16214C Total
70
0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 13 16.8 29 25.2 42 42.0 34 34.0 51 51.0 85 85.0
21 17.2 22 25.8 43 43.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .122 .072
85
2.832a 2.136 2.852 1 1 1 .092 .144 .091 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .122 .122 .072 .072 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 16.80. b. Computed only for a 2x2 table POPULATION * A16229G Crosstab Total A16229G 0
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0 34 34.0 51 51.0 85 85.0 Chi-Square Tests Value
.a 85
Pearson Chi-Square N of Valid Cases a. No statistics are computed because A16229G is a constant. POPULATION * T16243C Crosstab T16243C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 4 4.0 6 6.0 10 10.0 34 34.0 51 51.0 85 85.0
30 30.0 45 45.0 75 75.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .627
85
.000a .000 .000 1 1 1 1.000 1.000 1.000 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .627 .627 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.00. b. Computed only for a 2x2 table POPULATION * C16249T Crosstab
71
C16249T Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 19 15.6 20 23.4 39 39.0 34 34.0 51 51.0 85 85.0
15 18.4 31 27.6 46 46.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .183 .099
85
1 1 1 2.282a 1.660 2.286 .131 .198 .131 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .183 .183 .099 .099 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 15.60. b. Computed only for a 2x2 table POPULATION * C16282T Crosstab C16282T Total 0 1
CO LAO POPULATION KINH
Total 6 2.4 0 3.6 6 6.0 Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0
28 31.6 51 47.4 79 79.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .003 .003
85
1 1 1 .002 .007 .001 9.684a 7.180 11.689 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .003 .003 .003 .003
N of Valid Cases a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.40. b. Computed only for a 2x2 table POPULATION * C16287T Crosstab C16287T Total 0 1
CO LAO POPULATION KINH
Total 4 3.6 5 5.4 9 9.0 Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0
30 30.4 46 45.6 76 76.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .521
.083a .000 .082 1 1 1 .773 1.000 .775 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .521 .521
72
N of Valid Cases 85
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 3.60. b. Computed only for a 2x2 table POPULATION * C16292A Crosstab C16292A Total 0 1
CO LAO POPULATION KINH
Total 7 4.8 5 7.2 12 12.0 Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0
27 29.2 46 43.8 73 73.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .208 .140
85
1.957a 1.168 1.914 1 1 1 .162 .280 .166 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .208 .208 .140 .140 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.80. b. Computed only for a 2x2 table POPULATION * C16316T Crosstab C16316T Total 0 1
CO LAO POPULATION KINH
Total 1 .8 1 1.2 2 2.0 Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 85 85.0
33 33.2 50 49.8 83 83.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .643
.085a .000 .084 1 1 1 .770 1.000 .772 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .643 .643 N of Valid Cases
85 a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .80. b. Computed only for a 2x2 table POPULATION * T16323C
Crosstab T16323C Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 3 3.6 6 5.4 9 9.0 34 34.0 51 51.0 85 85.0
31 30.4 45 45.6 76 76.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided)
73
.735 .479
85
1 1 1 .666 .943 .663 .186a .005 .190 .735 .735 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .479 .479 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 3.60. b. Computed only for a 2x2 table POPULATION * T16324C Crosstab T16324C Total 0 1
CO LAO POPULATION KINH
Total 34 34.0 51 51.0 85 85.0 5 4.0 5 6.0 10 10.0 Count Expected Count Count Expected Count Count Expected Count
29 30.0 46 45.0 75 75.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .733 .360
85
1 1 1 .492 .731 .496 .472a .118 .464 .733 .512 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .360 .360 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.00. b. Computed only for a 2x2 table POPULATION * T16337C Crosstab T16337C Total 0 1
CO LAO POPULATION KINH
Total 34 34.0 51 51.0 85 85.0 16 9.2 7 13.8 23 23.0 Count Expected Count Count Expected Count Count Expected Count
18 24.8 44 37.2 62 62.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .001 .001
11.484a 9.858 11.442 1 1 1 .001 .002 .001 .001 .001 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .001 .001 N of Valid Cases
85 a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 9.20. b. Computed only for a 2x2 table POPULATION * A16344G
Crosstab Total A16344G 0
CO LAO POPULATION KINH
Count Expected Count Count Expected Count Count Total 34 34.0 51 51.0 85 34 34.0 51 51.0 85
74
Expected Count 85.0 85.0 Chi-Square Tests Value
.a 85
Pearson Chi-Square N of Valid Cases a. No statistics are computed because A16344G is a constant. POPULATION * G16345A Crosstab G16345A Total 0 1
CO LAO POPULATION KINH
Total Count Expected Count Count Expected Count Count Expected Count 1 .4 0 .6 1 1.0 34 34.0 51 51.0 85 85.0
33 33.6 51 50.4 84 84.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .400 .400
85 a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .40. b. Computed only for a 2x2 table
1.518a .042 1.850 1 1 1 .218 .837 .174 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .400 .400 .400 .400 N of Valid Cases
75
2. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc Kinh và Phù Lá
Case Processing Summary
Valid Total Cases Missing N Percent N Percent N Percent
86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% POPULATION * A73G POPULATION * T146C,A POPULATION * C150T POPULATION * T152C POPULATION * T199C POPULATION * T204C POPULATION * G207A POPULATION * A210G POPULATION * A235G POPULATION * A263G POPULATION * -315T,C POPULATION * T316C POPULATION * T16110C POPULATION * T16117C POPULATION * G16153A POPULATION * T16164C POPULATION * C16191T POPULATION * T16196C POPULATION * A16206C POPULATION * A16207C POPULATION * T16214C POPULATION * A16229G POPULATION * T16243C POPULATION * C16249T POPULATION * C16282T POPULATION * C16287T POPULATION * C16292A POPULATION * C16316T POPULATION * T16323C POPULATION * T16324C 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Case Processing Summary
Cases Missing Total Valid N Percent N Percent N Percent
0 0 0 86 86 86 100.0% 100.0% 100.0% 0.0% 0.0% 0.0% 86 86 86 100.0% 100.0% 100.0%
POPULATION * T16337C POPULATION * A16344G POPULATION * G16345A POPULATION * A73G Crosstab Total A73G 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 1 1.0 86 86.0 34 34.0 51 51.0 1 1.0 86 86.0 Chi-Square Tests Value
76
.a 86
Pearson Chi-Square N of Valid Cases a. No statistics are computed because A73G is a constant. POPULATION * T146C,A Crosstab Total T146C,A 1 2 0
POPULATION KINH
PHULA
Total 34 34.0 51 51.0 1 1.0 86 86.0 Count Expected Count Count Expected Count Count Expected Count Count Expected Count 32 30.8 45 46.3 1 .9 78 78.0 2 2.4 4 3.6 0 .1 6 6.0 0 .8 2 1.2 0 .0 2 2.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
4 4 .801 .657 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .733 .593 .733 N of Valid Cases 1.643a 2.431 4.249 86
a. 7 cells (77.8%) have expected count less than 5. The minimum expected count is .02. POPULATION * C150T
Crosstab C150T Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 27 25.7 37 38.5 1 .8 65 65.0 7 8.3 14 12.5 0 .2 21 21.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .655 .580 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .705 .705 .705 N of Valid Cases .847a 1.088 .925 86
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .24. POPULATION * T152C
Crosstab T152C Total 0 1
POPULATION KINH
Count Expected Count Count Expected Count Count PHULA 26 28.9 46 43.3 1 8 5.1 5 7.7 0 34 34.0 51 51.0 1
77
Total .8 73 73.0 .2 13 13.0 Expected Count Count Expected Count 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .204 .198 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .256 .256 .256 N of Valid Cases 3.175a 3.235 3.459 86
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .15. POPULATION * T204C Crosstab T204C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 4 3.6 5 5.3 0 .1 9 9.0 30 30.4 46 45.7 1 .9 77 77.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .904 .859 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test 1.000 1.000 1.000 N of Valid Cases .202a .305 .936 86
a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is .10. POPULATION * G207A Crosstab G207A Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 4 2.4 2 3.6 0 .1 6 6.0 30 31.6 49 47.4 1 .9 80 80.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .366 .365 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .267 .267 .267 N of Valid Cases 2.009a 2.017 2.937 86
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .07. POPULATION * A210G Crosstab A210G Total 0 1 POPULATION Count 33 1 34
78
KINH
PHULA
Total Expected Count Count Expected Count Count Expected Count Count Expected Count 31.6 46 47.4 1 .9 80 80.0 2.4 5 3.6 0 .1 6 6.0 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
.459 .410 2 2 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .437 .437 .437 N of Valid Cases 1.556a 1.783 2.336 86
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .07. POPULATION * A235G Crosstab A235G Total 0 1
POPULATION KINH
PHULA
Total 28 31.6 51 47.4 1 .9 80 80.0 6 2.4 0 3.6 0 .1 6 6.0 Count Expected Count Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
.007 .003 2 2 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .073 .003 .003 N of Valid Cases 9.865a 11.834 10.504 86
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .07. POPULATION * A263G Crosstab A263G Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 0 .4 1 .6 0 .0 1 1.0 34 33.6 50 50.4 1 1.0 85 85.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .707 .591 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test 1.000 1.000 1.000 N of Valid Cases .694a 1.053 3.298 86
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .01. POPULATION * -315T,C
79
Crosstab Total 0 -315T,C 1 2
POPULATION KINH
PHULA
Total 34 34.0 51 51.0 1 1.0 86 86.0 Count Expected Count Count Expected Count Count Expected Count Count Expected Count 2 3.2 6 4.7 0 .1 8 8.0 31 29.3 42 43.9 1 .9 74 74.0 1 1.6 3 2.4 0 .0 4 4.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
4 4 .829 .794 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .611 .611 .611 N of Valid Cases 1.487a 1.683 3.434 86
a. 7 cells (77.8%) have expected count less than 5. The minimum expected count is .05. POPULATION * T316C Crosstab T316C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 4 5.9 11 8.9 0 .2 15 15.0 30 28.1 40 42.1 1 .8 71 71.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .455 .408 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .492 .395 .492 N of Valid Cases 1.575a 1.793 1.774 86
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .17. POPULATION * T16110C Crosstab T16110C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 21 28.5 50 42.7 1 .8 72 72.0 13 5.5 1 8.3 0 .2 14 14.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Pearson Chi-Square 19.892a 2 .000 .000
80
2 .000 Likelihood Ratio Fisher's Exact Test .000 .000 N of Valid Cases 21.336 20.248 86
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .16. POPULATION * T16117C Crosstab T16117C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 32 30.4 44 45.7 1 .9 77 77.0 2 3.6 7 5.3 0 .1 9 9.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .483 .440 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .378 .378 .378 N of Valid Cases 1.458a 1.644 1.970 86
a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is .10. POPULATION * G16153A Crosstab G16153A Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 28 25.7 36 38.5 1 .8 65 65.0 6 8.3 15 12.5 0 .2 21 21.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .395 .345 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .475 .475 .475 N of Valid Cases 1.857a 2.128 1.892 86
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .24. POPULATION * T16164C Crosstab T16164C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 31 29.3 42 43.9 1 .9 74 74.0 3 4.7 9 7.1 0 .1 12 12.0 34 34.0 51 51.0 1 1.0 86 86.0
81
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .475 .431 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .438 .438 .438 N of Valid Cases 1.487a 1.683 1.816 86
a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is .14. POPULATION * C16191T Crosstab C16191T Total 0 1
POPULATION KINH
PHULA
Total 10 4.0 0 5.9 0 .1 10 10.0 24 30.0 51 45.1 1 .9 76 76.0 34 34.0 51 51.0 1 1.0 86 86.0 Count Expected Count Count Expected Count Count Expected Count Count Expected Count
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
.000 .000 2 2 .000 .000 .000 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test N of Valid Cases 17.307a 20.630 18.279 86
a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is .12. POPULATION * T16196C Crosstab T16196C Total 0 1
POPULATION KINH
PHULA
Total 2 3.2 6 4.7 0 .1 8 8.0 32 30.8 45 46.3 1 .9 78 78.0 34 34.0 51 51.0 1 1.0 86 86.0 Count Expected Count Count Expected Count Count Expected Count Count Expected Count
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
.625 .585 2 2 .517 .517 .517 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test N of Valid Cases .940a 1.072 1.583 86
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .09. POPULATION * A16206C Crosstab A16206C Total 0 1
POPULATION KINH Count Expected Count Count Expected Count 34 30.4 42 45.7 0 3.6 9 5.3 34 34.0 51 51.0
82
PHULA
Total Count Expected Count Count Expected Count 1 .9 77 77.0 0 .1 9 9.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .032 .006 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .113 .011 .014 N of Valid Cases 6.898a 10.120 8.092 86
a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is .10. POPULATION * A16207C Crosstab A16207C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 5 11.5 24 17.2 0 .3 29 29.0 29 22.5 27 33.8 1 .7 57 57.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .007 .004 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .003 .003 .003 N of Valid Cases 10.069a 11.017 10.246 86
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .34. POPULATION * T16214C Crosstab T16214C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 9 15.0 29 22.5 0 .4 38 38.0 25 19.0 22 28.5 1 .6 48 48.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .015 .011 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .008 .008 .008 N of Valid Cases 8.442a 9.020 8.364 86
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .44. POPULATION * A16229G Crosstab A16229G Total
83
0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 24 30.0 51 45.1 1 .9 76 76.0 10 4.0 0 5.9 0 .1 10 10.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .000 .000 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .000 .000 .000 N of Valid Cases 17.307a 20.630 18.279 86
a. 3 cells (50.0%) have expected count less than 5. The minimum expected count is .12. PULATION * T16243C Crosstab T16243C Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 32 30.8 45 46.3 1 .9 78 78.0 2 3.2 6 4.7 0 .1 8 8.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .625 .585 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .517 .517 .517 N of Valid Cases .940a 1.072 1.583 86
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .09. POPULATION * C16249T Crosstab C16249T Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 18 19.4 31 29.1 0 .6 49 49.0 16 14.6 20 21.9 1 .4 37 37.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .396 .330 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .370 .370 .370 N of Valid Cases 1.852a 2.215 1.791 86
84
a. 2 cells (33.3%) have expected count less than 5. The minimum expected count is .43. POPULATION * C16282T Crosstab Total C16282T 0
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 34 34.0 51 51.0 1 1.0 86 86.0 34 34.0 51 51.0 1 1.0 86 86.0 Chi-Square Tests Value
.a 86
Pearson Chi-Square N of Valid Cases a. No statistics are computed because C16282T is a constant. POPULATION * C16287T Crosstab C16287T Total 0 1
POPULATION KINH
PHULA
Total Count Expected Count Count Expected Count Count Expected Count Count Expected Count 34 32.0 46 48.0 1 .9 81 81.0 0 2.0 5 3.0 0 .1 5 5.0 34 34.0 51 51.0 1 1.0 86 86.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .162 .066 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .201 .134 .134 N of Valid Cases 3.643a 5.436 4.523 86
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .06. POPULATION * C16292A Crosstab C16292A Total 0 1
POPULATION KINH
PHULA
Total 33 31.6 46 47.4 1 .9 80 80.0 1 2.4 5 3.6 0 .1 6 6.0 34 34.0 51 51.0 1 1.0 86 86.0 Count Expected Count Count Expected Count Count Expected Count Count Expected Count
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
.437 .437 Pearson Chi-Square Likelihood Ratio 1.556a 1.783 2 2 .459 .410
85
Fisher's Exact Test .437 N of Valid Cases 2.336 86 a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .07.
86
3. Kết quả phân tích thống kê các đa hình xuất hiện ở 2 dân tộc cờ lao
và Phù Lá
Case Processing Summary
Valid Total Cases Missing N Percent N Percent N Percent
69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% POPULATION * A73G POPULATION * T146C,A POPULATION * C150T POPULATION * T152C POPULATION * T199C POPULATION * T204C POPULATION * G207A POPULATION * A210G POPULATION * A235G POPULATION * A263G POPULATION * -315T,C POPULATION * T316C POPULATION * T16110C POPULATION * T16117C POPULATION * G16153A POPULATION * T16164C POPULATION * C16191T POPULATION * T16196C POPULATION * A16206C POPULATION * A16207C POPULATION * T16214C POPULATION * A16229G POPULATION * T16243C POPULATION * C16249T POPULATION * C16282T POPULATION * C16287T POPULATION * C16292A POPULATION * C16316T POPULATION * T16323C POPULATION * T16324C 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Case Processing Summary
Cases Missing Total Valid N Percent N Percent N Percent
0 0 0 69 69 69 100.0% 100.0% 100.0% 0.0% 0.0% 0.0% 69 69 69 100.0% 100.0% 100.0%
POPULATION * T16337C POPULATION * A16344G POPULATION * G16345A POPULATION * A73G Crosstab Total A73G 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 34 34.0 35 35.0 69 69.0 34 34.0 35 35.0 69 69.0 Chi-Square Tests Value
Pearson Chi-Square N of Valid Cases .a 69
87
a. No statistics are computed because A73G is a constant. POPULATION * T146C,A Crosstab T146C,A Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 4 3.0 2 3.0 6 6.0 34 34.0 35 35.0 69 69.0
30 31.0 33 32.0 63 63.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .428 .323
69
.795a .216 .808 .373 .642 .369 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .428 .428 .323 .323 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.96. b. Computed only for a 2x2 table POPULATION * C150T Crosstab C150T Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 8 7.4 7 7.6 15 15.0 34 34.0 35 35.0 69 69.0
26 26.6 28 27.4 54 54.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .777 .474
69
.126a .004 .126 .722 .949 .722 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .777 .777 .474 .474 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 7.39. b. Computed only for a 2x2 table POPULATION * T152C Crosstab T152C Total 0 1
CO LAO POPULATION PHU LA
Total 3 5.4 8 5.6 11 11.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
31 28.6 27 29.4 58 58.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) Pearson Chi-Square 2.535a 1 .111 .188 .103
88
69
1.596 2.620 1 1 .207 .106 Continuity Correctionb Likelihood Ratio Fisher's Exact Test .188 .188 .103 .103 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 5.42. b. Computed only for a 2x2 table POPULATION * T199C Crosstab T199C Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 3 3.9 5 4.1 8 8.0 34 34.0 35 35.0 69 69.0
31 30.1 30 30.9 61 61.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .710 .371
69
1 1 1 .502a .111 .507 .479 .740 .476 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .710 .710 .371 .371 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.94. b. Computed only for a 2x2 table POPULATION * T204C Crosstab T204C Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 0 2.0 4 2.0 4 4.0 34 34.0 35 35.0 69 69.0
34 32.0 31 33.0 65 65.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .114 .061
69
1 1 1 4.125a 2.298 5.669 .042 .130 .017 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .114 .114 .061 .061 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 1.97. b. Computed only for a 2x2 table POPULATION * G207A Crosstab G207A Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 33 31.5 31 32.5 64 64.0 1 2.5 4 2.5 5 5.0 34 34.0 35 35.0 69 69.0
89
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .356 .187
69
1.848a .801 1.975 .174 .371 .160 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .356 .356 .187 .187 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.46. b. Computed only for a 2x2 table POPULATION * A210G Crosstab A210G Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 7 3.9 1 4.1 8 8.0 34 34.0 35 35.0 69 69.0
27 30.1 34 30.9 61 61.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .028 .025
69
5.290a 3.701 5.853 .021 .054 .016 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .028 .028 .025 .025 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.94. b. Computed only for a 2x2 table POPULATION * A235G Crosstab A235G Total 0 1
CO LAO POPULATION PHU LA
Total 1 3.4 6 3.6 7 7.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
33 30.6 29 31.4 62 62.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .106 .057
69
.051 .120 .040 3.816a 2.417 4.206 1 1 1 .106 .106 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .057 .057 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.45. b. Computed only for a 2x2 table POPULATION * A263G Crosstab A263G Total 0 1
POPULATION CO LAO Count Expected Count 1 .5 33 33.5 34 34.0
90
PHU LA
Total Count Expected Count Count Expected Count 0 .5 1 1.0 35 34.5 68 68.0 35 35.0 69 69.0
Value Chi-Square Tests df Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .493 .493
69
1.045a .000 1.431 .307 .988 .232 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .493 .493 .493 .493 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is .49. b. Computed only for a 2x2 table POPULATION * -315T,C Crosstab Total 0 -315T,C 1 2
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 4 3.0 2 3.0 6 6.0 30 30.6 32 31.4 62 62.0 34 34.0 35 35.0 69 69.0 0 .5 1 .5 1 1.0
Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided)
2 2 .424 .347 Pearson Chi-Square Likelihood Ratio Fisher's Exact Test .549 .549 .549 N of Valid Cases 1.717a 2.116 1.643 69
a. 4 cells (66.7%) have expected count less than 5. The minimum expected count is .49. POPULATION * T316C Crosstab T316C Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 30 30.1 31 30.9 61 61.0 34 34.0 35 35.0 69 69.0
4 3.9 4 4.1 8 8.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .629 1.000
69
.002a .000 .002 1 1 1 .965 1.000 .965 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .629 .629 1.000 1.000 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.94. b. Computed only for a 2x2 table
91
POPULATION * T16110C
Crosstab T16110C Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 1 6.9 13 7.1 14 14.0 34 34.0 35 35.0 69 69.0
33 27.1 22 27.9 55 55.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .001 .000
69
12.474a 10.449 14.404 1 1 1 .000 .001 .000 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .001 .001 .000 .000 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 6.90. b. Computed only for a 2x2 table POPULATION * T16117C Crosstab T16117C Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 2 2.0 2 2.0 4 4.0 34 34.0 35 35.0 69 69.0
32 32.0 33 33.0 65 65.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .682
69
1 1 1 .001a .000 .001 .976 1.000 .976 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test 1.000 1.000 .682 .682 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 1.97. b. Computed only for a 2x2 table POPULATION * G16153A Crosstab G16153A Total 0 1
CO LAO POPULATION PHU LA
Total 6 5.9 6 6.1 12 12.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
28 28.1 29 28.9 57 57.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) 1.000 .603
.003a .000 .003 1 1 1 .956 1.000 .956 1.000 .603 Pearson Chi-Square Continuity Correctionb Likelihood Ratio
92
69
Fisher's Exact Test 1.000 .603 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 5.91. b. Computed only for a 2x2 table POPULATION * T16164C Crosstab T16164C Total 0 1
CO LAO POPULATION PHU LA
Total 7 4.9 3 5.1 10 10.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
27 29.1 32 29.9 59 59.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .188 .141
69
1 1 1 .156 .282 .152 2.010a 1.157 2.055 .188 .188 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .141 .141 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.93. b. Computed only for a 2x2 table POPULATION * C16191T Crosstab C16191T Total 0 1
CO LAO POPULATION PHU LA
Total 1 5.4 10 5.6 11 11.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
33 28.6 25 29.4 58 58.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .006 .004
69
1 1 1 .004 .010 .002 8.454a 6.650 9.640 .006 .006 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .004 .004 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 5.42. b. Computed only for a 2x2 table POPULATION * A16206C Crosstab A16206C Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 6 3.0 0 3.0 6 6.0 34 34.0 35 35.0 69 69.0 28 31.0 35 32.0 63 63.0 Chi-Square Tests
93
Value df Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .011 .011
69
1 1 1 6.765a 4.725 9.083 .009 .030 .003 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .011 .011 .011 .011 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.96. b. Computed only for a 2x2 table POPULATION * A16207C Crosstab A16207C Total 0 1
CO LAO POPULATION PHU LA
Total 13 8.9 5 9.1 18 18.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
21 25.1 30 25.9 51 51.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .030 .022
69
1 1 1 .024 .046 .022 5.130a 3.963 5.265 .030 .030 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .022 .022 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 8.87. b. Computed only for a 2x2 table POPULATION * T16214C
Crosstab T16214C Total 0 1
CO LAO POPULATION PHU LA
Total 13 10.8 9 11.2 22 22.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
21 23.2 26 23.8 47 47.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .309 .196
69
1 1 1 .265 .391 .264 1.245a .735 1.250 .309 .309 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .196 .196 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 10.84. b. Computed only for a 2x2 table POPULATION * A16229G Crosstab A16229G Total 0 1
POPULATION CO LAO Count Expected Count 34 29.1 0 4.9 34 34.0
94
PHU LA
Total Count Expected Count Count Expected Count 10 5.1 10 10.0 35 35.0 69 69.0
25 29.9 59 59.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .001 .001
69
1 1 1 11.361a 9.172 15.227 .001 .002 .000 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .001 .001 .001 .001 N of Valid Cases
a. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.93. b. Computed only for a 2x2 table POPULATION * T16243C
Crosstab T16243C Total 0 1
CO LAO POPULATION PHU LA
Total 4 3.0 2 3.0 6 6.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
30 31.0 33 32.0 63 63.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .428 .323
69
1 1 1 .373 .642 .369 .795a .216 .808 .428 .428 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .323 .323 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.96. b. Computed only for a 2x2 table POPULATION * C16249T Crosstab C16249T Total 0 1
CO LAO POPULATION PHU LA
Total 19 17.7 17 18.3 36 36.0 34 34.0 35 35.0 69 69.0 Count Expected Count Count Expected Count Count Expected Count
15 16.3 18 16.7 33 33.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .632 .357
69
1 1 1 .543 .714 .543 .369a .135 .370 .632 .632 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .357 .357 N of Valid Cases
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 16.26. b. Computed only for a 2x2 table POPULATION * C16282T
95
Crosstab C16282T Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 6 3.0 0 3.0 6 6.0 34 34.0 35 35.0 69 69.0
28 31.0 35 32.0 63 63.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .011 .011
69
6.765a 4.725 9.083 .009 .030 .003 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .011 .011 .011 .011 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.96. b. Computed only for a 2x2 table POPULATION * C16287T Crosstab C16287T Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 4 2.0 0 2.0 4 4.0 34 34.0 35 35.0 69 69.0
30 32.0 35 33.0 65 65.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .054 .054
69
4.371a 2.482 5.916 .037 .115 .015 1 1 1 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .054 .054 .054 .054 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 1.97. b. Computed only for a 2x2 table POPULATION * C16292A Crosstab C16292A Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 7 3.9 1 4.1 8 8.0 34 34.0 35 35.0 69 69.0
27 30.1 34 30.9 61 61.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .028 .025
5.290a 3.701 5.853 1 1 1 .021 .054 .016 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .028 .028 .025 .025
96
N of Valid Cases 69
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.94. b. Computed only for a 2x2 table POPULATION * C16316T Crosstab C16316T Total 0 1
CO LAO POPULATION PHU LA
Total Count Expected Count Count Expected Count Count Expected Count 1 3.4 6 3.6 7 7.0 34 34.0 35 35.0 69 69.0
33 30.6 29 31.4 62 62.0 Chi-Square Tests df Value Asymp. Sig. (2- sided) Exact Sig. (2- sided) Exact Sig. (1- sided) .106 .057
69
3.816a 2.417 4.206 1 1 1 .051 .120 .040 Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test .106 .106 .057 .057 N of Valid Cases
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 3.45. b. Computed only for a 2x2 table