VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT *************** NGUYỄN THỊ HOA XÁC ĐỊNH ĐA HÌNH NUCLEOTIDE ĐƠN (SNP) CÓ KHẢ NĂNG LIÊN QUAN ĐẾN TÍNH TRẠNG TĂNG

TRƯỞNG Ở CÁ TRA PANGASIANODON

HYPOPHTHALMUS. LUẬN VĂN THẠC SĨ SINH HỌC THỰC NGHIỆM Hà Nội – 2018

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

VIỆN SINH THÁI VÀ TÀI NGUYÊN SINH VẬT *************** NGUYỄN THỊ HOA XÁC ĐỊNH ĐA HÌNH NUCLEOTIDE ĐƠN (SNP) CÓ KHẢ NĂNG LIÊN QUAN ĐẾN TÍNH TRẠNG TĂNG TRƯỞNG Ở CÁ TRA PANGASIANODON

HYPOPHTHALMUS. Chuyên ngành: SINH HỌC THỰC NGHIỆM Mã số: 8 42 01 14

LUẬN VĂN THẠC SĨ SINH HỌC THỰC NGHIỆM

NGƯỜI HƯỚNG DẪN KHOA HỌC TS. KIM THỊ PHƯƠNG OANH Hà Nội – 2018

i

LỜI CẢM ƠN

Tôi xin chân thành cảm ơn phòng Đào tạo Viện Sinh thái và Tài nguyên Sinh

vật đã tạo điều kiện cho tôi học tập và hoàn thành luận văn.

Tôi xin bày tỏ lòng biết ơn sâu sắc của mình đến TS. Kim Thị Phương Oanh, trưởng phòng Hệ gen học môi trường, Viện Nghiên cứu hệ Gen - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, người đã dành nhiều thời gian, tâm huyết, tận tình giúp đỡ và hướng dẫn tôi trong suốt quá trình thực hiện và hoàn thiện luận văn. Tôi xin chân thành cảm ơn sự quan tâm, giúp đỡ nhiệt tình của tập thể cán bộ Phòng Hệ gen học môi trường – Viện Nghiên cứu hệ Gen tạo điều kiện thuận lợi cho tôi trong quá trình thực hiện đề tài.

Cuối cùng, tôi xin cảm ơn gia đình, bạn bè và tập thể lớp Cao học K20 đã luôn

động viên, giúp đỡ tôi trong suốt quá trình học tập.

Hà Nội, ngày ..... tháng ...... năm 2018

Học viên Nguyễn Thị Hoa

ii

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn này hoàn toàn được trình bày dựa trên kết quả nghiên cứu khoa học của bản thân dưới sự hướng dẫn chuyên môn của TS. Kim Thị Phương Oanh, trưởng phòng Hệ gen học môi trường, Viện Nghiên cứu hệ Gen, cùng với sự giúp đỡ kỹ thuật của các cán bộ trong phòng Hệ gen học môi trường. Các số liệu hình ảnh, kết quả được trình bày, trong luận văn này là trung thực, không sao chép bất cứ tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ nguồn tham khảo. Tôi xin chịu trách nhiệm về lời cam đoan của mình trước hội đồng.

Hà Nội, ngày… tháng… năm 2018

Học viên Nguyễn Thị Hoa

iii

MỤC LỤC

LỜI CẢM ƠN ......................................................................................................................................... i

LỜI CAM ĐOAN ..................................................................................................................................ii

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT ................................................................................ v

MỞ ĐẦU ................................................................................................................................................ 1

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .............................................................................................. 3

1.1. Đặc điểm sinh học và giá trị kinh tế của cá tra ............................................................................... 3

1.1.1.

Đặc điểm sinh học .................................................................................................................. 3

1.1.2.

Giá trị kinh tế của cá tra ......................................................................................................... 4

1.2.

Tình hình nghiên cứu về SNP marker trong thủy sản trên thế giới ................................................ 5

1.3.

Tình hình nghiên cứu về cá tra ở Việt Nam ................................................................................... 7

CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP ............................................................. 10

2.1. Nguyên vật liệu .................................................................................................................................10

2.1.1. Thu thập mẫu cá tra ....................................................................................................................10

2.1.2. Các cặp mồi nhân các vùng trình tự có chứa SNP marker .........................................................10

2.1.3. Hóa chất thí nghiệm ...................................................................................................................11

2.1.4. Thiết bị, dụng cụ thí nghiệm ......................................................................................................12

2.2. Phương pháp......................................................................................................................................12

2.2.1. Tách chiết DNA tổng số .............................................................................................................12

2.2.2. Khuếch đại các vùng trình tự bằng phương pháp PCR ..............................................................13

2.2.3. Xác định SNP bằng phương pháp Single Base Extension (SNapShot Multiplex Kit). ..............14

2.2.4. Thiết kế mồi SBE (Single Base Extension) ................................................................................16

2.2.5. Thu thập dữ liệu và đánh giá ......................................................................................................22

2.2.6. Phân tích số liệu trên quần thể....................................................................................................23

3.1. Kết quả tách chiết DNA tổng số ........................................................................................................25

3.2. Kết quả khuếch đại các đoạn trình tự chứa SNP ...............................................................................26

3.3. Kết quả tinh sạch sản phẩm PCR ......................................................................................................26

3.4. Kết quả điện di mao quản bộ mẫu chuẩn ..........................................................................................27

3.5. Thiết lập 11 Binset cho 11 nhóm mẫu ...............................................................................................29

3.6. Kết quả chạy Binset cho các sản phẩm SNapShot của 11 nhóm.......................................................33

3.7. Kết quả thống kê và tính xác suất theo thành phần kiểu gen và tần số alen tại các vị trí SNP cần kiểm nghiệm trên hai nhóm cá tra sinh trưởng nhanh và sinh trưởng chậm ............................................35

iv

CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ ..................................................................................... 41

4.1. Kết luận .............................................................................................................................................41

4.2. Kiến nghị ...........................................................................................................................................41

TÀI LIỆU THAM KHẢO .................................................................................................................. 42

PHỤ LỤC 1: Danh sách 96 mẫu cá tra (gồm 48 mẫu STN và 48 mẫu STC) ................................... 1

PHỤ LỤC 2: Danh sách các cặp mồi nhân đoạn trình tự DNA chứa SNP. ..................................... 3

PHỤ LỤC 3: Kết quả tách chiết DNA tổng số của 96 mẫu cá tra (gồm 48 mẫu sinh trưởng nhanh và 48 mẫu sinh trưởng chậm ..................................................................................................................... 9

PHỤ LỤC 4: Kết quả đo nồng độ DNA tổng số 96 mẫu cá tra sinh trưởng nhanh và chậm ....... 10

PHỤ LỤC 5: Kết quả PCR khuếch đại các vùng trình tự có chứa SNP ........................................ 12

PHỤ LỤC 6: Danh sách 11 nhóm mồi SBE ...................................................................................... 14

PHỤ LỤC 7: Kết quả chạy điện di mao quản của 11 nhóm .......................................................... 100

PHỤ LỤC 8: Kết quả tinh sạch sản phẩm PCR của 11 nhóm mẫu .............................................. 107

PHỤ LỤC 9 ........................................................................................................................................ 100

Các chỉ số về thành phần kiểu gen và tần số alen của 84 SNP (thuộc 11 nhóm) của nhóm cá tra sinh trưởng nhanh và nhóm cá tra sinh trưởng chậm (NN:kí hiệu cho kiểu gen chưa được xác định rõ do kỹ thuật) ............................................................................................................................................. 100

phụ ...................................................................................................................................................... 103

v

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

Chữ viết tắt AFLP BLAST cDNA DNA EBV FAO

Từ đầy đủ Amplified Fragment Length Polymorphism Basic Local Alignment Search Tool Complementary DNA Deoxy Ribonucleic Acid Estimates of breeding value – Giá trị chọn giống của tính trạng Food and Agriculture Organization of the United Nations – Tổ chức lương thực và nông nghiệp Liên Hợp Quốc

FET NGS PCR RAPD SAP SBE SNP UTR

Fisher Exact Test Next Generation Sequencing Polymer Chain Reaction Random – Amplified Polymorphic DNA Shrimp Alkaline Phosphatase Single Base Extension Single Nucleotide Polymorphism Unified Genotyper

vi

DANH MỤC HÌNH Hình 1: Sơ đồ tổng quát các bước tiến hành thí nghiệm ............................................................... 12

Hình 2: Sơ đồ minh họa chu trình nhiệt ........................................................................................ 14

Hình 3: Hình ảnh minh họa quá trình thực hiện thí nghiệm SBE sử dụng SNapShot [38] ........... 16

Hình 4: Sơ đồ quy trình xử lý thiết kế mồi SBE ........................................................................... 17

Hình 5: Sơ đồ minh họa chu trình nhiệt trong phản ứng SNapShot .............................................. 20

Hình 6: Kết quả điện di mẫu DNA tổng số trên gel agarose 0,8% một số mẫu đại diện .............. 25

Hình 7: Kết quả điện di sản phẩm PCR của một mồi đại diện trên gel agarose 0.8% .................. 26

Hình 8: Kết quả điện di tinh sạch của đại diện một nhóm mẫu trên gel Agarose 0.8% ................ 27

Hình 9: Kết quả điện di mao quản bộ mẫu chuẩn 6 sản phẩm trên hệ thống phân tích ABI 3500 28

Hình 10: Kết quả điện di mao quản của một nhóm mẫu đại diện G1 ........................................... 34

Hình 11: Kết quả điện di mao quản nhóm sản phẩm SNapShot G2 của 9 mồi SBE (S024, S089,

SV14, S037, S125, S013, S105, S079 và S006) từ một mẫu cá tra sinh trưởng nhanh: kích thước sản phẩm thực tế lần lượt là 75, 70, 65, 53, 48, 42, 36, 30 và 24 nucleotide .............................. 100

Hình 12: Kết quả điện di mao quản nhóm sản phẩm SNapShot G3 của 9 mồi SBE (SV12, S004, S067, S127, S097, S082, S017, S030, S038) từ một mẫu cá tra sinh trưởng nhanh: kích thước sản phẩm thực tế lần lượt là 78,72, 61, 55, 50, 44, 38, 31 và 24 nucleotide. ..................................... 101

Hình 13: Binset G4 gồm 10 mồi SBE (S048, S122, S113, S056, S077, S039, S012, S047, S076

và S046) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 76, 71, 66, 61, 55, 49, 43, 37, 31 và 24 nucleotide. ....................................................................................... 101

Hình 14: Kết quả điện di mao quản nhóm sản phẩm SNapShot G5 của 10 mồi SBE (S005, S034,

SV06, SV03, S114, S109, SV08, SV04, S078 và S098) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 77,71, 65, 59, 53, 47, 41, 36, 30 và 24 ................................. 102

Hình 15: Kết quả điện di mao quản nhóm sản phẩm SNapShot G6 của 8 mồi SBE (S081, S008, SV15, S058, SV13, S011, S063 và S124) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 64, 58, 53, 47, 42, 37, 30 và 24 nucleotide. .......................................... 103

Hình 16: Kết quả điện di mao quản nhóm sản phẩm SNapShot G7 của 6 mồi SBE (S100, S095,

S020, S086, S001 và S042) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 53, 47, 42, 237, 31 và 24 nucleotide ................................................................................ 103

vii

Hình 17: Kết quả điện di mao quản nhóm sản phẩm SNapShot G8 của 7 mồi SBE (S090_4109, S033_1077, S090_3990, S060, S033_992, S044 và S036) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 59, 54, 48, 42, 36, 30 và 24 nucleotide ........................ 104

Hình 18: Kết quả điện di mao quản nhóm sản phẩm SNapShot G9 của 7 mồi SBE (S085, SV07,

S126, S053, S118, S019 và S071) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 58, 52, 47, 42, 37, 31 và 24 nucleotide ................................................................... 105

Hình 19: Kết quả điện di mao quản nhóm sản phẩm SNapShot G10 của 7 mồi SBE (SV02, S066, SV05, S121, S066, SV10 và SV16) từ một mẫu cá tra sinh trưởng nhanh: kích thước sản phẩm thực tế lần lượt là 69, 62, 55, 48, 41, 33 và 25 nucleotide .......................................................... 105

Hình 20: Kết quả điện di mao quản nhóm sản phẩm SNapShot G11 của 6 mồi SBE (S029, S028, S070, S080, S099 và S096) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 54, 48, 43, 38, 31 và 24 nucleotide .................................................................................. 106

DANH MỤC BẢNG

Bảng 1: Thông số kỹ thuật cài đặt mặc định cho kỹ thuật SNapShot trên hệ thống ABI 3500 ... 21

Bảng 2: Danh sách 6 mồi SBE trong bộ mồi chuẩn ...................................................................... 22

Bảng 3: Bảng kết quả đo nồng độ DNA tổng số của một số mẫu đại diện ................................... 25

Bảng 4: Kết quả điện di mao quản đối với bộ sản phẩm chuẩn trên hệ thống phân tích ABI 3500 ....................................................................................................................................................... 28

Bảng 5: Danh sách 11 bộ Binset cho 11 nhóm sản phẩm SNapShot ............................................ 29

Bảng 6: Các SNP được lựa chọn với điều kiện xác suất (FET<0.01, FST ≥ 0.05) ....................... 38

Bảng 7: Chú giải chức năng transcript chứa 4 chỉ thị SNP và dự đoán ảnh hưởng của SNP ....... 40

1

MỞ ĐẦU

1. Lý do chọn đề tài

Cá tra nuôi (Pangasianodon hypophthalmus), thuộc họ cá tra (Pangasiidae), bộ cá da trơn hay cá nheo (Siluriformes). Cá tra nuôi là một trong những loài cá đặc hữu của vùng lưu vực sông Mê Kông (Việt Nam, Thái Lan, Lào, Campuchia), có giá trị kinh tế lớn và được nuôi phổ biến ở vùng này và một số nước khác thuộc khu vực miền nam châu Á. Theo thống kê của FAO, Việt Nam là nước có sản lượng cá tra nuôi Pangasianodon hypophthalmus lớn nhất thế giới và xuất khẩu sang hơn 140 nước trên thế giới. Mặc dù xuất khẩu ra hàng trăm thị trường nhưng sản phẩm cá tra Việt Nam vẫn chưa có chỗ đứng bền vững. Một phần do chất lượng cá giống đầu vào chưa cao, tình hình dịch bệnh, thời tiết thất thường… dẫn đến hiệu quả sản xuất thấp, giá cả không ổn định, mặt khác, ngành hàng cá tra Việt Nam còn chịu sự cạnh tranh gay gắt khi mà một số nước khác đã và đang đẩy mạnh sản xuất loại thủy sản này. Do đó việc tìm ra giải pháp đột phá để nâng cao giá trị ngành hàng cá tra là yêu cầu cấp bách hiện nay. Việc phát triển và ứng dụng rộng rãi Công nghệ sinh học trong lĩnh vực thủy sản đang là hướng đi mà chính phủ, lãnh đạo các cấp các ngành liên quan cũng như các doanh nghiệp thủy sản đặc biệt quan tâm. Một trong những vấn đề cấp thiết và có ý nghĩa cực kỳ quan trọng đối với công tác giống là thông tin về đặc điểm cấu trúc phân tử của bộ gen (genome) của cá tra. Nghiên cứu genome sẽ cung cấp những thông tin chính xác nhất cho việc xác định các tính trạng quan trọng như tính kháng bệnh, tính chống chịu đối với điều kiện môi trường, các tính trạng liên quan đến năng suất, chất lượng sản phẩm cá tra. Để tạo tiền đề cho các nghiên cứu về hệ gen cá tra, góp phần cho công tác nghiên cứu và ứng dụng Công nghệ sinh học trong thủy sản, Viện Nghiên cứu hệ gen đã xây dựng và thực hiện đề tài nghiên cứu cấp nhà nước: “Phân tích hệ gen biểu hiện (exome + transcriptome) của cá tra nhằm phát triển chỉ thị phân tử phục vụ chọn giống cá tra theo hướng tăng trưởng” thuộc Chương trình phát triển và ứng dụng công nghệ sinh học trong thủy sản của Bộ nông nghiệp và Phát triển nông thôn, do TS. Kim Thị Phương Oanh làm chủ nhiệm (thời gian thực hiện đề tài 8/2014 đến 4/2018). Dựa trên dữ liệu toàn bộ hệ gen (genome) và hệ gen biểu hiện

2

(transcriptome) cá tra, chúng tôi đã tiến hành thực hiện đề tài: “Xác định đa hình

nucleotide đơn (SNP) có khả năng liên quan đến tính trạng tăng trưởng ở cá tra Pangasianodon hypophthalmus” nhằm xác định chính xác các chỉ thị SNP tiềm năng liên quan đến tính trạng tăng trưởng đã được sàng lọc và dự đoán bằng phương pháp tin sinh học trên quần thể cá tra. Kết quả của đề tài đóng góp về mặt khoa học cho hướng nghiên cứu phát triển chỉ thị phân tử trên đối tượng cá tra nuôi Việt Nam.

2. Mục tiêu của đề tài

Kiểm nghiệm lại các chỉ thị SNP tiềm năng đã được sàng lọc dựa trên dữ liệu

hệ gen biểu hiện (transcriptome) trong quần thể cá tra.

3. Đối tượng và phạm vi nghiên cứu

Mẫu vây cá tra (100 cá thể) được lấy từ Trung tâm Quốc gia Giống thủy sản nước ngọt Nam Bộ, Viện Nghiên cứu nuôi trồng thuỷ sản II, được chia thành hai nhóm:

- Nhóm mẫu sinh trưởng nhanh: Phân tích và kiểm nghiệm trên 50 cá thể thuộc

gia đình có EBV cao nhất.

- Nhóm mẫu sinh trưởng chậm: Phân tích và kiểm nghiệm trên 50 cá thể thuộc

gia đình có EBV thấp nhất. 4. Nội dung nghiên cứu

Nội dung 1: Tách chiết DNA tổng số từ mẫu mô vây của các cá thể cá tra

thuộc quần thể kiểm nghiệm.

Nội dung 2: Thiết kế mồi dựa trên dữ liệu transcriptome đã phân tích và sàng

lọc SNP bằng phương pháp tin sinh.

Nội dung 3: Thực hiện phản ứng PCR phân lập đoạn trình tự DNA có chứa

SNP.

Nội dung 4: Xác định các SNP bằng phương pháp Single-Base Extension/

SNaPshot Multiplex System

Nội dung 5: Phân tích dữ liệu SNP

3

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU

1.1. Đặc điểm sinh học và giá trị kinh tế của cá tra 1.1.1. Đặc điểm sinh học

Cá tra có tên khoa học là Pangasianodon hypophthalmus được Rainboth sử dụng lần đầu vào năm 1996 để chỉ định cho loài cá Tra và sau đó được nhiều tác giả khác sử dụng phổ biến cho đến nay. Cá tra nuôi là một trong những loại cá đặc hữu của vùng lưu vực sông Mê Kông (Việt Nam, Thái Lan, Lào, Campuchia), thuộc họ cá tra (Pagasiidae), bộ cá da trơn hay cá nheo (Siluriformes), có giá trị kinh tế lớn và được nuôi phổ biến ở vùng này và một số nước khác thuộc khu vực miền Nam Châu Á.

Về đặc điểm sinh học, cá tra là cá da trơn (không vẩy), thân dài, lưng xám đen, bụng hơi bạc, miệng rộng, đầu nhỏ vừa phải, mắt tương đối to. Vây lưng cao, có một gai cứng có răng cưa. Vây ngực có ngạch, bụng có 8 tia phân nhánh [10]. Cá tra dễ nuôi, có thể sống tốt trong điều kiện ao tù nước đọng, nhiều chất hữu cơ, có hàm lượng oxy hòa tan và độ pH thấp. Người ta có thể nuôi loại cá này với mật độ rất cao và có thể sống được ở vùng nước lợ (nồng độ muối 7-10‰). Một ao nuôi có thể chứa 50 con/ m2, còn nuôi bè thì khoảng 90 – 120 con/ m2.

Cá tra là loài cá ăn tạp. Chúng có thể ăn thịt lẫn nhau ngay trong bể ấp và chúng vẫn tiếp tục ăn nhau nếu cá ương không được cho ăn đầy đủ. Trong quá trình ương thành cá giống trong ao, chúng ăn các loại động vật phù du có kích thước nhỏ và thức ăn nhân tạo. Khi cá lớn thể hiện tính ăn rộng, ăn đáy và ăn tạp thiên về động vật. Trong điều kiện thiếu thức ăn, cá có thể sử dụng các loại thức ăn bắt buộc khác như mùn bã hữu cơ, rễ cây thủy sinh, rau quả và thức ăn có nguồn gốc động vật như tôm tép, cua, côn trùng, ốc và cá. Trong ao nuôi cá tra có khả năng thích nghi với nhiều loại loại thức ăn khác nhau như: thức ăn tự chế, thức ăn công nghiệp, cám, tấm, rau muống… Thức ăn có nguồn gốc động vật giúp cá lớn nhanh hơn [7].

Cá tra có tốc độ tăng trưởng tương đối nhanh, lúc còn nhỏ cá tăng nhanh về chiều dài. Cá ương trong ao sau 2 tháng đạt chiều dài từ 10-12 cm (14 – 15 gam). Từ khoảng 2,5 kg trở đi, mức tăng trọng lượng nhanh hơn so với chiều dài cơ thể. Cá nuôi trong ao 1 năm đạt 1 đến 1,5 kg/con (năm đầu), những năm về sau cá tăng

4

trọng nhanh hơn, có khi đạt tới 5 đến 6 kg/năm tuỳ thuộc môi trường sống và sự cung cấp thức ăn cũng như loại thức ăn có hàm lượng đạm nhiều hay ít.

Cá tra không sinh sản trong ao nuôi, cá có tập tính di cư sinh sản trên những khúc sông có điều kiện sinh thái phù hợp. Trong tự nhiên chỉ gặp cá thành thục trên sông ở địa phận của Campuchia và Thái Lan. Ở Việt Nam cá tra cũng không có bãi sinh sản tự nhiên. Cá sinh sản ở Campuchia, cá bột theo dòng nước về Việt Nam [7]. Tuổi thành thục của cá tra trên sông Mekong 3 – 4 năm tuổi. Cá tra có tập tính di cư ngược dòng. Mùa vụ sinh sản của cá trong tự nhiên bắt đầu từ tháng 5 đến tháng 7 âm lịch hàng năm. Trọng lượng cá thành thục lần đầu từ 2,5 đến 3 kg [7]. Cá tra không có cơ quan sinh dục phụ, nếu chỉ nhìn hình dáng bên ngoài thì khó phân biệt được cá đực và cá cái. Bắt đầu phân biệt được cá đực cái từ giai đoạn II, các giai đoạn sau, buồng trứng tăng về kích thước, hạt trứng màu vàng, tinh sào có hình dạng phân nhánh, màu hồng chuyển dần sang màu trắng sữa. Hệ số thành thục của cá tra khảo sát được trong tự nhiên từ 1,76 đến 12,94 (cá cái) và từ 0,83 đến 2,1 (cá đực) cỡ cá từ 8 đến 11 kg. Trong ao nuôi vỗ, hệ số thành thục cá tra cái có thể đạt 19,5%. Số lượng trứng đếm được trong buồng trứng của cá gọi là sức sinh sản tuyệt đối, sức sinh sản tuyệt đối của cá tra từ 200.000 đến vài triệu trứng. Sức sinh sản tương đối có thể là 135.000 trứng/kg cá cái. Kích thước của trứng cá tra tương đối nhỏ và có tính dính. Trứng sắp đẻ có đường kính trung bình 1mm, khi đẻ ra trứng trương nước thì đường kính trứng có thể là 1,5 – 1,6 mm. Trong sinh sản nhân tạo, ta có thể nuôi thành thục sớm và cho đẻ sớm hơn trong tự nhiên (từ tháng 3 dương lịch hàng năm), cá tra có thể tái phát dục 1 – 3 lần trong một năm [3].

1.1.2. Giá trị kinh tế của cá tra

Ở Việt Nam, đồng bằng Nam Bộ đã có truyền thống nuôi cá tra trong ao và bè. Năng suất nuôi cá tra rất cao, trung bình khoảng 300 tấn/ha. Cá tra đã và đang trở thành một đối tượng nuôi có giá trị xuất khẩu lớn. Tính đến hết năm 2017, diện tích nuôi cá tra cả nước là 5.230 ha (tăng 3,5% so cùng kỳ). Trong đó, vùng đồng bằng sông Cửu Long (ĐBSCL) với 5 tỉnh: An Giang, Đồng Tháp, Cần Thơ, Vĩnh Long và Bến Tre chiếm đến 95% diện tích. Kim ngạch xuất khẩu cá tra năm 2017 đạt khoảng 1,78 tỷ USD, tăng 4,3% so với năm 2016, đạt 1,79 tỉ USD, đóng góp 21,45% vào giá trị xuất khẩu của ngành thủy sản [4]. Song song với việc sản lượng

5

thủy sản xuất khẩu tăng là sự cạnh tranh gay gắt ở cả thị trường trong nước cũng như thị trường nước ngoài. Rất nhiều doanh nghiệp cạnh tranh không lành mạnh, lạm dụng kháng sinh, chất tăng trọng làm mất uy tín chất lượng cá tra xuất khẩu Việt Nam. Bên cạnh đó, giá cá tra nguyên liệu tăng dẫn đến tình trạng các hộ dân ồ ạt mở rộng diện tích nuôi trồng mà không có sự kiểm soát làm nguồn cung vượt cầu, rủi ro cao. Một khó khăn gây trở ngại cho việc xuất khẩu cá tra nữa là hiện nay các nước khác cũng gia tăng sản lượng nuôi và xuất khẩu cá tra, chẳng hạn như Ấn Độ có sản lượng hơn 650.000 tấn, Bangladesh gần 500.000 tấn, indonesia 110.000 tấn … Riêng thị trường Trung Quốc, vốn là nhà nhập khẩu cá tra lớn nhất, các doanh nghiệp nội địa cũng đang tích cực nuôi với sản lượng khoảng 10.000 tấn [5]. Không chỉ bị cạnh tranh về thị trường với các đối thủ mới, cá tra Việt Nam cũng đang gặp nhiều trở ngại tại thị trường nước ngoài từ chính các thay đổi về chính sách. Chính vì vậy, ngành thủy sản cần phải đổi mới phương pháp nuôi trồng để nâng cao năng suất, cải tiến cách thức quản lý để kiểm soát và nâng cao chất lượng sản phẩm cá tra để đáp ứng được yêu cầu thị trường và bảo vệ thương hiệu cá tra Việt Nam trên thị trường quốc tế. Nền tảng cho chiến lược phát triển này là công tác chọn giống, tập trung ứng dụng khoa học kỹ thuật nhằm nâng cao chất lượng di truyền của loài cá có giá trị kinh tế cao này. 1.2. Tình hình nghiên cứu về SNP marker trong thủy sản trên thế giới

Với sự phát triển của khoa học công nghệ trong những năm gần đây, việc áp dụng nghiên cứu genome trong nuôi trồng thủy sản và bảo vệ nguồn đa dạng sinh học đã trở nên dễ dàng tiếp cận hơn [33], [11], [32]. Giải mã gen hay đọc trình tự DNA bằng phương pháp Sanger [42] cùng với các thế hệ máy giải trình tự tự động đã tạo nên một cuộc cách mạng trong lĩnh vực nghiên cứu hệ gen (genomics) [24]. Với công nghệ giải trình tự gen thế hệ mới (Next Generation Sequencing - NGS) hiện nay đã và đang phát hiện được thêm nhiều đa hình nucleotide đơn (Single Nucleotide Polymorphism – SNP) cho nhiều đối tượng khác nhau. Đã có nhiều các nghiên cứu và bài báo được công bố liên quan đến chỉ thị phân tử DNA và phạm vi ứng dụng của chúng, bao gồm trong lĩnh vực nuôi trồng thủy sản. Phân tích đa hình nucleotide đã nổi lên như công nghệ genotyping với các ứng dụng rộng rãi trong nuôi trồng thủy sản như xây dựng bản đồ liên kết di truyền, tìm kiếm các gen quy

6

định tính trạng hữu ích trong nuôi trồng thủy sản [35], [55] như tính kháng bệnh, tính chống chịu với điều kiện môi trường, các tính trạng liên quan đến năng suất, chất lượng sản phẩm, màu sắc thịt, độ tuổi thành thục. Các SNP liên kết với các tính trạng mong muốn có thể được xác định bằng cách sử dụng công nghệ NGS như RNA-seq, Genotyping by sequencing (GBS) [18], multiplexed shotgun genotyping [14] và Restriction-site associated DNA sequencing (RAD-seq), tạo ra một khối lượng dữ liệu khổng lồ với giá thành rẻ hơn rất nhiều. Sử dụng GBS đã giúp xác định được 4275 loci SNP của cá nheo lục Ictalurus furcatus, trong đó 64 SNP multiplex đã được sử dụng cho genotyping [29]. Nhờ kĩ thuật NGS, đã xác định được tổng cộng 5243 SNP marker chất lượng cao ở loài ngọc trai môi đen Pinctada margaritifera từ quần đảo Fiji [28]. Một bản đồ liên kết di truyền mật độ cao được tích hợp cùng bản đồ vật lý được tạo ra ở cá nheo Mỹ (Ictalurus punctatus) với hơn 50000 SNP, độ bao phủ 90% Mb của hệ gen cá da trơn, kích thước di truyền ước tính 3505,4 cM [31]; [30]. Bản đồ tích hợp tạo điều kiện cho việc lắp ráp bộ gen cá da trơn, lập bản đồ QTL và phân lập các gen mang các đặc điểm hữu ích về mặt kinh tế. Một bản đồ di truyền cho cá chép (Cyprinus carpio) cũng được xây dựng dựa trên 8487 SNP marker với 50 nhóm liên kết với tổng khoảng cách 3762,88 cM [27]; [54]. Ngoài ra, bản đồ liên kết di truyền còn được xây dựng ở một số loài khác quan trọng đối với nuôi trồng thủy sản như cá tráp đầu vàng (Sparus aurata) [50]; cá chẽm Châu Á (Lates calcarifer) [52]; cá quế mõm hếch (Siniperca chuatsi) [45]; cá bơn Nhật (Paralichthys oilivaceus) [15]; [43]...

Tăng trưởng là đặc điểm kinh tế quan trọng nhất trong nhiều chương trình chọn giống trong nuôi trồng thủy sản, do đó đã có nhiều nghiên cứu về chủ đề này. Sự liên quan giữa tính trạng sinh trưởng và đa hình ở các gen thích hợp đã được nghiên cứu ở một số loài cá. Ở cá hồi chấm hồng Bắc cực (Salvelinus alalpinus), nghiên cứu đa hình nucleotide đơn (SNP) của các gen liên quan đến sinh trưởng cho thấy trên gen GHRH/PACAP2 có SNP liên quan rõ ràng tỷ lệ sinh trưởng và được coi như một marker tiềm năng có thể ứng dụng cho chọn giống dòng sinh trưởng nhanh [47]. Gần đây, công nghệ RNA-seq cũng đã được sử dụng để xác định SNP marker cho tính trạng tăng trưởng ở cá hồi cầu vồng. Nghiên cứu này đã xác định được 22 SNP có liên kết với tính trạng tăng trưởng ở 778 cá thể đại diện

7

cho 40 gia đình [40]. Ở cá hồi Đại tây dương (Salmo salar L.), nghiên cứu SNP trên gen IGF1 cho thấy, có hai vị trí (ở vùng promoter g.5763G>T và ở intron 3 g.4671A>C) có liên quan chặt chẽ với trọng lượng cơ thể và đây cũng là những marker tiềm năng có thể ứng dụng cho chọn giống [49]. Ở cá chép (Cyprinus carpio), SNP nằm trên intron 2 của gen IGF-1 (g.7627T>A) có liên quan chặt chẽ với trọng lượng và chiều dài cơ thể. Cá chép có kiểu gen AA có trọng lượng trung bình cao hơn cá có kiểu gen TT 5,9%. Cá có kiểu gen TT tương ứng có trọng lượng trung bình thấp nhất. Đây cũng là marker tiềm năng có thể ứng dụng cho chọn giống [20]. Ở cá rô phi (Oreochromis niloticus), nghiên cứu SNP trên các gen liên quan đến sinh trưởng (bao gồm: GH, IGF-1 và MyoG) đã tìm ra các SNP mới trên gen GH và MyoG có tiềm năng ứng dụng làm marker chọn giống [16]. Như vậy, nghiên cứu đa dạng di truyền của các gen liên quan đến tính trạng sinh trưởng là một phương pháp khá hiệu quả nhằm tìm ra marker phân tử để chọn lọc tính trạng này. 1.3. Tình hình nghiên cứu về cá tra ở Việt Nam

Trong những năm gần đây, ở nước ta đã bước đầu chú ý đến các nghiên cứu nhằm nâng cao chất lượng di truyền và kiểm soát dịch bệnh ở một số giống thủy sản. Các nghiên cứu đã và đang tiến hành trên cá tra đã đặt cơ sở khoa học cho công tác chọn giống và nghiên cứu đa dạng sinh học của giống thủy sản có giá trị kinh tế cao này. Các tác giả Phạm Anh Tuấn và Nguyễn Hữu Ninh đã sử dụng 4 microsatellite tìm kiếm mối tương quan giữa marker phân tử với màu sắc thịt của cá tra [9]. Một số nghiên cứu đa dạng di truyền sử dụng các marker phân tử như RAPD và AFLP đã được nghiên cứu trên trên cá tra [2]; [6]. Viện Nghiên cứu Nuôi trồng Thủy sản II đã thực hiện chương trình chọn giống cá tra thông qua tính trạng tốc độ tăng trưởng bằng phương pháp chọn lọc cá thể (quần đàn 2001-2002) và tỷ lệ phi lê bằng phương pháp chọn lọc kết hợp (quần đàn 2003) dưới sự hỗ trợ kinh phí của SUFA (2001-2005). Quần đàn 2001, 2002 và 2003 được thành lập trên cơ sở chọn lọc đàn con của 75, 79 và 101 gia đình được sản xuất từ cá bố mẹ thuộc 3- 4 trại sản xuất giống khác nhau và có nguồn gốc từ tự nhiên ở đồng bằng sông Cửu Long. Chương trình chọn giống được tiếp tục bằng đề tài cấp Bộ “Chọn giống cá tra nhằm tăng tỷ lệ philê bằng chọn lọc gia đình, 2006-2008” trên quần đàn G1-

8

2001, G1-2002 và G1-2003 và đề tài trong giai đoạn “Đánh giá hiệu quả chọn giống cá tra nâng cao tốc độ tăng trưởng và tỷ lệ philê, 2010-2012” trên quần đàn G2-2001, G2-2002 và G2-2003. Kết quả đề tài 03 giai đoạn này cho thấy hệ số di truyền ước tính của tính trạng tỷ lệ phi lê thấp (h2=0,05-0,12), trọng lượng cơ thể cao (h2=0,22-0,54) và kháng bệnh gan thận mủ thấp (h2=0,04-0,20). Hiệu quả chọn lọc tương ứng được mong đợi cho những tính trạng này. Nguyễn Văn Sáng và ctv (2009) đã tìm thấy tương quan di truyền thuận thấp giữa tỷ lệ philê và trọng lượng cơ thể (r=0,35). Kết quả này cho phép kết luận rằng chọn lọc tính trạng trọng lượng cơ thể có thể mang lại hiệu quả cho tỷ lệ philê nhưng không cao. Hiệu quả chọn lọc thực tế tính trạng tăng trưởng tương đối khả quan ở mức trung bình và cao 5,4-18,2% mỗi thế hệ và cho tính trạng tỷ lệ philê ở mức 0,51-1,2%. Hệ số di truyền thực tế cho tính trạng tăng trưởng cũng ở mức trung bình và cao như hệ số ước tính, 0,24-0,38 và cho tính trạng tỷ lệ phi lê tương đối cao, 0,27 (trong khi hệ số di truyền ước tính tương đối thấp). Quần đàn chọn giống thế hệ thứ 3 được hình thành trong các năm 2010-2012 cho chọn giống tiếp theo bao gồm 1800 con chọn lọc có giá trị chọn giống EBV cao và 250 con đối chứng (chọn ngẫu nhiên). Kết quả đánh giá đa dạng các quần đàn chọn giống bằng chỉ thị microsatellite cho thấy không có sự khác biệt về cấu trúc alen giữa các đàn cá thiết lập vật liệu chọn giống có nguồn gốc từ các trại giống khác nhau, 2001, 2002 và 2003 và giữa chúng với đàn con G1-2001, G1-2002 và G1-2003 trên 6 chỉ thị khảo sát [8]; [1]. Kết quả nghiên cứu chuyên đề trong đề tài giai đoạn 2010- 2012 cho thấy, các quần đàn bố mẹ G1-2001, G1-2002, G1-2003 và đàn tự nhiên có số lượng alen, độ phong phú alen, chỉ số thông tin đa hình, giá trị dị hợp tử mong đợi và thực tế gần tương đương nhau bằng phân tích trên 10 cặp microsatellite. Trong đó, quần đàn G1-2001 có khác biệt di truyền so với các đàn còn lại và đàn G1-2002 có chỉ số cận huyết thấp hơn các đàn còn lại. Như vậy, cho đến nay chúng ta chưa tìm ra chỉ thị phân tử nào có thể ứng dụng cho chọn giống cá tra. Do việc nghiên cứu xác định các chỉ thị phân tử DNA có độ tin cậy cao, có ý nghĩa thực tế lớn, ứng dụng trong chọn giống và kiểm soát sạch bệnh nên ngày càng được các nhà khoa học và các nhà quản lý quan tâm, xác định đó là nền tảng cho các nghiên cứu ứng dụng sau này.

Ở nước ta, với giá trị kinh tế cao của cá tra và yêu cầu cấp thiết nâng cao chất

9

lượng di truyền, kiểm soát dịch bệnh và quản lý nghề nuôi cá này, phân tích hệ gen cá tra là một trong những vấn đề rất cần nghiên cứu và có ý nghĩa quan trọng. Để tạo tiền đề cho các nghiên cứu về hệ gen cá tra, góp phần cho công tác nghiên cứu và ứng dụng công nghệ sinh học trong thủy sản, từ năm 2014 – 2018 viện Nghiên cứu hệ gen đã thực hiện đề tài cấp nhà nước: “Phân tích hệ gen biểu hiện (exome + transcriptome) của cá tra nhằm phát triển chỉ thị phân tử phục vụ chọn giống cá tra theo hướng tăng trưởng”, do TS. Kim Thị Phương Oanh làm chủ nhiệm. Đề tài đã sử dụng công nghệ giải trình tự thế hệ mới (NGS) giải mã được toàn bộ hệ gen (genome) của một cá thể cá tra đực độ bao phủ khoảng 127X. Kích thước bộ gen cá tra ước tính 700 Mb, lắp ráp thành 568 scaffolds, với giá trị N50 đạt 14,29 Mbp. Toàn bộ hệ gen của cá tra đã được chú giải và ước tính có khoảng 28.600 gen mã hoá protein. Đây là phác thảo bộ gen cá tra đầu tiên có thể được sử dụng làm hệ gen tham chiếu cho cá tra [26]. Đề tài cũng đã giải mã hệ gen biểu hiện (transcriptome) của mô cơ từ hai nhóm mẫu: cá tra sinh trưởng nhanh (10 cá thể) và cá tra sinh trưởng chậm (10 cá thể). Bằng cách sử dụng các công cụ và phần mềm tin sinh học, nhóm nghiên cứu đã tiến hành phân tích hai bộ dữ liệu transcriptome của hai nhóm cá tra sinh trưởng nhanh và sinh trưởng chậm; sàng lọc được 369 đa hình nucleotide đơn (SNP) có sự khác biệt giữa hai nhóm mẫu. Dựa trên những phân tích dự đoán bằng phương pháp tin sinh học, 99 chỉ thị SNP tiềm năng có sự khác biệt giữa các nhóm sinh trưởng nhanh và sinh trưởng chậm, có khả năng liên quan đến tính trạng tăng trưởng được sàng lọc. Tuy nhiên, những phân tích dựa trên phương pháp tin sinh học này cần được kiểm nghiệm lại bằng thực nghiệm trên quần thể lớn hơn.

10

CHƯƠNG 2. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP

2.1. Nguyên vật liệu 2.1.1. Thu thập mẫu cá tra a. Địa điểm thu thập mẫu Cá tra thuộc nhóm sinh trưởng nhanh và nhóm sinh trưởng chậm được thu thập từ Trung tâm Quốc gia giống thủy sản nước ngọt Nam Bộ, Viện nghiên cứu nuôi trồng Thủy sản II, ấp 2, xã An Thái Trung, huyện Cái Bè, tỉnh Tiền Giang.

b. Quá trình thu mẫu

Tất cả mẫu cá tra đã được phân loại thành hai nhóm sinh trưởng nhanh và sinh trưởng chậm theo kết quả đề tài trước đó của Viện Nghiên cứu Nuôi trồng Thủy sản II. Để phân loại nhóm sinh trưởng nhanh và sinh trưởng chậm người ta căn cứ vào chỉ số giá trị giống ước tính (Estimated Breeding Value – EBV) được tính toán cho từng cá thể. Dựa vào bảng xếp hạng EBV của toàn bộ quần đàn cá tra nuôi mẫu, chúng tôi tiến hành thu mẫu vây của 50 cá thể có EBV cao nhất (nhóm sinh trưởng nhanh) và 50 cá thể có EBV thấp nhất (nhóm sinh trưởng chậm). Mẫu vây được thu cắt từ vây bụng của cá, sau khi cắt rời khỏi cơ thể cá được bảo quản ngay trong cồn tuyệt đối. Mẫu vây sau đó được bảo quản ở nhiệt độ -20oC. Trong quá trình thao tác cắt mẫu vây dụng cụ cắt được rửa sạch bằng cồn trước khi thực hiện cắt mẫu tiếp theo. Trong quá trình bảo quản mẫu vây thường xuyên thay cồn trong ống đảm bảo mẫu không bị biến đổi.

Trong quá trình làm thí nghiệm, chúng tôi chỉ tiến hành trên 96 mẫu cá tra gồm 48 mẫu sinh trưởng nhanh và 48 mẫu sinh trưởng chậm để phù hợp với việc sử dụng khay 96 giếng.

Danh sách 96 mẫu cá tra được liệt kê ở PHỤ LỤC 1.

2.1.2. Các cặp mồi nhân các vùng trình tự có chứa SNP marker Trong đề tài này, chúng tôi sử dụng 90 cặp mồi nhân vùng trình tự có chứa chỉ thị SNP được thiết kế dựa vào danh sách 99 SNP tiềm năng có sự khác biệt giữa hai nhóm cá tra sinh trưởng nhanh và sinh trưởng chậm đã qua sàng lọc bằng các phần mềm tin sinh học, dựa trên kết quả nghiên cứu trước đó (kết quả của nhóm nghiên cứu đề tài “Phân tích hệ gen biểu hiện (exome + transcriptome) của cá tra nhằm phát triển chỉ thị phân tử phục vụ chọn giống cá tra theo hướng sinh trưởng”. Từ 99

11

SNP tiềm năng chỉ thiết kế 90 cặp mồi là do có một số trường hợp có 2 SNP trở lên ở cùng một transcript, do vậy sẽ có những cặp mồi nhân lên được đoạn trình tự có chứa nhiều SNP.

Danh sách 90 cặp mồi nhân đoạn trình tự genome chứa SNP cùng kích thước

sản phẩm PCR dự tính được liệt kê ở PHỤ LỤC 2

2.1.3. Hóa chất thí nghiệm

STT

Thí nghiệm

Tên hóa chất

1

Tách chiết và tinh sạch DNA tổng số

Hỗn hợp dung dịch solution 1: Tris HCl 10 mM, EDTA 100 mM, SDS 2% Dung dịch amonium axetat 7,5M (solution 2) Proteinase K (20 mg/ml) Ethanol 100% Ethanol 70%

2 Điện di

Agarose TAE Bromophenol blue 0,25% Ethidium bromide 0,1 µg/ ml

3

PCR

4

SNP Genotyping

Taq 2X Master Mix Primer H2O ABI PRISMSNaPshotTM Multiplex Kit gồm: SNaPshot Multiplex Ready Reaction Mix SNaPshot Multiplex Control Primer Mix SNaPshot Multiplex Control template

5

Tinh sạch DNA Shrimp Alkaline phosphatase (SAP)

12

2.1.4. Thiết bị, dụng cụ thí nghiệm

Sử dụng trang thiết bị và dụng cụ thí nghiệm thuộc phòng thí nghiệm của Viện Nghiên cứu hệ Gen gồm máy ly tâm Eppendorf 5415C (Biofuge, Sorvall), máy PCR veriti 96 well Thermal Cycler (ABI, Mỹ), tủ lạnh nhiệt độ 40C, -200C (Sanyo, Nhật bản)…

2.2. Phương pháp Toàn bộ quá trình thực hiện thí nghiệm được minh họa theo sơ đồ sau:

Hình 1: Sơ đồ tổng quát các bước tiến hành thí nghiệm

2.2.1. Tách chiết DNA tổng số 48 mẫu vây cá tra sinh trưởng nhanh và 48 mẫu sinh trưởng chậm được tách

chiết DNA tổng số dựa theo phương pháp của Sambrook và Russell có sửa đổi.

Các bước thực hiện: - Lấy mẫu mô vây cá tra ra, rửa sạch cồn bằng H2O 1X khử trùng, thấm khô

trên giấy thấm, cắt nhỏ mẫu trên đĩa peptri sạch.

- Cho 1000 µl solution 1 vào ống Eppendorf có chứa mẫu.

13

- Bổ sung thêm vào 5 µl proteinase K (20 mg/ml), lắc đều và để mẫu trong bể ổn nhiệt ở 55oC cho đến khi mẫu tan hoàn toàn. Chú ý: trong quá trình ủ lắc mẫu 2 – 3 lần

- Thêm vào mỗi ống 240 µl solution 2 (amonium axetat), sau đó để lạnh ở 4oC

trong 60 phút (để kết tủa protein).

- Lấy mẫu đem ly tâm 15 phút/ 14000 rpm/ 4oC. Hút dịch pha trên sang ống

mới, loại bỏ cặn protein

- Bổ sung một thể tích phenol – chloroform. Vortex và ly tâm 15 phút/ 14000

rpm/ 4oC. Hút dịch pha trên - Lặp lại bước 6. - Chiết lại dung dịch một lần nữa với chloroform. Vortex và ly tâm 15 phút/

14000 rpm/4oC. Hút dịch pha trên.

- Bổ sung 1/10 thể tích muối sodium acetate 3M và 2,5 thể tích ethanol 100%.

Ủ -20oC qua đêm hoặc ở -70oC trong 3h.

- Ly tâm 15 phút/ 14000 rpm/4oC. Loại bỏ dịch và thu tủa DNA - Rửa tủa thu được bằng 500 µl ethanol 70% (2 lần). - Để khô tủa DNA, sau đó hòa tan trong H2O tinh khiết (thể tích tùy lượng tủa

DNA thu được) và bảo quản ở - 20oC

- Kiểm tra chất lượng và nồng độ mẫu DNA bằng máy Nanodrop (kiểm tra nồng độ và độ tinh sạch). Chạy điện di trên gel 0,8% trong đệm TAE/ 30 phút/ 110 V (kiểm tra chất lượng, mức độ đứt gãy DNA hoặc DNA có bị lẫn RNA).

2.2.2. Khuếch đại các vùng trình tự bằng phương pháp PCR Chúng tôi tiến hành phản ứng PCR để khuếch đại các vùng trình tự chứa SNP marker với 90 cặp mồi đã thiết kế, sử dụng DNA tách chiết từ 96 cá thể, nhiệt độ Tm tương ứng với từng cặp mồi được hiệu chỉnh dựa trên Tm tham khảo của nhà sản xuất (IDT, Singapore). Nồng độ DNA template dùng cho phản ứng vào khoảng 100 – 120 ng/µL.

Thành phần phản ứng cho mỗi phản ứng, đơn vị µL Dung dịch đệm PCR 10X 2,5 dNTPs 10 mM 0,5 Dream taq polymerase (U/µl) 0,2

14

Mồi F (10 µM) 1 Mồi R (10 µM) 1 DNA (100 ng/µl) 1 H2O 18,8 25 (µL)

Chu trình nhiệt được thiết lập trên máy Eppendorf MasterCycler ProS (Chu trình chạy có thể thay đổi phụ thuộc kích thước sản phẩm và nhiệt độ gắn mồi)

Hình 2: Sơ đồ minh họa chu trình nhiệt

Sản phẩm PCR được điện di trên gel agarose 0,8% - 1,5% (tùy thuộc kích thước sản phẩm PCR) khoảng 30-35 phút, điện thế 100V. Gel sau khi điện di được nhuộm 2 - 5 phút trong dung dịch ethydium bromide loãng, soi UV và chụp ảnh trên máy chụp ảnh gel dùng phần mềm VisionWorks® LS Analysis.

2.2.3. Xác định SNP bằng phương pháp Single Base Extension (SNapShot

Multiplex Kit).

Phương pháp Single Base Extension (SBE) còn được biết đến như minisequencing [46], cho phép phát hiện đồng thời đến hơn 30 điểm SNP nằm rải rác trong bộ gen của cơ thể [37]. Ưu điểm của phương pháp này là khả năng phát hiện tetra – allelic SNPs, nhanh nhạy, có tính đặc hiệu và khả năng giải trình tự động. SBE đã được áp dụng trong một vài ứng dụng khác như phân tích tế bào đơn

15

dòng cho chẩn đoán di truyền trước khi cấy ghép, chẩn đoán phân tử trước và sau sinh [21], phân tích và giám định DNA ti thể trên mẫu đã bị phân hủy [34], và sàng lọc SNP hiệu năng cao trong nghiên cứu quần thể [51]. Trong nghiên cứu này của chúng tôi, với mục đích muốn kiểm nghiệm lại các SNP marker tiềm năng liên quan đến tính trạng tăng trưởng của cá tra nuôi P. hypophthalmus đã được dự đoán và lựa chọn dựa trên dữ liệu transcriptome đã được phân tích bằng các phương pháp tin sinh học trước đó, chúng tôi sử dụng bộ kit thương mại SNapShot Multiplex Kit của hãng Applied Biosystems, Mỹ. Bộ kit ứng dụng phương pháp SBE và phát hiện sản phẩm đã được đánh dấu bằng thuốc nhuộm huỳnh quang nhờ điện di mao quản (capillary electrophoresis). Một primer không đánh dấu được thiết kế để bắt cặp với trình tự chứa điểm SNP theo chiều 5’- 3’ với đầu 3’ nằm ngay sát vị trí SNP và được kéo dài một dideoxynucleotide (ddNTP) đã được đánh dấu huỳnh quang. Bộ kit SnapShot gồm dung dịch đệm phản ứng, Taq polymerase và các ddNTP có gắn thuốc nhuộm huỳnh quang. Mỗi một ddNTP được gắn với một loại thuốc nhuộm huỳnh quang khác nhau (ddATP phát tín ra tín hiệu màu xanh lá, ddTTP phát tín hiệu màu đỏ, ddGTP phát tín hiệu màu da trời và ddCTP phát tín hiệu màu đen). Trong suốt quá trình gia nhiệt, mồi SBE sẽ gắn với các sản phẩm PCR (amplicon) và ddNTP thích hợp sẽ được gắn vào vị trí SNP tương ứng (Hình 3). Tiếp theo, mẫu sẽ được tinh sạch để loại bỏ ddNTP dư thừa gây ảnh hưởng đến việc phân tích dữ liệu khi cho vào máy điện di mao quản. Với mục đích xác định được nhiều điểm SNP trên cùng một phản ứng (multiplex), chúng tôi có gắn thêm vào đầu phía 5’ của mồi SBE một đoạn trình tự có chiều dài khác nhau, sao cho mỗi mồi SBE có kích thước cách nhau 5 đến 7 nucleotided. Đó có thể là một đoạn trình tự poly-T, poly-C hoặc poly-AGCT. Mỗi mồi SBE sẽ có tổng chiều dài từ 25 đến 75 nucleotide. Sản phẩm của phản ứng sau đó sẽ được phân tách bằng điện di trên hệ thống máy giải trình tự mao quản tự động [41].

16

Hình 3: Hình ảnh minh họa quá trình thực hiện thí nghiệm SBE sử dụng SNapShot [38]

2.2.4. Thiết kế mồi SBE (Single Base Extension) Quy trình xử lý thiết kế mồi SBE được biểu diễn qua sơ đồ hình dưới đây:

17

Hình 4: Sơ đồ quy trình xử lý thiết kế mồi SBE

Quy trình xử lý dữ liệu chi tiết như sau: 

Chọn SNP thỏa mãn kết quả thực nghiệm: Từ các đoạn trình tự mang SNP đã được thiết kế mồi PCR thông thường, kết quả thực nghiệm PCR cho biết cặp mồi nào cho sản phẩm nhân lên hiệu quả và đặc hiệu. Từ kết quả này, chúng tôi chọn lọc ra các SNP tương ứng để tiến hành thiết kế mồi kéo dài SBE (single-base extension). Từ danh sách 90 cặp mồi thiết kế nhân đoạn trình tự chứa SNP (ở PHỤ LỤC 2), sau khi chạy PCR chúng tôi đã chọn lọc được 84 cặp mồi đủ điều kiện để tiến hành thiết mồi SBE.

Định vị mồi SBE về 2 phía của SNP: Dựa vào vị trí trên transcript của các SNP đã được lựa chọn, chúng tôi xác định khoảng trình tự 25 bp về 2 phía đầu 5’ và 3’. Sau đó, tương tự như cách thức trích xuất trình tự từ genome, chúng tôi sử dụng công cụ tin sinh để trích xuất các đoạn ngắn 25 bp này ra. Đoạn trình tự

18

25 bp về phía đầu 5’ từ vị trí SNP có thể được dùng trực tiếp làm mồi SBE, đoạn trình tự 25 bp về phía đầu 3’ thì cần được chuyển đổi đảo ngược - bổ sung (reverse – complement) để có thể được sử dụng làm mồi SBE. Trong trường hợp thứ 2 này, các allele của SNP sẽ là loại nucleotide bổ sung (complement) với dự đoán ban đầu (ví dụ SNP dự đoán là cặp A/G sẽ cho kết quả peak thực nghiệm là T/C). Như vậy với mỗi vị trí SNP, chúng ta có thể lựa chọn 1 trong 2 mồi SBE là mồi SBE 5’ và mồi SBE 3’. 

Kiểm tra mồi SBE: Các mồi SBE bao gồm cả mồi phía đầu 5’ và đầu 3’ của SNP đều được định vị lên trình tự genome (các đoạn đã sử dụng làm khuôn để thiết kế mồi PCR thông thường) để kiểm tra, một số trường hợp các mồi có sự sai khác giữa trình tự trên transcript so với trình tự trên genome, đặc biệt là các sai khác về phía đầu 3’ của mồi, sẽ bị loại bỏ. Và cuối cùng, các mồi sẽ được kiểm tra nhiệt độ Tm, khả năng tạo dimer và cross-dimer với mồi khác, khả năng tạo cấu trúc kẹp tóc. 

Phân nhóm mồi SBE và kiểm tra multiplexing: Về cơ bản, các mồi SBE được chúng tôi chia thành nhóm dựa theo kích thước của khuôn mẫu là các sản phẩm PCR từ thí nghiệm trước (các trình tự chứa SNP mục tiêu cần khảo sát), giả định mà chúng tôi đặt ra đó là với kích thước khuôn mẫu tương đồng nhau, cùng với nhiệt độ gắn mồi Tm chênh lệch thấp, hiệu suất phản ứng SNapShot sẽ là tương đương nhau ở các thành viên SNP trong cùng một nhóm multiplexing. Ngoài ra, dựa vào thông tin về tương tác cross-dimer giữa các mồi, chúng tôi sắp xếp các nhóm sao cho các mồi có khả năng cao tạo dimer với nhau sẽ không nằm chung một nhóm. Chúng tôi chia các mồi SBE vào 11 nhóm, các nhóm sau đó được kiểm tra các tương tác có khả năng xảy ra khi chạy multiplexing. Các mồi SBE có khả năng tạo cross-dimer cao có thể được thay thế bằng cách lựa chọn mồi SBE phía bên kia của vị trí SNP (mồi SBE 5’ thay bằng mồi SBE 3’ hoặc ngược lại).

Gắn đuôi cho các mồi SBE để phân tách kích thước: Sau khi phân nhóm mồi SBE, chúng tôi tiến hành bổ sung trình tự đuôi. Trình tự này không có tác dụng liên kết bổ sung gắn mồi vào khuôn mẫu mà nó có tác dụng phân tách kích thước các mồi trong cùng một nhóm. Khi chạy điện di mao quản để phát hiện đỉnh (peak) nucleotide gắn bổ sung tại vị trí SNP, kích thước mồi khác nhau sẽ

19

giúp phân tách các đỉnh này trên đồ thị, và giúp phân biệt cũng như nhận diện được allele của từng SNP. Các trình tự đuôi được chúng tôi sử dụng là poly-T, poly-C và poly-GACT tùy thuộc vào trình tự của mồi SBE cơ bản (tránh tạo tương tác hairpin hoặc self-dimer với trình tự mồi SBE cơ bản). Kích thước tổng của mồi nằm trong khoảng 23 – 75 bp, với mỗi mồi SBE trong nhóm có kích thước khác nhau từ 5 – 7 bp.

Chi tiết về danh sách 11 nhóm mồi được liệt kê ở PHỤ LỤC 6  Các bước tiến hành phản ứng SNapShot

Chuẩn bị đầu vào cho phản ứng SNapShot a. Tinh sạch sản phẩm PCR Sản phẩm PCR của mỗi một SNP trộn với nhau và được tinh sạch để loại bỏ

mồi dư thừa qua cột MinElute của hãng Qiagen theo hướng dẫn của nhà sản xuất.

b. Chuẩn bị phản ứng đối chứng dương

Mỗi một bộ SNapShot Kit sẽ được cung cấp sẵn mẫu DNA và hỗn hợp mồi cho 30 phản ứng đối chứng. Các bước thực hiện phản ứng được tiến hành theo hướng dẫn của nhà sản xuất.

Thành phần phản ứng

Đối chứng dương (µL)

Hỗn hợp phản ứng SNapShot Multiplex Ready

4

Mẫu DNA đối chứng SNapShot Multiplex

2,5

Hỗn hợp mồi đối chứng SNapShot Multiplex

0,8

0,7

H2O Tổng thể tích

8

c. Lượng sản phẩm PCR template đã tinh sạch nên từ 0,01 đến 0,4 pmol cho

một phản ứng 10 µL và 0,008 đến 0,32 pmol cho một phản ứng 8 µL.

d. Chuần bị mồi Các mồi SBE sử dụng cho phản ứng SNapShot cần được trộn với nhau để đưa về nồng độ cuối là 1 µM cho mỗi mồi. Hỗn hợp mồi sau khi chuẩn bị cần được để

20

trên đá. Ví dụ nhóm 1, các mồi SBE sau được mix với nhau: EP3-S061_A-G, EP3- S031_T-C, EP3-S049_G-C, EP3-S094_A-C, EP5-S111_G-A.

e. Thực hiện phản ứng SNapShot Thành phần phản ứng cho một lần chạy 1 mẫu với 10 mồi SBE, đơn vị µL

Hỗn hợp phản ứng SNapShot Multiplex Ready 2,5 Hỗn hợp sản phẩm PCR của các mồi 0,63 Hỗn hợp mồi SNapShot 0.8 H2O 1.07 5 µL

Đảo trộn và spin nhẹ

 Chú ý: Các thao tác tiến hành luôn phải được thực hiện trên đá.

f. Chu trình nhiệt được thiết lập trên máy Eppendorf Master: Các mồi trong một nhóm có nhiệt độ chênh lệch nhau không quá cao và Tm nằm ở hai điểm nhiệt độ là 54oC và 57oC, tùy theo nhiệt độ nền của các nhóm G1 đến G11, Tm sẽ thấp hơn nhiệt độ thấp nhất của nhóm là 2 độ.

Hình 5: Sơ đồ minh họa chu trình nhiệt trong phản ứng SNapShot

g. Tinh sạch sản phẩm SNapShot qua xử lý SAP  Thêm 0,5 Unit của SAP (Shrimp Alkaline Phosphatase) vào hỗn hợp sau

phản ứng SNapShot.

 Vortex hòa tan hoàn toàn, ủ 37oC trong 30 phút.

21

 Bất hoạt enzyme ở 65oC trong 15 phút  Bảo quản ở 4oC trong vòng 24 tiếng trước khi biến tính, cho vào điện di

mao quản trên hệ 3500, nếu chưa làm luôn cần quản ở -20oC.

h. Biến tính sản phẩm SNapShot tinh sạch Sản phẩm SNapShot tinh sạch của 11 nhóm từ G1 đến G11 được biến tính trước khi đưa vào giải trình tự. Theo đó, mỗi 0,5 µl sản phẩm của một mẫu được trộn cùng 0,2 µl GeneScan Liz Size 120 Standard (marker chuẩn cho quá trình điện di mao quản) và 9,0 µl Hi-Di formamide (có tác dụng ngăn DNA hồi tính lại thành sợi đôi), rồi được biến tính ở 95oC trong 5 phút bằng máy PCR 96 giếng (Effpendorf), sau đó được giữ lạnh ở 4oC để nhanh chóng đưa vào hệ thống giải trình tự ABI 3500.

i. Điện di mao quản tự động bằng máy giải trình tự ABI 3500 Sản phẩm SNapShot biến tính cùng với GeneScan Liz Size 120 Standard được đưa vào hệ thống ABI 3500 để tiến hành điện di mao quản với POP-7TM polymer và mao quản 50 cm để phân tách các đoạn sản phẩm có kích thước chênh nhau 5 đến 8 nucleotit, đồng thời đọc tín hiệu huỳnh quang của ddNTP được gắn vào của mỗi đoạn sản phẩm. Các thông số kỹ thuật của quá trình điện di mao quản được cài đặt mặc định theo hệ thống ABI dành cho kỹ thuật SNapShot theo bảng sau:

Bảng 1: Thông số kỹ thuật cài đặt mặc định cho kỹ thuật SNapShot trên hệ thống ABI 3500

Thông số kỹ thuật

Chỉ số 60oC

Oven Temperature - Nhiệt độ làm nóng hệ thống ABI 3500 trước khi điện di

Run Time - Thời gian chạy

560 giây

Run Voltage - Hiệu điện thế chạy

15 kV

PreRun Time

180 giây

PreRun Voltage

15 kV

Injection Time

8 giây

Injection Voltage

1.6 kV

22

2.2.5. Thu thập dữ liệu và đánh giá Dữ liệu kết quả SNapShot từ hệ thống ABI 3500 PRISM Genetic Analyzer được xử lý thô thông qua phần mềm GeneMapper phiên bản 5.0. Các giá trị nền của đỉnh trình tự (peak) được cài đặt là 120 RFU cho màu xanh dương-G, 120 RFU cho màu xanh lá -A, 100 RFU cho màu vàng-C, và 100 RFU cho màu đỏ-T. Tỉ lệ về chiều cao giữa hai đỉnh cho kiểu gen dị hợp tử lớn nhất và nhỏ nhất được cài đặt mặc định theo thông số kỹ thuật của phần mềm (Min peak heigh ratio: 0.5), với chiều cao peak tối thiểu đạt 100 RFU. Để hệ thống giải trình tự có thể gọi tên được các alen tại các vị trí quan tâm, chúng tôi cần cài đặt các thông số về vị trí của SNP trên máy, do các đoạn được tổng hợp thường di chuyển nhanh hơn tốc độ của đoạn kích thước thực tế ít nhất 5 nucleotide. Bằng cách so sánh với tốc độ di chuyển của bộ sản phẩm chuẩn được nhân lên từ mẫu chuẩn (Amplicon từ CEPH DNA) và bộ 6 mồi SBE chuẩn có kích thước và trình tự ddNTP gắn vào được xác định rõ được cung cấp trong bộ kit SNapShot (Bảng 2), chúng tôi sẽ thiết lập 11 bộ binset cho 11 nhóm mồi SBE, nhằm phản ánh tốc độ di chuyển của các đoạn sản phẩm SNapShot trong cùng một nhóm. Các thông số này được cài đặt để phù hợp với hệ thống phân tích dữ liệu genome ABI 3500 và các tiêu chí đã được khảo sát trong các nghiên cứu trước đó. Thông qua Binset, phần mềm sẽ gọi tên alen tại các đoạn vị trí mong muốn, qua đó chúng tôi có thể thu được thông tin về 84 SNP của 96 cá thể dưới dạng file được xuất ra, phục vụ công việc thống kê sau này.

Bảng 2: Danh sách 6 mồi SBE trong bộ mồi chuẩn

STT

Tên mồi SBE chuẩn

Tín hiệu màu của sản phẩm

1

20A primer

Chiều dài mồi (nucleotit) 20

Chiều dài sản phẩm được tạo ra (nucleotit) 21

ddNTP gắn huỳnh quang được thêm vào A

Xanh lá cây

Xanh lá cây/

2

28G/A primer

28

29

A/G

Xanh da trời

3

36G primer

36

37

G

Xanh da trời

4

44T primer

44

45

T

Đỏ

5

52C/T primer

52

53

C/T

Vàng/Đỏ

6

60C primer

60

61

C

Vàng

23

2.2.6. Phân tích số liệu trên quần thể

Từ file kết quả xuất ra bởi phần mềm GeneMapper, chúng tôi sẽ thống kê với mỗi vị trí SNP, ở nhóm sinh trưởng nhanh và nhóm sinh trưởng chậm, thành phần kiểu gen và tần số alen là bao nhiêu. Ví dụ, nếu tại vị trí của SNP A-G, mẫu thứ nhất chỉ có alen A, mẫu đó có kiểu gen đồng hợp AA, mẫu thứ hai chỉ có alen G, mẫu đó có kiểu gen đồng hợp GG, mẫu thứ 96 có cả hai alen A và G, mẫu đó có kiểu gen dị hợp AG. Như vậy, trên một nhóm 48 cá thể sinh trưởng nhanh có bao nhiêu cá thể xác định được kiểu gen, trong đó có bao nhiêu phần trăm kiểu gen AA, bao nhiêu phần trăm kiểu gen GG, bao nhiêu phần trăm kiểu gen AG và tương tự với 48 cá thể sinh trưởng chậm. Như vậy, chúng tôi sẽ có thành phần kiểu gen của nhóm cá tra sinh trưởng nhanh và nhóm cá tra sinh trưởng chậm tại vị trí SNP đó. Qua đó, chúng tôi dùng phép thử Fisher’s Exact Test (FET) để kiểm nghiệm thành phần kiểu gen của hai nhóm sinh trưởng nhanh và sinh trưởng chậm có thực sự khác nhau hay không thông qua giá trị p-value nhỏ hơn 1% (0.01). Công thức FET mà chúng tôi sử dụng theo Freeman-Halton được tính toán dựa trên bảng số liệu gồm 2 hàng và 3 cột, trong đó 2 hàng tương ứng với 2 nhóm sinh trưởng nhanh và sinh trưởng chậm, 3 cột ứng với 3 kiểu gen mà mỗi nhóm cá thể sinh trưởng nhanh hay chậm có thể có. Bảng tính này sử dụng cho bộ số liệu có số mẫu không vượt quá 300, phù hợp với quy mô mẫu thí nghiệm của chúng tôi với số cá thể của mỗi nhóm sinh trưởng nhanh và chậm tối đa là 48 cá thể.

Bên cạnh đó, dựa trên tên alen được gọi ra ở vị trí SNP trên số cá thể xác định được kiểu gen trong 96 cá thể, chúng tôi cũng tính được tần số alen của SNP đó cho mỗi nhóm sinh trưởng nhanh và sinh trưởng chậm, sau đó tính chỉ số FST dựa trên các tần số này đề so sánh hai nhóm thông qua công thức sau:

Trong đó: n1, n2: lần lượt là số cá thể xác định được kiểu gen của nhóm cá tra sinh trưởng

nhanh và nhóm tra sinh trưởng chậm (n1, n2 nhỏ hoặc bằng 48).

24

p1, p2: lần lượt là tần số của alen thứ nhất của nhóm cá tra sinh trưởng nhanh

và nhóm cá tra sinh trưởng chậm (p1, p2 thuộc khoảng [0;1])

Theo công thức này, giá trị FST có thể âm, tuy nhiên giá trị này rất gần với 0 và có thể được coi như bằng 0, có nghĩa là không có sự sai khác về tần số alen giữa hai nhóm cá tra sinh trưởng nhanh và cá tra sinh trưởng chậm và có thể đạt từ 0 đến 1. Nếu giá trị FST càng tiệm cận đến 1 hoặc bằng 1 có nghĩa là càng có sự sai khác về tần số alen giữa nhóm nhanh và nhóm chậm. Sau khi chọn các SNP có giá trị thống kê tốt nhất (p-value của FET < 0.01 và FST ≥ 0.05); chúng tôi sẽ chọn được các SNP có thể hiện tương đối rõ sự khác biệt giữa hai nhóm cá tra sinh trưởng nhanh và sinh trưởng chậm, có tiềm năng làm marker phân tử.

25

CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN

3.1. Kết quả tách chiết DNA tổng số Bước đầu tiên trong nghiên cứu sinh học phân tử là thu nhận được một lượng DNA tổng số ở dạng tinh sạch không bị đứt gãy hoặc đứt gãy ít, với lượng đủ để tiến hành các nghiên cứu tiếp theo. Chúng tôi đã tiến hành tách chiết DNA tổng số của 48 mẫu vây cá tra sinh trưởng nhanh và 48 mẫu vây cá tra sinh trưởng chậm, sau đó xác định nồng độ bằng cách đo quang phổ ở bước sóng 260 nm (OD260) và đánh giá độ tinh sạch thông qua giá trị OD260/280. Kết quả đo nồng độ DNA trên máy Eppendorf Spectrometer được thể hiện ở PHỤ LỤC 4.

Bảng 3: Bảng kết quả đo nồng độ DNA tổng số của một số mẫu đại diện

Sau khi xác định nồng độ, DNA tổng số của 96 mẫu sẽ được kiểm tra lại bằng

điện di. Kết quả điện di được thể hiện ở PHỤ LỤC 3.

Hình 6: Kết quả điện di mẫu DNA tổng số trên gel agarose 0,8% một số mẫu đại diện

Như vậy, kết quả điện di ở Hình 6 cho thấy các mẫu DNA tổng số được tách từ mẫu vây cá tra đều xuất hiện băng DNA tổng số lớn, không bị đứt gãy (do không hình thành các băng vạch ở dưới và có trọng lượng phân tử lớn). Một số mẫu còn có hiện tượng bị nhớt dính, có thể là do quá trình hòa tan mẫu chưa được tốt, lượng nước cho vào mẫu chưa đủ để làm tan hoàn toàn hết tủa DNA. Do đó, khi tiến hành đo nồng độ các mẫu DNA thì giữa các mẫu không có sự đồng đều về nồng độ. Tuy vậy, chúng tôi vẫn nhận định DNA tổng số thu được từ các mẫu nghiên cứu đã được tách chiết đủ điều kiện để sử dụng cho các thí nghiệm tiếp theo.

26

3.2. Kết quả khuếch đại các đoạn trình tự chứa SNP

Kết quả điện di sản phẩm PCR khuếch đại các trình tự chứa SNP của 90 cặp

mồi được thể hiện ở PHỤ LỤC 5.

Kết quả điện di sản phẩm PCR của cặp mồi S121 (~1015 bp)

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm

PCR của 48 mẫu cá tra STC Hình 7: Kết quả điện di sản phẩm PCR của một mồi đại diện trên gel agarose 0.8% Kết quả điện di kiểm tra sản phẩm PCR ở Hình 7 cho thấy tất cả các mẫu đều lên 1 băng sáng rõ và có kích thước nằm trong khoảng dự đoán ban đầu. Trong khi tiến hành PCR khuếch đại các đoạn trình tự chứa điểm SNP trên 96 mẫu DNA tổng số thì trong số tất cả 90 cặp mồi được thiết kế ban đầu sẽ có những cặp mồi không cho ra sản phẩm ở một vài mẫu. Các sản phẩm PCR của những cặp mồi không lên sẽ được tiến hành chạy PCR lần 2 để xác định nguyên nhân là do mồi, do hóa chất hay do thao tác kỹ thuật, máy móc. Sau đó, chúng tôi đã tiến hành loại bỏ những cặp mồi không đặc hiệu, những cặp mồi không cho sản phẩm ở quá nhiều mẫu với mục đích chỉ giữ lại những cặp mồi đã khuếch đại thành công các đoạn trình tự chứa điểm SNP trên cả 96 mẫu DNA để tiến hành thiết kế mồi kéo dài SBE. Sau khi sàng lọc, chúng tôi đã thu được 81 cặp mồi đáp ứng đủ điều kiện.

3.3. Kết quả tinh sạch sản phẩm PCR

Sau quá trình chọn lọc, 81 cặp mồi còn lại được tiến hành thiết kế mồi kéo dài SBE. Trong số 81 cặp mồi này, có 3 cặp mồi (S033, S066, S090) nhân được đoạn

27

trình tự có chứa 2 vị trí SNP, do đó chúng sẽ được thiết kế thành 2 mồi SBE riêng biệt tương đương với 2 đoạn trình tự chứa điểm SNP đó. Sau khi chia thành 11 nhóm, các sản phẩm PCR của từng mồi trong nhóm sẽ được trộn lẫn với nhau và được tiến hành tinh sạch theo hướng dẫn của nhà sản xuất. Kết quả điện di kiểm tra sản phẩm tinh sạch được thể hiện ở phần PHỤ LỤC 8.

Nhóm 3 Kết quả điện di 96 sản phẩm PCR tinh sạch của nhóm 3

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm

PCR của 48 mẫu cá tra STC

Hình 8: Kết quả điện di tinh sạch của đại diện một nhóm mẫu trên gel Agarose 0.8%

3.4. Kết quả điện di mao quản bộ mẫu chuẩn

Do các đoạn được tổng hợp từ phương pháp SBE thường di chuyển trong quá trình điện di mao quản nhanh hơn tốc độ của đoạn kích thước thực tế ít nhất 5 nucleotide nên chúng tôi đã tiến hành chạy điện di mao quản đối với bộ sản phẩm chuẩn (Bảng 2) được cung cấp sẵn trong bộ kit SNapShot (ABI) trên hệ thống máy ABI 3500 để cài đặt vị trí kích thước cho các SNP trong quá trình điện di mao

28

quản. Kết quả chạy điện di bộ sản phẩm chuẩn được thể hiện trong Hình 9 và Bảng 4.

Hình 9: Kết quả điện di mao quản bộ mẫu chuẩn 6 sản phẩm trên hệ thống phân tích ABI 3500

Bảng 4: Kết quả điện di mao quản đối với bộ sản phẩm chuẩn trên hệ thống phân tích ABI 3500

Từ kết quả ở Bảng 4, chúng tôi nhận thấy các sản phẩm SNapShot có kích thước càng nhỏ thì di chuyển trong điện di mao quản càng nhanh. Ví dụ như sản phẩm được tạo ra từ mồi 20A primer có kích thước thực tế là 21 nucleotide được hiển thị trong điện di mao quản ở vị trí 32.05 nucleotide (nhanh hơn 11 nucleotide), mồi 36G primer là 37 nucleotide được hiển thị trong điện di mao quản ở vị trí

29

khoảng 43.34 nucleotide (nhanh hơn 6 nucleotide), còn sản phẩm thực tế từ mồi 60C primer là 61 nucleotide được hiển thị trong điện di mao quản ở vị trí khoảng 65 nucleotide (nhanh hơn 4 nucleotide). Bên cạnh đó, các sản phẩm được tạo ra có kích thước thực tế nhỏ hơn 30 nucleotide thường được hiển thị ở vị trí lớn hơn 30 nucleotide trên điện di mao quản, và khá sít nhau, dù thực tế chiều dài chênh lệch tới 8 nucleotide, như sản phẩm của 2 mồi 20A primer và 28G/A primer lần lượt là 21 và 29 nucleotide, nhưng vị trí hiển thị trên điện di mao quản lại chỉ chênh nhau gần 2 nucleotide (lần lượt là 32.05 và khoảng gần 34 nucleotide). Với mỗi một đĩa chạy SNapShot của 96 mẫu cá tra, chúng tôi đều có chạy kèm với một bộ mẫu chuẩn, và kết quả của bộ mẫu chuẩn này chạy trên hệ thống máy phân tích ABI 3500 là khá ổn định trong cả 11 lần chạy cho 11 nhóm. Như vậy, chúng tôi có thể dựa vào độ chênh lệch giữa kích thước thực tế của các sản phẩm chuẩn với kích thước đọc được từ điện di mao quản để cài đặt bộ thông số về khoảng kích thước xác định cho 11 nhóm SNP (Binset).

3.5. Thiết lập 11 Binset cho 11 nhóm mẫu

Căn cứ vào độ chênh lệch giữa kích thước nhận được sau khi chạy bộ sản chuẩn trên hệ thống máy điện di mao quản 3500 so với kích thước thực tế qua 11 lần chạy, để xác định đúng khoảng vị trí của SNP cần cài đặt thì không thể dùng vị trí thực tế để xác định mà phải lựa chọn khoảng vị trí lớn hơn từ 5 đến 10 nucleotide. Kết hợp với phần dự đoán SNP đã được tiến hành trước đó, chúng tôi sẽ gọi tên luôn alen ở khoảng vị trí đó để phần mềm thống kê ra: ở mỗi mẫu, trong các tổ hợp đoạn vị trí quan tâm có SNP đã được dự đoán. Bằng cách này, sản phẩm từ 84 mồi SBE (được chia thành 11 nhóm) được phần mềm định vị ở kích thước và tên alen theo 11 bộ Binset.

Bảng 5: Danh sách 11 bộ Binset cho 11 nhóm sản phẩm SNapShot

STT Nhóm

Tên mồi

Alen dự đoán 1

Alen dự đoán 2

Chiều dài mồi

Chiều dài sản phẩm

Khoảng xác định vị trí (Bin)

1

T

C

48

49

55-57

EP3-S061_A-G

2

A

G

43

44

51-52.5

EP3-S031_T-C

G1

3

C

G

37

38

43-45

EP3-S049_G-C

30

4

G

T

30

31

37.1-38.5

EP3-S094_A-C

5

A

G

23

24

34-37

EP5-S111_G-A

6

A

G

74

75

79-81

EP5-S024_G-A

7

T

C

69

70

72-75

EP5-S089_C-T

8

G

A

64

65

68-70

EP_SV14_T-C

9

T

G

52

53

56-59

EP3-S037_C-A

10

A

C

47

48

53-55

EP3-S125_G-T

11

C

A

41

42

50-51

EP5-S013_A-C

G2

12

A

G

35

36

47-49.5

EP3-S105_C-T

13

T

C

29

30

45-46.5

EP3-S079_G- A_1305

14

G

A

23

24

41-44

EP5-S006_A-G

15

C

T

77

78

77-78.5

EP_SV12_A-G

16

T

C

71

72

71-74

EP3-S004_G-A

17

G

A

60

61

61-62

EP5-S067_A-G

18

C

G

54

55

56-60

EP3-S127_C-G

19

T

A

49

50

G3

50.2-51.5

EP5-S097_A-T

20

G

A

43

44

47-49.5

EP5-S082_A-G

21

A

G

37

38

44-46

EP5-S017_G-A

22

A

G

30

31

39.1-41

EP3-S030_C-T

23

T

G

23

24

35-39

EP3-S038_C-A

24

G

A

75

76

79-81

EP5-S048_A-G

25

T

C

70

71

EP5-S122_C-T

26

G

A

65

66

EP5-S113_A-G

G4

27

C

T

60

61

EP5-S056_T-C

28

T

G

54

55

EP3-S077_C-A

C: 75-76.4 T: 75.4-77 G: 69.5-71 A: 70.5-71.5 C: 62.2-63.5 T: 64-65.5 G: 59-60.7 T: 60-61.3

31

29

C

G

48

49

EP3-S039_C-G

30

C

A

42

43

EP5-S012_A-C

31

A

G

36

37

EP3-S047_C-T

G: 53.6-55.2 C: 53-54.2 A: 51-53 C: 51.47-52 G: 43-45 A: 43.5-45.8

32

C

T

30

31

39.5-41.5

EP3-S076_A-G

33

G

C

23

24

EP5-S046_C-G

G: 35.2-36.8 C: 37-39

34

A

C

76

77

81-83

EP5-S005_C-A

35

C

A

70

71

73-75

EP5-S034_A-C

36

C

G

64

65

66-68

EP_SV06_C-G

37

T

C

58

59

64-65.5

EP_SV03_G-A

38

C

T

52

53

60.5-63

EP5-S114_T-C

G5

39

T

C

46

47

52-56

EP3-S109_G-A

40

C

T

40

41

41-43

EP_SV08_T-C

41

A

G

35

36

40-41.5

EP_SV04_C-T

42

C

T

29

30

36-38

EP3-S078_A-G

43

G

A

23

24

30-33

EP5-S098_A-G

44

A

T

63

64

68.5-70.5

EP3-S081_A-T

45

G

A

57

58

63.5-65

EP5-S008_A-G

46

T

C

52

53

56.5-58.5

EP_SV15_C-T

47

C

A

46

47

50-52

EP3-S058_T-G

G6

48

G

T

41

42

44.5-46.5

EP_SV13_T-G

49

C

A

36

37

42-44

EP5-S011_A-C

50

A

G

23

24

38.5-41

EP3-S063_C-T

51

T

C

23

24

39-41

EP3-S124_G-A

52

C

T

52

53

56-60

EP3-S100_A-G

G7

53

T

C

46

47

52-54.5

EP3-S095_G-A

32

54

A

G

41

42

45.5-47.5

EP3-S020_C-T

55

T

C

36

37

38-40

EP3-S086_G-A

56

G

A

30

31

EP3-S001_T-C

57

A

T

23

24

EP3-S042_A-T

G: 34.5-36.5 A: 35.5-37.5 A: 33-35.4 T: 35-36.5

58

T

C

58

59

61-64.5

59

A

G

53

54

57-59

60

G

A

47

48

52-55

EP5-S090_C- T_4109 EP5-S033_G- A_1077 EP5-S090_A- G_3990

G8

61

A

T

41

42

48-50.5

EP5-S060_T-A

62

G

A

35

36

41.5-45

EP3-S033_T- C_992

63

C

T

29

30

38.5-42

EP5-S044_T-C

64

G

A

23

24

33-37

EP3-S036_T-C

65

T

G

57

58

56-58

EP3-S085_A-C

66

T

C

51

52

54-55.5

EP_SV07_G-A

67

A

G

46

47

50.5-53

EP3-S126_C-T

68

G9

G

A

41

42

47-50

EP5-S053_A-G

69

T

C

36

37

41-45

EP5-S118_C-T

70

G

A

30

31

39-42

EP5-S019_A-G

71

A

C

23

24

32-37.5

EP3-S071_G-T

72

A

G

68

69

77-81

EP_SV02_C-T

73

A

G

61

62

73-76.9

EP5-S066_G- A_2370

74

A

G

54

55

63-66

EP_SV05_G-A

G10

75

A

G

47

48

58-60.5

76

A

C

40

41

52-55.5

EP3-S121_C- T_643 EP5-S066_C- A_2055

77

A

T

32

33

35-40

EP_SV10_T-A

33

78

G

A

24

25

28-34

EP_SV16_C-T

79

G

C

53

54

57-59

EP3-S029_C-G

80

C

T

47

48

52-54

EP3-S028_G-A

81

A

G

42

43

48-51

EP5-S070_A-G

G11

82

T

C

37

38

39.3-42

EP3-S080_A- G_233

83

T

C

30

31

35.1-39.2

EP3-S099_A-G

84

A

C

23

24

EP5-S096_A-C

C: 33-35 A: 34-36

3.6. Kết quả chạy Binset cho các sản phẩm SNapShot của 11 nhóm

Như vậy, với mỗi bộ Binset này, từ kết quả điện di mao quản của 1 mẫu, có thể thấy sự phân bố của các khoảng vị trí ứng với các SNP của một nhóm, cụ thể: nhóm G1 có 5 SNP – 5 khoảng vị trí, nhóm G2 có 9 SNP – 9 khoảng vị trí, nhóm G3 có 9 SNP – 9 khoảng vị trí, nhóm G4 có 10 SNP – 10 khoảng vị trí, nhóm G5 có 10 SNP – 10 khoảng vị trí, nhóm G6 có 8 SNP – 8 khoảng vị trí, nhóm G7 có 6 SNP – 6 khoảng vị trí, nhóm G8 có 7 SNP – 7 khoảng vị trí, nhóm G9 có 7 SNP – 7 khoảng vị trí, nhóm G10 có 7 SNP – 7 khoảng vị trí, nhóm G11 có 6 SNP – 6 khoảng vị trí. Theo đó, 96 mẫu của 1 nhóm sẽ cho 96 pherogram phân bố vùng vị trí SNP của nhóm. Ở đây, chúng tôi chỉ lấy đại diện kết quả điện di mao quản của mỗi nhóm một hình để minh họa (PHỤ LỤC 7).

Các kết quả điện di mao quản với đầy đủ kết quả của 84 vị trí SNP cho thấy các nhóm từ G1 đến G11 được tổ hợp khá tối ưu, dựa trên sự tương đồng về kích thước của các sản phẩm PCR được dùng làm khuôn cho phản ứng SNapShot và biến đổi chiều dài ở đầu 5‘ của các mồi SBE vào một nhóm sao cho các mồi này không tạo cấu trúc bậc hai và ít bắt cặp với nhau nhất có thể, tạo điều kiện cho phản ứng SNapShot diễn ra dễ dàng.

34

Binset G1 gồm 5 mồi SBE (S061, S031, S049, S094 và S111)

Kết quả điện di mao quản nhóm sản phẩm SNapShot G1 của 5 mồi SBE (S061, S031, S049, S094 và S111) từ một mẫu cá tra sinh trưởng nhanh: kích thước sản phẩm thực tế lần lượt là 49,

44, 38, 31 và 24 nucleotide

Hình 10: Kết quả điện di mao quản của một nhóm mẫu đại diện G1

Hình 10 cho thấy độ nhạy của các sản phẩm SNapShot nhóm G1 trên điện di mao quản không cao, do có rất nhiều tín hiệu nền (background cao), đó là những peak phụ nằm ngoài khoảng Binset (trừ peak màu da cam của marker chuẩn- GeneScan Liz Size 120 Standard). Nguyên nhân có thể là do chúng tôi dồn nhiều khuôn cho phản ứng SNapShot (6 đến 10 khuôn) để xác định một nhóm có từ 6 đến 10 SNP (trong khi kit khuyến cáo nên sử dụng lượng khuôn rất ít từ 0.01 đến 0.4 pmol cho một phản ứng SNapShot 10 µL), dẫn đến lượng sản phẩm PCR được dùng làm khuôn cho phản ứng SNapShot được sử dụng nhiều hơn khuyến cáo, làm

35

giảm độ đặc hiệu của phản ứng gắn thêm 1 ddNTP gắn huỳnh quang. Mặc dù hiện tượng này còn gặp ở những nhóm G4, G5, G6, G7, G9, G10 nhưng nó không gây ảnh hưởng nhiều đến việc xác định Binset, nên để tiết kiệm thời gian và mẫu, đồng thời giảm thao tác tránh nhiễm chéo mẫu giữa các cá thể, chúng tôi không tiến hành đo nồng độ DNA của sản phẩm PCR tinh sạch dùng làm khuôn cho phản ứng SNapShot ở các thí nghiệm sau.

Ngoài ra, độ phân tách của các sản phẩm SNapShot trên điện di mao quản chưa thực sự tốt, kết quả peak chưa được rõ nét. Điều này có thể là do trong quá trình chạy điện di mao quản trên hệ thống máy ABI 3500, chúng tôi đã sử dụng POP-7TM polymer thay vì sử dụng POP-6TM. Trong một bài báo gần đây của Will và cộng sự (2017), nhóm nghiên cứu đã tiến hành phân tích 52 SNP sử dụng phương pháp kéo dài một nucleotide (Single-Base Extension - SBE) và SNP được xác định bằng phương pháp chạy điện di mao quản trên hệ thống máy phân tích ABI PRSM 310 sử dụng POP-4TM, máy phân tích 3500 sử dụng POP-6TM và POP- 7TM. Kết quả nghiên cứu cho thấy việc sử dụng POP-6TM với máy 3500 là hiệu quả nhất, sự phân tách các sản phẩm SBE kích thước nhỏ tốt hơn (đặc biệt đối với các sản phẩm SBE có kích thước dưới 60 nucleotide), điều này lại mâu thuẫn với việc sử dụng POP-7TM [23]. Tuy vậy, cũng có những nhóm kết quả khá tốt với độ nhạy và độ đặc hiệu cao, được thể hiện qua peak có hình dạng đặc trưng, chân peak nhỏ, ít hoặc không có peak phụ. Số SNP trong một phản ứng SNapShot có thể lên đến 10 SNP, nhưng hãng khuyến cáo chỉ nên làm 6 SNP để thu được kết quả tối ưu nhưng trong quá trình thực hiện thí nghiệm, chúng tôi đã thử làm nhóm mẫu có số SNP trong một nhóm lớn hơn số SNP được khuyến cáo như nhóm G2- 9 SNP, G3- 9 SNP, G8- 7 SNP... Kết quả thu được tương đối tốt, do đó, chúng tôi nhận thấy hoàn toàn có thể sử dụng POP-7TM polymer trên hệ điện di mao quản ABI 3500 để phân tách các sản phẩm có kích thước nhỏ như sản phẩm SNapShot.

3.7. Kết quả thống kê và tính xác suất theo thành phần kiểu gen và tần số alen tại các vị trí SNP cần kiểm nghiệm trên hai nhóm cá tra sinh trưởng nhanh và sinh trưởng chậm

Từ kết quả chạy của các Binset, phần mềm GeneMapper sẽ xuất cho người dùng một file kết quả cho mỗi nhóm SNP trên cả 96 cá thể cá tra (48 cá thể sinh

36

trưởng nhanh, 48 cá thể sinh trưởng chậm), cung cấp thông tin về alen ứng với mỗi khoảng vị trí được chỉ ra trong Binset. Theo đó, kết quả này được thống kê lại theo thành phần kiểu gen và tần số alen để dễ theo dõi (xem PHỤ LỤC 9). Đồng thời, thông qua 2 phép kiểm nghiệm FET và FST, chúng tôi tính được các giá trị FET (p- value) và FST cho sự khác nhau về thành phần kiểu gen (hay tần số alen) giữa hai nhóm sinh trưởng nhanh-chậm.

Kết quả thống kê chỉ ra bên cạnh những mẫu xác định được kiểu gen, còn có những mẫu không xác định được kiểu gen (Non-identify) và được kí hiệu kiểu gen là NN (xem PHỤ LỤC 9). Nguyên nhân của hiện tượng này có thể là do điều kiện tiến hành phản ứng SBE, mỗi một nhóm mẫu gồm 6 đến 10 SNP được trộn chung với nhau mà chưa được tối ưu về nồng độ dẫn đến sản phẩm gắn huỳnh quang của một số mẫu chưa đủ nhạy để được xác định trên hệ thống phân tích ABI 3500. Để đảm bảo tính khách quan của thí nghiệm, chúng tôi chỉ lựa chọn những kết quả mà số cá thể không xác định được kiểu gen ở hai nhóm sinh trưởng nhanh và sinh trưởng chậm không vượt quá 30% tổng số mẫu mỗi nhóm (NN<14) để tính xác suất thông qua hai chỉ số FET và FST. Kết quả ở phần PHỤ LỤC 9 cho thấy, có 6 vị trí SNP không đạt được điều kiện này (Ghi chú: Loại), 78 SNP còn lại đủ điều kiện để tính xác suất, đạt 92,86% tổng số SNP được kiểm nghiệm theo phương pháp SNapShot. Đó là một tỉ lệ cao vì quá trình tối ưu hóa phản ứng SNapShot cho một khối lượng SNP lớn trên một quần thể với hàng trăm cá thể thường đòi hỏi rất nhiều thời gian và hóa chất để có thể có được sản phẩm với độ nhạy và độ đặc hiệu cao nhất, nên chúng tôi chấp nhận kết quả này cho quy trình kiểm nghiệm SNP trong điều thời gian ngắn và hóa chất có hạn mức.

Đối với thông số kiểm định FST, giá trị trong khoảng từ 0 đến 0.05 phản ánh sự khác biệt di truyền mức độ thấp, giá trị trong khoảng từ 0.05 đến 0.15 phản ánh sự khác biệt di truyền mức độ trung bình, giá trị trong khoảng từ 0.15 đến 0.25 phản ánh sự khác biệt di truyền mức độ cao, và giá trị lớn hơn 0.25 phản ánh sự khác biệt di truyền rất cao (Hartl et Clark 1997, Wright 1978). Năm 2018, quần thể cá hồi ở miền Trung Na-uy được xem xét đa dạng di truyền với quần thể cá hồi ở phía Tây và phía Nam của cùng quốc gia này, và với các quần thể cá hồi trên phạm vi toàn cầu. Kết quả cho thấy, sự khác biệt di truyền giữa quần thể cá hồi được

37

kiểm nghiệm với các quần thể cá hồi trên phạm vi toàn cầu đạt chỉ số FST là 0.0789, giữa hai quần thể cá hồi ở phía Tây Na-uy và phía Nam Na-uy đạt FST từ 0.101 đến 0.1312, còn giữa các quần thể ở cùng phía Nam đạt FST từ 0.0023 đến 0.0030, giữa các quần thể ở cùng phía Tây đạt FST = 0.0065. Bên cạnh đó, cá hồi ở miền Trung Na-uy có sự tương đồng di truyền với quần thể cá hồi ở phía Tây Na- uy hơn (do giá trị FST thấp đạt từ 0.0243- 0.0277) là tương đồng với quần thể phía Nam Na-uy (do giá trị FST đạt 0.1163 đến 0.1258) [19]. Như vậy, các quần thể thuộc cùng một vùng địa lý, ít có sự sai khác di truyền thì có giá trị FST càng nhỏ, các quần thể ở các vùng càng xa nhau về mặt địa lý càng có sự sai khác di truyền, thể hiện qua giá trị FST càng lớn. Để đánh giá sự sai khác di truyền giữa hai quần thể thì giá trị FST tối thiểu đạt 0.05 là giá trị được phần lớn các nghiên cứu về thống kê di truyền quần thể lựa chọn (Francois et Nicolas 2002). Tuy nhiên cũng có những nghiên cứu về khác biệt di truyền có thêm yếu tố môi trường sử dụng giá trị FST nhỏ hơn 0.05 (từ 0.02 đến 0.04) [25] .

So sánh với các nghiên cứu về việc sử dụng các dấu chuẩn phân tử để chọn lọc các tính trạng liên quan đến phân bố, sinh trưởng, chất lượng sản phẩm hay khả năng chống chịu bệnh, ô nhiễm trong môi trường sống của các loài có giá trị kinh tế cao trong nông nghiệp như: dấu chuẩn đa hình chiều dài đoạn (AFLP) hay dấu chuẩn microsattelite, giá trị FST 0.05 được lựa chọn trong nghiên cứu đại diện cho sự sai khác về đa dạng di truyền ở mức độ trung bình. Cụ thể, William và Oleksiak (2008) khi nghiên cứu sự khác biệt về các AFLP giữa 3 quần thể cá xương Mummichog (Fundulus heteroclitus) có liên quan đến mức độ chống chịu khác nhau của 3 quần thể này với sự ô nhiễm hóa chất trong môi trường sống, đã chỉ ra sự sai khác di truyền giữa các quần thể ở mức độ thấp với các giá trị FST từ 0.018 đến 0.039 [53]. Cũng trên loài cá Mummichog này, sự khác nhau về đa dạng di truyền microsattelite giữa các quần thể thuộc các vùng phân bố khác nhau đạt mức độ trung bình với giá trị FST từ 0.043 đến 0.101 [12].

Đối với đa dạng di truyền SNP liên quan đến chọn lọc tính trạng ở các loài, việc đặt ngưỡng cho giá trị FST để căn cứ vào đó để chọn lọc các SNP làm dấu chuẩn cũng khá khác nhau trong các nghiên cứu. Diopere (2013), khi nghiên cứu về các SNP liên quan đến tính trạng sinh trưởng và thành thục của hai quần thể cá bơn

38

(Solea solea L.) ở biển Bắc (Bỉ) và vùng chuyển tiếp giữa Biển Bắc –biển Baltic, đã chọn ngưỡng FST 0.01 để đánh giá sự sai khác SNP giữa hai quần thể đó là có liên quan đến tính trạng quan tâm [17]. Tuy nhiên, nghiên cứu khác trên dê nuôi, tìm kiếm các SNP có liên quan đến kích thước cơ thể dê để người nuôi có thể chọn lọc bằng mắt thường, và liên quan đến hàm lượng dinh dưỡng trong sữa dê, lại đặt ra ngưỡng FST cao hơn 0.078 để kiểm nghiệm sự sai khác di truyền SNP giữa các quần thể được kiểm tra [36]. Do đó, chúng tôi lựa chọn điều kiện xác suất: giá trị FET nhỏ hơn 1% (p-value <0.01) và giá trị FST ≥ 0.05 để kiểm định sự sai khác di truyền giữa hai nhóm cá tra sinh trưởng nhanh và sinh trưởng chậm. Hơn nữa, tính trạng sinh trưởng là một tính trạng được quy định và chịu tác động bởi nhiều gen, sự khác biệt tính trạng sinh trưởng là tác động cộng gộp của rất nhiều yếu tố, do vậy sự ảnh hưởng của mỗi SNP là rất nhỏ. Với điều kiện này, chúng tôi lựa chọn được 13 SNP có thành phần kiểu gen và tần số alen khác nhau giữa hai nhóm được liệt kê ở Bảng 6, chiếm 15.5% số SNP được kiểm nghiệm.

Bảng 6: Các SNP được lựa chọn với điều kiện xác suất (FET<0.01, FST ≥ 0.05)

39

Để lựa chọn được các SNP tiềm năng làm marker phân tử cho sự sinh trưởng nhanh và chậm ở cá tra, chúng tôi cần đưa ra điều kiện sàng lọc về xác suất chặt chẽ hơn, cụ thể là chỉ số FST cần đạt ít nhất là 0.1 (Meirmans et Hedrick 2011), có nghĩa là sự khác nhau về tần số alen giữa hai nhóm sinh trưởng nhanh và sinh trưởng chậm phải đạt ít nhất 10%. Theo tiêu chuẩn này, chúng tôi chọn được 4 SNP có giá trị p-value < 0.01 và FST ≥ 0.1 (Các dòng bôi màu ở Bảng 5) là những marker tiềm năng nhất. Chức năng của 4 SNP này đã được chú giải ở Bảng 6. Theo đó, ở SNP S121-643, sự thay đổi alen sẽ dẫn đến sự thay đổi axit amin (đột biến nhầm nghĩa), ở SNP S063 và S078 sự thay đổi alen dẫn đến sự biến đổi ở vùng 3`- Không dịch mã (3`-UTR), ở S024 dẫn đến đột biến đồng nghĩa trên khung đọc mở (ORF). Đặc biệt, SNP S121-643 gây nên sự biến đổi trình tự axit amin từ Arginine thành Glutamine, đây là hai axit amin thuộc hai nhóm phân loại khác nhau. Trong khi Arginine thuộc nhóm axit amin phân cực, mang điện tích dương, có tính ba-zơ, với pI đạt 10.76 thì Glutamine lại thuộc nhóm axit amin phân cực, không mang điện tích, trung tính, với pI chỉ đạt 5.65 [48]. Theo đó, đột biến từ Arginine thành Glutamine có thể gây tác động đến hoạt động protein. Các SNP dẫn đến sự biến đổi ở vùng Không dịch mã (UTR) cũng chiếm một tỉ lệ khá lớn trong số các SNP được sàng lọc để tìm kiếm mối liên quan với tính trạng quan tâm. Cụ thể, 43% SNP thuộc vùng 3` và 5`-UTR trong tổng số 435 SNP thuộc 326 gen được kiểm nghiệm trên cá bơn nước ngọt Bắc Đại Tây dương (Scophthalmus maximus) để theo dõi tính trạng sinh trưởng [39]. Phần trăm của SNP giả định có liên quan đến trọng lượng cơ và các tính trạng chất lượng của cá hồi vân (Oncorhynchus mykiss) thuộc vùng 3`-UTR lên tới 17.24% [13]. Nghiên cứu của Fu và cộng sự (2009) đã chỉ ra SNP ở vùng 3`-UTR của gen CDIPT có liên quan đến tính trạng chất lượng thịt ở lợn nuôi [22]. Hai trong số 4 SNPs thuộc vùng 3`-UTR của gen TLR-8 là 4062 A/T và 4168 C/T được phát hiện là có liên quan mật thiết đến khả năng chống chịu bệnh xuất huyết do virus ở cá trắm cỏ Ctenopharyngodon idella (grass carp reovirus – GCRV) [44]. Như vậy việc khảo sát tiếp các SNP gây đột biến nhầm nghĩa và đột biến ở vùng 3`-UTR trong nghiên cứu này ở quần thể lớn hơn nhằm tìm kiếm mối tương quan với tính trạng sinh trưởng là rất có tiềm năng.

40

Bảng 7: Chú giải chức năng transcript chứa 4 chỉ thị SNP và dự đoán ảnh hưởng của SNP

41

CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ

4.1. Kết luận Từ những kết quả thu được, chúng tôi có những kết luận chính sau đây:

- Tách chiết thành công DNA tổng số của 96 mẫu cá tra (48 cá thể sinh trưởng nhanh và 48 cá thể sinh trưởng chậm) đủ điều kiện để sử dụng làm khuôn cho phản ứng khuếch đại các đoạn gen có chứa SNP tiềm năng

- Thiết kế thành công 84 mồi SBE, nhóm thành 11 nhóm mồi và tiến hành

thực hiện phản ứng SNapShot.

- Với điều kiện xác suất FET<0.01 (p-value <0.01) và FST>=0.05, chúng tôi thu được 13 SNP trên 84 SNP có sự sai khác về thành phần kiểu gen và tần số alen giữa hai nhóm cá tra sinh trưởng nhanh và cá tra sinh trưởng chậm, chiếm 15.5% số SNP được kiểm nghiệm.

- Với điều kiện xác xuất FET<0.01 (p-value <0.01) và FST>=0.1, chúng tôi thu được 4 SNP có sự sai khác về thành phần kiểu gen và tần số alen giữa hai nhóm cá tra sinh trưởng nhanh và cá tra sinh trưởng chậm ở mức độ cao hơn. Đây là những chỉ thị SNP có tiềm năng cần được tiếp tục kiểm nghiệm để định hướng ứng dụng trong chọn giống cá tra.

4.2. Kiến nghị Từ những kết luận trên, tiếp tục kiểm nghiệm sự sai khác di truyền về thành phần kiểu gen và tần số alen của 13 SNP marker tiềm năng trên trong tương lai, với quy mô quần thể lớn hơn, để có thể khẳng định chắc chắn hơn nữa tính chính xác của các SNP marker này nhằm ứng dụng chỉ thị phân tử trong chọn giống cá tra theo hướng tăng trưởng.

42

TÀI LIỆU THAM KHẢO

Tài liệu tiếng việt

1. Bùi Thị Liên Hà, Nguyễn Văn Sáng, Nguyễn Văn Hảo, David Hurwud, Peter Mather (2011). Bước đầu đánh giá đa dạng di truyền quần đàn cá tra

(Pangasianodon hypophthalmus) có nguồn gốc tự nhiên, từ các trại giống và từ

chương trình chọn giống ở Việt Nam. Tuyển tập nghề cá Đồng Bằng Sông Cửu

Long. NXB Nông nghiệp, ISSN 1859-1159, trang 13-24.

2. Đào Thị Tuyết, Quyền Đình Thi, Nguyễn Thị Bảy, Phạm Anh Tuấn (2003). Đánh

giá tính đa hình các quần đàn cá tra nuôi (Pangasius hypophthalmus) ở Việt Nam

bằng phương pháp RAPD. Hội nghị Công nghệ Sinh học Toàn quốc. NXB Khoa

học và Kỹ thuật Hà Nội, trang 616-620.

3.

http://kythuatnuoitrong.com/dac-diem-sinh-hoc-ca-tra/.

4.

http://thitruongthuysan.com/xuat-khau-ca-tra-nhin-ve-dai-han_18340.html.

5.

https://baotintuc.vn/kinh-te/ca-tra-viet-lo-mat-thi-truong-xuat-khau-

20180902135649380.htm.

6. Nguyễn Văn Cường, Nguyễn Thu Thúy, Nguyễn Thị Diệu Thúy, Nguyễn Kim Độ,

Phạm Anh Tuấn (2003). Phân

tích di

truyền AFLP cá

tra (Pangasius

hypophthalmus). Tuyển tập báo cáo khoa học về nuôi trồng thủy sản. Hội nghị khoa

học toàn quốc lần thứ 2 (24-25/11/2003). Nxb Nông nghiệp, Hà Nội, trang 85-88.

7. Nguyễn Văn Kiểm (2004). Giáo trình sản xuất cá giống. Trường Đại Học Cần Thơ.

8. Nguyễn Văn Sáng, Nguyễn Văn Hảo, Trần Đình Trọng, Nguyễn Công Dân, Quyền

Đình Thi, Nguyễn Thị Diệu Thúy, Đinh Hùng, Phạm Đình Khôi, Bùi Thị Liên Hà, Nguyễn Điền, Nguyễn Quyết Tâm, Ngô Hồng Ngân, Trịnh Quang Sơn (2009).

Chọn giống cá tra (Pangasianodon hypophthalmus) nhằm tăng tỷ lệ phi lê bằng chọn lọc gia đình. Viện Nghiên cứu Nuôi trồng Thủy sản II, 84 trang.

9.

Phạm Anh Tuấn, Nguyễn Hữu Ninh (2003). Microsatellite nghiên cứu biến dị về màu sắc thịt trắng và thịt vàng của cá tra (Pangasius hypophthalmus). Tuyển tập

10.

báo cáo khoa học về nuôi trồng thủy sản. Hội nghị Khoa học toàn quốc lần thứ 2 (24-25/11/2003). Nxb Nông nghiệp, Hà Nội, trang 59-62. Phạm Văn Khánh (2000). Kỹ thuật nuôi cá tra và cá ba sa trong bè. Nxb Nông Nghiệp TP Hồ Chí Minh.

43

Tài liệu tiếng anh

11. Abdelrahman H., ElHady M., et al, (2017), Aquaculture genomics, genetics and

breeding in the United States: current status, challenges, and priorities for future

research. BMC Genomics. 18(1): p. 191.

12. Adams S. M., Lindmeier J. B., and Duvernell D. D., (2006), Microsatellite analysis

of the phylogeography, Pleistocene history and secondary contact hypotheses for the

killifish, Fundulus heteroclitus. Mol Ecol. 15(4): p. 1109-23.

13. Al-Tobasei R., Ali A., Leeds T. D., Liu S., Palti Y., Kenney B., and Salem M.,

(2017), Identification of SNPs associated with muscle yield and quality traits using allelic-imbalance analyses of pooled RNA-Seq samples in rainbow trout. BMC

Genomics. 18(1): p. 582.

14. Andolfatto P., Davison D., Erezyilmaz D., Hu T. T., Mast J., Sunayama-Morita T.,

and Stern D. L., (2011), Multiplexed shotgun genotyping for rapid and efficient genetic mapping. Genome Res. 21(4): p. 610-7.

15. Castaño-Sánchez C., Fuji K., et al, (2010), A second generation genetic linkage map

of Japanese flounder (Paralichthys olivaceus). BMC Genomics. 11(1): p. 554.

16. Cuevas-Rodríguez B., María Sifuentes-Rincón A., Ambriz-Morales P., García-Ulloa

G M., Valdez González F., and Rodríguez-González H., Novel single nucleotide

polymorphisms in candidate genes for growth in tilapia ( Oreochromis niloticus ).

Vol. 45. 2016. 345-348.

17. Diopere E., Hellemans B., Volckaert F. A., and Maes G. E., (2013), Identification

and validation of single nucleotide polymorphisms in growth- and maturation-

related candidate genes in sole (Solea solea L.). Mar Genomics. 9: p. 33-8.

18. Elshire R. J., Glaubitz J. C., Sun Q., Poland J. A., Kawamoto K., Buckler E. S., and Mitchell S. E., (2011), A robust, simple genotyping-by-sequencing (GBS) approach

for high diversity species. PLoS One. 6(5): p. e19379.

19. Faust E., Halvorsen K. T., Andersen P., Knutsen H., and André C., (2018), Cleaner fish escape salmon farms and hybridize with local wrasse populations. Royal

Society Open Science. 5(3).

20. Feng X., Yu X., and Tong J., (2014), Novel single nucleotide polymorphisms of the insulin-like growth factor-I gene and their associations with growth traits in common carp (Cyprinus carpio L.). Int J Mol Sci. 15(12): p. 22471-82.

44

21. Fiorentino F., Magli M. C., Podini D., Ferraretti A. P., Nuccitelli A., Vitale N., . . . Gianaroli L., (2003), The minisequencing method: an alternative strategy for

preimplantation genetic diagnosis of single gene disorders. Mol Hum Reprod. 9(7):

p. 399-410.

22. Fu Y. Y., Xiong Y. Z., Pan G., Cheng L., Li F., and Zuo B., (2009), Association of the polymorphism of porcine CDIPT gene with carcass and meat quality traits. Chin

J Anim Vet Sci 40: p. 787-91.

23. Goodwin W. and Alimat S., (2017), Analysis of four PCR/SNaPshot multiplex

assays analyzing 52 SNPforID markers. Electrophoresis. 38(7): p. 1007-1015.

24. Hutchison C. A., 3rd, (2007), DNA sequencing: bench to bedside and beyond.

Nucleic Acids Res. 35(18): p. 6227-37.

25. José M. C., Takahito S., Anna K., and Juha M., Genetic differentiation, effective

population size and gene flow inmarine fi shes: implications for stock management.

JIFS. 5: p. 1-10.

26. Kim O. T. P., Nguyen P. T., Shoguchi E., Hisata K., Vo T. T. B., Inoue J., . . . Satoh

N., (2018), A draft genome of the striped catfish, Pangasianodon hypophthalmus,

for comparative analysis of genes relevant to development and a resource for

aquaculture improvement. BMC Genomics. 19(1): p. 733.

27. Laghari M. Y., Lashari P., Zhang X., Xu P., Xin B., Zhang Y., . . . Sun X., (2014),

Mapping quantitative trait loci (QTL) for body weight, length and condition factor

traits in backcross (BC1) family of Common carp (Cyprinus carpio L.). Mol Biol

Rep. 41(2): p. 721-31.

28. Lal M. M., Southgate P. C., Jerry D. R., and Zenger K. R., (2016), Fishing for divergence in a sea of connectivity: The utility of ddRADseq genotyping in a marine

invertebrate, the black-lip pearl oyster Pinctada margaritifera. Mar Genomics. 25:

p. 57-68.

29. Li C., Waldbieser G., Bosworth B., Beck B. H., Thongda W., and Peatman E.,

(2014), SNP discovery in wild and domesticated populations of blue catfish, Ictalurus furcatus, using genotyping-by-sequencing and subsequent SNP validation. Mol Ecol Resour. 14(6): p. 1261-70.

30. Li Y., Liu S., Qin Z., Waldbieser G., Wang R., Sun L., . . . Liu Z., (2015), Construction of a high-density, high-resolution genetic map and its integration with

45

BAC-based physical map in channel catfish. DNA research : an international journal for rapid publication of reports on genes and genomes. 22(1): p. 39-52.

31. Liu S., Zhou Z., Lu J., Sun F., Wang S., Liu H., . . . Liu Z., (2011), Generation of

genome-scale gene-associated SNPs in catfish for the construction of a high-density

SNP array. BMC Genomics. 12: p. 53.

32. Macqueen D. J., Primmer C. R., Houston R. D., Nowak B. F., Bernatchez L.,

Bergseth S., . . . Yanez J. M., (2017), Functional Annotation of All Salmonid

Genomes (FAASG): an international initiative supporting future salmonid research,

conservation and aquaculture. BMC Genomics. 18(1): p. 484.

33. McAndrew B. and Napier J., (2011), Application of genetics and genomics to

aquaculture development: Current and

future directions. The Journal of

Agricultural Science. 149(S1): p. 143-151.

34. Nelson T. M., Just R. S., Loreille O., Schanfield M. S., and Podini D., (2007),

Development of a multiplex single base extension assay for mitochondrial DNA

haplogroup typing. Croat Med J. 48(4): p. 460-72.

35. Oyarzún P. A., Toro J. E., and Navarro J. M., (2013), Comparison of the

physiological energetics between Mytilus chilensis, Mytilus galloprovincialis and

their hybrids, under laboratory conditions. Aquaculture Research. 44(12): p. 1805-

1814.

36. Pariset L., Joost S., Marsan P. A., and Valentini A., (2009), Landscape genomics

and biased FST approaches reveal single nucleotide polymorphisms under selection

in goat breeds of North-East Mediterranean. BMC Genet. 10: p. 7.

37. Phillips C., Salas A., Sanchez J. J., Fondevila M., Gomez-Tato A., Alvarez-Dios J., . . . Carracedo A., (2007), Inferring ancestral origin using a single multiplex assay of

ancestry-informative marker SNPs. Forensic Sci Int Genet. 1(3-4): p. 273-80.

38. Podini D. and Vallone P. M., (2009), SNP genotyping using multiplex single base

primer extension assays. Methods Mol Biol. 578: p. 379-91.

39. Robledo D., Rubiolo J. A., Cabaleiro S., Martínez P., and Bouza C., (2017), Differential gene expression and SNP association between fast- and slow-growing turbot (Scophthalmus maximus). Scientific Reports. 7(1): p. 12105.

40. Salem M., Vallejo R. L., Leeds T. D., Palti Y., Liu S., Sabbagh A., . . . Yao J., (2012), RNA-Seq identifies SNP markers for growth traits in rainbow trout. PLoS

One. 7(5): p. e36264.

46

41. Sanchez J. J., Borsting C., Hallenberg C., Buchard A., Hernandez A., and Morling N., (2003), Multiplex PCR and minisequencing of SNPs--a model with 35 Y

chromosome SNPs. Forensic Sci Int. 137(1): p. 74-84.

42. Sanger F., Nicklen S., and Coulson A. R., (1977), DNA sequencing with chain-

terminating inhibitors. Proc Natl Acad Sci U S A. 74(12): p. 5463-7.

43. Shao C., Niu Y., Rastas P., Liu Y., Xie Z., Li H., . . . Chen S., (2015), Genome-wide

SNP identification for the construction of a high-resolution genetic map of Japanese

flounder (Paralichthys olivaceus): applications to QTL mapping of Vibrio

anguillarum disease resistance and comparative genomic analysis. DNA Res. 22(2):

p. 161-70.

44. Su J., Su J., Shang X., Wan Q., Chen X., and Rao Y., (2015), SNP detection of TLR8

gene, association study with susceptibility/resistance to GCRV and regulation on

mRNA expression in grass carp, Ctenopharyngodon idella. Fish Shellfish Immunol.

43(1): p. 1-12.

45. Sun C., Niu Y., Ye X., Dong J., Hu W., Zeng Q., . . . Lu M., (2017), Construction of

a high-density linkage map and mapping of sex determination and growth-related

loci in the mandarin fish (Siniperca chuatsi). BMC genomics. 18(1): p. 446-446.

46. Syvanen A. C., (1999), From gels to chips: "minisequencing" primer extension for

analysis of point mutations and single nucleotide polymorphisms. Hum Mutat.

13(1): p. 1-10.

47. Tao W. J. and Boulding E. G., (2003), Associations between single nucleotide

polymorphisms in candidate genes and growth rate in Arctic charr (Salvelinus

alpinus L.). Heredity (Edinb). 91(1): p. 60-9.

48. Taylor W. R., (1986), The classification of amino acid conservation. Journal of

Theoretical Biology. 119(2): p. 205-218.

49. Tsai H. Y., Hamilton A., Guy D. R., and Houston R. D., (2014), Single nucleotide polymorphisms in the insulin-like growth factor 1 (IGF1) gene are associated with

growth-related traits in farmed Atlantic salmon. Anim Genet. 45(5): p. 709-15. 50. Tsigenopoulos C. S., Louro B., Chatziplis D., Lagnel J., Vogiatzi E., Loukovitis D., . . . Kotoulas G., (2014), Second generation genetic linkage map for the gilthead sea bream Sparus aurata L. Marine Genomics. 18: p. 77-82.

47

51. Vallone P. M. and Butler J. M., (2004), Y-SNP typing of U.S. African American and Caucasian samples using allele-specific hybridization and primer extension. J

Forensic Sci. 49(4): p. 723-32.

52. Wang L., Wan Z. Y., Bai B., Huang S. Q., Chua E., Lee M., . . . Yue G. H., (2015),

Construction of a high-density linkage map and fine mapping of QTL for growth in Asian seabass. Sci Rep. 5: p. 16358.

53. Williams L. M. and Oleksiak M. F., (2008), Signatures of selection in natural

populations adapted to chronic pollution. BMC Evol Biol. 8: p. 282.

54. Xu P., Zhang X., Wang X., Li J., Liu G., Kuang Y., . . . Sun X., (2014), Genome

sequence and genetic diversity of the common carp, Cyprinus carpio. Nat Genet.

46(11): p. 1212-9.

55. Yanez J. M., Newman S., and Houston R. D., (2015), Genomics in aquaculture to

better understand species biology and accelerate genetic progress. Front Genet. 6:

p. 128.

PHỤ LỤC 1: Danh sách 96 mẫu cá tra (gồm 48 mẫu STN và 48 mẫu STC)

STT

Loại

Kí hiệu STT

Loại

Kí hiệu

1

Sinh trưởng chậm

1

Sinh trưởng nhanh

2

9

2

Sinh trưởng chậm

2

Sinh trưởng nhanh

42

22

3

Sinh trưởng chậm

3

Sinh trưởng nhanh

48

46

4

Sinh trưởng chậm

4

Sinh trưởng nhanh

118

54

5

Sinh trưởng chậm

5

Sinh trưởng nhanh

123

70

6

Sinh trưởng chậm

6

Sinh trưởng nhanh

128

76

7

Sinh trưởng chậm

7

Sinh trưởng nhanh

140

79

8

Sinh trưởng chậm

8

Sinh trưởng nhanh

159

80

9

Sinh trưởng chậm

9

Sinh trưởng nhanh

195

125

10 Sinh trưởng chậm

10 Sinh trưởng nhanh

205

133

11 Sinh trưởng chậm

11 Sinh trưởng nhanh

3

136

12 Sinh trưởng chậm

12 Sinh trưởng nhanh

41

137

13 Sinh trưởng chậm

13 Sinh trưởng nhanh

103

15

14 Sinh trưởng chậm

14 Sinh trưởng nhanh

122

25

15 Sinh trưởng chậm

15 Sinh trưởng nhanh

127

33

16 Sinh trưởng chậm

16 Sinh trưởng nhanh

132

34

17 Sinh trưởng chậm

17 Sinh trưởng nhanh

139

39

18 Sinh trưởng chậm

18 Sinh trưởng nhanh

142

96

19 Sinh trưởng chậm

19 Sinh trưởng nhanh

153

116

20 Sinh trưởng chậm

20 Sinh trưởng nhanh

177

131

21 Sinh trưởng chậm

21 Sinh trưởng nhanh

181

141

22 Sinh trưởng chậm

22 Sinh trưởng nhanh

200

180

23 Sinh trưởng chậm

23 Sinh trưởng nhanh

13

190

24 Sinh trưởng chậm

24 Sinh trưởng nhanh

23

192

25 Sinh trưởng chậm

25 Sinh trưởng nhanh

24

14

26 Sinh trưởng chậm

26 Sinh trưởng nhanh

31

49

27 Sinh trưởng chậm

27 Sinh trưởng nhanh

35

53

28 Sinh trưởng chậm

28 Sinh trưởng nhanh

38

61

29 Sinh trưởng chậm

29 Sinh trưởng nhanh

57

62

30 Sinh trưởng chậm

30 Sinh trưởng nhanh

59

69

31 Sinh trưởng nhanh

31 Sinh trưởng chậm

71

77

32 Sinh trưởng nhanh

32 Sinh trưởng chậm

78

82

33 Sinh trưởng nhanh

33 Sinh trưởng chậm

92

84

34 Sinh trưởng nhanh

34 Sinh trưởng chậm

93

104

35 Sinh trưởng nhanh

35 Sinh trưởng chậm

99

112

36 Sinh trưởng nhanh

36 Sinh trưởng chậm

100

135

37 Sinh trưởng nhanh

37 Sinh trưởng chậm

117

114

38 Sinh trưởng nhanh

38 Sinh trưởng chậm

145

154

39 Sinh trưởng nhanh

39 Sinh trưởng chậm

152

155

40 Sinh trưởng nhanh

40 Sinh trưởng chậm

165

176

41 Sinh trưởng nhanh

41 Sinh trưởng chậm

175

182

42 Sinh trưởng nhanh

42 Sinh trưởng chậm

183

189

43 Sinh trưởng nhanh

43 Sinh trưởng chậm

187

191

44 Sinh trưởng nhanh

44 Sinh trưởng chậm

214

207

45 Sinh trưởng nhanh

45 Sinh trưởng chậm

216

209

46 Sinh trưởng nhanh

46 Sinh trưởng chậm

218

212

47 Sinh trưởng nhanh

47 Sinh trưởng chậm

6

215

48 Sinh trưởng nhanh

48 Sinh trưởng chậm

18

217

PHỤ LỤC 2: Danh sách các cặp mồi nhân đoạn trình tự DNA chứa SNP.

STT

ID

Trình tự

Kích thước (bp)

S001-F

GGCTTTCTGACTTCTTGTTTCTCA

1

688

S001-R

CAAGGTATTTTCAAAGCAGGGACA

S003-F

ATGTAAGCGCACTTGAAGAAGAG

2

718

S003-R

CAGAGTTGTTTCTGACTTGCTGA

S004-F

TCATGTATCGTTAAGCTTTAGCAC

3

527

S004-R

TTTAAAACGCTCGGTAACTATGG

S005-F

AAAATACTCAAACCAGCCCATCTG

4

615

S005-R

AACAGATCCAAAGGGTTCTTGTTC

S006-F

CAGCAAGGTGGCATGAAATATG

5

509

S006-R

TAACTATCCAATCATGTGCATCC

S008-F

TACTGTGGCATTACTTTCACTCCA

6

639

S008-R ATGTGATGAAGGAGGAAAACCAGA

S011-F

TGTGAAAATCTCAAATACTCCATC

7

654

S011-R

ATAAAATACTTGACACCAACAGTC

S012-F

TTATCTGTGTATTTTAAGTGTGG

8

570

S012-R

TTAGTAAACAAGTAAACCTGAACC

S013-F

TACAGATTAGAAAGGGCTAGTTTG

9

514

S013-R

AAACACTTTAATTTTCACAATGCT

S017-F

GTAAGCAAGAAAAGAAGCCAGCA

10

540

S017-R

CCGTATGATCCAAAGAAAGACCTG

S019-F

CACTTATGCAAGCCAACGTATTC

11

729

S019-R

TCTGTGTTCTACTATATGCGCTGA

S020-F

TGGGTCATTCTTTGCTTTGTGA

12

670

S020-R

ACTTCATTTCTACGGAATGTGAC

S024-F

GTCATCAAGGGTTACATCATCTGC

13

512

S024-R

ACACATTTACAGCATTGCCAACA

S028-F

TGATCCTGAAGAACATTGAGAAG

14

695

S028-R

ATATGAAGCTTTGGGAATTTGG

S029-F

GATCCTTGCCAAAGGCTTATC

15

694

S029-R

CATGATGCCTGAAATAAATGTGA

16

S030-F

ACGATATTGCACTGAGATGTTTGA

537

S030-R

AATGAAGTTTGTTGTCATCCAGGT

S031-F

ATCTACGAAAGCCATGTGTAAG

17

462

S031-R

TACACTCTCATTACAGATTCAG

S033-F

TCCATTCTGTAGGTTTCTGTGATG

18

699

S033-R

AGCATGGAGATTAGTGAGACTGC

S034-F AAAATGATAGAAAATAGGATTGTGC

19

618

S034-R

CAGTAAATAAACAGTCAGTCAGG

S036-F

TAGCCTACATCTGTTTGGCTGA

20

695

S036-R

TGTTGGGCATCATCTGTTAAG

S037-F

AAACACAATGCACAATAAAGTC

21

504

S037-R

TTAAAACCACCATGTTTATGACG

S038-F

CATGGGATGGTCTCTTACTTTCTG

22

523

S038-R

GGCAGGTATTTTGTACCCATTCA

S039-F

CACACCTATAAAACCTGCATCTGA

23

597

S039-R

TAACCTGGAAGTGGTAAGCTAG

S042-F

TTGTTCCACTGGGAATCTGAATTG

24

674

S042-R

TCTCCCTCTCCAATCCTTTCATAC

S044-F

CTCTTTGGCACAGTGAAATG

25

707

S044-R

AGTGCAGTGATCATTCAACAGAC

S046-F

TTTAAGAGTTGTTTTAGAAATGTGC

26

571

S046-R AAAAGGAGAATAACACTGTACATC

S047-F

TCAGAGCACCTAGAGTATTTCAGA

27

521

S047-R AATACCAACATGGCTCTATGGAAG

S048-F

ACAGTGGTCATGGTATTAGTCAGA

28

589

GCACCTCTCTCTTTTACTTTCCTC

S048-R

CAATCACGGTTTACAATCTTAC

S049-F

29

483

S049-R

TATTAGCCATTCAAGAAGTACAAC

TGACAACATTCAGCCATTTGTAG

S053-F

30

716

AATCTGTGAACACACGAAATTG

S053-R

TTGTACTTTTTCTACTCATCTCAC

S056-F

31

572

S056-R

TATGATGACAGTACAAAGCTAATG

S058-F

CGCCATCTTATTGTGTACTTATTC

32

630

S058-R

AATCTGTATTAAACCCAGCTAC

S059-F

ATACTGCGTGATAACTAGGGTTC

33

550

S059-R

TGCACCCCATGACAAAATATAGAC

S060-F

GCCCAGTCAGAATGAATAAAGTG

34

701

S060-R

AGATGACAGCCTGAACTCAAATC

S061-F

ATTTCCTGTTCACAAATTACTAGC

35

450

S061-R ATTTTTGAATGATTACATTTTGCAG

S063-F

AGGTTTGGGTGGGTTTTTAATCTG

36

648

S063-R

GGTGTGTGAGATTTGACCATAC

S066-F

AATCAGTGTGTTGCTTTTCTTGTG

37

928

S066-R

TAATTCTGCTCATCATCGTGTCTG

S067-F

AGCAGTTCATATTTGTTTCTTACG

38

535

S067-R

AGAACAGTGAAGCTACTAAAATG

S070-F

GGTCTGCATGGTGTATTGATC

39

705

S070-R

GTATCGCCATAGCTACAGGTCAG

S071-F

AACAGGCTGCTTGAGAATAAATG

40

714

S071-R

TCATGCTGTACTATCTGCTGGAC

S073-F

GTTTAAGTATTTTCCACTCCTGAT

41

502

S073-R

CGCATCTACTTGCTCTGTATTG

S076-F CGATGGATAAAAGAAGAGGCAGAG

42

577

S076-R

ATCTGTAGTGTGAGTCAAAAGTGG

S077-F AAAACGCGAATGCAAATAAACAGA

43

566

S077-R

TTTCCCCACTCACATTATGACAAG

S078-F

AAACCACTGACCTCTTTATCAACC

44

623

S078-R

GCTGACATCTGAGTAAACTGAAC

S079-F

ACAAGACAACTAACAGAGGAGAG

45

506

S079-R

TCCTTGTAGTCAGTTATGGAGACC

S080-F

CTACTGAGCATTCGTTGTGATGA

46

695

S080-R

GTAAACACAGGGAACATGAGGA

S081-F

TTGATGGCTGTGATTACTACTG

47

655

S081-R

TAAGGGTACTGTGTAAAGATACTG

S082-F

CCAAATCCTCCATCTTACTCCAAG

48

523

S082-R

ACTCTCTGATGCACACTGATACTG

S085-F AATAAAATTGTGAGCTAAAACACG

49

746

S085-R

TATGTAAATAAGCACGACGATATG

S086-F

CTTCATTTATTACCGCTTCCTGA

50

679

S086-R

GTATTCCATCCACACCCATAAG

51

S089-F

GCTACATCCTAATTACCAGTATTC

505

GCATATTCAATCTTCCACATC

S089-R

AGGAAGCAGTTCTTTGTGACTTG

S090-F

52

698

TTCCCTCTGCAACTACAGCTAC

S090-R

GGTTTCTTTCTTGTCTTTGATC

S094-F

53

459

TCCCTTCTTGCTATTTTAACTGT

S094-R

ACCATTAGTGACTCGGACGTAG

S095-F

54

663

AGTCCATGAGCGTGTATGAGTTC

S095-R

ATCGATCAAGGTCTTAAACAGC

S096-F

55

693

TTAAATCAACGTCCAGAACAAC

S096-R

ACACCTTCATTAGAGCAATTCA

S097-F

56

533

CTCAGTTCATGCTTTTCATTACC

S097-R

GTATAAACTTTGGCACACACAG

S098-F

57

654

AGTCGGTTTCCTGCTTGATCG

S098-R

S099-F

ATGACAGGGATTACTCCAGGAAC

58

692

S099-R

ACCTTATTATGTCGTCCACAACG

S100-F

ATGTCATGGAAATCATGGAAGAC

59

685

S100-R

GGAGATTACCTGGGACTATGGAC

TTTCTGGTAGTCTTTGGTATG

S102-F

60

792

AAAATTCGAGCTAATGACAGGA

S102-R

AGTGCGATGTATATCCGAGAG

S105-F

61

518

S105-R TGTTATACAAGATAGGAGATTATTG

ATACCCAAGAGGTTCTTACTAC

S109-F

62

607

TAACACAACACAGCTATACTTTC

S109-R

S110-F

CGGCTGCAAAGAAGTTAATAGAT

63

665

S110-R

AACTTTACCTGCCAAACCAACTC

S111-F

TAGGACATATTCCGGGGTAATCAG

64

330

S111-R

CAGACAGTTATGCGTATTTGAGA

S112-F

CTCTTCCATAAACAAGAATAATGC

65

462

S112-R

CTACTGAAGTGAATAAAGTGTTGG

S113-F

ACTGAATACATCCCTTAATAGTCA

66

587

S113-R

AAGAGTTACAGCCTAACAATAG

S114-F

CCATTGTCTCTGATGTATGGACAG

67

625

S114-R

ACCAGTTGGATAAAGATAAGCCA

S115-F

AAACAGCATACTTCCACACTACAG

68

566

S115-R

GTCACACTGGCTAATAACTACAGG

S118-F

AGTGACTTTTGTTTCAAGTTGTG

69

715

S118-R

TTTTGCCTGTAGAATGAAGAATG

S119-F

TGCAACTTTCTTCACTGTTAC

70

509

S119-R

CTGTGATGGGGAGAACATGTAAG

S121-F

GGCAACAGTTCAGTGCTTAAATTC

71

1015

S121-R

ACAAAATATCCCTTTCCCAGAC

S122-F

TAAGTGCTTCATGGTTTACACTGG

72

561

S122-R

TGTAGAACAGCGTCACAATAAC

S124-F

AGAATCAAAAAGAGATCAAGTTC

73

653

S124-R

TAGTGATTTGAGGAATTGTAGTC

S125-F GGACGAATACATAAATAAACACTG

74

500

S125-R

AAAGATCCCTTGTTTGCTTAATAG

S126-F

TGAGAAAGTCCGTTATGAATAG

75

756

S126-R TCTAAATGTAAAAGATAACAAGGTG

S127-F

ACTTTGATTGCATTTCCTTTCACC

76

546

AAAGGATACTCATCCAGCAG

S127-R

AAACTTTCGGGGGAGGAA

SV01-F

77

703

CGATGTGATCCTTGTGAGTGT

SV01-R

CCAGGTCAGGAGTACCTTCG

SV02-F

78

888

TCCAAGTTTGGGAACATTACA

SV02-R

TGACGGACGCTAATGCTAAC

SV03-F

79

617

GTGCTGAGAGTCTGGACGAC

SV03-R

TGGTTTTACTGAGGGACGAGA

SV04-F

80

610

CCCAGGTAGTGAAGTGGTGAG

SV04-R

CATCCGTTGCTTTCTATAGG

SV05-F

81

871

TCAGACGTTTTCAGCGTGTT

SV05-R

TAGCGCGTTGAACATCCTC

SV06-F

82

600

SV06-R AGCTACAATCAGAGAACCCTAAAGA

CATGACTACATCGGGCAGGA

SV07-F

83

726

CTTATACTCAACGTGGCTTTAC

SV07-R

SV08-F

GAGTGACTGTCCTGTGTGTTTGT

84

602

CTTCCTGTGCGGAGATGTG

SV08-R

GAACAGAATTGGGTCTGGCA

SV10-F

85

937

CATCAGGGCTCTTTCTTTCG

SV10-R

86

SV12-F

GGGTGCCAATAATTCTACTGTTG

566

SV12-R

CCGTAAAGTGACATTCAGGTTG

SV13-F

CCTGAGCTTCATCATCATCG

87

611

SV13-R

CCCATCGGGGTAATCCTTATC

SV14-F

TGTTCCATGGTTCATTTTGG

88

500

SV14-R

GAGAGCTGGTCCGTGTGAG

SV15-F

TTGGGAGGGAATGTGTTTTC

89

645

SV15-R

CAGGCTCAACAGCTTTACCA

SV16-F

TGACAATGAGTCTGCCATCC

90

955

SV16-R

CCCCCACTCAACATCTGTCT

PHỤ LỤC 3: Kết quả tách chiết DNA tổng số của 96 mẫu cá tra (gồm 48 mẫu

sinh trưởng nhanh và 48 mẫu sinh trưởng chậm

Kết quả tách chiết DNA tổng số của 48 mẫu cá tra sinh trưởng

1. nhanh

2. Kết quả tách chiết DNA tổng số của 48 mẫu cá tra sinh trưởng chậm

PHỤ LỤC 4: Kết quả đo nồng độ DNA tổng số 96 mẫu cá tra sinh trưởng nhanh và chậm

Nồng độ

OD

Mẫu

OD

Nồng độ

Mẫu

STT

(ng/µl)

(A260/A280)

STT

(ng/µl)

(A260/A280)

STC

STN

1

1.84

1516.9

1

2756.2

1.76

2

9

2

1.75

2554.9

2

1693.4

1.82

42

22

3

1.82

1164.3

3

1988.3

1.77

48

46

4

1.83

1002.4

4

1011.1

1.83

118

54

5

1.84

1295.3

5

1549.3

1.81

123

70

6

1.85

1658.3

6

1914.5

1.81

128

76

7

1.82

1696.3

7

1910.1

1.75

140

79

8

1.80

1932.5

8

2096.1

1.82

159

80

9

1.84

1876.5

9

2059.3

1.80

195

125

10

1.87

1316.4

10

1689.3

1.84

205

133

11

1.81

1120.9

11

1511.3

1.75

3

136

12

1.76

1997.5

12

1489.3

1.81

41

137

13

1.89

1354.3

13

2704.2

1.75

103

15

14

1.88

1356.8

14

2196.7

1.80

122

25

15

1.85

1856.4

15

1801.9

1.82

127

33

16

1.86

1352.9

16

1486.3

1.82

132

34

17

1.86

1728.6

17

1415.3

1.81

139

39

18

1.84

1059.8

18

1993.2

1.83

142

96

19

1.85

1868.9

19

2540.9

1.75

153

116

20

1.84

1249.6

20

2463.1

1.77

177

131

21

1.84

1800.4

21

2658.4

1.76

181

141

22

1.85

1540.9

22

1958.4

1.75

200

180

23

1.83

1530.6

23

2346.2

1.77

13

190

24

1.82

1889.4

24

2658.4

1.81

23

192

25

1.84

1658.4

25

1463.1

1.82

24

14

26

1.87

1468.2

26

2658.4

1.82

31

49

27

1.84

1056.8

27

2540.9

1.75

35

53

28

1069.2

1.87

2908.4

1.75

28

38

61

29

1463.8

1.85

2056.8

1.86

29

57

62

30

2435.6

1.80

2035.6

1.83

30

59

69

31

2053.8

1.81

2469.3

1.78

31

71

70

32

1208.4

1.75

2259.4

1.81

32

78

72

33

1968.6

1.81

2589.4

1.83

33

92

75

34

1509.4

1.79

2560.6

1.81

34

93

76

35

1560.6

1.86

1756.1

1.79

35

99

77

36

1856.1

1.89

2095.3

1.75

36

100

79

37

1595.3

1.88

1011.2

1.81

37

117

80

38

1255.6

1.89

2040.1

1.78

38

145

82

39

1277.4

1.86

1903.1

1.86

39

152

84

40

2017.3

1.81

1921.0

1.87

40

165

91

41

1456.8

1.84

2256.1

1.82

41

175

96

42

1811.2

1.84

1040.8

1.81

42

183

104

43

2006.4

1.89

2720.9

1.75

43

187

111

44

2090.3

1.85

1298.7

1.82

44

214

112

45

1736.1

1.81

1993.1

1.76

45

216

114

46

1563.2

1.87

2256.1

1.82

46

218

116

47

1325.6

1.82

2400.9

1.76

47

6

119

48

1865.4

1.75

2912.1

1.75

48

18

120

PHỤ LỤC 5: Kết quả PCR khuếch đại các vùng trình tự có chứa SNP

Mồi S053 – Kích thước 716 bp

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm

PCR của 48 mẫu cá tra STC

Mồi SV07 – Kích thước 726 bp

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm

PCR của 48 mẫu cá tra STC

Mồi S085 – Kích thước 746 bp

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm

PCR của 48 mẫu cá tra STC

Mồi S078 – Kích thước 623 bp

M: marker 100bp; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản

phẩm PCR của 48 mẫu cá tra STC

Mồi SV14 – Kích thước 500 bp

M: marker 100bp; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản

phẩm PCR của 48 mẫu cá tra STC

Mồi S098 – Kích thước 654 bp M: marker 100bp; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm PCR của 48 mẫu cá tra STC

PHỤ LỤC 6: Danh sách 11 nhóm mồi SBE

Allele Allele GROUP Primers Extended tail (5'-3') Base primer seq (5'-3') Tm Total length 2 1 (nt) G1 TTTTTTTTTTTTTTTTTTTTTTTTTT AGCGCTTGTGGCAAGTCTTATA 65.1 C 48 T EP3-S061_A-G TTTTTTGACTGACTGACT CACCAAAATGTCAGAACACATTAAC 63.5 G 43 A EP3-S031_T-C TTTTTTTTTTGACT CAATTGTTGCAAAGAATGTCTGA 64.2 G 37 C EP3-S049_G-C TTTTTTTT ATCGGGAATAAGAGTCTCGCTG 65.8 G 30 T EP3-S094_A-C TTT AGTTTTATCCCAGAGCCGGA 65 A 23 G EP5-S111_G-A G2

TTAAAGTAATCATGGCTACTAATCG 59.6 A 74 G EP5-S024_G-A TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTG ACTGACTGACTGACT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTGACT ACTAACAGTATTTTGAGTGACACA 57.5 T 69 C EP5-S089_C-T GACTGACTGACT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTG CGATTAAATGTACAGCATCAGTCA 63.1 G 64 A EP_SV14_T-C ACTGACT TTTTTTTTTTTTTTTTTTTTTTTTTTT TTTCTCCGGTGTAGTAAACAAACTC 63.5 T 52 G EP3-S037_C-A TTTTTTTTTTGACTGACTGACT GCTTTTACAAGTCCTTTTTTCTTCA 62.8 A 47 C EP3-S125_G-T TTTTTTTTTTTTTTTTTTTTT CTGCACCGTTACCGCTAAAG 64.8 C 41 A EP5-S013_A-C TTTTTTTTTTTT TCAGTGAAGGTCACTCCGTACTC 64.8 A 35 G EP3-S105_C-T EP3-S079_G- TTTTTTTT AGCAAGTTTCCAGTCACCACA 65.1 T 29 C A_1305 TTTTT CATCATGATGGCAGCACA 63.8 G 23 A EP5-S006_A-G G3 CCCCCCCCCCCCCCCCCCCCGACTGACTGAC TTTATGAACAATGTTTTATGTAACTACT 58.7 C 77 T EP_SV12_A-G TGACTGACTGACTGACT T CCCCCCCCCCCCCCCCCCCCCGACTGACTGA GACAGAAAAAAACACAAACGAC 60.6 T 71 C EP3-S004_G-A CTGACTGACTGACTGACT CCCCCCCCCCCCCCCCCCCGACTGACTGACT AAAAACCCAAGACTACCAGCA 62.8 G 60 A EP5-S067_A-G GACTGACT CCCCCCCCCCCCCCCCCGACTGACTGACT CACATATTAAAGATGACCAGACCAG 62.7 C 54 G EP3-S127_C-G CCCCCCCCCCCCCCCCCCCCCCCCC ATCCCTACGTAATTTTACCCAATG 62.9 T 49 A EP5-S097_A-T CCCCCCCCCCCCCCCCCCCCC AAGCCGTTATGTTGGTGAACAT 64.5 G 43 A EP5-S082_A-G CCCCCCCCCCCCC TGGCCTACATGTTACGCTCTTATT 64.7 A 37 G EP5-S017_G-A CCCCCC TCTTTAAGAACCAGGTTGAGGAGC 65.8 A 30 G EP3-S030_C-T CC CTCAGGAAACATGGAGAGGTG 64.1 T 23 G EP3-S038_C-A G4 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT CCTTCAAGTGATTATGAATTAAGCC 62.9 G 75 A EP5-S048_A-G TTTTGACTGACTGACT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT GAGATCGAGTACGAGCAAGAGA 63 T 70 C EP5-S122_C-T TTTTTTTTTTTTTT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT GTGACGTCTTTGCTGTCAGAC 63.1 G 65 A EP5-S113_A-G TTTTTTTTTT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT CATCACAATAACACAGTGGAGTCA 64.1 C 60 T EP5-S056_T-C TT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT AAGGACAAGATCTTGGGAAGGA 65.2 T 54 G EP3-S077_C-A TTTTTTTTTTTTTTTTTTTTTTTTTTT AAGCCGTGGTTTATGACCTCA 65.8 C 48 G EP3-S039_C-G TTTTTTTTTTTTTTTTTTTTTT CGAACGAGAAGTGAAGCTGC 65.6 C 42 A EP5-S012_A-C TTTTTTTTTTTTT AGCCACAGCGAGTTTCTGTTTAT 65.2 A 36 G EP3-S047_C-T TTTTTTTTTT GTCCCGAACATCACACCCAT 67.4 C 30 T EP3-S076_A-G TTTTT GGATCCTGGTGAGGACGA 64.4 G 23 C EP5-S046_C-G G5 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT TGTTCGGTTCTGTCATCGA 63.6 A 76 C EP5-S005_C-A TTTTTTTTTTTTTTTTTTTTTTT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT AATATGCTTGTCGGAGAAATACGAC 65.2 C 70 A EP5-S034_A-C

TTTTTTTTTTT

CATCAAGAAAATAGCCGACTTCCT 65.5 64 EP_SV06_C-G G C TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT TTTTTT

CATCCAGAACACAATTTCACTTCA 65.2 58 EP_SV03_G-A C T TTTTTTTTTTTTTTTTTTTTTTGACTGACTGA CT TTTTTTTTTTTTTTTTTTTGACTGACT TGAGATGTTTATCATGCCTAATGGA 65.4 52 EP5-S114_T-C T C TTTTTTTTTTTTTTTTTTTTTTTTT ATCACGGGTTTGCATGTCATC 67.3 46 EP3-S109_G-A C T TTTTTTTTTTTTTTTTTTTTT CTCAGAGGATACCTGCGCA 64.7 40 EP_SV08_T-C T C TTTTTTTTTTTTTTTT CTGCAGCAGGTTCCTGATC 64.2 35 EP_SV04_C-T G A TTTTTTT GTTGTGGTGTTTAGGGCTGTGG 67.8 29 EP3-S078_A-G T C TTTT TCCCGAGGAGAGCATCAGC 68.5 23 EP5-S098_A-G A G G6 CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCG CTTTTAACAGTCCAATGAATGATCC 63.7 63 EP3-S081_A-T T A ACTGACT CCCCCCCCCCCCCCCCCCCCGACTGACTGAC AACTCTTTGCATATCTCTGTATCAG 59.9 57 EP5-S008_A-G A G T CCCCCCCCCCCCCCCCCCCGACTGACTGACT CTGAGATCTCTTTCCTTTCCG 62.3 52 EP_SV15_C-T C T CCCCCCCCCGACTGACTGACT ATCTAAAAATGAAGAAATCAAGCAT 60.3 46 EP3-S058_T-G A C CCCCTGACTGACTGACT TTTTGTGCGTTTGTATATGTGTCT 62.5 41 EP_SV13_T-G T G CCCCCCCCCCC CATTCAGCGCTCGATAGGTTACTAC 65.9 36 EP5-S011_A-C A C CCCCCCCCC CCTGACGCGTTGTTTGAGAC 66.2 29 EP3-S063_C-T G A TGACT ACCACCTGGGCCAGTTTG 66.5 23 EP3-S124_G-A C T G7 TTTTTTTTTTTTTTTGACTGACTGACT CGATCTTTACGGTTATTAAAGAATA 58.8 52 EP3-S100_A-G T C TTTTTTTTTTTTTTTTTTTTT TCTTCTGTCCTTATAGCTGAGAGAG 61.5 46 EP3-S095_G-A C T TTTTTTTTTTTTTTTTTTTTT GGTGGATAAAGTGGGTGACC 63.4 41 EP3-S020_C-T G A TTTTTTTTTTT TGTCAGAGAGTGTGTTGATACACAG 63.5 36 EP3-S086_G-A C T TTTTTTTTT AGAGGAATCACCACTCACACG 64.6 30 EP3-S001_T-C A G TTTT ATGGCAGCCAATGCCTCAG 69 23 EP3-S042_A-T T A G8 TTTTTTTTTTTTTTTTTTTTTGACTGACTGAC EP5-S090_C- TACGAATTGAAATTTTAAAGCCATA 61.7 58 C T T T_4109 EP5-S033_G- TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT CGAGGCTACTATTTACATTGCC 61.8 53 G A A_1077 EP5-S090_A- TTTTTTTTTTTTTTGACTGACT TCTGAGGCTTTACTACATTTTTGAA 62.2 47 A G G_3990 TTTTTTTTTTTTTTTTTTTTTTT AGGCTGGCAAAGAACGAC 63.5 41 EP5-S060_T-A T A EP3-S033_T- TTTTTTTTTTTTTT CTTTCATGCAACGTTGTCCAT 65.1 35 A G C_992 TTTTT ACCCCACGTTATTTGAATATGGTC 65.7 29 EP5-S044_T-C T C TTTT ATGTTCGCACCTGGCACAT 67.1 23 EP3-S036_T-C A G G9 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT GGGACTATCTTAGCACTTTGTGT 60.6 57 EP3-S085_A-C G T TTTTTTTTTTTTTTTTGACTGACTGACT CAAACATGGATGAACATGTCATA 62.5 51 EP_SV07_G-A C T TTTTTTTTTTTTTTTTTTTTTTTT GTTCTCTGTCCTTTAGGGATGC 63.2 46 EP3-S126_C-T G A TTTTTTTTTTTTTTTTTTTTTTT CTGGCGTCCTGAGGCTAA 64.6 41 EP5-S053_A-G A G TTTTTTTTTTTTTTTTTT CCTCCCTCCCTTCCCAGT 65.9 36 EP5-S118_C-T C T TTTTTTT CCTTTGATAGCTTTGGTATTGGC 64.7 30 EP5-S019_A-G A G TTTTT CATCAACCACTCCGGCTG 66 23 EP3-S071_G-T C A G10 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT GAGACTATTGATGTGTGTGTGG 60.1 68 EP_SV02_C-T G A TTTTTTTTTTTT TTTTTTTTTTTTTTTTTTTTGACTGACTGACT EP5-S066_G- TTTATTTTTTATGTCTGTACGGACA 60.6 61 G A GACT A_2370 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT GAGCCTCATCAGTGTGAGGTC 64.4 54 EP_SV05_G-A G A EP3-S121_C- TTTTTTTTTTTTTTTTTTTTGACTGACT GCAAAACAACCAACCAACC 63.3 47 G A T_643 EP5-S066_C- TTTTTTTTTTTTTTTTTTTTTT GCTGTGACGGCTCATGAC 63.9 40 C A A_2055

TTTTTTTTTTT CTGGTGAGGAACTTGTTCACA 63.3 EP_SV10_T-A T A 32 TTTTTTT CAAGCCATGCACCTGCA 66.7 EP_SV16_C-T G A 24 G11 TTTTTTTTTTTTTTTTGACTGACTGACT CAGAAATTCCCTTGTTCTTTTTGTA 63.4 EP3-S029_C-G G C 53 TTTTTTGACTGACTGACTGACT AAACCCCAATGTTAAGATATTTGTT 61.7 EP3-S028_G-A C T 47 TTTTTGACTGACTGACT CAGGTACATTCATAAGTTTGAGATA 58.3 EP5-S070_A-G A G 42

TTTTTTTTTGACTGACT GAAAGGCGTGGAAAGTATGG 63.7 T C 37 EP3-S080_A- G_233 TTTTT CTTTGGACTAAACATCATAGCGAGG 65.8 EP3-S099_A-G T C 30 TTTTT TTAGCGTCGCCTGACTCG 65.8 EP5-S096_A-C A C 23

PHỤ LỤC 7: Kết quả chạy điện di mao quản của 11 nhóm

Binset G2 gồm 9 mồi SBE (S024, S089, SV14, S037, S125, S013, S105, S079 và

S006).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G2 của 9 mồi SBE (S024, S089,

SV14, S037, S125, S013, S105, S079 và S006) từ một mẫu cá tra sinh trưởng nhanh: kích

thước sản phẩm thực tế lần lượt là 75, 70, 65, 53, 48, 42, 36, 30 và 24 nucleotide

Hình 11: Kết quả điện di mao quản của nhóm mẫu G2

Binset G3 gồm 9 mồi SBE (SV12, S004, S067, S127, S097, S082, S017, S030, S038).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G3 của 9 mồi SBE (SV12, S004, S067, S127, S097, S082, S017, S030, S038) từ một mẫu cá tra sinh trưởng nhanh: kích thước

sản phẩm thực tế lần lượt là 78,72, 61, 55, 50, 44, 38, 31 và 24 nucleotide.

Hình 12: Kết quả điện di mao quản của nhóm mẫu G3

Binset G4 gồm 10 mồi SBE (S048, S122, S113, S056, S077, S039, S012, S047, S076 và

S046).

Binset G4 gồm 10 mồi SBE (S048, S122, S113, S056, S077, S039, S012, S047, S076

và S046) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 76, 71, 66, 61, 55, 49, 43, 37, 31 và 24 nucleotide.

Hình 13: Kết quả ddienj di mao quản của nhóm mẫu G4

Binset G5 gồm 10 mồi SBE (S005, S034, SV06, SV03, S114, S109, SV08, SV04, S078 và

S098).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G5 của 10 mồi SBE (S005, S034,

SV06, SV03, S114, S109, SV08, SV04, S078 và S098) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 77,71, 65, 59, 53, 47, 41, 36, 30 và 24

Hình 14: Kết quả điện di mao quản của nhóm mẫu G5

Binset G6 gồm 8 mồi SBE (S081, S008, SV15, S058, SV13, S011, S063 và S124).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G6 của 8 mồi SBE (S081, S008,

SV15, S058, SV13, S011, S063 và S124) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 64, 58, 53, 47, 42, 37, 30 và 24 nucleotide.

Hình 15: Kết quả điện di mao quản của nhóm mẫu G6

Binset G7 gồm 6 mồi SBE (S100, S095, S020, S086, S001 và S042).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G7 của 6 mồi SBE (S100, S095,

S020, S086, S001 và S042) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế lần lượt là 53, 47, 42, 237, 31 và 24 nucleotide

Hình 16: Kết quả điện di mao quản của nhóm mẫu G7

Binset G8 gồm 7 mồi SBE (S090_4109, S033_1077, S090_3990, S060, S033_992,

S044 và S036).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G8 của 7 mồi SBE (S090_4109,

S033_1077, S090_3990, S060, S033_992, S044 và S036) từ một mẫu cá tra sinh trưởng

chậm: kích thước sản phẩm thực tế lần lượt là 59, 54, 48, 42, 36, 30 và 24 nucleotide

Hình 17: Kết quả điện di m ao quản của nhóm G8

Binset G9 gồm 7 mồi SBE (S085, SV07, S126, S053, S118, S019 và S071)

Kết quả điện di mao quản nhóm sản phẩm SNapShot G9 của 7 mồi SBE (S085, SV07, S126, S053, S118, S019 và S071) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm

thực tế lần lượt là 58, 52, 47, 42, 37, 31 và 24 nucleotide

Hình 18: Kết quả điện di mao quản chủa nhóm mẫu G9

Binset G10 gồm 7 mồi SBE (SV02, S066, SV05, S121, S066, SV10 và SV16).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G10 của 7 mồi SBE (SV02, S066,

SV05, S121, S066, SV10 và SV16) từ một mẫu cá tra sinh trưởng nhanh: kích thước sản

phẩm thực tế lần lượt là 69, 62, 55, 48, 41, 33 và 25 nucleotide

Hình 19: Kết quả điện di mao quản của nhóm G10

Binset G11 gồm 7 mồi SBE (S029, S028, S070, S080, S099 và S096).

Kết quả điện di mao quản nhóm sản phẩm SNapShot G11 của 6 mồi SBE (S029, S028, S070, S080, S099 và S096) từ một mẫu cá tra sinh trưởng chậm: kích thước sản phẩm thực tế

lần lượt là 54, 48, 43, 38, 31 và 24 nucleotide

Hình 20: Kết quả điện di mao quản của nhóm mẫu G11

PHỤ LỤC 8: Kết quả tinh sạch sản phẩm PCR của 11 nhóm mẫu

Nhóm 2

Kết quả điện di tinh sạch 96 sản phẩm PCR của nhóm 2

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm PCR của 48 mẫu cá tra STC

Nhóm 5 Kết quả điện di 96 sản phẩm PCR tinh sạch của nhóm 5 M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm PCR của 48 mẫu cá tra STC

Nhóm 6 Kết quả điện di 96 sản phẩm PCR tinh sạch của nhóm 6

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm PCR của 48 mẫu cá tra STC

Nhóm 9 Kết quả điện di 96 sản phẩm PCR tinh sạch của nhóm 9

M: marker 1kb; Giếng 1-48: sản phẩm PCR của 48 mẫu cá tra STN; giếng 49-96: sản phẩm PCR của 48 mẫu cá tra STC

PHỤ LỤC 9

Các chỉ số về thành phần kiểu gen và tần số alen của 84 SNP (thuộc 11 nhóm) của nhóm cá tra sinh trưởng nhanh và nhóm cá tra sinh trưởng chậm (NN:kí hiệu cho kiểu gen chưa được xác định rõ do kỹ thuật)

Nhóm cá thể sinh trưởng nhanh Nhóm cá thể sinh trưởng chậm

Số cá

Tên Tên Số cá thể Số cá thể không xác Số cá thể thể không STT Ghi chú SNP Thành phần kiểu gen Tần số alen Thành phần kiểu gen Tần số alen nhóm xác định được kiểu định được kiểu gen xác định được kiểu xác định được gen gen (Non- identify) kiểu gen (Non- identify)

Không tính 27 Không tính Loại 19 29 21 1 S031 19 AA; 1 AG; 1 GG; 27 NN 15AA; 1 AG; 3 GG; 29 NN 79.0 21.0 22 CC; 16 CG; 10 FET:0.16 87.0 13.0 34 CC; 12 CG; 2 NN 38 10 46 2 S049 2 % C % G NN FST:-0.001 % C % G 58.0 42.0 8 CC; 35 CT; 1 TT; FET:0.673 56.2 43.8 44 4 7 CC; 41 CT 48 3 G1 S061 0 % C % T 4 NN FST:-0.02 % C % T 34.0 66.0 FET:1 33.3 66.7 1 32 GT; 16 TT 48 4 S094 32 GT; 15 TT;1 NN 47 0 % G % T FST:-0.02 % G % T 34.4 65.6 FET:1 35.4 64.6 48 0 34 GA; 14 GG; 48 5 S111 33 GA; 15 GG; 0 % A % G FST:-0.02 % A % G 6.4 93.6 FET:0.03 20.8 79.2 S006 6 GA; 41 GG; 5 AA; 10 GA; 33 GG 47 0 48 6 0 % A % G FST:0.06 % A % G 100% FET:1 100 45 2 44 AA; 4 NN 44 7 S013 45 AA;2 NN 4 A FST: % A 60.9 39.1 33 AA; 12 GA; 2 GG; 15 AA; 26 GA; 5 83% 17% FET:0.0009F 46 2 47 8 S024 1 % A % G 1 NN GG; 2 NN A G ST:0.09 78.3 21.7 28 GG; 16 GT; 2 FET:0.035 90.6 9.4 46 2 40 GG; 7 GT; 1 TT 48 9 G2 S037 0 % G % T TT; 2NN FST:0.036 % G % T 44.0 56.0 S079- FET:0.02 50.0 50.0 6 47 10 36 CT; 5 TT; 6 NN 41 47 CT; 1 NN 1 % C % T 1305 FST:-0.015 % A % T 34.0 66.0 FET:0.25 25.0 75.0 0 48 11 S089 4 CC; 24 CT; 19 TT 47 1 CC; 22 CT; 25 TT 0 % C % T FST:-0.001 % C % T 4.8 95.2 FET:0.01 16.3 83.7 5 46 12 S105 4 AG; 38 GG; 5 NN 42 15 AG; 31 GG; 2 NN 2 % A % G FST:0.045 % A % G 51.0 49.0 17 AA; 16 AC; 12 FET:0.0001 46.9 53.1 45 2 6 AA; 33 AC; 9 CC 48 13 S125 0 % A % C CC; 2NN FST:-0.018 % A % C 88.3 11.7 FET:0.0003 69.8 30.2 47 0 19 AA; 29 GA 48 14 SV14 36 AA; 11 GA 0 % A % G FST:0.08 % A % G 81.6 18.4 FET:0.834 80.0 20.0 1 29 CC; 19 CT 48 15 S004 29 CC; 17 CT; 1 NN 46 0 % C % T FST:-0.02 % C % T 38.9 61.1 8 AA; 19 GA; 18 FET:12 39.5 60.5 45 2 4 AA; 30 GA; 14 GG 48 16 S017 0 % A % G GG; 2 NN FST:-0.02 % A % G 29.1 70.9 1 AA; 25 AG; 20 FET:0.02 15.5 84.5 46 1 15 AG; 33 GG 48 17 G3 S030 0 % A % G GG; 1 NN FST:0.03 % A % G

41 6 44 18 S038 4 62.6 % G 37.4 % T 6 GG; 36 GT; 2 TT; 4 NN 12 GG; 27 GT; 2 TT; 6 NN FET:0.21 FST:-0.011 54.9 % G 45.1 % T 75.0 25.0 24 AA; 21 AG; 1 FET:0.4 81.5 18.5 46 1 30 AA; 18 AG 48 19 S067 0 % A % G GG; 1 NN FST:-0.01 % A % G

20 AA; 26 AG; 1 71.9 28.1 58.5 41.5 FET:0.06 S082 8 AA; 40 AG 1 48 46 20 0 NN % A % G % A % G FST:0.02

77.0 23.0 59.5 40.5 S097 25 AA; 21 AT; 1 NN 46 9 AA; 39 AT 1 48 21 0 FET:5.1e+0. 4 % A % T % A % T FST:0.05 7 CC; 1 CG; 33 GG; 42.5 57.5 51.0 49.0 FET:0.037 S127 1 CC; 2 CG; 45 GG 6 48 41 22 0 6 NN % C % G % C % G FST:-0.009

SV12 22 CT; 17 TT; 8 NN 39 29 CT; 17 TT; 2 NN 8 46 23 2 28.3 % C 71.7 % T 31.6 % C 68.4 % T FET:0.65 FST:-0.02

S012 46 AA; 1 NN 46 48 AA 1 48 24 0 FET:1 100 % A 100 % A 8.7 % 91.3 14.8 85.2 FET:0.22 25 G4 S039 38 CG; 8 GG; 1 NN 46 33 CG; 14 GG; 1 NN 1 47 1 C % G % C % G FST:-0.003 56.8 43.2 50.0 50.0 FET:0.054 S046 6 CC; 39 GC; 2 NN 45 1 CC; 1 CG; 46 GG 2 48 26 0 % C % G % C % G FST:-0.01 28.5 71.5 2 AA; 23 AG; 22 22.5 77.5 FET:0.43 2 AA; 18 AG; 28 GG 0 48 47 27 S047 0 % A % G GG % A % G FST:-0.01 80.0 20.0 29 AA; 17 AG; 1 80.5 19.5 FET:1 30 AA; 17 AG; 1 GG 0 48 47 28 S048 0 % A % G GG % A % G FST:-0.02

2 45 45 29 S056 2 9 CC; 35 CT; 2 TT; 2 NN 53.1 % C 46.9 % T 9 CC; 30 CT; 6 TT; 2 NN 57.8 % C 42.2 % T FET:0.33 FST:-0.01 50.0 50.0 50.0 50.0 FET:0.06 48 CT 0 48 47 30 S076 47 CT 0 % C % T % C % T FST:-0.02 66.7 33.3 72.0 28.0 FET:0.39 S077 15 GG; 30 GT; 2 NN 45 21 GG; 27 GT 2 48 31 0 % G % T % G % T FST:-0.015 65.0 35.0 22 AA; 17 AG; 8 83.0 17.0 FET:0.02 32 AA; 14 AG; 1 GG 0 47 47 32 S113 1 % A % G GG % A % G FST:0.06 31 CC; 15 CT; 1 TT; 1 88.5 11.5 82.1 17.9 FET:0.36 0 47 47 33 S122 36 CC; 11 CT 1 NN % C % T % C % T FST:-0.005 91.4 8.6% 39 AA; 3 CA; 2 CC; 96.0 4.0 FET:0.34 46 AA; 2 CC 3 48 44 34 S005 0 % A C 3 NN % A % C FST:-0.002 91.5 8.5% 80.0 20.0 FET:0.02 29 AA; 19 AC 0 48 47 35 S034 39 AA; 8 AC 0 % A C % A % C FST:0.03 34.0 66.0 8 CC; 10 CT; 20 TT; 64.1 35.9 FET:4e-09 13 CC; 33 CT; 2 NN 9 46 38 36 S078 2 % C % T 9 NN % C % T FST:0.14 23 AA; 5 GG; 19 92.5 7.5 48 28 37 G5 S098 19 Không tính 47 AA; 1 AG 0 Loại NN % A % G FET:0.65 20 CC; 14 CT; 13 79.5 20.5 76.1 23.9 44 34 38 S109 13 23 CC; 21 CT; 4 NN 4 FST:-0.02 NN % C % T % C % T 13 CC; 8 CT; 1 TT; 16 CC; 27 CT; 1 TT; 4 67.0 33.0 44 22 39 S114 25 Không tính 4 Loại 25 NN NN % C % T 78.3 21.7 85.9 14.1 FET:0.17 8 46 40 SV03 22 CC; 17 CT; 8 NN 39 33 CC; 13 CT; 2 NN 2 % C % T % C % T FST:-0.003 15 AA; 23 AG; 6 GG; 61.7 38.3 20 AA; 14 AG; 10 59.8 40.2 FET:0.15 3 44 44 41 SV04 4 4 NN % A % G GG; 3 NN % A % G FST:-0.02 2.0 98.0 15.5 84.5 FET:0.004 35 CC; 2 CG; 11 GG 0 48 47 42 SV06 45 CG; 2 GG 0 % C % G % C % G FST:0.09 8 CC; 30 CT; 38 TT; 6 CC; 9 CT; 13 TT; 10.5 89.5 38 28 43 SV08 19 Không tính 10 Loại 10 NN 19 NN % C % T 6.0 94.0 9.0 91.0 FET:0.55 8 AG; 37 GG; 3 NN 5 45 44 S008 5 AG; 37 GG; 5 NN 42 3 % A % G % A % G FST:-0.02 84.0 16.0 74.0 26.0 FET:0.062 23 AA; 25 CA 0 48 47 45 S011 32 AA; 15 CA 0 % A % C % A % C FST:0.009 G6 85.0 15.0 81.5 18.5 FET:0.51 30 AA; 18 AC 0 48 47 46 S058 33 AA; 14 AC 0 % A % C % A % C FST:0.016 1.0 99.0 14.5 85.5 FET:0.0003 14 AG; 34 GG 0 48 47 47 S063 1 AG; 46 GG 0 % A % G % A % G FST: 0.099

95.0 5.0 S081 14 AA; 33 NN 33 Không tính 35 AA; 4 AG; 9 NN 39 9 Loại 14 48 % A % G 56.0 44.0 56.6 43.4 FET:0.34 7 CC; 34 CT; 2 TT; 4 6 CC; 41 CT; 1 NN 47 1 43 49 S124 % C % T % C % T FST:-0.02 4 NN 3 GG; 30 GT; 9 TT; 6 42.9 57.1 16 GT; 11 TT; 20 20 Không tính 42 6 Loại 27 50 SV13 NN % G % T NN 38.3 61.7 37.8 62.2 FET:0.196 3 CC; 27 CT; 13 TT; 4 31 CT; 10 TT; 7 NN 41 7 43 51 SV15 % C % T % C % T FST:-0.02 4 NN 73.5 26.5 90.5 9.5 FET:0.0015 23 AA; 23 AG; 1 0 39 AA; 9 AG 48 0 47 52 S001 % A % G % A % G FST:0.07 GG

1 42 AG; 6 GG 48 0 46 53 G7 S020 51.0 % A 49.0 % G 43.8 % A 56.2 % G FET:0.06 FST:-0.01 5 AA; 37 AG; 4 GG; 1 NN

S042 39 AA; 1 AT; 7 TT 47 42 AA; 5 AT; 1 NN 0 47 1 54 90.5 % A 9.5% T 94.9 % A 5.1 % T FET:0.55 FST:-0.008

2 45 CT; 3 TT 48 0 45 55 S086 42.2 % C 57.8 % T 47.0 % C 53.0 % T FET:0.08 FST:-0.01 1 CC; 36 CT; 8 TT; 2 NN

2 15 CC; 30 CT; 3 TT 48 0 45 56 S095 67.7 % C 32.3 % T 62.5 % C 37.5 % T FET:0.015 FST:-0.01 23 CC; 15 CT; 7 TT; 2 NN

1 7 CC; 41 CT 48 0 46 57 S100 68.6 % C 31.4 % T 57.5 % C 42.5 % T FET:0.006 FST:0.005 18 CC; 27 CT; 1 TT; 1 NN 35.0 65.0 38.5 61.5 FET:0.89 9 AA; 15 AG; 23 S033- 0 10 AA; 17 AG; 21 GG 48 0 47 58 % A % G % A % G FST:-0.01 GG 1077 74.5 25.5 64.5 35.5 FET:0.17 S033- 0 15 AA; 32 AG; 1 GG 48 0 47 59 23 AA; 24 AG % A % G % A % G FST:0.001 992 57.5 42.5 68.8 31.2 FET:0.26 16 AA; 22 AG; 9 0 24 AA; 18 AG; 6 GG 48 0 47 60 S036 % A % G %A % G FST:0.006 GG 41.5 58.5 43.5 56.5 FET:0.58 0 2 CC; 38 CT; 8 TT 48 0 47 61 G8 S044 39 CT; 8 TT % C % T % C % T FST:-0.02 53.0 47.0 34.5 65.5 FET:0.038 19 AA; 16 AT; 12 0 8 AA; 23 AT; 17 TT 48 0 47 62 S060 % A % T % A % T FST:0.05 TT 66.0 34.0 68.5 31.5 FET:0.2 20 AA; 22 AG; 5 S090- 0 26 AA; 14 AG; 8 GG 48 0 47 63 % A % G % A % G FST:-0.01 GG 3990 58.0 42.0 62.0 38.0 FET:0.51 S090- 0 48 0 11 CC; 33 CT; 3 TT 47 16 CC; 28 CT; 4 TT 64 % C % T % C % T FST:-0.01 4109 88.5 11.5 89.5 10.5 FET:0.81 0 38 AA; 10 AG 48 0 47 65 S019 36 AA; 11 AG % A % G % A % G FST:-0.02 75.0 25.0 8 AA; 33 AG; 1 GG; 6 58.5 41.5 FET:0.005 20 AA; 20 AG; 7 7 42 6 40 66 G9 S053 % A % G NN % A % G FST:0.03 NN 76.5 23.5 73.0 27.0 FET:0.6 0 24 AA; 2 AC; 22 CC 48 0 47 67 S071 25 AA; 22 AC % A % C % A % C FST:-0.02 78.7 21.3 59.7 40.3 FET:0.0003 5 % G % T 1 % G % T S085 24 GG; 18 GT; 5 NN 42 9 GG; 38 GT; 1 NN 47 68 FST:0.05

91.8 8.2 % 77.6 22.4 FET:0.006 4 47 1 S118 36 CC; 7 CT; 4 NN 43 26 CC; 21 CT; 1 NN 69 % C T % C % T FST:0.05 47.9 52.1 39.5 60.5 FET:0.03 8 AA; 27 AG; 10 2 1 AA; 36 AG; 11 GG 48 0 45 70 S126 % A % G % A % G FST:-0.008 GG; 2 NN 58.3 41.7 2 CC; 26 CT; 16 TT; 4 45.5 54.5 FET:0.002 11 CC; 18 CT; 5 TT; 13 44 4 34 71 SV07 % C % T NN % C % T FST:0.005 13 NN 94.4 5.6% 86.2 13.8 FET:0.065 S066- 1 47 1 41 AA; 5 AC; 1 NN 46 34 AA; 13 AC; 1 NN 72 % A C % A % C FST:0.01 2055 2.2 97.8 100 FET:0.226 S066- 3 48 0 2 AG; 42 GG; 3 NN 44 48 GG 73 % A % G % G FST:0.002 2370 G10 1 48 0 7 AA; 22 AG; 19 GG 47 74 65.0 % A 35.0 % G 38.0 % A 62.0 % G FET:0.001 FST:0.121 23 AA; 15 AG; 9 GG; 1 NN S121- 643 100 100 FET:1 8 45 3 SV20 39 AA; 8 NN 45 AA; 3 NN 39 75 % A % A FST:

7 AA; 36 AG; 4 GG; 1 3 AA; 32 AG; 10 42.1 57.9 42.2 57.8 FET:0.13 76 SV05 45 2 47 1 NN GG; 2 NN % A % G % A % G FST:0.002 32 AA; 11 AG; 4 87.4 12.6 69.7 30.3 FET:0.002 17 AA; 26 AG; 5 NN 77 SV10 43 4 43 5 NN % A % G % A % G FST:0.06

19 AA; 25 AG; 2 68.6 31.4 54.5 45.5 FET:0.0035 6 AA; 40 AG; 2 GG 78 SV16 46 1 48 0 GG; 1 NN % A % G % A % G FST:0.02

79 0 S028 6 CC; 20 CT; 21 TT 47 5 CC; 20 CT; 23 TT 48 0 34.5 % C 65.5 % T 33.3 % C 68.7 % T FET:0.95 FST:-0.02 54.0 46.0 48.0 52.0 FET:0.09 80 0 S029 7 CC; 11 CG; 29 GG 47 15 CC; 13 CG; 20 GG 48 0 % C % G % C % G FST:-0.01

81 0 S070 47 25 AA; 23 AG 48 0 68.5 % A 31.5 % G 19 AA; 27 AG; 1 GG 76.0 % A 24.0 % G FET:0.3 FST:-0.009 G11 43.4 56.6 39.3 60.7 FET:0.41 82 1 S080 40 CT; 6 TT; 1 NN 46 37 CT; 10 TT; 1 NN 47 1 % C % T % C % T FST:-0.001 98.0 2.0% 86.5 13.5 FET:0.01 83 0 S096 45 AA; 2 AC 47 36 AA; 1 AC; 11 CC 48 0 % A C % A % C FST:0.06 47.9 52.1 46.9 53.1 FET:1 84 2 S099 43 CT; 2 TT; 2 NN 45 44 CT; 3 TT; 1 NN 47 1 % C % T % C % T FST:-0.02

phụ