VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
BỘ GIÁO DỤC VÀ ĐÀO TẠO
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Nguyễn Thị Thu Thủy
NGHIÊN CỨU SỬ DỤNG CHỈ THỊ ITS ĐỂ ĐÁNH GIÁ QUAN HỆ DI TRUYỀN VÀ NHẬN DẠNG MỘT SỐ MẪU GIỐNG CÂY ÓC CHÓ THU THẬP TẠI CÁC TỈNH MIỀN NÚI PHÍA BẮC
LUẬ N VĂ N THẠ C SĨ SINH HỌC THỰC NGHIỆM
Hà Nội – 2019
VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
BỘ GIÁO DỤC VÀ ĐÀO TẠO
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Nguyễn Thị Thu Thủy
NGHIÊN CỨU SỬ DỤNG CHỈ THỊ ITS ĐỂ ĐÁNH GIÁ QUAN HỆ DI TRUYỀN VÀ NHẬN DẠNG MỘT SỐ MẪU GIỐNG CÂY ÓC CHÓ THU THẬP TẠI CÁC TỈNH MIỀN NÚI PHÍA BẮC
Chuyên ngành
: Sinh học thực nghiệm
Mã số
: 8420114
LUẬ N VĂ N THẠ C SĨ SINH HỌC THỰC NGHIỆM
NGƯỜI HƯỚNG DẪ N KHOA HỌC
Hướng dẫn 1: PGS.TS. Khuất Hữu Trung
Hướng dẫn 2: PGS.TS. Đồng Văn Quyền
Hà Nội - 2019
LỜI CAM ĐOAN
Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của cá nhân tôi dưới sự hướng dẫn của PGS.TS. Khuất Hữu Trung và PGS.TS. Đồng Văn Quyền. Các số liệu và tài liệu được trích dẫn trong luận văn là trung
thực. Kết quả nghiên cứu này không trùng với bất cứ công trình nào đã được công bố trước đó.
Tôi xin chịu trách nhiệm với lời cam đoan của mình.
Hà Nội, tháng năm 2019
Tác giả
Nguyễn Thị Thu Thủy
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành đến Học viện Khoa học và Công nghệ, Viện Di truyền Nông nghiêp, các thầy giáo, cô giáo đã tạo điều kiện thuận lợi cho tôi được học tập và hoàn thành khóa học này.
Tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS Khuất Hữu Trung – Phó viện trưởng – Viện Di truyền Nông nghiệp và PGS.TS Đồng Văn Quyền – Phó viện trưởng – Viện Công nghệ Sinh học, người đã tận tình giúp đỡ, hướng dẫn tôi hoàn thành luận văn này.
Tôi xin được cảm ơn tập thể cán bộ Bộ môn Kĩ thuật Di truyền - Viện Di truyền Nông nghiệp luôn động viên, giúp đỡ và tạo điều kiện thuận lợi về cơ sở vật chất - trang thiết bị để tôi có thể hoàn thành luận văn này.
Luận văn được sử dụng một phần số liệu và kết quả thuộc đề tài: “Khai thác và Phát triển nguồn gen cây Óc chó (Juglans regia Linn) tại Lai Châu và một số tỉnh miền núi phía Bắc”, mã số NVQG-2016/15 do TS. Nguyễn Toàn Thắng làm chủ nhiệm. Tôi xin chân thành cám ơn.
Cuối cùng, tôi xin bày tỏ lòng biết ơn vô cùng sâu sắc tới gia đình, bạn bè, đồng nghiệp những người đã luôn bên cạnh, động viên, góp ý cho tôi trong suốt quá trình học tập.
Hà Nội, tháng năm 2019
Tác giả
Nguyễn Thị Thu Thủy
DANH MỤC CÁC TỪ VIẾT TẮT
AFLP Amplified Fragments Length Polymorphism
cDNA Complementary deoxyribonucleic acid
CTAB Cetyl trimethyl ammonium bromide
DNA Deoxyribonucleic acid
dNTPs Deoxynucleoside triphosphates
DMSO Dimethyl sulfoxide (CH3)2SO
EDTA Ethylendiamin Tetraacetic Acid
EtBr Ethidium Bromide
ISSR Inter simple sequence repeat
ITS Internal Transcribed Spacer
PCR Phản ứng nhân theo chuỗi
RAPD Random Amplified Polymorphic DNA
rDNA Ribosomal deoxyribonucleic acid
RFLP Restriction Fragment Length Polymorphism
RNA Ribonucleic acid
SSR Simple sequence repeats
SCAR Sequence Characterised Amplification Regions
DANH MỤC HÌNH ẢNH
Hình 1.1: Sơ đồ vùng ITS của các gen rDNA vùng nhân và vị trí của các mồi
ITS........................................................................................................... 20
Hình 3.1:DNA tổng số của 26 mẫu Óc chó ................................................ 29
Hình 3.2: Phổ điện di sản phẩm PCR với cặp mồi ITS1/ITS8 trên 26 mẫu Óc
chó (M1KB: Marker ladder 1Kb; H2O: Đ/c âm) ........................................ 30
Hình 3.3: Một đoạn giản đồ có các đỉnh với 4 màu sắc khác nhau tương ứng
với 4 loại nucleotid của mẫu Óc chó HG02, HG05 và HG18 ...................... 32
Hình 3.4: Kết quả gióng hàng, gióng cột 26 trình tự ITS1-5,8SrRNA-ITS2
của 26 mẫu Óc chó và mẫu tham chiếu AF399876.1 .................................. 42
Hình 3.5: Sơ đồ hình cây về mối quan hệ di truyền giữa 26 mẫu nghiên cứu và
mẫu tham chiếu AF399876.1..................................................................... 46
DANH MỤC BẢNG
Bảng 1.1: Các hợp chất của cây Óc chó Anh (Juglans regia) ........................ 9
Bảng 2. 1: Danh sách 26 mẫu Óc chó ........................................................ 23
Bảng 2. 2: Danh sách các mồi ITS (White và cộng sự, 1990) ...................... 25
Bảng 2. 3: Thành phần phản ứng PCR ....................................................... 26
Bảng 2. 4: Chu trình phản ứng PCR ........................................................... 27
Bảng 3. 1: Độ dài các trình tự thuộc 26 mẫu Óc chó nghiên cứu và mẫu tham
chiếu AF399876.1 .................................................................................... 33
Bảng 3. 2: Thành phần bốn loại nucleotide của 26 mẫu nghiên cứu và mẫu
tham chiếu AF399876.1 ............................................................................ 34
Bảng 3. 3: Hệ số tương đồng di truyền giữa 26 mẫu nghiên cứu và mẫu tham
chiếu AF399876.1 vào trình tự vùng ITS1-5,8SrRNA-ITS2 ....................... 44
1
MỤC LỤC
LỜI CAM ĐOAN
LỜI CẢM ƠN
DANH MỤC CÁC TỪ VIẾT TẮT
DANH MỤC HÌNH ẢNH
DANH MỤC BẢNG
MỤC LỤC ................................................................................................ 1
MỞ ĐẦU ................................................................................................... 3
CHƯƠNG I: TỔNG QUAN TÀI LIỆU .................................................... 6 1.1. GIỚI THIỆU VỀ CÂY ÓC CHÓ ...................................................... 6
1.1.1. Nguồn gốc và phạm vi phân bố của cây Óc chó ........................... 6
1.1.2. Đặc điểm thực vật học và thành phần hóa học trong hạt của cây óc chó ..................................................................................................... 8
1.1.3. Đặc điểm sinh thái và phạm vi phân bố ..................................... 11
1.1.4. Giá trị sử dụng và giá trị kinh tế . .............................................. 13
1.2. TỔNG QUAN PHƯƠNG PHÁP NGHIÊN CỨU VỀ PHÂN LOẠI THỰC VẬT ......................................................................................... 14
1.2.1. Các phương pháp phân loại dựa trên đặc điểm hình thái ............ 14
1.2.2. Các phương pháp dựa trên chỉ thị phân tử ................................. 15
1.2.2.1. Các Marker phân tử dựa trên DNA..................................... 15
1.2.2.2. Sử dụng các trình tự DNA bảo tồn cao trong phân tích quan hệ phát sinh ở thực vật ....................................................................... 17
1.3. CÁC NGHIÊN CỨU VỀ ĐA DẠNG DI TRUYỀN ÓC CHÓ .......... 21
CHƯƠNG 2: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ............ 23 2.1. VẬT LIỆU ..................................................................................... 23
2.2. HÓA CHẤT................................................................................... 25
2.3. PHƯƠNG PHÁP NGHIÊN CỨU ................................................... 25
2.3.1. Tách chiết DNA tổng số ........................................................... 25
2
2.3.2. Thành phần của 1 phản ứng PCR .............................................. 26
2.3.3. Chương trình chạy PCR ........................................................... 26
2.3.4. Phương pháp điện di trên agarose ............................................. 27
2.3.5. Phương pháp thôi gel theo kit Qiagen ....................................... 27
2.3.6. Giải trình tự ............................................................................. 28
CHƯƠNG 3: KẾT QUẢ VÀ THẢO LUẬN ........................................... 29 3.1. KẾT QUẢ TÁCH CHIẾT DNA...................................................... 29
3.2. KẾT QỦA PCR VÀ TINH SẠCH CÁC SẢN PHẨM KHUẾCH ĐẠI .. 30
3.3. KẾT QUẢ KHẢO SÁT VÙNG TRÌNH TỰ ITS1-5,8SrRNA-ITS2 Ở CÁC MẪU NGHIÊN CỨU ................................................................... 30
3.4. KẾT QỦA SO SÁNH TRÌNH TỰ NUCLEOTIDE VÙNG ITS1 5,8SrRNA - ITS2 CỦA CÁC MẪU NGHIÊN CỨU......................... 36
3.5. KẾT QUẢ XÂY DỰNG CÂY QUAN HỆ PHÁT SINH GIỮA 26 MẪU NGHIÊN CỨU ...................................................................................... 43
3.6. KẾT QUẢ XÁC ĐỊNH MARKER PHÂN TỬ PHÂN BIỆT 26 MẪU ÓC CHÓ NGHIÊN CỨU ...................................................................... 49
CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ ........................................... 55 4.1. KẾT LUẬN ................................................................................... 55
4.2. KIẾN NGHỊ................................................................................... 55
TÀI LIỆU THAM KHẢO....................................................................... 56
PHỤ LỤC: TRÌNH TỰ 26 MẪU ÓC CHÓ NGHIÊN CỨU ................... 62
3
MỞ ĐẦU
1. Lý do chọn đề tài
Cây Óc chó có tên khoa học là Juglans regia Linn, phân bố rộng rãi
trên khắp thế giới, được trồng thương mại khắp miền Nam châu Âu, Bắc
Phi, Mỹ, Tây Nam Mỹ và Đông Á như một cây cho nhiên liệu điezen sinh
học. Trên thế giới, ngành sản xuất hạt Óc chó có doanh thu ước tính gần 10
tỷ USD trong năm 2011 (tính theo số lượng của FAO với giá là 4 USD/kg).
Hoa Kỳ là nước xuất khẩu lớn nhất thế giới trong khi Trung Quốc nổi lên là
một nước quan trọng về cả sản xuất và tiêu dùng. Tính từ năm 2000, tổng
sản lượng hạt óc chó toàn cầu đã tăng đều đặn về khối lượng. Tới năm 2010,
sản lượng đạt 2,55 (triệu tấn), gần gấp đôi 1,29 (triệu tấn) sản lượng năm
2000. Tại Việt Nam, năm 2011 có 22.000 tấn hạt óc chó được tiêu thụ và chủ yếu từ nhập khẩu.[1]
Cây Óc chó được ưa chuộng bởi nó đem giá trị thương mại, thẩm mỹ
và quan trọng hơn hết là nó đem lại giá trị dinh dưỡng cho con người. Quả
óc chó và các sản phẩm từ óc chó có tính phổ biến cao như một siêu thực
phẩm có lợi cho sức khỏe vì chúng chứa chất chống oxy hóa, hàm lượng
chất béo, protein, vitamin và khoáng chất cao. Quả óc chó có tác dụng giảm
nguy cơ tim mạch, bệnh tim mạch vành, điều trị đái tháo đường tuýp II,
phòng ngừa và điều trị một số bệnh ung thư, và giảm các triệu chứng do rối
loạn thần kinh và tuổi tác. Ngoài ra, cây Óc cho tăng cường sự phát triển trí
thông minh của não bộ, phòng và hỗ trợ bệnh ung thư, phòng chống loãng
xương, giảm stress, giảm mất ngủ, tăng cường chất lượng tinh trùng, ổn định
đường huyết, giảm cholesterol trong máu. Các bộ phận của cây đều được sử
dụng như một vị thuốc trong y học cổ truyền, điển hình như lá được sử dụng
để điều trị đau thấp khớp, sốt, tiểu đường, bệnh ngoài da và hoa được sử
dụng để điều trị đau thấp khớp và sốt rét. Gỗ của một số loài óc chó được
đánh giá cao về màu sắc, độ cứng và độ bền cao nên được sử dụng làm đồ
nội thất, sàn nhà và nhiều vật dụng đặc biệt khác như súng săn ...
Việc nghiên cứu, phát triển và trồng cây Óc chó không chỉ cải tạo môi
4
trường mà còn đem lại giá trị kinh tế cho vùng cao, cây Óc chó có thể được
khuyến khích trồng xen trong các hệ thống nông lâm kết hợp để giải quyết
những thách thức của du canh và độc canh cây lương thực ngắn ngày tại
miền núi phía Bắc. Vì vậy, để góp phần nghiên cứu bảo tồn và phát triển cây óc chó, chúng tôi tiến hành nghiên cứu đề tài: “Nghiên cứu sử dụng chỉ thị
ITS để đánh giá quan hệ di truyền và nhận dạng một số m ẫu giống cây Óc
chó thu thập tại các tỉnh miền núi phía Bắc”.
2. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu là 26 mẫu giống cây Óc chó được thu thập tại
các tỉnh miền núi phía Bắc: huyện Đồng Văn, tỉnh Hà Giang; huyện Sa Pa,
tỉnh Lào Cai; huyện Sỉn Hồ và huyện Phong Thổ tỉnh Lai Châu do Viện
Nghiên cứu Lâm sinh cung cấp.
- Thời gian thu mẫu: tháng 8/2018
- Thời gian nghiên cứu: từ tháng 9/2018 đến tháng 2/2019.
- Địa điểm nghiên cứu: thực hiện các thí nghiệm phân tử tại Bộ môn
Kỹ thuật di truyền, Viện Di truyền Nông nghiệp.
3. Cơ sở khoa học và tính thực tiễn của đề tài
Ý nghĩa khoa học
Hiểu biết về đa dạng di truyền ở mức độ phân tử của các mẫu cây Óc chó
thu được, là cơ sở để phân loại, tuyển chọn những nguồn gen ưu tú phục vụ cho
công tác chọn và lai tạo giống mới. Các marker phân tử nhận biết chính xác một
số nguồn gen Óc chó quý được sử dụng để xác định tính đúng giống phục vụ
công tác nhân giống và kiểm soát cây con giống ở giai đoạn sớm.
Ý nghĩa thực tiễn
Đề tài góp phần thu thập các nguồn gen Óc chó thu thập tại các tỉnh
miền núi phía Bắc.
Kết quả đề tài góp phần bảo tồn và sử dụng hợp lí nguồn gen Óc chó
của Việt Nam, phục vụ cho công tác chọn tạo giống mới, chuẩn hóa nguồn
5
cây giống góp phần nâng cao thương hiệu cho sản phẩm Óc chó của Việt
Nam ở khu vực và trên thế giới.
Kết quả của luận văn là nguồn tài liệu tham khảo hữu ích phục vụ cho
nghiên cứu và giảng dạy.
4. Mục đích nghiên cứu
Xác định được quan hệ di truyền, mức độ đa dạng của cây Óc chó thu
thập tại các tỉnh miền núi phía Bắc.
Xác định được các đặc trưng trình tự ITS của một số mẫu cây Óc chó
phục vụ công tác tuyển chọn và lai tạo giống.
6
CHƯƠNG I: TỔNG QUAN TÀI LIỆU
1.1. GIỚI THIỆU VỀ CÂY ÓC CHÓ
1.1.1. Nguồn gốc và phạm vi phân bố của cây Óc chó
Cây óc chó có tên khoa học là Juglans regia, tên tiếng anh là Walnut, tên
Latinh là Gallica. Đây là một loài cây có giá trị cao về chất lượng gỗ và hạt.
Bộ : Fagales (Bộ Cử )
Họ : Juglandaceae (Họ Óc chó, Họ Hồ Đào )
Chi : Juglans ( Óc chó hay Hồ đào, Hạch đào)
Loài : J.regia
Cây óc chó thuộc chi Juglans, là loài phân bố lớn nhất và rộng rãi nhất
trong tám chi thuộc họ Juglandaceae. Chi Juglans bao gồm khoảng 21 loài
phân bố ở châu Á, Nam Âu, Bắc Mỹ, Trung Mỹ, Tây Nam Mỹ và Tây Ấn (Manning, 1978[2]; Stanford và cộng sự, 2000 [3]). Loài Juglans có dạng lưỡng bội, với dạng karyotype 2n = 2x = 32 (Woodworth,1930[4]; Komanich, I. G., 1982 [5]). Óc chó là một trong những loài sản xuất hạt được trồng lâu
đời nhất trong lịch sử loài người và được trồng ở hầu hết các phần ôn đới của bán cầu bắc. Có rất nhiều nghiên cứu khác nhau về nguồn gốc của cây
Óc chó, nhưng các nhà nghiên cứu cho rằng óc chó có nguồn gốc từ Hy Lạp và bán đảo Balkan (Polunin, 1977 [6]).
Vào thế kỷ thứ IV trước công nguyên, Óc chó có nguồn gốc từ Iran và vùng Trung Á đã được gây trồng tại Nam Tư và Hy Lạp. Những giống đầu
tiên này đã được lai tạo thành các giống tốt hơn và kể từ đó nó được gây trồng rộng rãi trên khắp châu Âu và Bắc Phi. Sau đó vào thời kỳ Trung cổ
những giống này lại được mang về trồng tại Thổ Nhĩ Kỳ. Một số nguồn gen óc chó được cho là du nhập và gây trồng tại Trung Quốc cách đây 2000 năm
và hiện nay tại một số vùng nó được xem như là phân bố tự nhiên tại đây. Bên cạnh đó Óc chó được cho là du nhập và gây trồng tại châu Mỹ vào thế
kỷ 17. Những nước gây trồng phổ biến Óc chó hiện nay bao gồm Pháp,
7
Serbia, Hy lạp, Rumani, Hungari, Trung Quốc, Mỹ, Chi Lê, New Zealand và
miền Đông Nam châu Úc. Như vậy, hiện nay Óc chó đã được gây trồng từ 30° - 50° vùng Bắc bán cầu và 30° - 40° vùng Nam bán cầu bao gồm rất
nhiều giống khác nhau cho hạt to và vỏ hạt mỏng, chịu được các điều kiện
khắc nghiệt, thích nghi với điều kiện tự nhiên, đất đai thổ nhưỡng tại các khu vực gây trồng.
Cây Óc chó có hai loài phổ biến nhất chi đó là óc chó Ba Tư (Juglans regia) và óc chó Đen (Juglans nigra). Óc chó Ba Tư hay còn gọi là óc chó
Anh Quốc là loài nổi tiếng và được biết đến nhiều. Loài này có nguồn gốc từ vùng Balkan ở Đông Nam Châu Âu, Tây Nam và Trung Á đến dãy
Himalaya và Tây Nam Trung Quốc và được mở rộng sang Hoa Kỳ bởi những người định cư Anh. Ngoài ra, Óc chó Anh Quốc cũng được tìm thấy
rải rác ở khắp Châu Âu và Châu Á, chúng được trồng rộng rãi để sản xuất các loại hạt có chất lượng tốt. Óc chó Đen là một loài phổ biến ở miền đông
Bắc Mỹ và cũng được trồng rộng rãi ở một số nơi khác. Cả hai đều là cây rụng lá (lá rụng khi ngủ đông) và sống hơn một thế kỷ và được trồng trên
toàn thế giới để lấy hạt và gỗ chất lượng cao, được sử dụng rộng rãi trong nội thất, nội thất xe hơi, cửa ra vào và ngành công nghiệp súng. Tuy nhiên,
chúng ta có thể nói rằng quả óc chó Anh được trồng nhiều hơn cho các loại hạt và cho gỗ ít hơn. Mặc dù hạt óc chó Đen có thể ăn được, nhưng hạt nhân
nhỏ và vỏ cứng vì thế chúng không được trồng để sản xuất hạt. Vì vậy, trồng
cây Óc chó đen để lấy gỗ rất phổ biến ở Mỹ và các nước khác và được coi là một lựa chọn đầu tư sẽ mang lại lợi nhuận lớn trong dài hạn (hai hoặc ba
thập kỷ sau khi trồng cây). Óc chó Đen cho gỗ tốt màu tối và cứng nên loài này được đánh giá cao về khả năng đem lại giá trị kinh tế. Óc chó Anh và óc
chó Đen đều đem lại giá trị thương mại; óc chó Anh cho gỗ và các loại hạt, óc chó Đen cho gỗ. Óc chó đen có thể đạt chiều cao 100-120 feet (30-37
mét), trong khi Óc chó Anh trung bình đạt chiều cao 80 feet (25 mét) khi trưởng thành. Cây Óc chó đen và Óc chó Anh đều sản sinh các hóa chất độc
hại cho nhiều loại cây (cà chua, khoai tây, cỏ linh lăng, quả việt quất, táo và nhiều loại khác).
8
Mặc dù cây Óc chó (Carya tongkinensis) không có nguồn gốc từ Việt
Nam nhưng theo ông Vũ Văn Dũng, một chuyên gia trong thụ mọc học,
chúng có thể được tái sinh tự nhiên tại các khu vực miền núi phía Bắc của
Việt Nam như Cao Bằng, Sa Pa (Lào Cai) và Hà Giang. Điều này được cho
thấy quả óc chó tại Việt Nam là thuộc giống tương tự như óc chó Anh phát
triển trong khu vực Himalaya và Tây Nam của Trung Quốc.
1.1.2. Đặc điểm thực vật học và thành phần hóa học trong hạt của
cây óc chó
Cây Óc chó thuộc dạng cây lớn, cây trưởng thành có thể đạt độ cao 25–35m, bán kính thân cây có thể lên đến 2m, thân cây mập, ngắn nhưng tán cây thì rất rộng để giành được lợi thế cạnh tranh về ánh sáng trong các khu rừng. Cây trưởng thành đặc trưng có thân dài, thường không có nhánh thấp. Vỏ cây óc chó có màu nâu xanh và mịn khi cây còn non, trở nên xám và xuất hiện vết nứt khi cây già đi. Cây óc chó có rễ to và sâu tạo ra chất gọi là juglones ngăn chặn sự phát triển của các cây khác ở gần.
Tùy thuộc vào vĩ độ, hoa óc chó thường bắt đầu xuất hiện vào khoảng giữa tháng 4 cho đến đầu tháng 6. Sự ra hoa và ra lá xảy ra gần như cùng lúc và luôn đủ sớm để tránh thiệt hại bởi sương giá cuối mùa xuân. Lá óc chó to hình lông chim dài tới 40cm, kép lông sẻ, thường có từ 7 đến 9 lá chét, không cuống, hình trứng thuôn hoặc tròn dẹt một phía, khi vò ra có mùi hăng đặc biệt. Hoa đơn tính, màu lục nhạt, hoa đực xếp thành đuôi sóc thõng xuống, hoa cái xếp 2 đến 5 cái ở cuối các nhánh. Hoa đực phát triển từ các chồi không lá từ năm trước, chúng có chiều dài khoảng 10 cm (3,9 inch) và có nhiều hoa nhỏ. Hoa cái xuất hiện trong một cụm ở đỉnh của các chồi lá vào năm sau.
Quả chín ăn được vào tháng 9 hoặc tháng 10 cùng năm và giảm ngay sau khi lá rụng. Quả của cây óc chó có hình tròn, khi chín sẽ tự động khô lại và nứt ra để lộ hạt bên trong, mỗi quả óc chó chỉ cho 1 hạt duy nhất. Quả hạch to có vỏ ngoài màu lục và nạc, dễ hoá đen khi chà xát, vỏ quả bên trong hay vỏ của hạch rất cứng, có 2 van bao lấy hạt với 2 lá mầm to, chia thuỳ và nhăn nheo như nếp của óc động vật.
9
Tùy thuộc vào các yếu tố khác nhau như vị trí địa lý, nhiệt độ, thời
gian và các yếu tố khác, mỗi cây Óc chó có thành phần hóa học khác nhau ở
các quốc gia khác nhau. Ngày nay, các bộ phận khác nhau của cây Óc chó
như lá, vỏ cây và trái cây đều được sử dụng trên thế giới. Các nhà nghiên
cứu cho rằng các hợp chất hóa học được tìm thấy trong quả óc chó là khác
nhau ở các vùng khí hậu khác nhau. Các hợp chất hóa học của các phần khác
nhau của quả óc chó được thể hiện trong Bảng 1.1 .
Bảng 1.1: Các hợp chất của cây Óc chó Anh (Juglans regia)
Bộ phận Hợp chất
Lá Phenolic acids, tannins, esential faty acids, ascorbic
acid, flavonoids, caffeic acid, paracomaric acid,
juglone.
Vỏ xanh của quả Emulsion, glucose, organic materials such as citric
acid, malic acid, phosphate và calcium oxalate.
Quả Óc chó Fatty acids, tocopherols, phytosterols, total phenolic (tannin).
Zahoo báo cáo rằng 17 hợp chất đã được xác định trong lá óc chó; 9
trong số đó là epicatechin, syringetin-o-hexoside, myricetin-3-o-glucoside,
myricetin-3-o-pantocid, aesculetin, taxifolin-pantocid, quercetin
glucuronide, kaempferol loại cây này có chứa axit phenolic, tannin, axit béo
thiết yếu (axit linoleic là axit béo chính), axit ascobic, flavonoid, axit caffeic
và axit paracomaric. Các flavonoid quan trọng nhất trong lá óc chó bao gồm
các dẫn xuất quercetin galactoside và quercetin pantocid, quercetin
arabinoside, quercetin xyloside và quercetin rhamnoside. Ngoài ra, Shah và
các cộng sự cũng sàng lọc phytochemical của chiết xuất lá thô có sự hiện
diện của carbohydrate, glycoside tim, phenolics, flavonoid, alkaloids,
protein, steroid và tannin. Amaral và cộng sự đã nghiên cứu có các hợp chất
phenolic bao gồm axit 3- và 5-caffeoylquinic, axit 3- và 5-p-
10
coumaroylquinic, quercetin 3-galactoside, dẫn xuất quercetin 3-pantocide,
quercetin 3-arabinoside, quercetin-quercetin và quercetin 3-rhamonocide
trong lá óc chó. Quercetin 3-galactoside là thành phần chính trong số các
hợp chất được đề cập. Ngoài ra, đã có nghiên cứu cho rằng lá của cây Óc
chó có chứa dẫn xuất naphthalene, đặc biệt là 5- hydroxy-1-4-
naphthoquinone. Juglone (5-hydroxy-1, 4-naphthoquinone) là một hợp chất
naphthoquinone được tìm thấy trong lá tươi và vỏ xanh của quả óc
chó. Juglone là thành phần rõ ràng nhất trong các cơ quan khác nhau của cây
Óc chó, với trọng lượng phân tử là 174,16 và công thức C10H5O2-(OH), tiền chất là một glycoside được tìm thấy như một hợp chất trong các bộ phận trên
không của cây, đặc biệt là lá, sau đó được chuyển thành juglone thông qua
quá trình thủy phân. Juglone là một chất kiềm được hòa tan nhẹ trong nước
nóng và vừa phải trong rượu; do đó, nó có thể là một trong những hợp chất
hiệu quả trong lá óc chó vì các chất khác trong lá của quả óc chó thường tan
trong nước hoặc tan trong chất béo. Vỏ xanh của quả óc chó có nhũ tương,
glucose và các vật liệu hữu cơ như axit citric, axit malic, phốt phát và canxi
oxalate. Hợp chất Juglone và phenolic là những hợp chất quan trọng nhất
được tìm thấy trong lá và vỏ xanh của quả óc chó. Juglone, là một hợp chất
độc hại, chỉ được tìm thấy trong quả óc chó tươi và xanh. Vỏ xanh quả óc
chó có sản phẩm phụ với ít công dụng.
Quả óc chó có chứa các thành phần hóa học đa dạng, bao gồm
diarylheptanoids, quinones, polyphenol, flavon và terpenes. Các
diarylheptanoids và quinones có hoạt tính chống ung thư đáng chú ý, cung
cấp các hợp chất chì mới để điều chế các thuốc chống ung thư. Các hoạt
động giảm đau, chống oxy hóa, kháng khuẩn và chống ung thư mạnh của các
loại cây này là đáng kể. Hơn thế nữa là quả óc chó chứa hàm lượng dinh
dưỡng cao như Omega-3, protein quả óc chó chứa 24% protein, 12% –16%
carbohydrate, 1,5% –2,0% cellulose, và 1,7% –2,0% khoáng chất, chất xơ,
Photpho, Kali, Magie, Canxi, Sắt và Các Vitamin, đặc biệt là hàm lượng
Omega-3 cao gấp 5 lần cá hồi.
11
1.1.3. Đặc điểm sinh thái và phạm vi phân bố
Cây óc cho phù hợp trồng ở độ cao từ 1,000 đến 2,000m so với mực
nước biển. Cây óc chó là một loại cây rất kén đất và yêu cầu điều kiện khí
hậu phải phù hợp. Cây óc chó phát triển tốt nhất ở những vùng có khí hậu ôn
hòa, không quá nóng và điều kiện thổ nhưỡng phải tốt, gần nguồn nước để
đảm bảo cho ra chất lượng hạt đồng đều cả về kích thước lẫn dinh dưỡng.
- Khí hậu, nhiệt độ: Cây Óc chó thích hướng về ánh nắng mặt trời,
Cây Óc chó rất nhạy cảm với thời tiết quá nóng và quá lạnh vào mùa hè và
mùa đông. Óc chó rất nhạy cảm với mùa đông và sương giá của mùa xuân. Cành non và hoa dễ dàng bị hư hại do sương giá mùa xuân ở nhiệt độ 1oC;
sương giá trong mùa thu có thể ảnh hưởng đến các chồi chưa phát triển. Tuy nhiên, trong thời kì ngủ đông, cây Óc chó có thể chịu được thời tiết lạnh -11oC.
khí hậu ấm áp, có thể chịu nhiệt độ thấp trong thời gian ngắn. Nhiệt độ sinh trưởng thích hợp là 20 – 30 oC. Trong mùa sinh trưởng cần phải cung cấp nhiệt độ ấm áp cho cây với ít nhất 6 tháng có nhiệt độ trung bình hơn 10oC.
- Đất đai, thổ nhưỡng: Óc chó đòi hỏi đất sâu và phong phú (Jacamon, 1987[7]), và để phát triển tốt, loài này phải được trồng trong đất sâu hơn 80-100 cm (Becquey,1997 [8]). Các loại đất tốt nhất cho Óc chó canh
tác là loams (đất sét> 25%, phù sa 30- 50% và cát 30-50 %). Hàm lượng đất
sét lý tưởng nhất phải nhỏ hơn 35% và lưu lượng mưa càng nhiều, lượng đất sét càng ít dung nạp (Giannini và Mercurrio, 1997 [9]). Ở miền trung nước Ý
sự gia tăng diện tích cơ bản tốt nhất cho các loài đã được tìm thấy trong đất
có hàm lượng sét nằm trong khoảng từ 15 đến 25% (Fratteggiani và cộng sự, 1996 [10]). Óc chó không thích đất ngập nước, đất nông và đất có canxi tự do (Boudru,1989[11]). Giá trị pH đất lý tưởng nằm trong khoảng từ 6,5 đến 7,5 (Becquey, 1997[8]) hoặc theo các tác giả khác trong khoảng từ 6 đến 7.5 (Giannini và Mercurrio, 1997[9]). Để tránh nhiễm clo , Becquey (1997)
khuyên trồng cây Óc chó trên đất bề mặt có độ pH cao (8.0-8.5). Vị trí nên tránh là đất cát nhẹ và đất nặng (Klemp , 1979 [12]), đất than bùn.
- Nước: Yêu cầu lượng mưa trung bình trong năm khoảng 700-
12
800mm/năm và được phân phối đều trong cả năm (Becquey, 1997 [8]; Bergougnoux and Grospierre, 1981[13] ). Tuy nhiên, cây vẫn có thể chịu
được một khoảng thời gian hạn hán với lượng mưa tối thiểu là 100-150mm trong thời gian phát triển của cây (Giannini and Mercurio, 1997 [9]).
- Ánh sáng: Óc chó là một loài cây ưa sáng. Ánh sáng là yếu tố cần
cây chịu được bóng râm. Cây non có thể sinh trưởng trong một thời gian
thiết cho sự phát triển của cây. Chỉ có ở dạng cây con và trong đất giàu nitơ,
ngắn ở điều kiện thiếu ánh sáng, nhưng nếu kéo dài khi cây trưởng thành sẽ
kiện ánh sáng đầy đủ để tránh phát triển thân cây quanh co, dẫn đầu đến sự phát triển của gỗ căng hoặc giảm thân cây (Winter, 1982[14] ).
xuất hiện các biến dạng không mong muốn. Khi cây trưởng thành cần điều
Với những điều kiện trên, tại Việt Nam, cây óc chó chỉ có thể trồng và
phát triển tốt nhất ở một số vùng núi sát biên giới phía Bắc như Sa Pa (Lào
Cai), Phó Bảng, Đồng Văn (Hà Giang), Cao Bằng. Hiện nhiều dự án nghiên
cứu trồng thử nghiệm cây Óc chó cũng chủ yếu được tiến hành ở vùng này.
Trong cuốn “Cẩm nang ngành Lâm nghiệp, chương Lâm sản ngoài gỗ” của
Bộ Nông nghiệp và Phát triển nông thôn thì cây Óc chó mọc ở độ cao từ 500
- 800 m, có phân bố rải rác từ Thanh Hoá đến Lai Châu, Hà Giang, Lào Cai. Lê Sỹ Doanh và Trần Quang Bảo (2012)[15] khi nghiên cứu kỹ thuật trồng
cây Óc chó thấy loài này có thể trồng được ở Lào Cai (Sa Pa), Hà Giang
(Phó Bảng, Đồng Văn) và Cao Bằng. Nghiên cứu đặc điểm sinh thái cây Óc
chó Viện Điều tra Quy hoạch rừng và Viện Khoa học Lâm nghiệp Việt Nam
cho thấy loài cây này ít khi mọc thuần loài, mà thường mọc hỗn giao, rải rác
trong rừng lá rộng thường xanh hay nửa rụng lá trên đất ẩm, tầng dầy, màu
mỡ và thoát nước tốt với một số loài như Sấu (Dracontomelum
duperreanum), Sâng (Pometia pinnata),....
Theo Lê Mộng Chân (2000)[16], họ óc chó ở Việt Nam có 5 chi và 8 -
9 loài. Trong đó loài óc chó có tên khoa học là Juglans regia có đặc điểm
nhận biết: Lõi cành xếp ngang. Lá kép lông chim lẻ, mép lá nguyên. Quả
hạch, không cánh.
13
Khi nghiên cứu về các loài cây lâm sản ngoài gỗ có giá trị trong tài
liệu “Cẩm nang ngành Lâm nghiệp, chương Lâm sản ngoài gỗ” năm 2006
thì cây óc chó lại có tên gọi khác là Carya annamocarya.
Theo Hoàng Thị Lụa và cộng sự (2014) [1] khi nghiên cứu về thị
trường phát triển cây Óc chó tại vùng Tây Bắc Việt Nam. Tác giả đưa ra tên
gọi khác cho loài óc chó là Carya tonkinensis.
Như vậy, có thể thấy tên khoa học cho loài Óc chó ở Việt Nam chưa
được thống nhất giữa các tài liệu. Một số tài liệu vẫn còn nhầm lẫn tên khoa
học của cây Óc chó với các loài khác cùng họ Hồ đào (Juglandaceae). Do
đó, cần có nghiên cứu làm sáng tỏ tên khoa học của loài Óc chó tại Việt
Nam để tránh nhầm lẫn.
1.1.4. Giá trị sử dụng và giá trị kinh tế .
Cây Óc chó là một loại cây quan trọng vì mọi bộ phận của cây đều có
lợi ích vì vậy óc chó có vị trí đặc biệt trong nền kinh tế xã hội. Quả Óc chó
rất giàu chất béo, protein, khoáng chất, vitamin và một lượng đáng kể các
chất xơ. Dầu của hạt óc chó chứa các axit béo chính, như axit oleic, axit
linoleic và axit linolenic, được sử dụng rộng rãi trong mỹ phẩm công nghiệp
vì nó chứa các đặc tính giữ ẩm và chống oxy hóa. Nồng độ omega-3-fatty
acids trong quả óc chó có nhiều lợi ích sức khỏe tiềm năng từ bảo vệ tim
mạch đến việc thúc đẩy chức năng nhận thức tốt hơn, lợi ích chống viêm,
hữu ích trong hen suyễn, viêm khớp dạng thấp và bệnh viêm ngoài da như
eczema và bệnh vẩy nến. Quả óc chó còn được sử dụng để điều trị ho, bệnh
dạ dày và ung thư ở châu Á và các nước châu Âu. Cây Óc chó là một cái cây
thân gỗ thuộc bộ dẻ và gỗ của cây Óc chó được dùng đa dạng để chế tác
những sản phẩm nội thất. Hiện thị trường hiện giờ rất chuộng những sản
phẩm được tạo ra trong khoảng gỗ óc chó như giường, tủ, ghế và các nội thất
gỗ óc chó khác nữa. Hiện các sản phẩm nội thất được tạo ra từ cây Óc chó
với giá khá cao so với các sản phẩm gỗ khác. Điều đó mang lại nguồn thu
mang giá trị kinh tế cao cho người trồng cây Óc chó cuối mỗi quá trình thu
hoạch. Chưa kể là nhiều năm cho thu hoạch trái đem đến nguồn thu đều đặn
14
thường xuyên cho người trồng cây Óc chó. Không những phần thân gỗ của
cây Óc chó có giá trị kinh tế mà phần lá của cây Óc chó hứa hẹn cũng mang
lại nguồn thu cho người nông dân trồng. Hiện lá cây Óc chó sử dụng phổ
biến trong lĩnh vực công nghiệp hóa mỹ phẩm, toàn bộ các chế phẩm được
chế tạo trong khoảng lá cây Óc chó. Trong đông y người ta cũng biết đến lá
cây óc chó như một vị thuốc chữa bệnh suy tim và hở van tim.
Sản lượng hạt Óc chó đã phát triển nhanh chóng trong mười năm qua
do ngày càng nhiều người nhận thấy giá trị dinh dưỡng của nó. Ngành sản
xuất hạt Óc chó có doanh thu ước tính gần 10 tỷ USD trong năm 2011 (tính
theo số lượng của FAO với giá là 4 USD/kg). Hoa Kỳ là nước xuất khẩu lớn
nhất thế giới trong khi Trung Quốc nổi lên là một nước quan trọng về cả sản
xuất tiêu dùng. Tính từ năm 2000, tổng sản lượng hạt Óc chó toàn cầu đã
tăng đều đặn về khối lượng. Tới năm 2010, sản lượng đạt 2,55 (triệu tấn),
gần gấp đôi 1,29 (triệu tấn) của năm 2000. Tốc độ tăng trưởng trung bình từ
2000 - 2005 là 6,2%, và từ 2006 - 2010 là 10,8%. Sáu nước sản xuất hàng
đầu trong năm 2010,xếp theo khối lượng giảm dần là Trung Quốc,Hoa Kỳ,
Iran, Thổ Nhĩ Kỳ, Ukraine và Mexico. Các quốc gia này vẫn giữ vị trí đứng
đầu với sản lượng và chiếm hơn 80% sản lượng toàn cầu. Hoa Kỳ và Trung
Quốc có sản lượng hạt Óc chó liên tục tăng.Tổng sản lượng của hai nước
tăng từ 47% tổng nguồn cung toàn cầu năm 2005 lên khoảng 60% trong năm
2010. Sản lượng của Trung Quốc đã tăng gấp đôi từ 2005 - 2010. Trung
Quốc đã đạt được tốc độ tăng trung bình giai đoạn 2005 - 2010 là 16,3% cao hơn so với nước sản xuất thứ 2 và thứ 3 là Hoa Kỳ 7,3%, và Iran 9,7%.[1]
1.2. TỔNG QUAN PHƯƠNG PHÁP NGHIÊN CỨU VỀ PHÂN LOẠI THỰC VẬT
1.2.1. Các phương pháp phân loại dựa trên đặc điểm hình thái
Phương pháp phân loại dựa trên đặc điểm hình thái có nguyên tắc cơ
bản là hai đơn vị phân loại (taxon) có nhiều đặc điểm chung, càng giống
chúng càng có quan hệ gần gũi với nhau. Nhưng không phải đặc điểm nào
cũng có thể là đặc điểm để phân loại. Các taxon bậc cao thường có đặc điểm
15
phân loại ổn định, biến đổi chậm, liên quan đến những cấu trúc ít biến của
cơ thể. Còn taxon bậc thấp thì biến đổi nhanh hoặc liên quan đến cơ chế
cách ly sinh sản. Do vậy, để tăng độ tin cậy cho phân loại hình thái thì người
ta kết hợp nhiều đặc điểm lại với nhau.
Ưu điểm của phương pháp phân loại dựa trên đặc điểm hình thái là rất
kinh tế, nhanh chóng và tiện lợi nhưng lại đòi hỏi các nhà phân loại học phải
có kiến thức chuyên sâu, có kinh nghiệm và sự khéo léo. Không những thế
phương pháp này còn thiếu độ chính xác vì có hiện tượng đồng quy tính
trạng và không phân biệt được các loại đồng hình, mặt khác bởi hình thái
chính là kết quả nhau thì của biểu hiện gen trong một điều kiện ngoại cảnh
nhất định nên việc hoàn toàn dựa vào hình thái đôi khi dẫn đến các kết quả
không xác thực, nhất là đối với các taxon thực vật có mức độ thường biến
cao. Các marker hình thái có nhiều điểm hạn chế như: các biến đổi hình thái
không phát hiện được ở một số loài; các nghiên cứu sử dụng đặc điểm hình
thái nói chung thường giới hạn trong một hay một vài locus; nhiều đặc điểm
hình thái chỉ có thể quan sát được vào cuối chu kỳ sống; nhiều đặc tính hình
thái không riêng biệt mà mang tính liên tục và chồng lấp giữa các loài gây
trở ngại cho việc phân tích chính xác sự đa dạng di truyền của quần thể.
1.2.2. Các phương pháp dựa trên chỉ thị phân tử
1.2.2.1. Các Marker phân tử dựa trên DNA
Các marker phân tử được sử dụng để đánh giá đa hình DNA được
phân thành hai loại: marker dựa trên cơ sở lai phân tử và marker dựa trên cơ
sở phản ứng chuỗi polymer hóa (PCR). Về mặt định dạng, đặc tính DNA có
thể nhận ra thông qua việc lai các đoạn DNA được cắt giới hạn bằng
enzymes phân giải với các DNA thăm dò (probe) được đánh dấu vốn là các
đoạn DNA có nguồn gốc hoặc trình tự đã biết. Marker trên cơ sở PCR bao
gồm việc khuếch đại in vitro những trình tự DNA hay locus đặc trưng bằng
cách sử dụng những trình tự olygonucleotide trong vai trò là các mồi đặc
hiệu hay ngẫu nhiên và một enzyme DNA polymerase bền nhiệt. Các đoạn
được khuếch đại được tách ra trên điện di và tạo các đặc trưng hình thành
16
băng, các đặc trưng này vốn được phát hiện bằng nhiều phương pháp khác
nhau như nhuộm hay ghi phóng xạ tự động. Những marker phân tử thường
được sử dụng bao gồm:
Đa hình chiều dài các đoạn giới hạn [Restriction Fragment Length
Polymorphism (RFLP)]
RFLP là một kỹ thuật áp dụng để phân biệt các sinh vật với nhau bằng
cách phân tích các kiểu dẫn xuất hình thành từ việc cắt nhỏ DNA của chúng.
RFLP có thể ứng dụng trong nghiên cứu đa dạng và phát sinh loài trên dải
đối tượng từ các cá thể đến quần thể, từ trong loài đến các loài có quan hệ họ
hàng gần. RFLP được sử dụng rộng rãi trong việc nghiên cứu lập bản đồ gen
bởi tính phong phú cao của chúng trên bộ gen, khả năng ứng dụng rộng của
các enzym cắt giới hạn khác nhau và sự phân bố ngẫu nhiên suốt bộ gen của các RFLP (Neale & Williams 1991)[17]. RFLP cũng được sử dụng trong
nghiên cứu khảo sát mối quan hệ giữa các bậc phân loại gần, hoặc sử dụng
như một công cụ làm nảy sinh đặc trưng nhận dạng DNA (DNA
fingerprinting), trong nghiên cứu về đa dạng di truyền lai, chuyển gen quan
tâm vào sinh vật và bao gồm cả những nghiên cứu về dòng gene hay phân bố
gen giữa các cây trồng. Các marker RFLP cũng được sử dụng lần đầu trong
việc xây dựng bản đồ di truyền bởi Botstein và cộng sự năm 1980, từ đó một
bộ các marker RFLP phát hiện được đã tạo nhiều cơ hội cho việc phát triển một bản đồ chi tiết ở rau diếp (Landry và cộng sự, 1987) [18].
DNA Đa hình khuếch đại ngẫu nhiên [Random Amplified
Polymorphic DNA (RAPD)]
RAPD là một kỹ thuật dựa trên cơ sở PCR. Phương pháp được dựa
trên cơ sở sự khuếch đại các đoạn DNA mục tiêu hay ngẫu nhiên dưới tác
động của enzyme với các mồi tùy chọn, kỹ thuật này được Welsh và
McClelland phát triển năm 1991. Trong phản ứng RAPD, một chủng loại
mồi đơn sẽ gắn vào DNA bộ gen ở hai vị trí khác nhau trên hai mạch bổ sung của DNA khuôn mẫu. Trung bình, mỗi mồi sẽ dẫn đến việc khuếch đại
một vài locus riêng rẽ trên bộ gen, đó là cơ sở cho sự hữu dụng của RAPD
17
cho việc sàng lọc một cách hiệu quả các đa hình trình tự nucleotide giữa các
cá thể. Tuy nhiên, vì tính ngẫu nhiên một cách tự nhiên trong việc khuếch
đại DNA với các mồi có trình tự ngẫu nhiên, điều quan trọng là phải tối ưu
hóa và duy trì điều kiện phản ứng cho việc nhân mạch đôi DNA.
RAPD đã được sử dụng với nhiều mục đích, từ nghiên cứu ở mức độ
cá thể (như xác định đa dạng di truyền) đến nghiên cứu liên quan đến những
loài họ hàng gần nhau. RAPD cũng đã và đang được ứng dụng vào việc
nghiên cứu lập bản đồ gen để lấp đầy những lỗ hổng mà các markers khác chưa thực hiện được (Hadrys và cộng sự, 1992) [19] .
Vi vệ tinh hay Trình tự lặp đơn giản [Microsatellites or Simple
sequence Repeat (SSR)]
Microsatellite đặc biệt thích hợp để phân biệt các kiểu gen có quan hệ
họ hàng gần; bởi mức độ biến động cao của chúng, vì thế chúng được ưa
thích khi sử dụng trong các nghiên cứu về quần thể và cho việc nhận dạng
các chủng giống nông nghiệp có quan hệ gần. Microsatellite thể hiện một
tính đa hình cao nên chúng là những marker có thể được sử dụng trong nhiều
nghiên cứu về di truyền quần thể cũng như các nghiên cứu quan hệ phát sinh
từ mức độ cá thể (như nhân dòng vô tính và xác định các dòng) đến mức độ
những loài có quan hệ họ hàng gần. Ngược lại, tỷ lệ đột biến cao của chúng
làm cho chúng không thích hợp trong nghiên cứu phân biệt các taxon có
quan hệ phát sinh xa nhau. Microsatellite được xem là các marker lý tưởng trong nghiên cứu lập bản đồ gen (Jarne & Lagoda 1996) [19] . Marker SSR đã
được chứng minh tính hữu dụng cho việc đánh giá biến động di truyền trong
chọn lọc các sinh vật.
1.2.2.2. Sử dụng các trình tự DNA bảo tồn cao trong phân tích quan hệ
phát sinh ở thực vật
Hệ thống hóa là quá trình thăm dò, mô tả và giải thích tính đa dạng
của thế giới sinh vật. Vào năm 1758, Linnaeus đã xây dựng hệ thống phân loại mang tính thứ tự trước khi phát triển học thuyết tiến hóa. Sự xuất hiện
18
và phát triển của các kỹ thuật phân tử mà đặc biệt là phản ứng chuỗi polymer hóa – PCR (Mullis và Faloona, 1987)[20] đã hình thành nên một
lượng lớn các dữ liệu sẵn sàng cho việc giải trình tự DNA và các kỹ thuật
làm nảy sinh đặc trưng nhận dạng DNA . Nhiều dạng đặc điểm mang tính
thông tin, đặc biệt là các trình tự DNA đã được ứng dụng trong nghiên cứu
mối quan hệ phát sinh và quá trình tiến hóa ở thực vật. Các thực vật bậc cao
mang trong nó ba bộ gen: bộ gen trong nhân, bộ gen ty thể và bộ gen lạp thể.
Bộ gen lục lạp
Bộ gen lục lạp của đa số các thực vật trên cạn thông thường được đặc
trưng bởi phân tử dạng vòng. Thành phần, kích thước, cấu trúc và trình tự
của bộ gen lục lạp đã được xác định là có mức độ bảo tồn cao trong các
nghiên cứu về tiến hóa. Tính bảo tồn cao này chỉ ra rằng bất kỳ thay đổi nào
về cấu trúc, cách sắp xếp hay thành phần đều liên quan mạnh mẽ đến quan
hệ phát sinh. Các phần khác nhau của bộ gen tiến hóa theo các tỷ lệ khác
nhau và tương đối chậm ở mức độ trình tự nucleotide. Những vùng không
mã hóa của bộ gen lục lạp tiến hóa nhanh hơn những vùng mã hóa. Các đột
biến ở DNA lục lạp thường là các thay thế nucleotide hay sự sắp xếp lại. Các
đột biến tăng đoạn hay mất đoạn tích lũy trong vùng không mang mã xảy ra
với tỷ lệ ngang với sự thay thế nucleotide và chính kiểu đột biến này làm
tăng cường tính đa dạng của các vùng không mang mã. Phần lớn các gen lục
lạp là loại gen đơn bản trong khi các gen trong nhân là thành viên của những
họ đa gen. Tính bảo tồn cao của DNA lục lạp thực sự là ưu thế khi sử dụng
nó để xây dựng lại mối quan hệ phát sinh và quá trình tiến hóa ở các mức độ
từ loài đến chi và đến họ thực vật. Có thể thấy những gen mã hóa và không
mã hóa ở lục lạp thường được sử dụng trong nghiên cứu quan hệ phát sinh
như sau:
Các trình tự bảo thủ ở bộ gen trong nhân
Bộ gen trong nhân có kích thước lớn nhất trong số ba bộ gen ở thực vật (1.1 × 106 đến 110 × 106 kbp) và bao gồm rất nhiều gen. Phần lớn các nỗ
lực nghiên cứu về quan hệ phát sinh bằng chỉ thị phân tử sử dụng các trình
19
tự DNA ribosome trong nhân. Cấu trúc căn bản của DNA ribosome là một
đơn vị lặp đơn, mỗi đơn vị như thế có thể lặp lại đến hàng ngàn lần trong bộ
gene. Bộ gen trong nhân chứa một vùng sao mã có cấu trúc bao gồm khoảng
trống bên ngoài vùng sao mã, tiếp theo là gen 18S mã hóa cho tiểu đơn vị
nhỏ và gen 26S mã hóa cho tiểu đơn vị lớn vốn phân cách nhau bởi một gen
nhỏ hơn là 5,8S. Các khoảng trống trong vùng phiên mã (ITS1 và ITS2) tách
rời những gen vừa đề cập. Chiều dài của ba vùng mang mã là giống nhau ở
các thực vật: gen 18S là khoảng 1800bp, 26S là khoảng 3300bp và gen 5,8S
là khoảng 160bp. Ngược lại, chiều dài của các khoảng trống giữa các gen
biến động từ 1 đến 8kb. Họ gen rDNA chứa các vùng bảo tồn cao như 18S,
26S có thể sử dụng để suy luận các quan hệ phát sinh ở các mức độ phân
loại cao. Các đoạn tiến hóa nhanh như các vùng ITS có thể là thích hợp nhất
trong so sánh các loài và những chi gần nhau, thậm chí là so ở mức độ các
quần thể.
Các trình tự 18S rDNA thường được sử dụng rộng rãi hơn các trình tự
26S. Cho dù cả hai vùng cùng được có dải ứng dụng rộng như nhau nhưng
kích thước trên 3000bp của 26S rDNA đã cản trở các nhà nghiên cứu, đặc
biệt là trong việc giải trình tự toàn bộ gen. Trái lại, kích thước của 18S
rDNA khoảng 1800bp giúp cho nó được ưu tiên lựa chọn hơn để khuếch đại
bằng PCR và giải trình tự. Thực tế cho thấy hình thể cây quan hệ phát sinh
sử dụng trình tự 18S rDNA khá đồng dạng với cây quan hệ phát sinh sử
dụng trình tự rbcL ở nhiều mức độ phân loại ở thực vật hạt kín. Cho dù rất
có tiềm năng trong việc xây dựng cây quan hệ phát sinh ở thực vật, vùng
18S rDNA vẫn chưa được tận dụng trong hệ thống học thực vật hạt kín.
Gen 26S rDNA thường được lưu ý là ứng viên cho việc thay thế gen
18S rDNA. Khi so sánh có thể nhận thấy toàn bộ gen 26S rDNA tiến hóa
nhanh gấp từ 1,6 đến 2,2 lần và cung cấp các đặc điểm mang tính thông tin
nhiều hơn 3 lần so với 18S rDNA.
Gene 5,8S rDNA dễ dàng được khuếch đại và giải trình tự khi sử dụng
các mồi định vị trên các gen 18S và 26S rDNA. Gen 5,8S rDNA hiếm khi được
20
sử dụng để suy luận quan hệ phát sinh bởi tính bảo thủ cao và kích thước bé
(164-165bp). Tỷ lệ các vị trí mang thông tin tiềm năng cho phân tích quan hệ
phát sinh ở thực vật có hạt cũng tương đương với gen 18S rDNA.
Vùng ITS: ITS1 phân cách gen 18S rDNA với gen 5,8S rDNA còn
ITS 2 phân cách gen 5,8S rDNA với gen 26S rDNA. Vùng ITS hiện hữu một
cách rộng rãi dưới 700bp ở các thực vật có hoa (Baldwin và cộng sự, 1995)[21].Vùng ITS chứa các trình tự bảo tồn cao nên rất nhiều mồi tổng thể
được thiết kế cho việc khuếch đại và giải trình tự đã được mô tả. Các trình tự
ITS1 và ITS2 vốn giàu GC làm cho việc giải trình tự trở nên khó khăn. Khó
khăn trong việc giải trình tự biến động theo các nhóm thực vật và việc cho
thêm Dimethyl sulfoxide (DMSO) vào PCR hay phản ứng giải trình tự là
việc bổ sung mang lại hiệu quả cao. Việc căn trình tự ITS từ nhiều họ thực
vật hạt kín chỉ ra rằng các trình tự ITS1 và ITS2 đa dạng hơn trình tự của các
gen rDNA. Các trình tự ITS biến động một cách hiệu quả cho phép giải
quyết những câu hỏi về quan hệ phát sinh ở những taxon có quan hệ họ hàng
gần. Theo đó, rất nhiều các bài báo thể hiện sự thành công trong việc xây
dựng lại lịch sử tiến hóa sử dụng các trình tự ITS (Bellarosa và cộng sự, 2005)[22]. Hơn nữa, vùng ITS được di truyền theo kiểu từ cả cha và mẹ khiến
cho nó cũng có thể được sử dụng để thăm dò sự lai chéo.
Hình 1.1: Sơ đồ vùng ITS của các gen rDNA vùng nhân và vị trí của các mồi ITS
21
1.3. CÁC NGHIÊN CỨU VỀ ĐA DẠNG DI TRUYỀN ÓC CHÓ
Zhang Z. Gao Y. Zhao Y. (2009) sử dụng AFLP xác định mối quan
mối quan hệ di truyền và tính đa dạng trong 8 loài Juglans và 1
loài Peterocarya stenoptera ở Trung Quốc. Tám mồi kết hợp tạo ra tổng
cộng 833 băng, trong đó có 819 (98,32%) đa hình trong số 31 mẫu. Phân
tích phân cụm cho thấy rằng tất cả 31 mẫu đã được phân loại thành 4 nhóm
tương ứng với 8 loài Juglans. Kết quả cho thấy mối quan hệ di truyền của
8 loài Juglans này dựa trên phân tích AFLP không phù hợp với phân loại
của chúng theo các phương pháp truyền thống.
Malvolti và cộng sự (1993) đã nghiên cứu sự khác biệt di truyền trong
quả óc chó Ý dựa trên phân tích isozyme và tìm thấy sự khác biệt không đáng kể đối với các thông số di truyền được nghiên cứu [19]. Năm 1998, Nicese và
cộng sự đã sử dụng chỉ thị RAPD để nghiên cứu sự đa dạng di truyền của 19
mẫu óc chó được sử dụng làm bố mẹ trong chương trình chọn tạo giống của
trường đại học California. Kết quả cho thấy 19 mẫu nghiên cứu phân làm 2
nhóm, sự phân nhóm này liên quan đến nguồn gốc phả hệ của các mẫu. Các kiểu gen có chung cha hoặc mẹ thường có xu hướng tạo thành nhóm với nhau [23].
Wang và cộng sự (2008) đã sử dụng chỉ thị microsatellite để nghiên
cứu đa dạng di truyền và cấu trúc của quần thể cây Óc chó Cùng Trung và Tây
Nam Trung Quốc. Kết quả cho thấy quần thể này khá đa dạng, tỷ lệ dị hợp dao
động từ 0,389 đến 0,687. Dựa vào cây phân loại, có thể thấy khoảng cách di tryền của quần thể có liên quan đến đến sự phân bố địa lý của chúng [24].
Miltiadis và cộng sự (2010) sử dụng chỉ thị ISSR để nghiên cứu
sự đa dạng di truyền giữa các giống óc chó đang được canh tác với các giống
bản địa tại Hy Lạp. Kết quả cho thấy các mẫu óc chó khảo sát có độ đa dạng
di truyền rất cao với hệ số tương đồng di truyền dao động từ 0,13 đến 0,93.
Kiểu gen của các giống óc chó bản địa đa dạng hơn nhiều so với các giống ngoại óc chó đang được canh tác [25].
22
Uzma Noor Shah và cộng sự (2017) đã sử dụng 19 mồi SSR để đánh
giá đa dạng di truyền các mẫu óc chó thu thập tại Jammu và Kashmir, Ấn
Độ. Kết quả phân tích cho thấy 96 mẫu óc chó được khảo sát có tỷ lệ đa
hình lên tới 89,6%, hệ số tương đồng di truyền dao động từ 0 đến 0,43, tỷ lệ dị hợp dao động từ 0,043 đến 0,067 [26].
Ciarmiello LF và cộng sự (2011) sử dụng cho 18 giống J. regia L.
được phân lập từ các nguồn gốc địa lý khác nhau. Kích thước của các trình
tự dao động từ 257 đến 263 căn cứ cho ITS1 và từ 217 đến 219 căn cứ cho
ITS2. Sự thay đổi của các GC là 55-56,7% đối với ITS1 và 57,1-58,9% đối
với ITS2. Dữ liệu này thể hiện sự hiện diện của đa hình trong các giống cây
trồng. Sự sắp xếp của các chuỗi ITS1-5.8S-ITS2 từ 18 giống óc chó cho thấy
có 244 đa hình đơn nucleotide (SNPs). Dự đoán cấu trúc thứ cấp ITS1 và
ITS2 RNA từ mỗi giống đã được cải thiện bằng cách phát hiện các yếu tố
chức năng chính được chia sẻ bởi tất cả các trình tự trong các sắp xếp. Phân
tích phát sinh loài của vùng ITS1-5.8S-ITS2 phân tách rõ ràng trình tự cô
lập thành hai cụm. Kết quả cho thấy vùng ITS1 và ITS2 có thể được sử dụng để phân biệt các giống cây Óc chó này [27].
Các nghiên cứu trên cho thấy rằng, marker phân tử ITS của DNA
ribosome là phù hợp nhất để điều tra các mối quan hệ phát sinh và sinh học
trong chi Juglans do RAPD và ISSR không phù hợp để xác định giống cây
trồng do thiếu khả năng tái lặp còn SSR là sự khác biệt về kích thước giữa
sản phẩm khuếch đại từ mỗi alen thường nhỏ, làm biến dạng đáng tin cậy
bằng gel agarose tiêu chuẩn điện di.
Đánh giá đa dạng di truyền là một trong vấn đề còn khá mới đối với
các loài cây lâm nghiệp ở Việt Nam. Hiện nay, trong công tác bảo tồn nguồn
gen và khai thác phát triển nguồn gen đang được quan tâm vấn đề đánh giá
di truyền nguồn gen các loài cây, các giống cây trồng làm cơ sở cho việc lưu
giữ, bảo tồn những nguồn gen có giá trị. Đến nay, chưa có công trình nào
nghiên cứu xác định đa dạng di truyền nguồn gen cây Óc chó ở Việt Nam.
Điều này là một trong những vấn đề còn tồn tại trong công tác bảo tồn và
phát triển nguồn gen cây Óc chó.
23
CHƯƠNG 2: VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. VẬT LIỆU
Vật liệu sử dụng trong nghiên cứu là 26 mẫu lá non cây Óc chó được
thu thập tại các tỉnh miền núi phía Bắc gồm 9 mẫu thuộc huyện Đồng Văn,
tỉnh Hà Giang; 5 mẫu thuộc huyện Sa Pa, tỉnh Lào Cai và 12 mẫu thuộc các
huyện Sỉn Hồ và huyện Phong Thổ tỉnh Lai Châu do Viện Nghiên cứu Lâm
sinh cung cấp.
Bảng 2. 1: Danh sách 26 mẫu Óc chó
STT Địa điểm thu thập mẫu Ký hiệu mẫu
HG1 Lũng Hoà B, Sà Phìn, Đồng Văn, Hà Giang 1
HG2 Sà Phìn A, Sà Phìn, Đồng Văn, Hà Giang 2
HG5 Sà Phìn A, Sà Phìn, Đồng Văn, Hà Giang 3
HG7 Há Hơ, Sà Phìn, Đồng Văn, Hà Giang 4
HG9 Lũng Thầu, Sà Phìn, Đồng Văn, Hà Giang 5
HG11 Lũng Thầu, Sà Phìn, Đồng Văn, Hà Giang 6
HG16 Lý Chá Tủng, Sà Phìn, Đồng Văn,Hà Giang 7
HG18 Thành Ma Tủng, Sà Phìn, Đồng Văn, Hà Giang 8
HG22 Séo Lủng B, Sảng Tủng, Đồng Văn, Hà Giang 9
10 LCa01 Tổ 3, xã Sa Pa, huyện Sa Pa, Lào Cai
24
11 LCa03 Tổ 3, xã Sa Pa, huyện Sa Pa, Lào Cai
12 LCa04 Tổ 3, xã Sa Pa, huyện Sa Pa, Lào Cai
13 LCa10 Tổ 13, TT Sa Pa, huyện Sa Pa, tỉnh Lào Cai
14 LCa12 Tổ 13, TT Sa Pa, huyện Sa Pa, tỉnh Lào Cai
LC3 Bành Phán, Tả Phìn, Sìn Hồ, Lai Châu 15
LC14 Xăng Tăng Ngai, Phan Xô Lin, Sìn Hồ, Lai Châu 16
LC18 Tủa Sín Chải, Sìn Hồ, Lai Châu 17
LC23 Sìn Hồ,Lai Châu 18
LC25 Làng Mô, Sìn Hồ, Lai Châu 19
LC37 Hợp 2, Dào San, Phong Thổ, Lai Châu 20
LC42 Cao Sín Chải, Dào San, Phong Thổ, Lai Châu 21
LC48 Lièng Chư, Dào San, Phong Thổ, Lai Châu 22
LC52 Hà Nhì,Tùng Qua Lìn, Phong Thổ, Lai Châu 23
LC55 Khấu Rào, Tùng Qua Lìn, Phong Thổ, Lai Châu 24
LC65 Pờ Xa, Pa Vây Sử, Phong Thổ, Lai Châu 25
LC68 Ngài Thầu, Pa Vây Sử, Phong Thổ, Lai Châu 26
25
2.2. HÓA CHẤT
Một số hóa chất thông dụng dùng trong sinh học phân tử của các hãng
Sigma, Merck,...CTAB, Tris base, Boric acid, NaCl, dNTPs, EDTA, 6X
orange loading dye solution, Taq Polymeraza, Ethanol, 2-propanol, Acetic
acid glacial, Phenol, Chloroform, isoamyalcohol, Agarose, kit Qiagen, các
mồi ITS.
Bảng 2. 2: Danh sách các mồi ITS (White và cộng sự, 1990)[28]
TT Trình tự Nucelotid
ITS1 ́5’ TCCGTAGGTGAACCTTGCGG 3’
Mồ 5’ GCACTACGATGAAGAACGCT 3’ ITS8 i
Kích thước đoạn DNA được khuếch đại bởi cặp mồi ITS 1-8 nằm
trong khoảng 750-800bp.
2.3. PHƯƠNG PHÁP NGHIÊN CỨU
2.3.1. Tách chiết DNA tổng số
Trong nghiên cứu này, chúng tôi đã lựa chọn phương pháp sử dụng CTAB của P. Doyle and Doyle (1987) [29] có một số cải tiến nhỏ để tiến
hành tách chiết DNA từ các mẫu nghiên cứu.
Quy trình:
- Chuẩn bị sẵn dung dịch đệm chiết CTAB ở 60C.
- Nghiền 0,3 gam mẫu lá bằng chày cối sứ vô trùng trong nitơ lỏng đến
khi thành dạng bột mịn (mẫu óc chó, chày, cối được giữ trước ở - 80C).
- Hoà tan mẫu đã nghiền nhỏ trong 800l CTAB buffer và 60l SDS
10%. Thành phần dung dịch đệm chiết: Tris-bazơ 100 mM, EDTA 20 mM, NaCl 1,4 M, CTAB 2% và PVP 1%.
- Ủ mẫu ở 65C trong bể ổn nhiệt, thời gian 30 phút.
- Làm nguội ở nhiệt độ phòng và bổ sung 200l potassium acetate 5M,
trộn đều và ủ trên đá 45 phút.
26
- Bổ sung thể tích tương đương chloroform—isoamylalcohol (24:1), lắc nhẹ cho tới khi thành dạng nhũ sữa. Ly tâm 11000 vòng/phút trong 30 phút ở
nhiệt độ 4C. Hút dung dịch phía trên chuyển sang ống mới.
- Tiếp tục chiết lần 2 bằng chloroform—isoamylalcohol (24:1), thu được
dịch chiết chứa DNA.
- Tủa DNA bằng isopropanol đã làm lạnh. Để ở -20C trong 1 giờ.
- Ly tâm thu tủa 11000 vòng/phút trong 15 phút ở 4C.
- Rửa tủa bằng ethanol 70%, ly tâm thu tủa - Làm khô và hòa tan DNA, loại ARN, hoà tan DNA trong đệm TE.
2.3.2. Thành phần của 1 phản ứng PCR
Mỗi phản ứng PCR bao gồm các thành phần:
Bảng 2. 3: Thành phần phản ứng PCR
Thành phần Thể tích (µl)1 STT Nước cất hai lần khử ion 9 1 1,5 Buffer Mg+ 25 Mm 2 dNTPs 10 Mm 0,3 3 Taq DNA polymerase 5 U/µl 0,2 4 Mồi ITS1 10 µM 1,5 5
6 Mồi ITS8 10 µM 1.5
DNA 50ng/µl 1 7 15,0 Tổng thể tích của một phản ứng
2.3.3. Chương trình chạy PCR
Phản ứng PCR được tiến hành trong ống eppendorf 0,2ml và thực hiện
trên máy Mastercycler epgradient S theo chu trình sau:
27
Bảng 2. 4: Chu trình phản ứng PCR
Chu kì Nhiệt độ (oC) Thời gian Các bước 1 94 5 phút 1
94 1 phút 2 35 58 45 giây 3
72 50 giây 4 1 72 7 phút 5 1 4 ∞ 6
Sau khi hoàn thành chương trình chạy PCR, sản phẩm PCR được bổ
sung 4µl loading dye rồi tiến hành điện di.
2.3.4. Phương pháp điện di trên agarose
- Cân 0,6g agarose cho vào 40 ml TAE 1X, đun đến sôi để agarose tan hoàn toàn. Để nguội 45-50C bổ sung 2,5l Ethidium Bromide, đổ vào khuôn
gel đã được chuẩn bị sẵn. Sau 30-60 phút, khi gel đã nguội và đông cứng thì chuyển khay chứa bản gel vào máy điện di và cho đệm chạy TAE 1X vào buồng điện di sao cho đệm ngập bản gel khoảng 0,5-1 cm.
- Tra mẫu: Sản phẩm PCR được trộn với 4 l loading dye và tra vào các
giếng trên gel. - Chạy điện di: Sau khi tra mẫu điện di xong, máy điện di được kết nối
với bộ nguồn. Đặt 130 V.
- Quan sát: gel được soi dưới đèn tử ngoại, DNA sẽ được phát sáng nhờ
liên kết với Ethidium Bromide.
2.3.5. Phương pháp thôi gel theo kit Qiagen
- Cắt lấy đoạn DNA mong muốn từ gel agarose, cho đoạn gel vừa cắt vào
ống eppendorf 2ml.
- Bổ sung buffer QG theo tỷ lệ 3 thể tích QG : 1 thể tích gel (100mg
~100μl).
28
- Ủ ở nhiệt độ 50°C trong khoảng 10 phút cho đến khi gel tan hoàn toàn. - Sau khi gel tan hoàn toàn, kiểm tra màu của dung dịch phải là màu vàng, nếu màu của dung dịch là màu cam hoặc màu tím xanh thì phải bổ sung 10μl sodium acetate 3M, pH 5.
- Cho dung dịch mẫu đã hoà tan ở trên vào cột QIAquick và ly tâm tốc
độ 13 000 rpm trong 1 phút.
- Bổ sung 500 μl buffer QG vào cột QIAquick và ly tâm tốc độ 13 000
rpm trong 1 phút để loại hết agarose dư thừa.
- Bổ sung 750 μl buffer PE vào cột QIAquick, để cột thẳng đứng 5 phút
sau đó ly tâm tốc độ 13 000 rpm trong 1 phút.
- Chuyển cột QIAquick sang ống microcentrifuge 1.5ml sạch. - Để hoà tan DNA, bổ sung 30 μl nước (pH 7 – 8.5) vào giữa màng của cột QIAquick và ly tâm tốc độ 13 000 rpm trong 1 phút, thu lượng DNA tinh sạch.
2.3.6. Giải trình tự
Sản phẩm PCR ITS sau khi được tinh sạch, được giải trình tự tại công
ty Macrogen (HànQuốc) bằng máy Applied Biosystems 3500.. Kết quả giải
trình tự được được so sánh với các trình tự tương đồng trên NCBI bằng công
cụ căn trình tự ClustalW của phần mềm Mega 6.0 và CLC 8.0. Sau đó, các
trình tự được tập hợp lại và phân tích bằng chương trình MEGA v6.0 để tạo
cây phát sinh loài.
29
CHƯƠNG 3: KẾT QUẢ VÀ THẢO LUẬN
3.1. KẾT QUẢ TÁCH CHIẾT DNA
Tách chiết axit nucleic là công việc đầu tiên đóng vai trò quan trọng
trong công nghệ DNA. Nhờ tiến bộ và sự đổi mới công nghệ mà tách chiết
axit nucleic ngày nay đã trở nên đơn giản. Hiện nay có rất nhiều phương pháp tách
chiết DNA tổng số của thực vật. Tuy nhiên đối với từng đối tượng nhất định cần
có phương pháp riêng. Do vậy, việc lựa chọn và cải tiến phương pháp cho phù
hợp với từng đối tượng là điều rất cần thiết và quan trọng.
Trong nghiên cứu này, chúng tôi đã lựa chọn phương pháp sử dụng CTAB của P.Doyle and Doyle (1987)[29] có một số cải tiến nhỏ để tiến
hành tách chiết DNA tổng số của 26 mẫu Óc chó nghiên cứu. Kết quả tách
chiết DNA tổng số của 26 mẫu Óc chó được kiểm tra bằng phương pháp
điện di trên gel agarose 1%.
Hình 3. 1: Ảnh điện di DNA tổng số của 26 mẫu Óc chó
Kết quả điện di trên gel agarose 1% ở Hình 3.1 thể hiện sản phẩm
DNA tổng số rõ nét, rõ băng cho thấy chất lượng DNA của các mẫu tốt. Kết
quả điện di cũng cho thấy DNA có nồng độ tương đối cao, đảm bảo mức độ
nguyên vẹn và tinh sạch, đáp ứng được các yêu cầu dành cho việc phân tích
đa hình di truyền trong các thí nghiệm tiếp theo.
30
3.2. KẾT QỦA PCR VÀ TINH SẠCH CÁC SẢN PHẨM KHUẾCH ĐẠI
Sau khi thực hiện PCR, sản phẩm khuếch đại với cặp mồi ITS1/ITS8
và được điện di trên gel agarose 1,5% cho băng đơn hình với kích thước
khoảng 750-800bp. Kết quả của đối chứng âm là nước không xuất hiện băng
vạch chứng tỏ DNA đã được khuyếch đại và không bị nhiễm tạp chất. Kết
quả được trình bày ở Hình 3.2.
Hình 3. 2: Phổ điện di sản phẩm PCR với cặp mồi ITS1/ITS8 trên 26 mẫu Óc chó (M1KB: Marker ladder 1Kb; H2O: Đ/c âm)
Kết quả khuếch đại sản phẩm PCR của từng mẫu được tiến hành thôi
gel, sử dụng cột Sigma GenElute TM Agarose Spin column (USA), nhằm
thu được sản phẩm PCR đặc hiệu.
3.3. KẾT QUẢ KHẢO SÁT VÙNG TRÌNH TỰ ITS1-5,8SrRNA-ITS2 Ở CÁC MẪU NGHIÊN CỨU
Bên cạnh việc phân loại theo phương pháp truyền thống dựa vào việc so sánh hình thái giải phẫu của cơ quan sinh sản và dinh dưỡng, trong việc
định loại các taxon sinh vật hiện đại, đặc biệt là các taxon có sự biến động
hình thái lớn như các loại thực vật, trong đó có các loài thuộc chi Juglans,
các dữ liệu về đặc tính phân loại và quan hệ phát sinh dựa trên các vùng bảo
thủ cao (phylogenetical characteristics) đóng một vai trò quan trọng. Các dữ
liệu này dựa trên đặc điểm trình tự các nucleotide của các vùng trình tự bảo
31
thủ cao trong bộ gen nói chung và các DNA barcode nói riêng nhiều khi
chính là cơ sở để nhận dạng và định loại một số taxon của Óc chó.
Việc xác định trình tự và sử dụng trình tự nucleotide đoạn ITS1-
5,8SrRNA-ITS2 để so sánh nhằm tìm ra mối quan hệ phát sinh giữa các loài
hoặc sự đa dạng di truyền trong một chi, thậm chí các bậc phân loại dưới
loài trong một loài đã được sử dụng phổ biến từ lâu trên thế giới.
Sản phẩm PCR với cặp mồi ITS1/ITS8 (Bảng 2.2), sau khi tinh sạch
được phân tích trực tiếp trên máy giải trình tự ABI PRISM 3100 DNA
Analyzer (Applied Biotech) và phần mềm MEGA v6.0, kết quả cho ra giản
đồ có các đỉnh (peak) với 4 màu sắc khác nhau tương ứng với 4 loại
nucleotide và biểu thị dãy trình tự các nucleotide (Hình 3.3). Kết quả thu
được 26 đoạn trình tự ITS của 26 mẫu Óc chó với số nucleotide khác nhau
trên từng mẫu.
32
Hình 3. 3: Một đoạn giản đồ có các đỉnh với 4 màu sắc khác nhau tương
ứng với 4 loại nucleotide của mẫu Óc chó HG02, HG05 và HG18
Thông qua quá trình khuếch đại và giải trình tự đối với các mẫu khảo
sát theo phương pháp được nêu trong phần vật liệu và phương pháp nghiên
cứu, xác định vùng ITS1-5,8SrRNA-ITS2 trên sản phẩm khuếch đại thông
33
qua việc căn trình tự và đối chiếu với các trình tự ITS1-5,8S rRNA và ITS2
của các taxon cùng chi trên Genbank, thu được các trình tự có độ dài được
thể hiện trong Bảng 3.1.
Bảng 3. 1: Độ dài các trình tự thuộc 26 mẫu Óc chó nghiên cứu và mẫu
tham chiếu AF399876.1
STT Kí hiệu Tổng số nucleotide STT Kí hiệu Tổng số nucleotide
729 14 LCa12 729 HG1 1
729 15 LC3 729 HG2 2
729 16 731 3 LC14 HG5
729 17 LC18 729 HG7 4
729 18 729 5 LC23 HG9
729 19 LC25 729 HG11 6
729 20 LC37 729 HG16 7
729 21 729 8 LC42 HG18
729 22 LC48 729 HG22 9
729 23 727 10 LC52 LCa01
729 24 LC55 726 LCa03 11
729 25 725 12 LC65 LCa04
733 26 LC68 729 LCa10 13
AF399876.1* 729 27
Trung bình 728,9
*: Trình tự tương ứng của mẫu Óc chó được lấy từ Genbank với mã truy cập là AF399876.1.( https://www.ncbi.nlm.nih.gov/nuccore/AF399876.1 )
34
Kết quả thu được từ Bảng 3.1. cho thấy độ dài vùng ITS1-5,8SrRNA-
ITS2 có sự khác biệt nhau giữa các mẫu đại diện cho các taxon khảo sát, dao
động từ 725 – 733 nucleotide.
Khảo sát thành phần nucletotide thuộc các trình tự ITS1-5,8SrRNA-
Commented [TDT1]: Điều này chưa chính xác. Vì giải trình tự từ sản phẩm P CR nên sẽ mất khoảng 30-40 nu từ hai đầu do chất lượng base calling kém ở vùng gắn mồi. Ở đây cần align và phân tích phần trình tự chung nhất của 26 mẫu phân tích và ref. thì mới có ý nghĩa
ITS2 của các mẫu nghiên cứu, thu được kết quả trình bày trong Bảng 3.2.
Bảng 3. 2: Thành phần bốn loại nucleotide của 26 mẫu nghiên cứu và
mẫu tham chiếu AF399876.1
STT Mẫu %T (U) %C %A %G %GC %AT
1 AF399876.1 21,3 27,9 22,7 28,1 56,0 44,0
2 HG1 21,7 27,8 22,4 28,1 56,0 44,0
3 HG02 22,2 27,4 22,2 28,1 55,6 44,4
4 HG05 21,9 27,8 22,1 28,1 56,0 44,0
5 HG7 21,8 27,8 22,4 28,0 55,8 44,2
6 HG9 21,7 27,8 22,5 28,0 55,8 44,2
7 HG11 21,9 28,0 21,8 28,3 56,2 43,8
8 HG16 21,8 27,8 22,4 28,0 55,8 44,2
9 HG18 21,8 28,0 22,4 27,8 55,8 44,2
10 HG22 21,8 27,6 22,4 28,3 55,8 44,2
11 LCa01 21,8 27,8 224 28,0 55,8 44,2
12 LCa03 21,8 27,8 22,4 28,0 55,8 44,2
35
13 LCa04 21,8 27,8 22,4 28,0 55,8 44,2
14 LCa10 22,0 28,1 22,4 27,6 55,7 44,3
15 LCa12 21,8 27,8 22,4 28,0 55,8 44,2
16 LC3 21,7 27,8 22,6 27,8 55,7 44,3
17 LC14 21,8 28,0 22,3 27,9 56,0 44,0
18 LC18 21,8 27,7 22,6 27,8 55,6 44,4
19 LC23 21,9 27,7 22,4 28,0 55,7 44,3
20 LC25 21,8 27,8 22,4 28,0 55,8 44.,2
21 LC37 21,8 27,8 22,4 28,0 55,8 44,2
22 LC42 21,8 27,8 22,5 27,8 55,7 44,3
23 LC48 21,9 28,0 22,2 27,8 55,8 44,2
24 LC52 21,7 27,9 22,6 27,8 55,7 44,3
25 LC55 22,2 28,2 21,8 27,8 56,1 43,9
26 LC65 21,8 28,1 22,5 27,6 55,7 44,3
27 LC68 21,9 27,8 22,6 27,8 55,6 44,4
Trung bình 21,8 27,9 22,4 27,9 55,8 44,2
*Chú thích: T: Thymine, C: Cytosine, A: Adenine. G: Guanin
Kết quả ở Bảng 3.2 cho thấy, thành phần Guanin, Cytosine, Adenine và Thymine của các mẫu nghiên cứu khác nhau trong đó tỉ lệ thành phần
36
Thymine là thấp nhất và Guanin cao nhất. Đây cũng là đặc điểm cho thấy sự
khác nhau giữa các mẫu khảo sát dựa trên vùng ITS1-5,8SrRNA-ITS2. Nhìn
chung, các mẫu nghiên cứu có tỷ lệ Guanin và Cytosine cao hơn tỷ lệ
Commented [TDT2]: Statement này chưa vững chắc. Chiều dài trình tự của từng mẫu khác nhau (do kết qủa giải trình tự) nên sự khác nhau là ĐƯƠNG NHIÊN. Nếu chỉ phân tích cho vùng trình tự chung, kết quả mới chính xác
Adenine và Thymine hay nói một cách khác là đều có thành phần %GC cao
hơn thành phần %AT và sự chênh lệch này có ở cây hai lá mầm. Mẫu HG11
có thành phần GC cao nhất (56,2 %) và có thành phần AT 43,8%) thấp nhất.
Tỷ lệ thành phần %GC trung bình ở cả 26 mẫu nghiên cứu là 55,8% và tỷ lệ
thành phần %AT trung bình 44,2% (Bảng 3.2).
3.4. KẾT QỦA SO SÁNH TRÌNH TỰ NUCLEOTIDE VÙNG ITS 1 5,8SrRNA - ITS2 CỦA CÁC MẪU NGHIÊN CỨU
Sản phẩm PCR sau khi được tinh sạch, được giải trình tự tại công ty
Macrogen (Hàn Quốc). Kết quả giải trình tự được vùng ITS1-5,8S-ITS2 của
các mẫu nghiên cứu được tiến hành so sánh với nhau bằng công cụ căn trình
tự ClustalW của phần mềm Mega 6.0 và CLC 8.0, kết quả được thể hiện
trong Hình 3.4.
37
38
39
40
41
42
Hình 3. 4: Kết quả gióng hàng, gióng cột 26 trình tự ITS1-5,8SrRNA-
ITS2 của 26 mẫu Óc chó và mẫu tham chiếu AF399876.1
Kết quả Hình 3.4, có thể nhận thấy sự khác biệt giữa các trình tự chủ
yếu là các vị trị đa hình đơn (SNP) ở 26 mẫu nghiên cứu. Trong đó, 1
nucleotide bị thay thế bởi một nucleotide khác, bên cạnh đó cũng có một số
đột biến InDel giữa các trình tự. Điều này có thể là do hệ quả sự biến động
theo hướng mất hoặc tăng thêm (deletion và insertion) một hay một số
nucleotide trong trình tự vùng ITS1-5,8SrRNA-ITS2 của các mẫu Óc chó
khảo sát.
Trình tự nucleotide của mẫu HG02, đây là mẫu nghiên cứu có nhiều
điểm sai khác nhất trong dãy trình tự do đó mẫu này có sự khác biệt lớn nhất
so với mẫu tham chiếu. Các mẫu như: LC52 mất 2 nucleotide tại vị trí 412-
413; LC55 mất đi 3 nucleotide ở vị trí số 656-658; LC65 mất 4 nucleotide
tại vị trí 20 và 301-303 và Lca10 thêm 4 nucleotide ở vị trí 576-579. Một số
43
mẫu có sự sai khác rất ít trong dãy trình tự như HG18, LC23, LC42, LC68
chỉ có 1 điểm sai khác duy nhất.
Hai mươi sáu mẫu Óc chó được nghiên cứu có sự khác biệt rất nhiều
về trình tự vùng ITS1-5,8SrRNA-ITS2, sự biến động trình tự giữa các mẫu
thể hiện rõ nhất ở khoảng 70 nucleotide đầu và 200 nucleotide cuối, đây
chính là các vùng trống không mang mã hai phía của gen 5,8S rRNA. Nói
cách khác, ở các mẫu Óc chó trong nghiên cứu này thì sự biến động trình tự
xảy ra mạnh mẽ ở vùng ITS1 và ITS2 nhưng ít hơn ở vùng gen 5,8S rRNA.
Sự biến động ít hay nhiều trong dãy trình tự của 26 mẫu Óc chó nghiên cứu
đã thể hiện mối quan hệ về mặt di truyền, đồng thời sự khác nhau trong dãy
trình tự của các mẫu cũng thể hiện được tính đa dạng của các mẫu nghiên
cứu nhằm mục đích phân loại, chọn lọc được nguồn gen tốt.
3.5. KẾT QUẢ XÂY DỰNG CÂY QUAN HỆ PHÁT SINH GIỮA 26 MẪU NGHIÊN CỨU
Sự khác biệt về trình tự vùng ITS1-rRNA-ITS2 giữa các mẫu nghiên
toán bằng công cụ đo khoảng cách di truyền của phần mềm CLC v8.02 và thống kê chỉ ra ở Bảng 3.3.
cứu được thể hiện thông qua hệ số tương đồng của từng cặp mẫu, được tính
44
Bảng 3. 3: Hệ số tương đồng di truyền giữa 26 mẫu nghiên cứu và mẫu
tham chiếu AF399876.1 vào trình tự vùng ITS1-5,8SrRNA-ITS2
*Ghi chú: Thứ tự mẫu từ 1 đến 27 theo hàng ngang giống thứ tự mẫu theo hàng dọc
Kết quả phân tích dựa vào đoạn trình tự ITS1-5,8S-ITS2 cho thấy, các
mẫu Óc chó của Việt Nam khá đa dạng di truyền với hệ số tương đồng di
truyền dao động từ 92,73% ( ở mẫu HG11) đến 100,00%, khác biệt di truyền
Commented [TDT3]: “ ”Khác biệt” chứ không phải khoảng cách nhé. Khoảng cách “ distant” là phương pháp phân tích khác
gần nhất là 0,00 và xa nhất là 0,07. Nhiều mẫu óc chó có chung nguồn gốc
do đó hệ số tương đồng di truyền của chúng là 100%. Với kết quả trên so với
kết quả hệ số tương đồng (0,13-0,93) của Miltiadis và cộng sự (2010) sử
dụng chỉ thị ISSR để nghiên cứu sự đa dạng di truyền giữa các giống óc chó
đang được canh tác với các giống bản địa tại Hy Lạp thì thấp hơn (0,73).
Còn so hệ số tương đồng (0,00-0,43) của Uzma Noor Shah và cộng sự
45
(2016) đã sử dụng 19 mồi SSR để đánh giá đa dạng di truyền 96 mẫu óc chó
thu thập tại Jammu và Kashmir, Ấn Độ thì cũng nhỏ hơn (0,36). Kết quả này
rất hữu ích trong nghiên cứu về nguồn gốc, tiến hóa, quan hệ phát sinh
chủng loại cây Óc chó của Việt Nam. Từ đó xác định chính xác những
Commented [TDT4]: Cái này cần cẩn trọng. ITS là marker đặc hiệu gen trong khi các chỉ tị ISSR và SSR là chị thị phân bố trên hệ gen. Kết quả của ISSR và SSR có ý nghĩa hơn khi phân tích dưới loài vì đánh giá trên nhiều locus chứa SSR trên toàn hệ gen, trong khi ITS là marker phân loại mạnh ở cấp độ loài
nguồn gen có năng suất, chất lượng cao phục vụ công tác nhân giống, phát
triển và bảo tồn các nguồn gen Óc chó quý tại Việt Nam.
Nếu chỉ xét riêng theo từng địa phương, Hà Giang là nơi độ đa dạng di
truyền lớn hơn 2 địa phương còn lại. Các mẫu Óc chó thu thập tại Hà Giang
có hệ số tương đồng dao động trong khoảng 93,55% -100%. Hệ số tương
đồng di truyền của các mẫu Óc chó thu thập tại Lai Châu dao động trong
khoảng 96,30%-100%. Hệ số tương đồng của các mẫu Óc chó thu thập tại
Lào Cai dao động trong khoảng 98,23%-100%.
Sau khi xác định được trình tự nucleotide vùng ITS1-5,8SrRNA-ITS2,
tiến hành dựng cây quan hệ phát sinh bằng phần mềm Mega 6.0 theo phương
pháp Maximum likelihood, kết quả thể hiện ở Hình 3.5.
46
Hình 3. 5: Sơ đồ hình cây về mối quan hệ di truyền giữa 26 mẫu nghiên
cứu và mẫu tham chiếu AF399876.1
Qua Hình 3.5 cho thấy, dựa vào trình tự vùng ITS1-5,8SrRDN-ITS2,
26 mẫu Óc chó được khảo sát chia thành 3 nhóm chính dựa trên sự khác biệt
di truyền của chúng:
Nhóm I: gồm có 2 taxon nghiên cứu là HG11 và HG02, hai mẫu này đều
được thu tại xã Sà Phìn-huyện Đồng Văn- Hà Giang. Mẫu nghiên cứu
HG11 có hệ số tương đồng di truyền với các mẫu còn lại dao động từ
92,73% (so với LC65) đến 95,20% (so với HG1), khoảng cách di truyền xa
Commented [TDT5]: Lưu ý phylotree đang thể hiện khoảng cách di truyền “ ”distant”” chứ không phải mức độ tương đồng di truyền
nhất là 0,07 và gần nhất là 0,03; và HG02 có hệ số tương đồng di truyền
47
với các mẫu còn lại từ 93,00% ( so với LC65) đến 95,75% (HG1), khoảng
cách di truyền xa nhất là 0,07 và gần nhất 0,03.
Nhóm II: có một taxon nghiên cứu là HG1 (Lũng Hoà B, Hà Giang) có hệ
số tương đồng di truyền với các mẫu còn lại dao động từ 95,20% (HG11)
đến 97,94% ( HG18) và khoảng cách di truyền xa nhất là 0,05; gần nhất là
0,02.
Nhóm III: gồm 23 taxon nghiên cứu còn lại và mẫu tham chiếu. Nhóm này
được chia thành 3 tiểu nhóm:
Commented [TDT6]: Nên reroot cây phân loại sử dụng mẫu tham chiếu làm outgroup, như vậy mới thấy rõ quan hệ di truyền giữa các mẫu VN và với mẫu đối chứng
Nhóm 1: có một taxon nghiên cứu là HG05 (Sa Phìn A, Hà Giang) có hệ số
tương đồng di truyền với các mẫu còn lại dao động từ 94,79% (so với HG11)
đến 98,90% và khoảng cách di truyền xa nhất là 0,05 và gần nhất là 0,01.
Nhóm 2: chỉ có 01 taxon nghiên cứu là Lca10 có nguồn gốc ở Sa Pa, Lào Cai,
có hệ số tương đồng di truyền với các mẫu còn lại dao động từ 93,59% (so với
HG11) đến 98,23% và khoảng cách di truyền xa nhất là 0,06 và gần nhất là 0,01.
Nhóm 3: gồm 21 taxon nghiên cứu còn lại và mẫu tham chiếu. Nhóm này
được chia thành 8 nhóm phụ:
- Nhóm phụ 3.1: gồm 4 taxon nghiên cứu là HG22 (Séo Lủng B, Hà Giang
), LC55 (Khấu Rào, Lai Châu), LC3 (Bành Phán, Lai Châu) và LC48
(Lìeng Chư, Lai Châu). Hệ số tương đồng di truyền với các mẫu còn lại
dao động từ 93,55% (so với HG11) đến 99,04%. Khoảng cách di truyền xa
nhất là 0,07 (HG11) và khoảng cách di truyền thấp nhất là 0,01 chủ yếu
với các mẫu nằm trong nhóm phụ 3.8.
Nhóm phụ 3.2 : gồm 3 taxon nghiên cứu là HG9 (bản Sà Phìn A- Hà Giang),
LC18( xã Tủa Sín Chải – Lai Châu) và LC65 (xã Pa Vây Sử- Lai Châu).
Hệ số tương đồng di truyền với các mẫu còn lại dao động từ 92,73%
(HG11) đến 99,73%. Khoảng cách di truyền xa nhất là 0,07 (HG11) và
khoảng cách di truyền thấp nhất là 0,00.
- Nhóm phụ 3.3: chỉ có 1 mẫu LC42, mẫu này được thu tại bản Cao Sín
48
Chải- tỉnh Lai Châu. Hệ số tương đồng di truyền với các mẫu còn lại dao
động từ 94,24% (HG11) đến 99,86%. Khoảng cách di truyền xa nhất là
0,06 (HG11) và khoảng cách di truyền thấp nhất là 0,00.
- Nhóm phụ 3.4 có 1 mẫu là HG18 , mẫu này được thu tại bản Thành Ma
Tủng – tỉnh Hà Giang. Hệ số tương đồng di truyền với các mẫu còn lại dao
động từ 94,23% (HG11) đến 99,86%. HG18 có hệ số tương đồng di truyền
với nhóm phụ 3.8 cao nhất 99,86% nên mẫu này mối quan hệ khá gần với
các mẫu trong nhóm phụ 3.8. Khoảng cách di truyền xa nhất là 0,06
(HG11) và khoảng cách di truyền thấp nhất là 0,00.
- Nhóm phụ 3.5 chỉ duy nhất mẫu LC52, mẫu này được thu tại bản Hà Nhì –
Lai Châu. Hệ số tương đồng di truyền với các mẫu còn lại dao động từ
93,14% (HG11) đến 98,77%. Khoảng cách di truyền xa nhất là 0,07 và gần
nhất là 0,01.
- Nhóm phụ 3.6 bao gồm 2 mẫu LC23 (huyện Sìn Hồ- Lai Châu) và LC68
(bản Ngải Thầu-Lai Châu) . Hệ số tương đồng di truyền với các mẫu còn
lại dao động từ 94,24% (HG11) đến 99,86%. Khoảng cách di truyền xa
nhất là 0,06 và gần nhất là 0,00. Mẫu LC23 và LC68 giống nhau 99,86%
và có hệ số di truyền với mẫu tham chiếu AF399876.1 là 99,73% với
khoảng cách di truyền là 0,00. Chứng tỏ LC23 và LC68 có quan hệ chị em
và rất gần gũi với mẫu tham chiếu.
- Nhóm phụ 3.7: là mẫu tham chiếu AF399876.1, có hệ số tương đồng di
truyền với các mẫu còn lại dao động từ 94,24 (HG11) đến 99,86%.
Khoảng cách di truyền xa nhất là 0,06 (HG02 và HG11) và khoảng cách di
truyền thấp nhất là 0,00.
- Nhóm phụ 3.8: bao gồm 9 mẫu LC25, LC14, LC37, Lca12, Lca04, Lca03,
Lca01, HG7 và HG16. Các mẫu này có hệ số tương đồng di truyền với các
mẫu còn lại dao động từ 94,38% (HG11) đến 99,86% (HG18). Các mẫu
LC25, LC37, Lca01, Lca03, Lca04, Lca12, HG7, HG16 giống nhau 100%
(có thể là cùng một loài) và có hệ số di truyền với mẫu LC14 đều trên 99%
49
với khoảng cách di truyền là 0,00. Chứng tỏ các mẫu này có quan hệ rất
gần gũi với nhau và có thể có cùng một nguồn gốc. Nhóm mẫu này cũng
có hệ số tương đồng di truyền khá cao so với mẫu tham chiếu trên 99,86%
với khoảng cách di truyền là 0,00 nên chúng cũng có quan hệ gần gũi với
mẫu tham chiếu.
3.6. KẾT QUẢ XÁC ĐỊNH MARKER PHÂN TỬ PHÂN BIỆT 26 MẪU ÓC CHÓ NGHIÊN CỨU
Chỉ thị (marker) là một dấu hiệu, một đặc trưng có thể nhận biết được
giúp chúng ta phân biệt thứ này với thứ khác, ví dụ như hình thái, màu sắc
hoa; hình dạng, màu sắc thân, lá,…. Tương tự, chỉ thị phân tử (molecular
marker) hay chỉ thị di truyền (genetic marker) cũng là các dấu hiệu, hoặc các
đặc trưng có tính phân biệt giữa các cá thể. Điểm khác biệt của những chỉ thị
này không dựa trên hình thái bên ngoài mà là dựa trên sự khác biệt về trình
tự gen của mỗi sinh vật.
Dựa vào kết quả so sánh trình tự các nucleotide ở Hình 3.4, cho thấy
dựa vào trình tự ITS1-5,8SrRNA-ITS2 với marker ITS1/ITS8 có thể phân biệt
và nhận dạng chính xác các mẫu Óc chó trong tập đoàn nghiên cứu.
Trình tự nucleotide của hai mẫu HG02 và HG11 có sự khác biệt với các
mẫu khác chủ yếu là các vị trí đa hình đơn (SNP), trong đó có 1 nucleotide bị
thay thế bởi một nucleotide khác tập trung ở 300 nucleotide cuối.
Commented [TDT7]: Nếu có số liệu đầy đủ, nên bỏ sung hình minh họa chromatograms vùng có SNP hay InDel
+ Vị trí nucleotide số 588, 593, 596: thay thế G bằng A
+ Vị trí nucleotide số 602, 604: thay thế A bằng G
+ Vị trí nucleotide số 622: thay thế A thành T
+ Vị trí nucleotide số 627: thay thế T thành A
+ Vị trí nucleotide số 630: thay thế T thành G
+ Vị trí nucleotide số 640: thay thế G thành A
+ Vị trí nucleotide số 642: thay thế C thành G
+ Vị trí nucleotide số 648-650: thay thế ACC bằng TTA
50
+ Vị trí nucleotide số 661: thay thế G bằng C
+ Vị trí nucleotide số 666: thay thế T bằng A
+ Vị trí nucleotide số 669: thay thế T bằng G
+ Vị trí nucleotide số 673: thay thế A thành T
+ Vị trí nucleotide số 678-682: thay thế CACAG bằng TGTTC(HG2) và
TGCTC(HG11)
+ Vị trí nucleotide số 687: thay thế T bằng G
+ Vị trí nucleotide số 696 : thay thế C bằng G
+ Vị trí nucleotide số 696-697: thay thế GC bằng CT
+ Vị trí nucleotide số 708: thay thế A thành C
+ Vị trí nucleotide số 715-716: thay thế CT thành GA
+ Vị trí nucleotide số 720: thay thế G thành T
+ Vị trí nucleotide số 722: thay thế A thành C
+ Vị trí nucleotide số 728: thay thế A thành G
Trình tự của hai mẫu này cũng sai khác với nhau tại một số điểm như:
+ Vị trí nucleotide số 597: thay thế T bằng G (HG11)
+ Vị trí nucleotide số 609: thay thế A thành T( HG11)
+ Vị trí nucleotide số 629: thay thế T thành C (HG02)
+ Vị trí nucleotide số 647: thay thế C thành A (HG02)
+ Vị trí nucleotide số 654: thay thế A thành C (HG11)
+ Vị trí nucleotide số 664: thay thế G thành A (HG111)
+ Vị trí nucleotide số 677: thay thế T thành A (HG02)
+ Vị trí nucleotide số 677: thay thế T thành A (HG02)
+ Vị trí nucleotide số 693: thay thế T thành C (HG11)
+ Vị trí nucleotide số 698: thay thế A thành G (HG11)
+ Vị trí nucleotide số 704: thay thế C thành G (HG02)
+ Vị trí nucleotide số 707: thay thế C thành T (HG11)
+ Vị trí nucleotide số 717: thay thế T thành C (HG11)
+ Vị trí nucleotide số 719: thay thế C thành T (HG11)
51
+ Vị trí nucleotide số 721: thay thế C thành T(HG02)
+ Vị trí nucleotide số 726: thay thế T thành A (HG11)
Trình tự nucleotide của mẫu HG1 có sự khác biệt với các mẫu còn lại chủ yếu
là các vị trí đa hình đơn (SNP) sau:
+ Vị trí nucleotide số 588, 596: thay thế G bằng A
+ Vị trí nucleotide số 598: thay thế G bằng C
+ Vị trí nucleotide số 602: thay thế A bằng G
+ Vị trí nucleotide số 616: thay thế C bằng G
+ Vị trí nucleotide số 622 thay thế A bằng T
+ Vị trí nucleotide số 627: thay thế T bằng A
+ Vị trí nucleotide số 661: thay thế G bằng C
+ Vị trí nucleotide số 666: thay thế T bằng A
+ Vị trí nucleotide số 669: thay thế T bằng G
+ Vị trí nucleotide số 679: thay thế A bằng G
+ Vị trí nucleotide số 687: thay thế T bằng G
+ Vị trí nucleotide số 721: thay thế C bằng T
+ Vị trí nucleotide số 723: thay thế G bằng C
+ Vị trí nucleotide số 728: thay thế A bằng G
Trình tự mẫu HG05 có các điểm sai khác
+ Sự sai khác trình tự nucleotide của HG05 tại các vị trí mẫu với HG02
là: 715, 716, 720-722, 728.
+ Vị trí nucleotide số 622: thay thế A bằng G
Trình tự mẫu Lca10 thêm 4 nucleotid CCAC ở vị trí 576-579, có các điểm sai
khác:
52
+ Vị trí nucleotide số 588: thay thế G bằng A
+ Vị trí nucleotide số 590: thay thế G bằng C
+ Vị trí nucleotide số 599: thay thế G bằng T
+ Vị trí nucleotide số 610, 622: thay thế A bằng G
+ Vị trí nucleotide số 648: thay thế A bằng C
+ Vị trí nucleotide số 658: thay thế C bằng A
+ Vị trí nucleotide số 664: thay thế G bằng A
- Trình tự nucleotide mẫu nghiên cứu HG22 có các điểm sai khác khác với
mẫu còn lại tại các vị trí:
+ Vị trí nucleotide số 2-5 thay CCGC bằng GGCG
+ Vị trí nucleotide số 67 thay C bằng T
+ Vị trí nucleotide số 726-728 thay TCA bằng CAC
- Trình tự mẫu LC55 mất đi 3 nucleotide ở vị trí số 656-658 và có các điểm
sai khác:
+ Vị trí nucleotide số 177: thay thế C bằng T
+ Vị trí nucleotide số 224: thay thế C bằng A
+ Vị trí nucleotide số 648: thay thế A bằng C
+ Vị trí nucleotide số 660-661: thay thế AG bằng CC
+ Vị trí nucleotide số 678-679 thay thế CA bằng TC
+ Vị trí nucleotide số 686: thay thế G bằng T
+ Vị trí nucleotide số 705: thay thế G bằng C
+ Vị trí nucleotide số 708: thay thế A bằng C
+ Vị trí nucleotide số 726: thay thế T bằng C
+ Vị trí nucleotide số 728: thay thế A bằng C
+ Vị trí nucleotide số 730: thay thế C bằng G
- Trình tự mẫu LC3 có các điểm sai khác:
53
+ Vị trí nucleotide số 28: thay thế C bằng A
+ Vị trí nucleotide số 30: thay thế G bằng T
+ Vị trí nucleotide số 32: thay thế T bằng A
+ Vị trí nucleotide số 34: thay thế A bằng T
+ Vị trí nucleotide số 725-726: thay thế TT bằng CA
+ Vị trí nucleotide số 728: thay thế A bằng C
+ Vị trí nucleotide số 730-731: thay thế CT bằng TA
- Trình tự nucleotide mẫu nghiên cứu LC48 có các vị trí sai khác khác với
các mẫu còn lại:
+ Vị trí nucleotide số 357: thay thế C bằng T
+ Vị trí nucleotide số 720: thay thế G bằng A
+ Vị trí nucleotide số 722: thay thế A bằng C
+ Vị trí nucleotide số 725-726: thay thế TT bằng CC
+ Vị trí nucleotide số 730: thay thế C bằng T
+ Vị trí nucleotide số 732: thay thế A bằng T
- Trình tự nucleotide của mẫu LC65 mất 4 nucleotide tại vị trí 20 và 301-
303, có sự sai khác với các mẫu còn lại tại các điểm
+ Vị trí nucleotide số 8: thay thế A bằng T
+ Vị trí nucleotide số 14-15: thay thế AT bằng CC
+ Vị trí nucleotide số 32: thay thế T bằng A
+ Vị trí nucleotide số 71, 90: thay thế G bằng A
+ Vị trí nucleotide số 200: thay thế C bằng G
+ Vị trí nucleotide số 215: thay thế G bằng A
+ Vị trí nucleotide số 648: thay thế A bằng C
- Trình tự mẫu LC18 có các điểm sai khác:
+ Tại các vị trí nucleotide 30,32 có sự sai khác nucleotide mẫu LC3
+ Vị trí nucleotide số 46-48: thay thế CTG bằng TGA
Trình tự nucleotide mẫu nghiên cứu HG9, mặc dù cùng nhóm phụ 3.2 nhưng
54
HG9 lại chỉ có 2 điểm sai khác trong dãy trình tự là vị trí nucleotide số 31-
32 thay thế GT bằng AG.
Trình tự mẫu nghiên cứu LC42 chỉ có 1 điểm sai khác tại vị trí số 30 giống
mẫu LC3 và LC18, tuy nhiên G được thay bằng A.
Trình tự nucleotide mẫu nghiên cứu HG18 chỉ có 1 điểm sai khác tại vị trí số
723 G được thay bằng C. Điểm sai khác duy nhất này giống với vị trí sai
khác của mẫu nghiên cứu HG1.
Trình tự nucleotide của mẫu LC52 mất 2 nu tại vị trí nu 412-413, có sự sai
khác với các mẫu còn lại tại các điểm
+ Vị trí nucleotide số 26: thay thế A bằng G
+ Vị trí nucleotide số 103: thay thế A bằng C
+ Vị trí nucleotide số 364-365: thay thế TC bằng AG
+ Vị trí nucleotide số 400, 414 và 427: thay thế G bằng A
- Trình tự nucleotide 2 mẫu nghiên cứu LC23 và LC68 chỉ có 1 điểm sai
khác duy nhất tại vị trí số 45 thay thế C bằng T (LC23) và A (LC68).
- Trình tự nucleotide các mẫu nghiên cứu LC25, LC37, Lca01, Lca03,
Lca04, Lca12, HG7 và HG16 giống nhau hoàn toàn; có cùng 1 vị trí sai
khác so với mẫu tham chiếu AF399876.1 ở vị trí số 1 thay C bằng T.
- Trình tự nucleotide mẫu LC14 có các điểm sai khác: thêm 2 nucleotide ở
vị trí số 654-655 (thêm AC); vị trí nucleotide 656 thay A bằng C. Đây là
mẫu có sự khác biệt lớn nhất trong phân nhóm phụ 3.8.
55
CHƯƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ
4.1. KẾT LUẬN
Kết quả phân tích đa dạng di truyền 26 mẫu Óc chó nghiên cứu thu tại
các tỉnh miền núi phía Bắc dựa vào đoạn trình tự gen ITS1-5,8rRNA-ITS2
cho thấy: Các mẫu Óc chó thu thập khá đa dạng di truyền. Hệ số tương đồng
di truyền giữa các mẫu Óc chó dao động từ 92,73 % đến 100% (khoảng cách
di truyền gần nhất là 0,00 và xa nhất là 0,07).
Trong 3 tỉnh thu thập mẫu, các mẫu Óc chó ở Hà Giang có sự da dạng
di truyền cao hơn các mẫu Óc chó thu thập ở Lai Châu và Lào Cai.
Hai mươi sáu mẫu Óc chó nghiên cứu được chia thành nhiều nhóm
nhỏ khác nhau dựa trên sự khác biệt di truyền của chúng. Trong đó có các
mẫu LC25, LC37, Lca01, Lca03, Lca04, Lca12, HG7 và HG16 có hệ số
tương đồng là 100%; như vậy, nhiều mẫu Óc chó thu thập ở các địa
phương khác nhau nhưng lại có hệ số tương đồng như nhau có thể có chung
nguồn gốc.
Sử dụng vùng trình tự ITS1-5,8SrRNA-ITS2 có thể nhận dạng các
mẫu Óc chó trong tổng số 26 mẫu nghiên cứu. Đây là cơ sở để xác định
được những nguồn gen quý phục vụ công tác nhân giống, phát triển và bảo
tồn giống Óc chó của Việt Nam.
4.2. KIẾN NGHỊ
- Cần tiếp tục nghiên cứu về sự đa dạng ở mức hình thái đặc biệt là thành phần dinh dưỡng, các hoạt chất dược học để xác định nguồn giống có năng suất, chất lượng phục vụ công tác nhân giống, bảo tồn, lưu giữ nguồn gen Óc chó ở Việt Nam.
- Kết hợp với các nghiên cứu khác để có thể đẩy nhanh cây Óc chó làm
cây chủ lực để đem lại kinh tế, xóa đói giảm nghèo cho nông dân vùng cao.
56
TÀI LIỆU THAM KHẢO
1.
Hoàng Thị Lụa và cộng sự, Thị trường và tiềm năng phát triển cây óc chó tại vùng Tây Bắc, Việt Nam. Tạp chí khoa học lâm nghiệp 2/2014: p. 3355 - 3370.
3.
2. Manning, W.E., Annals of the Missouri Botanical Garden. The classification within the Juglandaceae 1978. 65(4), pp. 1058–1087. Alice M. Stanford, e.a., Phylogeny and Biogeography of Juglans (Juglandaceae) Based on matK and ITS Sequence Data. American Journal of Botany 2000. 87(6), pp. 872-882. in the
5.
6.
7.
8.
9. 4. Woodworth, R., 1930, Meiosis of microsporogenesis Juglandaceae, American Journal of Botany, 17, pp. 863–869. Komanich, I.G., 1982, Karyology study of Juglans species, Bulletin of the State Botanical Garden, 125, pp. 73-79. Polunin., Trees and Bushes of Britain and Europe. Granada Pub. Ltd, Paladin Frogmore, St Albans Herts, pp. 204. Jacamon, M., 1987, Guide de dendrologie. Arbres, arbustes, arbrisseaux des forêts françaises.Tome II Feuillus. Ecole Nationale du Génie Rural, des Eaux et des Forêts Becquey, J., 1997, Les noyers à bois. Institut pour le Développement Forestier. Giannini and Mercurio, 1997, Avenue media, Bologna. Il Noce comuneper la produzione legnosa.
10. FratteggianiI, M., R. Mercurio et al., 1996, Relazione tra tessitura del suolo e coltivazione del noce da legno, Giornale Botanico Italiano, 130(1), pp. 421. 11. Boudru, M., 1989 Forêt et sylviculture: sylviculture appliquée. Les Presses Agronomiques de Gembloux, Gembloux.
12. Klemp, C.D., 1979, Walnut cultivation under forest condition for timber production. Allgemeine Forstzeitschrif, 27, pp. 732–733.
13. Bergougnoux, F.a.P.G., 1981, , Le noyer. Infuflec. 14. Winter, R., 1982, Der Walnussbaum – die vergessene Baumart. Holz- Zentralblatt, 52, pp. 737–738.
15. Lê Sỹ Doanh và Trần Quang Bảo (2012), Kỹ thuật nhân giống và gây trồng loài Hồ Đào (Juglans Regia Linn) trong giai đoạn vườn ươm. Tạp chí NN&PTNT, Tháng 6, 2012. 16. Lê Mộng Chân and L.T. Huyên, Thực vật rừng, NXB. Nông nghiệp, Hà Nội. 17. Neale, D.B.a.W., C. G. 1991, Restriction fragment
length polymorphism mapping in conifers and applications to forest genetics and tree improvement, Can. J. For. Res, 21, pp.545-554.
57
18. Landry và cộng sự, Methods and applications of restriction fragment length polymorphism analysis to plants, Tailoring genes for crop improvement: an agricultural perspective, pp. 25-44. 19. Malvolti ME và cộng sự, 1993, Genetic variation in Italian populations of Juglans regia L.
20. Mullis và Faloona, Specific synthesis of DNA in vitro via a polymerase-catalysed chain reaction, Meth. Enzymol, 155, pp. 335–350. 21. Baldwin, B.G., Sanderson, M.J., Porter, J.M., Wojciechowski, M.F., Campbell, C.S., Donoghue, M.J., 1995, The ITS region of nuclear ribosomal DNA-A valuable source of evidence on Angiosperm phylogeny, Ann. Mo. Bot. Gard, 82, pp.247–277.
22. Bellarosa R và cộng sự, 2005, Utility of ITS sequence data for phylogenetic reconstruction of Italian Quercus spp, Mol Phylogenet, 34, pp.355-370.
23. Nicese FP., H.J., McGranahan GH., 1998, Molecular characterization and genetic relatedness among walnut ( Juglans regia L.) genotypes based on RAPD markers. Euphytica, 101, pp. 199–206.
24. Wang, H., Pei, D., 2008, Genetic diversity and structure of walnut populations in Central and Southwestern China revealed by microsatellite markers. Journal of the American Society for Horticultural Science, 133, pp. 197–203. 25. Miltiadis V. Christopoulos và cộng sự, 2010, Germplasm diversity and
genetic relationships among walnut (Juglans regia L.) cultivars and Greek local selections revealed by Inter-Simple Sequence Repeat (ISSR) markers. Scientia Horticulturae. 125(4): p. 584-592. 26. Uzma Noor Shah., e.a., 2017, Bioefficacy potential of different
genotypes of walnut Juglans regia L. Journal of Food Science and Technology -Mysore. 55(5).
27. Ciarmiello LF., W.P., Fuggi A., Pontecorvo G., Carillo P., 2011, Plant genes for abiotic stress. Abiotic stress in plants—mechanisms and adaptations
28. White TJ., B.T., Lee S., Taylor J., 1990, Amplification and direct
sequencing of fungal ribosomal RNA genes for phylogenetics. PCR Protocols: a guide to methods and applications: p. 315–322.
29. Doyle, J.J.a.J.L.D., 1987, A rapid DNA isolation procedure for small quantities of fresh leaf tissue. Phytochemistry Bulletin, 19, pp. 11-15.
30. Ayliffe, M.A., G.J. Lawrence, J.G. Ellis., A.J. Pryor, 1994, Heteroduplex molecules formed between allelic sequences cause nonparetnal RAPD bands, Nucl Acids Res, 22(9),pp. 1632-1636.
58
31. Bachmann, K., 1994, Molecular markers in plant ecology, The New
Phytologist, 126, pp. 403-418.
32. Beer R., Kaiser F., Schmidt K., Ammann B., Carraro G., Grisa E., et al., 2008, Vegetation history of the walnut forests in Kyrgyzstan (Central Asia): natural or anthropogenic origin, Quat. Sci. Rev, 27, pp. 621–632. 33. Ciarmiello L. F., Pontecorvo G., Piccirillo P., Luca A. D., Carillo P., Kafantaris I., et al., 2013, Use of nuclear and mitochondrial single nucleotide polymorphisms to characterize English walnut (Juglans regia L.) genotypes, Plant Mol. Biol. Rep, 31, pp. 1116–1130.
34. Dang M, Zhang T, Hu Y, Zhou H, Woeste K, Zhao P., 2016, De Novo Assembly and Characterization of Bud, Leaf and Flowers Transcriptome from Juglans Regia L. for the Identification and Characterization of New EST-SSRs, Forests, 7, pp. 247–63. 1909, Contribution 34. Dode L. A., study of the to
the translation by Cuendett, R.E), Bull. Soc.
genus Juglans (English Dendrol. Fr, 11, pp. 22–90.
35. Dudley, J.W., 1994, Comparison of genetic distance estimators using molecular marker data. Analysis of molecular marker data, Joint plant breeding Symposia series, Am Soc Hort Sci Crop Sci Soc USA, pp. 3-7. 36. Dunemann, F., R. Kahnau., H. Schmidt, 1994, Genetic relationships in Malusevaluated by RAPD fingerprinting of cultivars and wild species, Plant Breed ,113(2), pp. 150-159.
37. Dweikat, I., S. Mackenzie, L. Morris., H. Ohm, 1993, Pedigree assessment using RAPD-DGGE in cereal crop species, Theor Appl Genet, 85, pp. 497-505.
38. Hills L. V., Klovan J. E., Sweet A. R., 1974, Juglans eocinerea n. sp., Beaufort Formation (Tertiary), southwestern Banks Inland, Arctic Canada, Can. J. Bot, 52, pp.65–90.
39. Fjellstrom, R.G. & D.E. Parfitt, 1994a, RFLP inheritance and linkage
in walnut, Theor Appl Genet ,89(6), pp. 665-670.
40. Fjellstrom, R.G. & D.E. Parfitt, 1994b, Walnut (Juglansspp.) genetic diversity determined by restriction fragment length polymorphisms,
59
Genome, 37(4), pp. 690-700.
41. Fjellstrom, R.G. & D.E. Parfitt, 1995, Phylogenetic analysis and evolution of the genus Juglans (Juglandaceae) as determined from nuclear genome RFLPs, Plant Syst Evol ,197(1-4), pp. 19-32.
42. Fjellstrom, R.G., D.E. Parfitt & G.H. McGranahan, 1994, Genetic relationship and characterization of Persian walnut (Juglans regiaL.) cultivars using restriction fragment length polymorphism (RFLPs), J Am Soc Hort Sci, 119(4), pp. 833-839.
43. Forde, H.I. & G.H. McGranahan, 1996, Walnuts. In: J. Janick & J.N.
Moore (Eds.), Fruit Breeding, 3, pp. 241-273. 44. Liang W, Dondini L, De Franceschi P, Paris R, Sansavini S, Tartarini
S., 2015, Genetic Diversity, Population Structure and Construction of a
Core Collection of Apple Cultivars from Italian Germplasm, Plant Mol
Biol Report, 33(3), pp.458–73.
45. Molvolti, M.E., M. Pigliucci, F. Cannata., S. Fineschi, 1993, Genetic
variation in Italian populations of Juglans regia, Acta Horticulturae,
311: 86-91.
46. Rink, G., G. Zhang, Z. Jinghua, F.H. Kung., E.R. Carroll, 1994,
Mating parameters in Juglans nigraL. seed orchard similar to natural
population estimates, Silvae Genetica, 43(4), pp. 261-263.
47. Serr, E.F., 1969, Persian walnuts in the western states. In: R.A. Jaynes
(Ed.), Handboof of North American Nut Trees, pp. 240- 263.
48. Solar, A., J. Smole & F. Stampar, 1993, Identification of walnut
cultivars by pollen isozymes, Acta Horticulturae, 311, pp. 95-99.
49. Solar, A., J. Smole, F. Stampar., M. Virscekmarn, 1994,
Characterization of isozyme variation in walnut (Juglans regiaL.),
Euphytica, 77(1-2), pp. 105-112.
50. Pollegioni, P.; Woeste, K.E.; Chiocchini, F.; Olimpieri, I.; Tortolano,
V.; Clark, J.; Hemery, G.E.; Mapelli, S.;Maria, E.M.,2014, Landscape
genetics of Persian walnut (Juglans regia L.) across its Asian range,
Tree Genet. Genomes.
60
51. Pollegioni, P.; Woeste, K.; Mugnozza, G.S.; Malvolti, M.E., 2009,
Retrospective identification of hybridogenic walnut plants by SSR
fingerprinting and parentage analysis, Mol. Breed, 24, pp. 321–335.
52. Robichaud RL., Glaubitz JC., Rhodes OE., Woeste K., 2006, A robust
set of black walnut microsatellites for parentage and clonal
identification, New Forests, 32, pp.179–196.
53. Uzma Noor Shah., et al., 2016, Assessment of germplasm diversity and
genetic relationships among walnut (Juglans regia L.) genotypes
through microsatellite markers, Journal of the Saudi Society of
Agricultural Sciences.
54.
Victory ER., Glaubitz JC., Rhodes OE., Woeste KE., 2006 Genetic homogeneity in Juglans nigra(Juglandaceae) at nuclear microsatellites, Am J Bot, 93, pp.118–126.
55. Vischi M, Chiabà C, Raranciuc S, Poggetti L, Messina R, Ermacora P, et al., 2017, Genetic Diversity of Walnut (Juglans Regia L.) in the Eastern Italian Alps. Forests., 8.
56. Vigouroux Y, Glaubitz JC, Matsuoka Y, Goodman MM,
Sánchez G J, Doebley J., 2008, Population structure and genetic diversity of New World maize races assessed by DNA microsatellites, Am J Bot, 95(10), pp.1240–53.
57. Vyas D., Sharma SK., Sharma DR.,2003, Genetic structure of walnut genotypes using leaf isozymes as variability measure, Sci Hort, 97, pp.141–152.
58. Wu YanMin., Pei Dong., Xi ShengKe., Li JiaRui.,2000, A study on the genetic relationship among species in Juglans L. using RAPD markers, Acta Horticulturae Sinica, 27(1),pp. 17-22
59. Weising K., Nybom H., Wolff K., Meyer W., 1995, DNA fingerprinting in plants and fungi, Boca Raton, Florida: CRC Press Inc.
60. Wenheng, C.S.Y., 1984, Taxonomic studies of ten species of the
61
genus Juglansbased on isozymic zymograms, Acta Hort Sinica 14(2), pp.90-96.
61. Woeste K., Burns R., Rhodes O., Michler C., 2002, Thirty polymorphic
nuclear microsatellite loci from black walnut, J Hered, 93, pp.58–60.
62. Wolfe KH., L.W.H., Sharp P., 1987, Rates of nucleotide substitutionvary greatly among plant mitochondria, chloroplast, nuclearDNAs, Proc Natl Acad Sci USA, 84, pp. 9054–9058.
63. Yan-Min W., Ying L., Feng-Xiang D., Sheng-Ke X., 2000, Study on different ecological types of Chinese walnut (Juglans regia) using RAPD markers, J Beij For Univ, 22, pp.23–27.
62
PHỤ LỤC: TRÌNH TỰ 26 MẪU ÓC CHÓ NGHIÊN CỨU
>A F399876.1 Juglans regia (mẫu tham chiếu)
CCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>HG1
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCTTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CA A GGA G
CGA TCGGCGTA TCTCA A CGTGCGCTCCCTA CCGA TTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA CA A GGA TA GTA CA TGTTCGCA GGTCGGTCTGCT
GGGCA GGTA TCGA CA A TGA TCCTTCCGTA CGTTCGCCTA CGG
>HG02
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CA A GGA A
CGA TGGGCGTGTCTCA CTGTGCCCTCCCTA CCGA TCGTTGGGA GGGA GG
A TTA A TTA CCCA CCCA CA A GGA TA GTA CTTGTA TGTTCGTCGGTCTGCTG
GCTA GGTA TGGA CCA TGA TCGA TCCTTCGGTTCGCCTA CCG
>HG05
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCGA CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCGA TCCTTCGGTTCGCCTA CCG
63
>HG7
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>HG9
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGA GA A TCCCGCCTGA CCTGG
GGTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA
CCTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CC
A CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGC GA GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA
TA A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA C
GTGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA
TGA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTT
CTTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA
TCA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCC
GTGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA T
TGTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA
GCGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGG
CA TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCT
GGGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
64
>HG11
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CA A GGA A
CGA GGGGCGTGTCTCTCCGTGCCCTCCCTA CCGA TTGTTGGGA GGGA GG
A TTA CTTA CCCCCCCA CA A A GA TA GTA CTTGTTTGCTCGTCGGTCTGCCG
GCTGGGTA TCGA TCA TGA TCGA CCTTCCGGTA CGCCTA CGG
>HG16
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
65
>HG18
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA CGTTCA CCTA CGG
>HG22
TGGCGTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGG
GGTCGCGA TGGTA GA GTTGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA
CCTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CC
A CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGC GA GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA
TA A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA C
GTGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA
TGA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTT
CTTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA
TCA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCC
GTGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA T
TGTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA
GCGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGG
CA TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCT
GGGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTCA CCCTA CGG
66
>LCa01
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>LCa03
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
67
>LCa04
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>LCa10
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGT TCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CCCA CA CA CA A
CGA GCGGTGTGTA TA TCTCA GCGTGCCCTCCCGA CCGTTTTTTGGGA GG
GGGCA TTA CCCCCCCA CA CA GA A A GTTA TTA CA TGTTCA CA GGTCGTTC
TGCTGGGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
68
>LCa12
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>LC3
TCCGCTTA TTGA TA TGCTTA A A TTCA GA GTGA A TTCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGCA CCCTA A CGG
69
>LC14
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCCA CCCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGC
TGGGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>LC18
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGTGA A A TCCCGCCTGA CTGA GG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
70
>LC23
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA TCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>LC25
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
71
>LC37
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
>LC42
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGA GTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG
TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
72
>LC48
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTTTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCA CCGGCCCA CTTTCGG
>LC52
TCCGCTTA TTGA TA TGCTTA A A TTCGGCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCCCA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TA GA CA CCA A GTA TCGCA TTTCGCTA CGTT
CTTCA TCA A TGCGA GA GCCA A TA TCCGTTGCCA A GA GTCGTTA TGTA TC
A TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCGT
GGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TTG
TTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA GC
GGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGCA
TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTGG
GCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
73
>LC55
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA CCTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA TTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTA TTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA T T
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CCCCCCCCCCA A GGTTA TTA CA TGTTTCCA GGTCTTTCTGCTGGGC
A GGTA TCCA CCA TGA TCCTTCCGCA GGTCCCCGTA CGG
>LC65
TCCGCTTTTTGA TCCGCTTA A TTCA GCGGGA A A TCCCGCCTGA CCTGGGG
TCGCGA TGGTA GA GTCGCA A GA A CGA CGCA A TA GGGTCA A GGA GCA CC
TTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA C
CGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG A GGA GA A GCA CA CGGGA A GCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA TGA T
TCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTCTTC
A TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA TCA T
GGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCGTGG
TTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TTGTT
CGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA GCGG
TGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGCA TT
A CCCCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTGGG
CA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
74
>LC68
TCCGCTTA TTGA TA TGCTTA A A TTCA GCGGGTA A TCCCGCCTGA A CTGGG
GTCGCGA TGGTA GA GTCGCA GGA A CGA CGCA A TA GGGTCGA GGA GCA C
CTTCA CA GCGA CGGGCA A CA CA CGA CGGGTCA CGA GGGTTTCTCA A CCA
CCGA TTGTCGTGGCGCTCGTCGCCTA GGA CTCA CTTTTA GGCTA A CCGCG
A GCA GA A GCA CA CGGGA GGCCA A TGTCTTCCCCGCA CCCCA CA CA TCA T
A A GA A GTGTTTGGGGTTGGGGCA A CGA TGCGTGA CA CCCA GGCA GA CG
TGCCCTCGGCCGA A TGGCTTCGGGCGCA A CTTGCGTTCA A A GA CTCGA T
GA TTCGCGGGA TTCTGCA A TTCA CA CCA A GTA TCGCA TTTCGCTA CGTTC
TTCA TCGA TGCGA GA GCCGA GA TA TCCGTTGCCGA GA GTCGTTA TGTA T
CA TGGTA A A GA TGTCA CCA A CA A CGCGCA CA CCGTTTCCGGGGCGCCCG TGGTTA CTCCTTGTTTA A GTTCCTTGGCGCA GA CCGCGCCGGGGTTCA TT
GTTCGA TCGGGA A GGGA A CGA GA A GA TTGA CCA A CCA CA CA CGA GGA G
CGGTGGGCA TA TCTCA A CGTGCCCTCCCA A CCGTTTTTTGGGA GGGGGC
A TTA CA CCCCCA CCCA GA A GGTTA TTA CA TGTTCA CA GGTCGTTCTGCTG
GGCA GGTA TCGA CA A TGA TCCTTCCGCA GGTTCA CCTA CGG
75