TAÏP CHÍ ÑAÏI HOÏC SAØI GOØN Soá 21 - Thaùng 6/2014<br />
<br />
<br />
XÂY DỰNG CÔNG CỤ TRỰC TUYẾN<br />
TRA CỨU HỌ THỰC VẬT HẠT KÍN Ở VIỆT NAM<br />
<br />
NGUYỄN HỒ THẾ VINH(*)<br />
THÁI KẾ QUÂN(**)<br />
<br />
TÓM TẮT<br />
Việc định danh một họ thực vật từ những đặc điểm riêng lẻ thu được trên mẫu thực vật<br />
là một vấn đề khó khăn. Năm 1997, Nguyễn Tiến Bân giới thiệu cuốn khóa định loại các họ<br />
cây hạt kín ở Việt Nam. Tuy các đặc điểm dùng định họ rất rõ ràng, nhưng việc tra bảng<br />
các bảng đặc điểm khác nhau trên giấy rất khó khăn đối với người dùng, đặc biệt là những<br />
sinh viên ngành Sinh học. Dựa trên khóa định loại các họ thực vật hạt kín ở Việt Nam<br />
(Nguyễn Tiến Bân, 1997), chúng tôi xây dựng công cụ trực tuyến giúp người dùng dễ dàng<br />
tra cứu họ thực vật hạt kín ở Việt Nam với giao diện tiếng Việt. Công cụ có thể được sử<br />
dụng tại http://vnplants.vietbiodata.net.<br />
Từ khóa: họ thực vật, cây hạt kín, ngành Sinh học, công cụ trực tuyến.<br />
<br />
ABSTRACT<br />
Identification of a plant family based on certain features of a collected plant sample is<br />
very difficult. In 1997, Nguyen Tien Ban reported “keys for identification of Vietnamese<br />
plant families”. In spite of clear identification keys, it’s not easy to identify a plan family of<br />
a sample with certain features by looking up them in the printout version, especially for<br />
undergraduate biology students. Using the reported keys for identification of Vietnamese<br />
plant families, we developed a web-based tool to make the identification easier. The tool<br />
can be accessed via Internet at http://vnplants.vietbiodata.net.<br />
Keywords: plant families, biology, website - based tools<br />
<br />
<br />
1. MỞ ĐẦU (*) (**) dùng dễ dàng hơn trong việc định danh các<br />
Trong số hơn 260000 loài thực vật hạt họ thực vật. Người dùng sẽ xem xét đặc<br />
kín được phát hiện trên Trái Đất [3, 4], điểm mẫu vật của họ và tra bảng để tìm ra<br />
Việt Nam ghi nhận sự có mặt khoảng họ tương ứng của mẫu vật cần tra cứu. Tuy<br />
12000 loài được xếp vào 265 họ thực vật nhiên, việc tra cứu từng bảng riêng biệt<br />
khác nhau. Dựa vào các đặc điểm riêng của thường không mang lại một kết quả rõ<br />
từng họ thực vật, khóa định loại các họ cây ràng, chẳng hạn nếu tra cứu theo dạng sống<br />
hạt kín ở Việt Nam đã được thiết lập bởi thì có thể gặp rất nhiều họ thực vật có dạng<br />
Nguyễn Tiến Bân [1, 2] nhằm giúp người sống tương tự nhau. Sự kết hợp giữa hai<br />
hay nhiều bảng khóa sẽ cho kết quả chính<br />
(*)<br />
xác hơn nhưng thực hiện điều này rất khó<br />
CN, Khoa Sư phạm Khoa học Tự nhiên, Trường<br />
Đại học Sài Gòn với các bảng in. Phần mềm quản lí và tra<br />
(**)<br />
ThS, Bộ môn Sinh học, Khoa Sư phạm Khoa học cứu đa dạng thực vật Việt Nam (PlantsVN)<br />
Tự nhiên, Trường Đại học Sài Gòn<br />
<br />
118<br />
NGUYỄN HỒ THẾ VINH - THÁI KẾ QUÂN<br />
<br />
<br />
được xây dựng bởi GS.TS Nguyễn Văn nhận dạng 265 họ thực vật hạt kín ở Việt<br />
Sinh, dựa trên cẩm nang của Nguyễn Tiến Nam. Nguồn dữ liệu này được chúng tôi<br />
Bân cũng đã cung cấp một chức năng tra lưu trữ máy vi tính.<br />
cứu họ thực vật [5]. Tuy nhiên, phần mềm Để xây dựng nên cơ sở dữ liệu chứa<br />
này chạy trên hệ điều hành Windows XP các thông tin về đặc điểm chi tiết và đặc<br />
với giao diện hoàn toàn bằng tiếng Anh là điểm nhận dạng của các họ thực vật, chúng<br />
một hạn chế không nhỏ cho người sử dụng. tôi phân tích và sắp xếp dữ liệu đã thu thập<br />
Sinh viên ngành Sinh học của nhiều thành các nhóm đối tượng thông tin khác<br />
trường, chẳng hạn như Đại học Sài Gòn, nhau. Từ đó mô hình đối tượng được xây<br />
Đại học Sư phạm Tp. Hồ Chí Minh, Đại dựng nên ở dạng các bảng, đồng thời thiết<br />
học Khoa học Tự nhiên Tp. Hồ Chí lập mối quan hệ giữa các bảng đó.<br />
Minh… hằng năm đều được tổ chức các Sau khi phân tích dữ liệu và khái quát<br />
khóa học “Thực tế thiên nhiên” tại các hóa dữ liệu thành các nhóm riêng biệt, mô<br />
vùng có sự đa dạng sinh học cao như Đà hình đối tượng này được thiết lập và quản<br />
Lạt, Nha Trang, Vũng Tàu, Vườn Quốc gia lí bởi hệ quản trị CSDL MySQL.<br />
Núi Chúa, Vườn Quốc gia Nam Cát Một chương trình máy tính được viết<br />
Tiên,…. Trong các khóa học này, sinh viên bởi ngôn ngữ Perl đọc tất cả các tập tin ở<br />
được hướng dẫn thu thập các mẫu thực vật định dạng kí tự đã lưu ở bước trên và tách<br />
và dựa vào các đặc điểm riêng để định họ, thành các nhóm thông tin riêng biệt, lưu<br />
định danh các mẫu vật thu được. Thế vào CSDL.<br />
nhưng để có được thông tin về tên, họ của 2.2. Xây dựng công cụ trực tuyến<br />
các mẫu vật thu được, các sinh viên hầu hết tra cứu họ thực vật hạt kín ở Việt Nam<br />
đều phải nhờ cậy các chuyên gia định họ, Trang Web thể hiện thông tin về họ<br />
định danh giúp mà ít khi (hoặc không thể) thực vật hạt kín trong CSDL và công cụ tra<br />
tự mình xác định được. cứu họ thực vật hạt kín ở Việt Nam được<br />
Chúng tôi đã tiến hành xây dựng cơ sở xây dựng bằng ngôn ngữ lập trình Perl và<br />
dữ liệu (CSDL) thu thập các đặc điểm phân ngôn ngữ HTML. Kịch bản chương trình<br />
loại các họ thực vật và phát triển một ứng được viết bằng Perl kết hợp với ngôn ngữ<br />
dụng Web nhằm cung cấp cho người dùng HTML kết nối với CSDL trong hệ quản trị<br />
một công cụ giúp xác định các họ thực vật CSDL MySQL.<br />
hạt kín ở Việt Nam. Các trang Web với Dựa trên qui luật đối với từng họ thực<br />
giao diện tiếng Việt, có thể sử dụng được ở vật sẽ có một nhóm các đặc điểm của một<br />
nhiều hệ điều hành khác nhau sẽ giúp cho đối tượng nào đó, chẳng hạn như họ<br />
việc tra cứu dễ dàng và thuận lợi. Magnoliaceae có đặc điểm về đối tượng<br />
2. PHƯƠNG PHÁP NGHIÊN CỨU ngoại dạng là: có dạng sống là gỗ hay bụi<br />
2.1. Xây dựng cơ sở dữ liệu đứng, có lông hình khiên/vảy, có lông hình<br />
Dữ liệu được sử dụng gồm 2 nhóm sao. Tổ hợp các đặc điểm cụ thể của 10 đối<br />
thông tin có ở “Cẩm nang tra cứu và nhận tượng trên mỗi họ thực vật là khác nhau.<br />
biết các họ thực vật hạt kín ở Việt Nam” – Nhờ đó chương trình sẽ xác định đúng họ<br />
Nguyễn Tiến Bân [1], bao gồm đặc điểm thực vật từ những đặc điểm mà người dùng<br />
chi tiết của 265 họ thực vật hạt kín và 10 đưa vào.<br />
bảng khóa – 10 đối tượng sử dụng tra cứu, 3. KẾT QUẢ VÀ BÀN LUẬN<br />
<br />
119<br />
XÂY DỰNG CÔNG CỤ TRỰC TUYẾN TRA CỨU HỌ THỰC VẬT HẠT KÍN Ở VIỆT NAM<br />
<br />
<br />
3.1. Mô hình cơ sở dữ liệu các bảng đều được thiết lập mối quan hệ<br />
Đề tài đã xây dựng mô hình CSDL với nhau nhằm truy xuất dữ liệu theo nhóm<br />
quan hệ gồm 24 bảng (Hình 3.1). Trong đó, khi người dùng thao tác với CSDL.<br />
<br />
<br />
<br />
<br />
Hình 3.1: Mô hình cơ sở dữ liệu ở dạng các bảng quan hệ<br />
<br />
<br />
120<br />
NGUYỄN HỒ THẾ VINH - THÁI KẾ QUÂN<br />
<br />
<br />
3.2. Công cụ trực tuyến tra cứu Để thực hiện được chức năng tra cứu họ<br />
họ thực vật hạt kín ở Việt Nam thực vật hạt kín ở Việt Nam dễ dàng và<br />
Song song với công cụ tra cứu họ mang lại kết quả chính xác, từ việc phân tích<br />
thực vật hạt kín, trang Web gồm nhiều mẫu vật thu được người dùng lựa chọn đối<br />
mục chọn giúp người dùng truy cập được tượng sẽ sử dụng làm cơ sở tra cứu họ, bao<br />
danh sách các họ thực vật hạt kín ở Việt gồm: Quả, Bao hoa, Ngoại dạng, Bao phấn<br />
Nam, hiển thị dưới dạng danh pháp khoa & triền/tuyến mật, Nhị, Hạt, Hoa và cụm<br />
học và tên họ thông thường, được sắp xếp hoa, Lá và lá kèm, Noãn và lối đính noãn, Lá<br />
theo thứ tự trong bảng chữ cái (A-Z), noãn và bầu. Mỗi đối tượng do người dùng<br />
trong đó người dùng có thể truy cập đặc lựa chọn sẽ được hiển thị một khung chọn<br />
điểm chi tiết của một họ bằng cách mở chứa các đặc điểm cụ thể của đối tượng đó<br />
liên kết bởi chính tên họ mà người dùng (Hình 3.2). Trong trường hợp người dùng có<br />
quan tâm; cùng với đó những đặc điểm nhiều đặc điểm cụ thể về một đối tượng,<br />
dùng để tra cứu phân biệt các họ thực vật khung chọn vẫn cho phép người dùng nhấn<br />
hạt kín ở Việt Nam cũng sẽ được cung chọn nhiều đặc điểm cụ thể cùng lúc.<br />
cấp cho người dùng.<br />
<br />
<br />
<br />
<br />
Hình 3.2: Giao diện lựa chọn các đặc điểm cụ thể<br />
<br />
Kết quả của chương trình sẽ thống kê vật hiển thị được liên kết đến trang chứa<br />
và hiển thị số lượng họ thực vật thỏa mãn thông tin về họ đó. Ngoài ra, phía trên trang<br />
yêu cầu, liệt kê tất cả các họ thực vật phù Web cũng hiển thị lại các đặc điểm cụ thể<br />
hợp với những đặc điểm mà người dùng của các đối tượng mà người dùng đã sử dụng<br />
đã đưa vào, các kết quả sẽ được chương để tiện trong việc kiểm soát và quản lí thông<br />
trình sắp xếp theo thứ tự trong bảng chữ tin (Hình 3.3).<br />
cái latin (A - Z), đồng thời tên họ thực Trong trường hợp các đặc điểm cụ thể<br />
<br />
<br />
121<br />
XÂY DỰNG CÔNG CỤ TRỰC TUYẾN TRA CỨU HỌ THỰC VẬT HẠT KÍN Ở VIỆT NAM<br />
<br />
<br />
của người dùng nhập vào đưa đến kết quả vật có trong CSDL sẽ được hiển thị lại, trong<br />
là nhiều hơn một họ, trang kết quả sẽ vừa đó các đối tượng mà người dùng đã chọn ban<br />
đồng thời thông báo số lượng kết quả tìm đầu cùng với các đặc điểm cụ thể của chúng<br />
được, vừa hiển thị danh pháp khoa học sẽ mặc định được giữ lại và người dùng có<br />
của tất cả các họ thực vật có đặc điểm thể lựa chọn thêm các đối tượng khác để<br />
phù hợp với các đặc điểm của người dùng phối hợp tra cứu hoặc cập nhật thêm đặc<br />
nhập vào. Lúc này danh sách 10 đối điểm cụ thể cho đối tượng cũ.<br />
tượng được sử dụng để tra cứu họ thực<br />
<br />
<br />
<br />
<br />
Hình 3.3: Trang hiển thị kết quả tra cứu<br />
<br />
Với trang Web chứa đặc điểm phân thực vật. Hiện nay, Website Trung tâm thực<br />
loại các họ thực vật cùng với công cụ tra vật rừng Việt Nam [6] có lẽ cũng đang xây<br />
cứu mà đề tài xây dựng, người dùng có dựng một bộ công cụ tương tự, tuy nhiên,<br />
thể sử dụng để khai thác thông tin về đặc cho đến thời điểm này (tháng 8/2013), trên<br />
điểm và tra cứu họ thực vật một cách trực website của Trung tâm này chỉ có giao diện<br />
tuyến, nhanh chóng, phù hợp với tất cả của công cụ và công cụ chưa thể hoạt động.<br />
các hệ điều hành phổ biến, đồng thời dễ Việc tra cứu định họ thực vật được xây<br />
dàng cập nhật các thông tin mới và sửa dựng bằng phần mềm (PlantsVN) sẽ có<br />
chữa các thông tin sai sót. nhiều hạn chế như: hiện tại phần mềm có lẽ<br />
Nếu so sánh với công việc tra cứu và không còn được phát triển nữa nên chỉ có thể<br />
định họ bằng cách sử dụng công cụ là các dùng được trên Microsoft Windows XP mà<br />
bảng in trong cẩm nang tra cứu của không thể sử dụng trên các phiên bản<br />
Nguyễn Tiến Bân, thì việc tra cứu định Windows thông dụng hiện nay như Windows<br />
họ thực vật bằng cách sử dụng công cụ 7, Windows 8,… và càng không thể chạy<br />
trên máy vi tính sẽ mang lại sự thuận tiện trên các hệ điều hành thông dụng khác như<br />
hơn nhiều cho những nhà nghiên cứu Macintosh, Linux, Android. Ngoài ra, do<br />
<br />
122<br />
NGUYỄN HỒ THẾ VINH - THÁI KẾ QUÂN<br />
<br />
<br />
phần mềm không được sử dụng trực PlantsVN được phát hiện khi chúng tôi kết<br />
tuyến, vì vậy sẽ hạn chế việc cập nhật và hợp sử dụng đặc điểm lá đơn mọc vòng và<br />
chỉnh sửa thông tin trên các phiên bản mọc đối (Leaves opposite or verticillate) để<br />
phần mềm mà người dùng sử dụng. Việc tra cứu, PlantsVN tìm thấy 128 kết quả,<br />
xây dựng một công cụ trực tuyến trên nền trong đó chúng tôi nhận thấy có rất nhiều họ<br />
Web có thể chạy tốt trên nhiều hệ điều không có lá đơn mọc đối và mọc vòng,<br />
hành thông dụng là sự lựa chọn hợp lý. chẳng hạn như họ Rosaceae được xác định<br />
Các thử nghiệm tra cứu trên công cụ có lá đơn mọc cách theo bảng khóa của<br />
cho thấy có ưu điểm hơn hẳn so với tính Nguyễn Tiến Bân. Chúng tôi đã tiến hành tra<br />
năng tương tự của chương trình cứu trên chương trình của mình và ghi nhận<br />
PlantsVN. Khi sử dụng đặc điểm là lá 33 họ trong đó không có họ Rosaceae và kết<br />
đơn hình khiên (Leaves peltate) để tra quả này phù hợp với bảng khóa tra cứu.<br />
cứu họ, chương trình của chúng tôi tìm 4. KẾT LUẬN<br />
thấy có 12 họ phù hợp và sau khi so sánh Đề tài đã xây dựng thành công một công<br />
lại với các bảng khóa, kết quả 12 họ này cụ trên nền Web, kết nối với cơ sở dữ liệu<br />
là đúng và đủ so với cẩm nang của giúp xác định các họ thực vật hạt kín ở Việt<br />
Nguyễn Tiến Bân. Trong khi đó, Nam. Nội dung trang Web được trình bày<br />
PlantsVN tìm thấy có 41 họ, trong số này bằng tiếng Việt, vừa thể hiện thông tin về<br />
có nhiều họ như: Ranunculaceae, các đặc điểm tra cứu và nhận dạng các họ<br />
Hamamelidaceae, Polygonaceae, thực vật hạt kín ở Việt Nam, vừa cung cấp<br />
Begoniaceae... là không phù hợp với các một công cụ hữu hiệu và đáng tin cậy để có<br />
bảng khóa, chẳng hạn như họ thể tiến hành tra cứu định danh các họ thực<br />
Polygonaceae có các đặc điểm trong bảng vật một cách nhanh chóng và chính xác, dựa<br />
Lá và lá kèm gồm: lá đơn mọc cách, mọc trên các đặc điểm phân họ đã được công bố<br />
đối, mọc vòng, gân lá hình lông chim và của Giáo sư Nguyễn Tiến Bân. Công cụ có<br />
lá kèm là bẹ chìa mà không có đặc điểm thể được sử dụng qua Internet ở địa chỉ<br />
lá đơn hình khiên. Một sai sót khác của http://vnplants.vietbiodata.net.<br />
<br />
TÀI LIỆU THAM KHẢO<br />
<br />
1. Group, A.P.(1998), "An ordinal classification for the families of flowering plants",<br />
Annals of the Missouri Botanical Garden, 85(4).<br />
2. http://www.iebr.ac.vn/pages/1PlantsVN.asp.<br />
3. http://www.vncreatures.net/.<br />
4. Kuldip S. Dogra, S.K.S., Parveen K. Dobhal and Seema Sharma (2010), "Alien<br />
plant invasion and their impact on indigenous species diversity at global scale: A<br />
review ", Journal of Ecology and the Natural Environment, 2(9), 175-186.<br />
5. Nguyễn Tiến Bân (1997), Cẩm nang tra cứu và nhận biết các họ thực vật hạt kín ở<br />
Việt Nam, NXB Nông nghiệp, Hà Nội.<br />
6. Phạm Hoàng Hộ (1999), Cây cỏ Việt Nam - Tập 1, NXB Trẻ, TP. Hồ Chí Minh.<br />
* Nhận bài ngày: 11/5/2014. Biên tập xong: 5/6/2014. Duyệt bài: 12/6/2014.<br />
<br />
123<br />