TẠP CHÍ KHOA HỌC, ðại học Huế, Số 66, 2011<br />
GÓP PHẦN XÁC ðỊNH NGUỒN GỐC TIẾNG VIỆT<br />
QUA “BẢNG 100 TỪ CƠ BẢN SWADESH”<br />
Võ Trung ðịnh<br />
Trường ðại học Ngoại ngữ, ðại học Huế<br />
<br />
TÓM TẮT<br />
“Bảng 100 từ cơ bản Swadesh” là Bảng từ cơ bản thông dụng trên thế giới. Ứng dụng<br />
Bảng này trong việc truy tìm từ nguyên tiếng Việt có thể phát hiện ra mối quan hệ giữa tiếng<br />
Việt và các thứ tiếng khác trong khu vực Châu Á thuộc ngữ hệ Nam Á, ngữ hệ Nam ðảo hay cả<br />
với ngữ hệ Hán Tạng. Thực ra 100 từ cơ bản này là 100 khái niệm, trên cơ sở ñó có thể quy nạp,<br />
tổng kết hàng ngàn lớp từ vựng cơ bản khác trong tiếng Việt, từ ñó có cái nhìn toàn diện hơn,<br />
chính xác hơn về nguồn gốc tiếng Việt.<br />
<br />
1. ðặt vấn ñề<br />
Về vấn ñề xác ñịnh nguồn gốc tiếng Việt, kể từ mốc 1852 khi J.R. Logan trong<br />
bài nghiên cứu Ethnology of the Indo-Pacific Islands lần ñầu tiên xếp tiếng Việt vào<br />
dòng Môn-Khmer, họ Nam Á thì quan ñiểm này cho ñến nay vẫn ñược nhiều người<br />
chấp nhận nhất và trở thành quan ñiểm chính thống cho các nhà nghiên cứu lịch sử tiếng<br />
Việt. Như giáo sư Nguyễn Tài Cẩn trong cuốn Giáo trình lịch sử ngữ âm tiếng Việt (sơ<br />
thảo) ñã chỉ ra rằng, tiếng Việt “là một ngôn ngữ thuộc nhóm Việt Mường, tiểu chi ViệtChứt (vẫn thường gọi là tiểu chi Việt-Mường) nằm trong khối Việt-Katu thuộc khu vực<br />
phía ðông của ngành Mon-Khmer, họ Nam Á” [1, trang 332], cho dù trong một quãng<br />
thời gian sau này tiếng Việt có mối quan hệ và ảnh hưởng sâu ñậm với tiếng Hán, nhưng<br />
ñó chỉ là quan hệ tiếp xúc chứ không phải quan hệ thân thuộc.<br />
Tuy nhiên, ngoài quan ñiểm chính thống ñó, tiếng Việt còn ñược nhiều học giả<br />
khác xếp vào các ngữ hệ khác nhau, do bởi trong quá trình sinh sống và di trú của cư<br />
dân Việt cổ, tổ tiên chúng ta ñã tiếp xúc và vay mượn rất nhiều các ngôn ngữ trong khu<br />
vực. Tiêu biểu như học giả người Pháp H. Maspéro trong công trình Nghiên cứu lịch sử<br />
ngữ âm tiếng An Nam-Các âm ñầu (Étude sur la phonétique historique de la langue<br />
Annamite. Les initiales, 1912) sau khi nghiên cứu tiếng Hán Việt, tiếng Mường, tiếng<br />
Thái và một số ngôn ngữ Môn-Khmer khác ñã ñưa ra nhận xét rằng “hệ thống thanh<br />
ñiệu làm cho tiếng Việt khác với các ngôn ngữ Môn-Khmer và ñó là một căn cứ quan<br />
trọng ñể tách nó ra khỏi các ngôn ngữ Môn-Khmer ñược biết ñến như là những ngôn<br />
ngữ không thanh ñiệu. Hệ thống thanh ñiệu của tiếng Việt ñã ñược hình thành dựa trên<br />
những nguyên tắc chung như trong tiếng Hán, tiếng Thái và ngôn ngữ Tạng Miến,<br />
nhưng nó thống nhất với hệ thanh của tiếng Thái cổ, tiếng Việt phải ñược quy vào họ<br />
45<br />
<br />
Thái” [1, trang 336]. Có rất nhiều nhà ngôn ngữ học tán thành quan ñiểm này như<br />
W.Schmidt (1926), K.Wuff (1934), R.Shafer (1942)… Nhà ngôn ngữ học trứ danh<br />
Trung Quốc Vương Lực cũng theo quan ñiểm này. Năm 1939 ông ñến Hà Nội nghiên<br />
cứu tiếng Việt, sau ñó ra mắt công trình Nghiên cứu tiếng Hán Việt. Do chịu ảnh hưởng<br />
sâu sắc của lớp từ Việt gốc Hán trong tiếng Việt nên Vương Lực ñã xếp tiếng Việt vào<br />
“ngữ hệ Hán Tạng, ngữ tộc Hán Thái” [2, trang 25].<br />
Một nhà nghiên cứu khác là Bình Nguyên Lộc ñã xếp tiếng Việt vào họ ngôn<br />
ngữ Nam ðảo. Trong hai cuốn Nguồn gốc Mã Lai của dân tộc Việt Nam (Sài Gòn,<br />
1972) và Lột trần Việt ngữ (Sài Gòn, 1973) ông ñã có sự so sánh tương ứng giữa từ<br />
vựng tiếng Việt với các ngôn ngữ khác nhau trong họ Nam ðảo, từ ñó nhiều lần ñưa ra<br />
kết luận tiếng Việt “ñã mượn ñến 40% danh từ của Mã Lai Nam Dương” [3, trang 383].<br />
Tuy các quan ñiểm trên có nhiều mức ñộ ñúng sai khác nhau, nhưng chính<br />
những nhận ñịnh này khiến chúng ta khi ñặt vấn ñề xác minh nguồn gốc tiếng Việt<br />
không thể không xét ñến các yếu tố Tày-Thái, yếu tố gốc Hán và cả yếu tố Nam ðảo<br />
trong lớp từ vựng cơ bản tiếng Việt ngày nay. Vấn ñề ñặt ra ở ñây là sử dụng phương<br />
pháp nào trong việc xác ñịnh nguồn gốc tiếng Việt? Bởi ñối với bất kỳ một loại ngôn<br />
ngữ nào, ba hệ thống lớn ngữ âm, từ vựng, ngữ pháp và các tiểu hệ thống của nó ñều có<br />
sự diễn biến khác nhau trong lịch sử, có yếu tố ñược bảo toàn lâu dài bên cạnh những<br />
yếu tố bị mất ñi và nhanh chóng ñược thay thế bằng những yếu tố khác, tuyệt ñối không<br />
thể có sự ñồng ñều về mặt diễn biến ngôn ngữ. Do vậy, việc xác ñịnh cho ñược một<br />
phương pháp nghiên cứu ñáng tin cậy là ñiều tối quan trọng.<br />
2. Phương pháp nghiên cứu<br />
“Mỗi một từ ñều có lịch sử của nó”, ñây là cách nhìn nhận của trường phái<br />
Phương ngữ học (dialectology) [4, trang 315]. Nhận ñịnh này càng nghĩ càng thấy ñúng,<br />
vấn ñề ñặt ra là chúng ta ñi nghiên cứu lịch sử của từ như thế nào? Trong các phương<br />
pháp so sánh ñối chiếu hiện nay, phương pháp so sánh-lịch sử có thể giúp chúng ta phát<br />
hiện ra sự thân thuộc giữa các ngôn ngữ về mặt cội nguồn. ðây là phương pháp thông<br />
qua sự ñối sánh về mặt ngữ âm, từ vựng và ngữ pháp giữa hai hoặc nhiều phương ngữ<br />
hoặc các ngôn ngữ thân thuộc ñể rút ra quy luật diễn biến, từ ñó xác ñịnh nguồn gốc của<br />
một ngôn ngữ. Phương pháp này dựa trên yếu tố tĩnh của sự phân bố từ vựng ñể xem<br />
xét yếu tố ñộng của quá trình diễn biến từ, như sự sản sinh từ mới nghĩa mới, sự tiêu<br />
vong lớp từ cũ nghĩa cũ… Ngoài ra, phương pháp này cũng xem xét ñặc ñiểm phân bố<br />
về mặt ñồng ñại và quy luật diễn biến về mặt lịch ñại các từ mục trong nhóm từ có<br />
trường nghĩa.<br />
Do vậy, phương pháp phân tích trường nghĩa cũng không thể thiếu khi xác ñịnh<br />
nguồn gốc từ. F. de Saussure trong Giáo trình ngôn ngữ học ñại cương ñã chỉ ra hai<br />
dạng quan hệ, ñó là quan hệ ngang (quan hệ tuyến tính, quan hệ ngữ ñoạn) và quan hệ<br />
dọc (quan hệ liên tưởng, quan hệ hệ hình). Theo hai dạng quan hệ ñó có thể có hai loại<br />
46<br />
<br />
trường nghĩa: trường nghĩa ngang (trường nghĩa tuyến tính) và trường nghĩa dọc (trường<br />
nghĩa liên tưởng). Chúng ta nên sử dụng trường nghĩa dọc (bao gồm trường nghĩa biểu<br />
vật và trường nghĩa biểu niệm) ñể khảo sát và xác ñịnh từ nguyên. A.G.Haudricourt khi<br />
phân tích một nhóm từ cụ thể (nhóm từ chỉ bộ phận cơ thể như mắt, tai mũi, miệng,<br />
răng, lưỡi, cổ, tay…) ñã cho thấy “sự tương ứng về từ vựng cơ bản giữa tiếng Việt và<br />
các ngôn ngữ Môn-Khmer là sự tương ứng mang tính bản chất cội nguồn, khác với sự<br />
tương ứng giữa tiếng Việt với các ngôn ngữ Thái” [5, trang 96]. ðể xác ñịnh giữa các<br />
ngôn ngữ có quan hệ ñồng nguyên ñồng tộc, thì phải có một số lượng từ ñồng nguyên<br />
ñáng kể ñể chứng minh. Ngôn ngữ học lịch sử (historical linguistics) dựa lớp từ vựng cơ<br />
bản ñó so sánh ñối chiếu ñể “quyết ñịnh những ngôn ngữ nào cùng có chung một tổ tiên,<br />
và do ñó, có những ngữ hệ nào, tiến hành phục nguyên ñể vạch ra ñặc tính của cái ngôn<br />
ngữ gốc không ñược ghi (các tiền ngôn ngữ), nhận diện những thay ñổi khác nhau khiến<br />
mỗi ngôn ngữ mẹ phân tách thành một số ngôn ngữ con” [6, trang 294]. A. G.<br />
Haudricourt cũng từng nhấn mạnh trong trường hợp xếp loại nguồn gốc tiếng Việt “cái<br />
quyết ñịnh là từ vựng cơ bản” [7, trang 20]. Tuy nhiên, việc xác ñịnh cho ñược ñâu là<br />
lớp từ vựng cơ bản, ñâu là lớp từ vựng vay mượn hay từ vựng văn hóa thực sự không dễ<br />
dàng. Do bởi trong quá trình phát triển, có rất nhiều ngôn ngữ ñã bị phân hóa thành<br />
nhiều nhóm, nhiều dòng ngôn ngữ khác nhau. Tiếng Việt cũng không ngoại lệ. Công<br />
việc của các nhà ngôn ngữ học lịch sử là truy nguyên ngôn ngữ ñược cho là ngôn ngữ<br />
nguồn ñó, là “bà mẹ” sản sinh ra các dòng ngôn ngữ sau này, từ ñó tiến hành quy nạp<br />
chúng vào những chi, những họ, những ngành khác nhau dựa trên mức ñộ thân thuộc<br />
nhiều hay ít. Khi tiến hành nghiên cứu so sánh-lịch sử, nếu chúng ta chưa xác ñịnh ñược<br />
ñâu là cội nguồn, ñâu là vay mượn trong nhóm từ vựng giống nhau giữa hai hay nhiều<br />
ngôn ngữ, thì chưa ñủ ñiều kiện ñể xác ñịnh quan hệ họ hàng thân thuộc giữa chúng.<br />
Tuy nhiên, A. G. Haudricourt cũng thừa nhận các ngôn ngữ không có biến hóa hình thái<br />
như tiếng Việt cũng có sự vay mượn từ vựng cơ bản. Do vậy, các nhà nghiên cứu muốn<br />
ñạt ñược mục ñích phân loại trong số những từ tương ứng giữa hai hay nhiều ngôn ngữ,<br />
từ nào mang tính cội nguồn, từ nào mang tính vay mượn, thì phải xem xét chúng theo<br />
từng nhóm từ vựng có ý nghĩa trọn vẹn, tức là sử dụng phương pháp phân tích trường<br />
nghĩa như ñã nói ở trên.<br />
3. Bảng 100 từ cơ bản của Swadesh<br />
Morris Swadesh (1909-1967) là nhà ngôn ngữ học người Mỹ. Ông ñề nghị<br />
phương pháp xác ñịnh thời gian tách rời (length of separation) của hai ngôn ngữ cùng<br />
một nguồn, bằng cách tìm ra bao nhiêu từ thay ñổi khi so sánh số vốn từ căn bản. ðây<br />
cũng là nền tảng của một ngành ngôn ngữ học mới gọi là Glottochronology (môn học<br />
xác ñịnh tuổi của ngôn ngữ), hay còn gọi là “phương pháp Ngữ thời học, vắn tắt hơn là<br />
phương pháp Swadesh” [8, trang 8]. Chính phương pháp này ñã ñưa ngôn ngữ học, một<br />
ngành theo truyền thống khoa học nhân văn, trở nên một ngành ngôn ngữ ñịnh lượng<br />
(quantitative linguistics) và ñem môn này ñến gần các ngành khoa học chính xác khác.<br />
47<br />
<br />
GS. Nguyễn Tài Cẩn trong giáo trình Lịch sử ngữ âm tiếng Việt (sơ thảo) ñã vận<br />
dụng có phê phán phương pháp Swadesh, ñó là phương pháp xuất phát từ quan niệm<br />
cho rằng, qua thời gian, việc thay thế từ vựng cơ bản cổ bằng từ vựng mới là một việc<br />
xảy ra theo quy luật chung cho mọi ngôn ngữ. Theo sự thống kê và tính toán trên một số<br />
lượng rất nhiều ngôn ngữ, phương pháp này ñưa ra cách xác ñịnh như sau: cứ qua 1000<br />
năm thì số lượng từ trong kho từ vựng cơ bản của một ngôn ngữ sẽ bị mất ñi 15%, chỉ<br />
còn lại 85%. Như vậy, nếu hai ngôn ngữ hay hai phương ngữ A, B cùng gốc tách nhau<br />
khoảng 1.000 năm, thì trong bảng từ vựng chúng chỉ còn giữ lại 74% là chung<br />
(85%85%=74%); nếu tách nhau 2.000 năm, thì số từ vựng chung còn lại chiếm<br />
khoảng 55% (74%74%=55%); tách nhau 4.000 năm, thì số từ vựng chung còn lại chỉ<br />
chiếm khoảng 30% (55%55%=30%); tách nhau 8.000 năm, thì số từ vựng chung còn<br />
lại càng ít hơn, chỉ chiếm khoảng 9% (30%30%=9%). Qua hơn 8000 năm thì lượng từ<br />
cơ bản chung sẽ rút ñi tới mức không thể xác lập nổi mối quan hệ nguồn gốc giữa hai<br />
ngôn ngữ nữa.<br />
Swadesh năm 1952 ñề xuất ra Bảng 200 từ cơ bản. 200 từ này có ñược trên cơ<br />
sở ông phân tích, quy nạp các ngôn ngữ ở châu Âu, châu Mỹ, châu Phi và châu Úc. Ban<br />
ñầu ông cho rằng 200 từ này là lớp từ cơ bản ổn ñịnh nhất trong tất cả các ngôn ngữ,<br />
nhưng trong quá trình nghiên cứu sau ñó, ông nhận thấy có khá nhiều từ trong Bảng có<br />
thể vay mượn qua lại lẫn nhau, vì thế năm 1955 ông rút gọn lại chỉ còn 100 từ cơ bản. Ý<br />
ñồ của ông là muốn có một ranh giới dứt khoát giữa vấn ñề vay mượn hay không vay<br />
mượn, tuy nhiên sau này theo khảo sát của một số nhà nghiên cứu thì trong Bảng 100 từ<br />
này vẫn có một số từ có thể vay mượn, nhưng ít hơn nhiều so với Bảng 200 từ. Có thể<br />
nói Bảng 100 từ cơ bản ñã xác ñịnh ñược lớp từ vựng ổn ñịnh nhất trong mọi ngôn ngữ<br />
và ñã trở thành Bảng 100 từ thông dụng trên thế giới khi khảo sát nguồn gốc từ. Vì vậy<br />
ứng dụng Bảng 100 từ cơ bản của Swadesh vào truy nguyên gốc tích tiếng Việt sẽ trở<br />
nên thuận tiện hơn cho các nghiên cứu khi so sánh ñối chiếu với Bảng 100 từ cơ bản của<br />
các ngôn ngữ khác mà ñã ñược khảo sát trước ñó. ðiều cần lưu ý là do Swadesh chỉ<br />
khảo sát các ngôn ngữ Ấn Âu. Vì vậy, khi áp dụng vào các ngôn ngữ vùng châu Á nói<br />
chung và ðông Nam Á nói riêng, nơi liên tục xảy ra các cuộc di cư và hội tụ của các tộc<br />
người, nơi mà sự tiếp xúc giữa các chi nhóm ngôn ngữ là xảy ra thường xuyên và lâu<br />
dài, thì khi áp dụng phương pháp này ñòi hỏi phải nghiên cứu trên quan ñiểm so sánh ña<br />
ngữ thì mới có cái nhìn khoa học hơn về nguồn gốc tiếng Việt.<br />
F. de Saussure trong Giáo trình ngôn ngữ học ñại cương (1916) cũng ñã dành<br />
một chương Ngôn ngữ học ñịa lý phân tích khá rõ nguyên nhân tạo nên sự khác biệt<br />
trong lịch sử diễn biến ngôn ngữ, ñó là tìm hiểu những vấn ñề ñịa lý liên quan tới nó.<br />
Bởi vì, “mối liên hệ giữa lịch sử phát triển, tức mặt thời gian, với môi trường phát triển,<br />
tức mặt không gian, là một liên hệ có tính bản chất của bất kỳ một sự phát triển nào” [9,<br />
trang 334]. Như ñã nói ở trên, do hiện nay nhận thức chung của ña số các nhà ngôn ngữ<br />
là tiếng Việt thuộc ngữ hệ Nam Á, do ñó, dấu vết từ vựng của họ ngôn ngữ này trong<br />
48<br />
<br />
tiếng Việt ñược coi là cội nguồn, các ngôn ngữ khác chỉ ñược coi là ngôn ngữ láng<br />
giềng chứ không phải là ngôn ngữ thân thuộc. Quan hệ giữa tiếng Việt với các ngôn ngữ<br />
láng giềng này chỉ là quan hệ tiếp xúc vay mượn lẫn nhau, do vị trí ñịa lý quá gần nhau,<br />
và những sự tiếp xúc lâu dài giữa cư dân các vùng miền xảy ra trong một thời gian dài.<br />
Tuy nhiên, cũng chính vì ñiều này mà khiến cho lớp từ vựng ñược coi là vay mượn ñôi<br />
khi thực sự rất khó xác ñịnh, vô hình trung ñược coi là yếu tố cội nguồn. Ví dụ như theo<br />
một số kết quả nghiên cứu hiện nay, thì chúng ta có thể nhận ñịnh rằng tiếng ViệtMường ñã từng có những sự tiếp xúc lâu dài với các ngôn ngữ thuộc họ Nam ðảo.<br />
Chứng cứ của sự tiếp xúc này là trong vốn từ tiếng Việt hiện nay vẫn còn một lớp từ rất<br />
cổ xưa có nguồn gốc Mã Lai-ða ñảo (xem thêm mục 4.3). Bởi vì thời gian tiếp xúc quá<br />
xa xưa, vì vậy khó có thể kết luận ngôn ngữ nào vay mượn ngôn ngữ nào, và cũng khó<br />
có thể nói những từ rất cơ bản, rất cổ xưa ấy là những từ vay mượn chứ không phải là từ<br />
cơ bản. ðây chính là khó khăn lớn nhất, gây nhiều tranh cãi nhất khi xác ñịnh nguồn<br />
gốc tiếng Việt, và sự tranh cãi trong gần suốt 200 năm này thậm chí cho ñến giờ xem ra<br />
vẫn còn chưa ngã ngũ…<br />
Từ lúc lý thuyết của Swadesh ra ñời ñã có những khảo cứu từ những ngôn ngữ<br />
khác nhau trên thế giới cho thấy kết quả tương ñối khả quan và hiện ñang ñược sử dụng<br />
vì có một số lợi ích thiết thực và thành tựu ñáng kể. Tuy nhiên cũng có nhiều tranh luận<br />
về các tiền ñề cơ bản của lý thuyết này, như tốc ñộ thay ñổi của ngôn ngữ không luôn<br />
ñều ñặn. Có quá nhiều yếu tố ảnh hưởng ñến sự thay ñổi của ngôn ngữ như các biến cố<br />
lịch sử xã hội (chiến tranh xâm lược, thôn tính ñất ñai, các cuộc cách mạng…), vì vậy<br />
mốc thời gian thay ñổi không thể là một hằng số. Mặc dù vậy, Bảng 100 từ cơ bản của<br />
Swadesh có thể ñược coi là Bảng chuẩn hiện nay cho việc xác ñịnh từ vựng cơ bản của<br />
tất cả các ngôn ngữ. Bảng này có thể tạm chia thành các nhóm sau:<br />
a. Nhóm sự vật hiện tượng thiên nhiên<br />
1. Mặt trời (sun); 2. Mặt trăng (moon); 3. Sao (star); 4. Nước (water); 5. Mưa<br />
(rain); 6. Mây (cloud); 7. ðá (stone); 8. Cát (sand); 9. ðất (earth); 10. Núi (mountain);<br />
11. ðường (path); 12. Lửa (fire); 13. Khói (smoke); 14. Tro (ash); 15. ðêm (night).<br />
b. Nhóm bộ phận cơ thể người<br />
16. ðầu (head); 17. Tóc (hair); 18. Mắt (eye); 19. Mũi (nose); 20 Răng (tooth);<br />
21. Lưỡi (tongue); 22. Tai (ear); 23. Miệng (mouth); 24. Cổ (neck); 25. Tay (hand); 26.<br />
Bụng (belly); 27. Vú (breasts); 28. Chân (foot); 29. Da (skin); 30. Tim (heart); 31. Gan<br />
(liver); 32. Xương (bone); 33. ðầu gối (knee); 34. Máu (blood); 35. Thịt (flesh).<br />
c. Nhóm ñộng thực vật<br />
36. Chim (bird); 37. Cá (fish); 38. Chó (dog); 39 Chí/Rận (louse); 40. Cây (tree);<br />
41. Hạt (seed); 42. Lá (leaf); 43. Gốc/Rễ (root); 44. Vỏ cây (bark); 45. Dầu/Mỡ<br />
(grease); 46. Trứng (egg); 47. ðuôi (tail); 48. Sừng (horn); 49. Lông (feather); 50. Móng<br />
49<br />
<br />