NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 3
...................................................................................................................................................................................
MÔ HÌNH NGÔN NG LN VÀ NG DNG:
NGHIÊN CỨU ĐIỂN HÌNH V PHÂN TÍCH CM XÚC
TRN KHI THIN
*
Tóm tt: Hin nay, mô hình ngôn ng lớn (LLMs) đã chứng minh tiềm năng vượt tri
trong ngôn ng hc tính toán. Bài báo này tp trung vào ng dng ca LLMs trong phân tích
cm xúc, một lĩnh vực quan trng vi nhiu ng dng thc tin. Qua nghiên cu mt tình
hung c th, chúng tôi trình y hiu qu của các hình như GPT-4o trong phân tích
đánh giá cảm xúc t văn bản. Bài báo cũng thảo lun v trin vng, thách thc k thuật và đạo
đức khi trin khai LLMs vi mục tiêu thúc đy s tho luận và trao đổi ýng gia các nhà
nghiên cứu và chuyên gia trong lĩnh vực này..
T khóa: hình ngôn ng ln; phân tích cm xúc; k thut li nhc; tiếng Vit,
prompt engineering; LLMs
I. GII THIU
Trong thp k qua, trí tu nhân to (Artificial Intelligence - AI) đã đạt được nhng
bước tiến vượt bc, đặc bit trong ngôn ng hc tính toán, x lý ngôn ng t nhiên. S ra
đời ca các mô hình ngôn ng ln (Large Language Models - LLMs) như GPT-4o [1] đã mở
ra mt k ngun mới, nơi mà máy tính không chỉ hiểu được ngôn ng của con người mà còn
có kh năng tạo sinh ngôn ng vi mức độ tinh vi và sáng to đáng kinh ngạc. Vin cnh máy
tính th trò chuyện như con người, hiểu ý nghĩa sâu xa trong li nói và sáng to ra nhng
tác phẩm văn học không còn là khoa hc viễn tưởng mà đang dần tr thành hin thc.
LLMs đã và đang chứng minh kh năng vượt tri trong nhiu ng dng ca ngôn ng
hc tính toán. Chúng h tr tóm tắt văn bản [2], giúp người dùng nhanh chóng nm bt ni
dung chính ca các tài liu dài và phc tp. Bên cnh đó, khả năng dịch t động [3] ca LLMs
đã phá vỡ rào cn ngôn ngữ, thúc đy giao tiếp hp tác hiu qu trên phm vi toàn cu.
Không ch dng li đó, LLMs còn được s dụng để phát trin chatbot thông minh [4], có th
tham gia vào các cuc trò chuyện mượt ý nghĩa với con người, nâng cao tri nghim
người dùng trong nhiều lĩnh vực như dịch v khách hàng giáo dục. Đặc bit hơn, LLMs
còn giúp khơi nguồn sáng to, h tr người dùng trong việc sáng tác thơ ca, âm nhạc, viết kch
bn và to ra ni dung cun hút trong nhiều lĩnh vực ngh thut [5].
Mt trong những lĩnh vc quan trọng và đầy thách thc trong ngôn ng hc tính toán
là phân tích cảm xúc, liên quan đến vic nhn din phân loi cảm xúc, thái đ t văn bản.
ng dng ca phân tích cm xúc rất đa dng, t tiếp th, dch v khách hàng đến nghiên cu
xã hội, nơi việc hiểu được cảm xúc và quan điểm của người dùng đóng vai trò then chốt. Vic
*
TS, Trường Đi hc Ngoi ng - Tin hc TP. HCM; Email: thientk@huflit.edu.vn
4 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
khai thác LLMs vào bài toán này ha hn mang li nhng ci tiến đáng kể, nh kh năng hiểu
ng cảnh và ý nghĩa sâu sắc trong ngôn ng t nhiên, vượt xa các phương pháp truyền thng.
Trong bài báo y, chúng tôi tp trung vào vic ng dng LLMs trong phân tích cm
xúc thông qua mt nghiên cứu điển hình c th. Chúng tôi s trình bày hiu qu ca các
hình như GPT-4o trong việc phân tích và đánh giá cảm xúc t văn bản, minh ha qua các thí
nghim và kết qu thc nghim chi tiết. Đồng thi, chúng tôi tho lun v trin vng, nhng
thách thc k thuật đạo đức khi trin khai LLMs trong lĩnh vực này, bao gm vic x
định kiến ngôn ng bo mật thông tin người dùng. Mc tiêu của chúng tôi thúc đẩy s
tho luận và trao đổi ý tưởng gia các nhà nghiên cu và chuyên gia trong ngôn ng hc tính
toán, góp phn vào s phát trin bn vng và ng dng hiu qu của LLMs trong tương lai.
II. TNG QUAN V MÔ HÌNH NGÔN NG LN
Mô hình ngôn ngmt phân phi xác sut trên các chui từ, ước tính xác sut xut
hin ca mt t trong ng cnh ca các t khác. Vi mt chui t có độ dài m, mô hình ngôn
ng gán mt xác sut cho toàn b chuỗi đó. Thut ng "ln" trong "mô hình ngôn ng ln"
không ch ám ch đến quy mô t vng khng l mà các hình này x lý, mà còn phn ánh
độ phc tp ca các thuật toán dùng để ước tính xác sut này.
Nghiên cu v hình ngôn ng đã những bước phát triển vượt bc nh s xut
hin ca kiến trúc Transformer [6]. Các LLMs tiên tiến, như OpenAI’s GPT, Meta's Llama,
Google's Gemini, vi kh năng tạo sinh văn bn t nhiên gn giống con người, đã tạo ra mt
cuc cách mạng trong lĩnh vực AI.
LLMs áp dng mt lot các quy trình phc tp bao gm tin x lý văn bn, biu din
văn bản, tin hun luyn (pre-training), sau đó tinh chnh (fine-tuning) hoc s dng k
thut thiết kế li nhc (prompt engineering), tùy thuc vào mc tiêu và yêu cu c th ca ng
dng.
- Tiền xử văn bản bước đầu tiên, nơi dữ liệu văn bản được làm sạch chuẩn
hóa để tạo ra một tập dữ liệu chất lượng cao cho hình học tập. Quá trình này bao gồm
việc loại bỏ ký tự không mong muốn, xử lý dấu câu, chuyển đổi chữ hoa thành chữ thường
loại bỏ các từ thừa. Mục tiêu đảm bảo rằng dữ liệu đầu vào nhất quán phù hợp
cho quá trình huấn luyện.
- Tiếp theo, biểu diễn văn bản sẽ chuyển đổi văn bản đã tiền xử thành dạng
hình thể hiểu được. Điều này thường liên quan đến việc phân tách từ (tokenization)
chuyển đổi các token này thành các biểu diễn số (embedding). Các biểu diễn số cho phép
hình xử lý dữ liệu văn bản dưới dạng toán học, giúp nắm bắt ý nghĩa và ngữ cảnh của từ ngữ
trong không gian nhiều chiều.
- Trong giai đoạn tiền huấn luyện, mô hình được huấn luyện trên một lượng lớn dữ
liệu văn bản không có nhãn để học các mẫu ngôn ngữ và cấu trúc cú pháp. Phương pháp học
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 5
...................................................................................................................................................................................
tự giám sát như hình hóa ngôn ngữ hai chiều (bidirectional language modeling) BERT
[7] hoặc mô hình hóa ngôn ngữ dự đoán từ tiếp theo (unidirectional) GPT [8] được sử dụng.
Mục tiêu giúp hình hiểu ngữ cảnh quan hệ giữa các từ trong câu, xây dựng kiến
thức ngôn ngữ tổng quát mà không cần sự can thiệp của con người.
Để áp dụng mô hình đã tiền huấn luyện vào các nhiệm vụ cụ thể, có hai phương pháp
chính:
- Tinh chỉnhquá trình điều chỉnh mô hình bằng cách huấn luyện lại trên dữ liệu có
nhãn cho nhiệm vụ cụ thể. Quá trình này điều chỉnh các trọng số của mô hình để tối ưu hóa
hiệu suất cho các tác vụ như phân loại văn bản, trả lời câu hỏi hoặc dịch máy, giúp mô hình
thích nghi sâu sắc với nhiệm vụ mới.
- Kỹ thuật lời nhắc phương pháp hướng dẫn hình thực hiện nhiệm vụ cụ thể
không cần thay đổi hoặc huấn luyện lại hình. Bằng cách tạo ra các lời nhắc (prompts)
hiệu quả, cung cấp ngữ cảnh, hướng dẫn hoặc dụ minh họa, hình thể được điều
chỉnh để tạo ra kết quả mong muốn.
- Việc tuân theo chuỗi quy trình kể trên cho phép LLMs xây dựng từ hiểu biết cơ bản
về ngôn ngữ đến khả năng thực hiện các nhiệm vụ ngôn ngữ phức tạp. Mỗi bước đều quan
trọng và đóng góp vào hiệu suất tổng thể của mô hình, giúp mô hình linh hoạt và hiệu quả
trong nhiều ứng dụng ngôn ngữ tự nhiên.
III. NGHIÊN CỨU ĐIỂN HÌNH: PHÂN TÍCH CM XÚC VI LLMs
1. Bài toán phân tích cm xúc
Phân tích cm xúc một lĩnh vực thuc x ngôn ng t nhiên (Natural Language
Processing - NLP), tp trung vào việc xác định phân tích các sc thái tình cm được th
hiện trong văn bản. Quá trình này thường bao gm phân loại văn bản thành các cm xúc tích
cc, tiêu cc, trung lp hoặc phân tích sâu hơn các trạng thái cảm xúc như vui v, tc gin,
bun bã. Phân tích cm xúc bắt đầu phát trin t những năm 2000 với các phương pháp chủ
yếu da trên quy tc, s dng t điển cm xúc hình da trên quy tắc để phát hin cm
xúc. Vi s tiến b ca học máy và sau đó là học sâu, các phương pháp này đã được ci thin
đáng kể, cho phép x d liu lớn hơn và phân tích cảm xúc một cách tinh vi hơn. Tuy nhiên,
lĩnh vực này cũng đi mt vi nhiu thách thc. Các t câu trong văn bản thường mang
nhiều nghĩa khác nhau tùy theo ngữ cảnh, điều này gây khó khăn cho việc c định chính xác
cm xúc. Ngoài ra, vic phát hin châm biếm ma mai mt thách thc ln, h thng
không ch cn hiểu văn bản mà còn phi nhn biết được ý định của người nói.
nhiu cấp độ khác nhau trong phân tích cm xúc: phân tích cấp đ i liu (xác
định cm xúc tng th ca mt tài liu), cấp độ câu (phân tích cm xúc từng câu đểcái nhìn
chi tiết hơn), và phân tích cảm xúc theo khía cạnh (liên quan đến các thuc tính c th trong
văn bản, ví d như đánh giá các khía cạnh ca sn phm).
6 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
Phương pháp truyền thng trong phân ch cm xúc ch yếu da trên các h thng t
điển mu ngôn ng để xác định cảm xúc, nhưng thường gp hn chế trong vic x lý các
ng cnh phc tp và cảm xúc đa chiều. Vi s ra đời ca hcy, các thut toán như Naive
Bayes SVM đã giúp ci thin quá trình phân tích cm xúc, tuy nhiên vn yêu cu nhiu
công đoạn x lý đặc trưng và gặp khó khăn trong việc tng quát hóa.
Học sâu, đặc bit vi các mô hình mng RNN (Recurrent Neural Networks) và LSTM
(Long Short-Term Memory), đã giúp x lý các chuỗi văn bản dài phc tp nh kh năng
lưu giữ thông tin t các trạng thái trước đó. Tuy nhiên, một hn chế ca RNN LSTM
chúng gặp khó khăn khi xử lý các chui rt dài do vấn đề bt nhớ” thông tin xa.
S xut hin ca kiến trúc Transformer đã tạo ra bước đột phá trong NLP, đặc bit vi
các LLMs như BERT GPT. Những hình này không ch nâng cao kh năng hiểu ng
cnh và ng nghĩa, mà còn cải thiện đáng kể độ chính xác trong các tác v phc tạp như phân
tích cm xúc, đặc bit khi x lý các biểu đạt ng nghĩa tinh tế.
2. K thut li nhc trong LLMs cho phân tích cm xúc
K thut li nhc là một phương pháp hướng dn mô hình ngôn ng thc hin các tác
v thông qua việc điều chỉnh đầu vào văn bản mà không cn thay đổi trc tiếp các tham s ca
hình. Các k thuật y đã chứng t kh năng đạt được hiu sut cao trong các tác v c
th ch bng cách cung cp mt s ít các điều kin hoc d minh họa đơn giản. Vic thiết
kế li nhc phù hp cho phép mô hình s dng hiu qu kiến thức đã học trong giai đoạn tin
hun luyn và gii quyết các tác v mi vi s điều chnh ti thiu. Các k thut li nhc tiêu
biu bao gm:
Zero-shot learning: hình được yêu cu thc hin mt tác v không
d c th nào v tác v đó. Dựa trên các t v yêu cu t đầu vào và kiến thc sn,
mô hình đưa ra dự đoán mà không cần hun luyn thêm.
One-shot learning: Mô hình thc hin tác v vi mt ví d minh ha duy nht.
d này giúp hình hiểu được yêu cu ca c v t đó đưa ra kết qu da trên kiến
thức đã học.
Few-shot learning: hình đưc cung cp mt s ít d minh ha (các cp
đầu vào - nhãn) để hiu yêu cu ca tác v. Vic s dng một lượng nh d liu mu giúp mô
hình thích ng và ci thin hiu sut trên các tác v c th.
Chain-of-thought (CoT): K thut y cho phép hình thc hiện các bước
lp luận trung gian rõ ràng trước khi đưa ra câu trả li cuối cùng. Các bước lp luận này được
minh ha bng các ví d tương tự để mô hình hc cách gii quyết vấn đề mt cách logic và
h thng.
Zero-shot CoT: Mô hình thc hin chui lp luận như trong CoT nhưng không
bt k d minh ha nào. Thay vào đó, hình được định hướng bng các gi ý ngôn
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 7
...................................................................................................................................................................................
ng như Hãy suy lun theo từng bước”, nhằm khuyến khích hình t trin khai các suy
lun mt cách mch lc.
Các k thut này không ch giúp tối ưu hóa khả năng thực thi ca hình trong các
tình hung ít d liu còn m rng kh năng áp dụng ca các LLMs trong nhiu ng cnh
phc tp. Hình 1 biu din vic s dng LLMs cho phân tích cm xúc của người dùng bng
cách cung cấp các hướng dn (li nhc) giống nngôn ngữ t nhiên, s dng Zero-shot
learning [9].
Hình 1. Sử dụng kỹ thuật lời nhắc trong LLMs, chúng ta có thể nhanh chóng phân loại
các đánh giá của người dùng bằng cách cung cấp các hướng dẫn giống như ngôn ngữ tự nhiên
[9]. 3. Tinh chnh LLMs cho phân tích cm xúc
Tinh chnh các LLMs như BERT GPT bao gồm việc điều chỉnh các hình đã
được hun luyện trước cho các tác v c th như phân tích cảm xúc bng cách hun luyn
chúng trên các tp d liệu có nhãn. Quá trình y điều chnh các tham s của mô hình để nm
bt tốt hơn các sắc thái cm xúc trong d liệu văn bản.
d, vic tinh chnh BERT bao gm vic thêm mt lp phân loi lên trên kiến trúc
BERT để d đoán nhãn cảm xúc da trên các biu din ng cnh được tạo ra cho văn bản đầu
vào. Quá trình hun luyện hình đã được b sung lp phân loi này trên tp d liu gán
nhãn cm xúc cho phép mô hình học được các liên kết giữa đặc trưng văn bản và kết qu cm
xúc.
Tương tự, các mô hình như GPT-4o có th được tinh chnh cho nhiu tác v khác nhau
ca NLP [10], chng hạn như cho phân tích cm xúc. Bng cách cung cp cho mô hình d liu
hun luyn c th v cm xúc, mô hình học cách đưa ra d đoán chính xác hơn về sc thái cm
xúc ca các d liu mới, chưa từng thấy trước đó. Quá trình tinh chỉnh này nâng cao kh năng