
615
Bùi Anh Tuấn
Phan Như Huỳnh
Nguyễn Ngọc Phương Anh
Trường Đại học Cần Thơ
Tóm tắt: Trong xu hướng dạy học chuyển đổi số thời kì 4.0, việc khai thác các
tài liệu dạy học (văn bản, video,…) nhờ vào công cụ kĩ thuật số đóng vai trò quan trọng.
Dựa vào xu hướng đó đã có rất nhiều phần mềm cũng như công cụ hỗ trọ được tạo
ra; trong đó ATLAS.ti, một phần mềm của Đức, được sử dụng rộng rãi bởi sự đa dạng
và miễn phí. Bài viết này trình bày các ứng dụng nổi bật của ATLAS.ti trong việc hỗ trợ
công tác tìm hiểu, nghiên cứu tài liệu học tập cho một số môn học, từ đó thúc đẩy hiệu
quả học tập hơn cho học sinh và làm nguồn tài liệu bổ ích cho giáo viên.
Từ khóa: Chuyển đổi số, Giáo dục 4.0, ATLAS.ti, Tài liệu online.
1. Giới Thiệu
Thời kỳ Công nghiệp 4.0 đang đưa ra những thách thức mang tính nhanh
chóng và theo kịp thời đại. Trong đó, thuật ngữ “chuyển đổi số” ngày càng được
biết đến trong thời gian gần đây ở hầu hết các lĩnh vực, đây chính là quá trình sử
dụng các công nghệ mới để chuyển đổi các thông tin ở thế giới thực sang kĩ thuật
số (Trần et al., [16]). Theo Gaikwad et al. [4] cho rằng từ sự tăng trưởng của dữ
liệu số, việc khám phá kiến thức và khai thác dữ liệu ngày càng thu hút sự chú ý
vì tính ứng dụng của nó. Một trong những kĩ thuật nổi bật được sử dụng để phân
tích văn bản là Text Mining. Điển hình là công trình Raja et al. [13] đã dùng Text
Mining khai thác văn bản của dữ liệu hồ sơ lâm sàng điện tử để chứa một khối
lượng lớn các thông tin bệnh án của các bệnh nhân. Công trình của Tuan et al.
[18] đã phân tích bài thơ Divan of Hafiz nhằm để xác định số lượng từ và phân
loại những từ quan trọng trong bài thơ. Grobelnik et al. [5] đã sử dụng công nghệ
hỗ trợ khai thác văn bản trong xuất bản để làm tăng số lượng khách hàng tiếp
cận. Ngoài ra, với các phương pháp khai thác văn bản trong nghiên cứu của
Lamurias và Couto [10] đã giúp cho người học dễ dàng truy xuất thông tin từ
nguồn tài liệu y sinh khổng lồ. Theo Jalali et al. [9] cho rằng hiện nay các tài
nguyên trực tuyến, cụ thể là dữ liệu lớn bao gồm văn bản, hình ảnh, video,… đã
làm cho các phương pháp khai thác văn bản truyền thống khó thực hiện được. Từ
đó, việc thúc đẩy sự phát triển của các công cụ để hỗ trợ quá trình khai thác dữ

616
liệu như: NVivo, ATLAS.ti, Quirkos, MAXQDA,… là các chương trình hỗ trợ
nghiên cứu phương pháp phân tích định tính bằng cách mã hóa dữ liệu đầu vào.
Trong đó, ATLAS.ti cho phép khám phá nhiều tài liệu nghiên cứu cùng một lúc,
làm giảm thời gian và số lượng sai lầm, ngoài ra còn có thể dễ dàng tìm kiếm,
sao chép và dán các trích dẫn. Ngalande và Mkwinda [11] nhận thấy được việc
trang bị đủ kiến thức và kĩ năng sử dụng ATLAS.ti là một lợi ích đối với bất kỳ
cơ sở Giáo dục Đại học nào.
Trong quá trình học tập, việc nghiên cứu các tài liệu dạy học từ giáo viên
và các nguồn trên Internet là điều vô cùng quan trọng mà mỗi học sinh nói riêng
và tất cả chúng ta nói chung khi thật sự muốn nắm toàn diện một vấn đề. Từ đây,
việc phân tích tài liệu rõ ràng, chính xác, đúng trọng tâm sẽ mang lại lợi ích lớn
đến việc cải thiện chất lượng học tập của học sinh mà còn tiết kiệm lượng lớn
thời gian. Theo nghiên cứu của Nguyễn [12], việc tìm kiếm những thông tin hữu
ích, tin cậy và chính xác về bệnh học lưu trữ tại các bệnh viện bằng kĩ thuật khai
phá dữ liệu là rất cần thiết. Việc chắt lọc đúng thông tin từ các tài liệu học tập là
một giải pháp vô cùng cần thiết khi khối lượng dữ liệu trên Web sinh ra liên tục
mỗi ngày (Hoàng Minh Hiền, [7]).
Từ những thực trạng trên, nghiên cứu này tiến hành phân thích các ứng
dụng nổi bật của ATLAS.ti trong việc hỗ trợ phân tích tài liệu học tập ở một số
môn Toán học, Lịch sử, Ngữ văn và hướng mở rộng thêm cho tất cả các môn học
khác trong chương trình giáo dục phổ thông. Các phần còn lại của bài báo được
trình bày theo các trình tự sau: Phần 2 trình bày cơ sở lí luận về khai thác văn
bản, phương pháp phân tích cụm dữ liệu và khai thác video, phần mềm ATLAS.ti
cũng như chọn lọc và giới thiệu các tài liệu phân tích các môn học. Phần 3 trình
bày phương pháp nghiên cứu và kết quả phân tích bài học. Phần 4 trình bày kết
luận và hướng phát triển đề tài.
2. Cơ sở lý luận
2.1 Khai thác dữ liệu văn bản và video
Khai thác văn bản (Text mining/ Text data mining) là một quá trình xử lý
và trích xuất thông tin trong văn bản, quá trình này là một phần của việc phân
tích văn bản. Khai thác văn bản đã trở thành một nghiên cứu quan trọng đây là
sự khám phá các thông tin chưa biết bằng cách tự động trích xuất thông tin từ các
tài nguyên văn bản khác nhau (Gupta và Lehal, [6]). Quá trình này bao gồm các
hoạt động như tóm tắt văn bản, phân cụm tài liệu, định vị các từ viết tắt và định
nghĩa của chúng (Witten et al., [20]).
Một số nhà nghiên cứu đã áp dụng kĩ thuật khai thác văn bản vào các dự án
nghiên cứu định tính và đã xem khai thác văn bản như một công cụ hữu ích mang
tính khả thi. Các tài liệu về bằng sáng chế chứa rất nhiều các thông tin về kết quả
nghiên cứu quan trọng, tuy nhiên chúng dài và giàu thuật ngữ kĩ thuật nên cần

617
rất nhiều thời gian để phân tích do đó các công cụ phân tích tự động mang lại rất
nhiều lợi ích như phân đoạn văn bản, trích xuất tóm tắt, liên kết thuật ngữ cũng
như xác định chủ đề (Tseng et al., [17]). Gaikwad et al. [4] đã đề xuất quy trình
khai thác văn bản gồm 5 bước (Hình 1).
Hình 1. Quá trình khai thác văn bản
Bên cạnh các dữ liệu văn bản thì video tạo khả năng nắm bắt thông tin tốt
hơn, sâu hơn so với chữ viết và hình ảnh tĩnh, để nghiên cứu dữ liệu video, có
thể sử dụng phần mềm như Vivo hoặc ATLAS.ti (Wang et al., [19]) từ đó cho
thấy các dữ liệu được đưa vào khai thác bằng các phần mềm phân tích định tính
từ các văn bản cho đến các đoạn video.
2.2 Giới thiệu phần mềm ATLAS.ti
ATLAS.ti là một chương trình máy tính phân tích dữ liệu định tính
(computer assisted qualitative data analysis - CAQDAS) cung cấp một số công
cụ định vị, mã hóa và chú thích (Barry, [2]) nhằm giúp các nhà nghiên cứu khám
phá và phân tích một cách có hệ thống các hiện tượng phức tạp ẩn trong dữ liệu
phi cấu trúc (văn bản, đa phương tiện, không gian địa lý); qua đó cân nhắc và
đánh giá tầm quan trọng và mối quan hệ giữa chúng (Silver, [14]). ATLAS.ti hỗ
trợ phân tích dữ liệu theo nhiều định dạng như văn bản, âm thanh, đồ họa, v.v…
giúp ích cho việc phân tích dữ liệu phi cấu trúc và phi số, xác định chủ đề, mẫu
và ý nghĩa. Hay nói khác hơn, ATLAS.ti là công cụ lý tưởng cho những ai muốn
xem bức tranh lớn nhưng đồng thời cũng có thể biết được các chi tiết được nổi
bật trong dữ liệu khai thác. Một số công dụng nổi bật có thể kể đến: Khi học sinh
tiếp nhận đoạn thông tin của bài đến từ giáo viên hoặc nguồn tài liệu tham khảo
học sinh có thể sử dụng chức năng “Code” để ghi chú lại trực tiếp các phần quan
trọng giúp dễ dàng xác định ý chính của đoạn. Thêm vào đó khi học sinh muốn
tìm các tài liệu nhưng do nội dung khá dài thì có thể sử dụng công cụ “Word list”,
“Word cloud” từ đó sẽ cho học sinh có cái nhìn tổng quan về điều mà tài liệu
muốn thể hiện. Bên cạnh đó, ATLAS.ti còn cho chúng ta trực tiếp xem, nghe
video (điều chỉnh âm lượng, tốc độ phát, đánh dấu phân đoạn có chứa nội dung
quan trọng),… Hiện nay ATLAS.ti có sẵn các phiên bản cho hệ điều hành
Windows, Mac, Android và iPad.

618
2.3 Giới thiệu các tài liệu học tập học sinh thường khai thác trong chương
trình GDPT
Ngày nay, công nghệ thông tin đang phát triển vô cùng nhanh chóng và nó
cũng mang lại những lợi ích to lớn đối với công tác dạy và học hiện nay. Đặc biệt
trong bối cảnh đại dịch Covid-19 khi xã hội giãn cách, mọi việc đều được thực
hiện trực tuyến do đó trong dạy học các loại tài liệu như văn bản, video được gửi
đến cho học sinh tìm hiểu và quan sát tại nhà cũng ngày càng phổ biến hơn.Theo
khảo sát của An [1] trong 2 tuần đầu tiên nghỉ học do ảnh hưởng của Covid-19,
số giờ học trực tuyến trung bình của học sinh ở cấp THCS và THPT Hà Nội là
3,7 giờ. Theo Hoang et al. [8] các yếu tố ảnh hưởng đến thói quen học tại nhà
trong đại dịch Covid-19: Nguồn tài liệu, môi trường học tập, động lực học tập,
động viên từ gia đình,… Trong đó yếu tố nguồn tài liệu với 65% đồng ý trên tổng
số 420 mẫu khảo sát cho thấy tầm quan trọng của tài liệu có ảnh hưởng lớn đến
việc học tập của học sinh so với các yếu tố khác. Tổng quan trong một bài báo
của Ta [15] với 294 mẫu khảo sát tỉ lệ giáo viên cho rằng công tác dạy học trực
tuyến hiệu quả chiếm số lượng khá tương đối nhưng số lượng cho rằng không
đồng ý và phân vân trong nhận định dạy học trực tuyến rất hiệu quả cũng đang
chiếm tỉ lệ vô cùng cao. Qua đó nhận thấy rằng các thầy cô cần có biện pháp hiệu
quả hơn để giúp cải thiện hiệu quả dạy và học trực tuyến nếu bối cảnh dịch cứ
tiếp tục diễn biến phức tạp.
Do đó các công cụ hỗ trợ dạy học cho giáo viên tiếp cận, truyền đạt bài
giảng bằng các tài liệu Online để giúp quá trình học của học sinh đạt hiệu quả
cao hơn là điều vô cùng cần thiết và ATLAS.ti sẽ là một công cụ hữu ích để thực
hiện điều này.
3. Phương pháp nghiên cứu và kết quả
3.1 Phương pháp nghiên cứu
Bằng những công cụ được cung cấp sẵn trong phần mềm ATLAS.ti 9, Bui
et al. [3] đã đưa ra quy trình phân tích dữ liệu định tính ở Hình 2.
Hình 2. Quy trình phân tích dữ liệu định tính bằng phần mềm ATLAS.ti

619
Ở Bước 1, lựa chọn tích hợp các tài liệu cần phân tích. Tạo dự án với tên
cụ thể trong ATLAS.ti, các file được đưa vào dự án bằng chức năng Add
Document trên thanh công cụ.
Ở Bước 2, tiến hành xử lí văn bản, video bằng các kĩ thuật phân tích văn
bản khác nhau. Các dữ liệu được thể hiện và truy xuất trực quan ở bước 3. Theo
Gupta và Lehal [6] các kĩ thuật cần được lặp đi lặp lại cho đến khi thông tin được
trích xuất. Do đó các dữ liệu ở Bước 3 trở thành dữ liệu đầu vào của Bước 2 để
tiếp tục quá trình xử lý. Quá trình này kết thúc khi dữ liệu được trích xuất thỏa
mãn yêu cầu của người phân tích.
Để hiểu rõ hơn quy trình làm việc này, nhóm tiến hành phân tích mẫu tác
phẩm văn học “Chí Phèo” và SGK Đại số 10 để làm tiền đề phân tích các loại tài
liệu tương tự cho các sinh viên sư phạm tìm hiểu và thúc đẩy sự sáng tạo, hiệu
quả hơn trong công tác giảng dạy.
+ Trước hết ta sử dụng công cụ Word Cloud để thống kê tần số xuất hiện
của tất cả các từ có trong tác phẩm giúp dễ dàng nắm bắt được chủ đề và cốt
truyện xoay quang nhân vật trong truyện với khoảng thời gian rất ngắn. Trên
thanh công cụ nhấp chuột chọn mục Word List/Word Cloud trong mục Document
(Hình 3).
Hình 3. Thanh công cụ của ATLAS.ti
Tiếp đó, tiến hành tạo Network để xem xét trực quan mối liên hệ của từ ngữ
trong tác phẩm. Vào Home/New Entities/New Network để tạo sơ đồ thể hiện sự
liên kết các từ/cụm từ trong văn bản.
+ Ngoài việc phân tích các dữ liệu văn bản ATLAS.ti còn được biết đến là
công cụ hỗ trợ phân tích Video hiệu quả. Trước hết chúng ta thêm Video vào bằng
cách Add Document/ Add Linked Video or Audio. Sau đó đánh dấu các đoạn có
nội dung quan trọng cần ghi chú lại vào lệnh Create Quotation (tạo trích dẫn)
trên thanh công cụ. Sau đó sẽ mã hóa các đoạn đó bằng cách tạo thêm Code(s)
mới hoặc Memo mới để đặt tên cũng như ghi chú lại các nội dung chính xuất hiện
trong video (Hình 4).

