615
Bùi Anh Tuấn
Phan Như Hunh
Nguyễn Ngọc Phương Anh
Trường Đại học Cần Thơ
Tóm tắt: Trong xu hướng dạy học chuyển đổi số thời kì 4.0, việc khai thác các
tài liệu dạy học (văn bản, video,…) nhvào công cụ kĩ thuật số đóng vai trò quan trọng.
Dựa vào xu hướng đó đã rất nhiều phần mềm cũng như công cụ hỗ trđược to
ra; trong đó ATLAS.ti, một phần mềm của Đức, được sử dụng rộng rãi bởi sự đa dạng
miễn phí. Bài viết này trình bày các ng dụng nổi bật của ATLAS.ti trong việc hỗ tr
công tácm hiểu, nghiên cứu tài liệu học tập cho một số môn học, từ đó thúc đẩy hiệu
qu học tập hơn cho học sinh và làm nguồn tài liệu bổ ích cho giáo viên.
Từ khóa: Chuyển đổi số, Giáo dục 4.0, ATLAS.ti, Tài liệu online.
1. Giới Thiệu
Thời kCông nghiệp 4.0 đang đưa ra những thách thức mang tính nhanh
chóng và theo kịp thời đại. Trong đó, thuật ngữ “chuyển đổi sốngày càng được
biết đến trong thời gian gần đây ở hầu hết các lĩnh vực, đây chính là quá trình s
dụng các công nghệ mới để chuyển đổi các thông tin thế giới thực sang thut
số (Trần et al., [16]). Theo Gaikwad et al. [4] cho rằng từ sự tăng trưởng của dữ
liệu số, việc khám phá kiến thc và khai thác dliệu ngày càng thu hút sự chú ý
vì tính ng dụng của nó. Một trong những kĩ thuật nổi bật đưc sử dụng để phân
tích văn bản Text Mining. Điển hình là công trình Raja et al. [13] đã dùng Text
Mining khai thác văn bản của dữ liệu hồ lâm sàng điện tử để cha một khối
ợng lớn các thông tin bệnh án của các bệnh nhân. Công trình của Tuan et al.
[18] đã phân tích bài thơ Divan of Hafiz nhằm để xác định số ợng từ phân
loại những từ quan trọng trong bài thơ. Grobelnik et al. [5] đã sử dụng công ngh
hỗ trkhai thác văn bản trong xuất bản để làm tăng số ợng khách hàng tiếp
cận. Ngoài ra, với các phương pháp khai thác văn bản trong nghiên cứu của
Lamurias Couto [10] đã giúp cho người học dễ dàng truy xuất thông tin từ
nguồn tài liệu y sinh khổng lồ. Theo Jalali et al. [9] cho rằng hiện nay các tài
nguyên trực tuyến, cụ thể là dữ liệu lớn bao gồm văn bản, hình ảnh, video,đã
làm cho các phương pháp khai thác văn bản truyền thống khó thực hiện được. Từ
đó, việc thúc đẩy sự phát triển của các công cụ để hỗ trquá trình khai thác dữ
616
liệu như: NVivo, ATLAS.ti, Quirkos, MAXQDA,các chương trình hỗ tr
nghiên cứu phương pháp phân tích định tính bằng cáchhóa dữ liệu đầu vào.
Trong đó, ATLAS.ti cho phép khám phá nhiều tài liệu nghiên cứu cùng một lúc,
làm giảm thời gian số ợng sai lầm, ngoài ra còn thể dễ dàng tìm kiếm,
sao chép dán các trích dẫn. Ngalande Mkwinda [11] nhận thấy được việc
trang bị đủ kiến thc và năng sử dụng ATLAS.ti là một lợi ích đối với bất k
cơ sở Giáo dục Đại học nào.
Trong quá trình học tập, việc nghiên cứu các tài liệu dạy học tgiáo viên
và các nguồn trên Internet là điều vô cùng quan trọng mà mỗi học sinh nói riêng
và tất cả chúng ta nói chung khi thật sự muốn nắm toàn diện mt vấn đề. Từ đây,
việc phân tích tài liệu rõ ràng, chính xác, đúng trọng m sẽ mang lại lợi ích lớn
đến việc cải thiện chất lượng học tập của học sinh còn tiết kiệm lượng lớn
thời gian. Theo nghiên cứu của Nguyễn [12], việc tìm kiếm những thông tin hữu
ích, tin cậy và chính xác về bệnh học lưu trữ tại các bệnh viện bằng kĩ thuật khai
phá dữ liệu là rất cần thiết. Việc chắt lọc đúng thông tin từ các tài liệu học tập là
một giải pháp cùng cần thiết khi khối lượng dữ liệu trên Web sinh ra liên tc
mỗi ngày (Hoàng Minh Hiền, [7]).
Từ những thực trạng trên, nghiên cứu y tiến hành phân thích c ứng
dụng nổi bật của ATLAS.ti trong việc htrphân tích tài liệu học tập một số
môn Toán học, Lịch sử, Ngữ văn và hướng mở rộng thêm cho tất cả các môn học
khác trong chương trình giáo dục phổ thông. Các phần còn lại của bài báo đưc
trình y theo c trình tự sau: Phần 2 trình bày sluận về khai thác văn
bản, phương pháp phân tích cụm dữ liệu và khai thác video, phần mềm ATLAS.ti
cũng như chọn lọc và gii thiệu các tài liệu phân tích các môn học. Phần 3 trình
bày phương pháp nghiên cứu kết quả phân tích bài học. Phần 4 trình bày kết
luận và hướng phát triển đề tài.
2. Cơ sở lý luận
2.1 Khai thác dữ liệu văn bản và video
Khai thác văn bản (Text mining/ Text data mining) một quá trình x
trích xuất thông tin trong văn bản, quá trình y một phần của việc phân
tích văn bản. Khai thác văn bản đã trở thành một nghiên cứu quan trọng đây
sự khám pcác thông tin chưa biết bằng cách tự động trích xuất thông tin từ các
tài nguyên văn bản khác nhau (Gupta và Lehal, [6]). Quá trình này bao gồm các
hoạt động nhưm tắt văn bản, phân cụm tài liệu, định vị các từ viết tắt định
nghĩa của chúng (Witten et al., [20]).
Một số nhà nghiên cứu đã áp dụng kĩ thuật khai thác văn bản vào các dự án
nghiên cứu định tính đã xem khai thác văn bản như một công cụ hữu ích mang
tính khả thi. Các tài liệu về bằng sáng chế chứa rất nhiều các thông tin về kết quả
nghiên cứu quan trọng, tuy nhiên chúng dài giàu thuật ngữ thuật nên cần
617
rất nhiều thời gian để phân tích do đó các công cụ phân tích tự động mang lại rất
nhiều lợi ích như phân đoạn văn bản, trích xuất tóm tắt, liên kết thuật ngữ cũng
như xác định chủ đề (Tseng et al., [17]). Gaikwad et al. [4] đã đ xuất quy trình
khai thác văn bản gồm 5 bước (Hình 1).
Hình 1. Quá trình khai thác văn bản
Bên cạnh các dữ liệu văn bản thì video tạo khnăng nắm bắt thông tin tốt
hơn, sâu hơn so với chữ viết hình ảnh tĩnh, để nghiên cứu dữ liu video,
thsử dụng phần mềm như Vivo hoặc ATLAS.ti (Wang et al., [19]) tđó cho
thấy các dliệu được đưa vào khai thác bằng các phần mềm phân tích định tính
từ các văn bản cho đến các đoạn video.
2.2 Giới thiu phần mềm ATLAS.ti
ATLAS.ti một chương trình y tính phân tích d liệu định tính
(computer assisted qualitative data analysis - CAQDAS) cung cấp một số công
cụ định vị, mã hóa chú thích (Barry, [2]) nhằm giúp các nhà nghiên cứu khám
phá và phân tích một cách hệ thống các hiện tượng phức tạp ẩn trong dliu
phi cấu trúc (văn bản, đa phương tiện, không gian địa lý); qua đó cân nhắc
đánh giá tầm quan trọng mối quan hệ giữa chúng (Silver, [14]). ATLAS.ti hỗ
trợ phân tích dữ liu theo nhiều định dạng như văn bản, âm thanh, đồ họa, v.v
giúp ích cho việc phân tích dữ liệu phi cấu trúc phi số, xác định chủ đề, mẫu
và ý nghĩa. Hay nói khác hơn, ATLAS.ti là công cụ lý tưởng cho những ai muốn
xem bức tranh lớn nhưng đồng thời cũng có thể biết được các chi tiết được ni
bật trong dữ liệu khai thác. Một số công dụng nổi bật có thể kể đến: Khi học sinh
tiếp nhận đoạn thông tin của bài đến tgiáo viên hoặc nguồn tài liệu tham khảo
học sinh có thể sử dụng chức năng Codeđể ghi chú lại trực tiếp các phần quan
trọng giúp dễ dàng xác định ý chính của đoạn. Thêm o đó khi học sinh muốn
tìm các tài liệu nhưng do nội dung khá dài thì có thể sử dụng công cụ Word list”,
Word cloudtừ đó sẽ cho học sinh cái nhìn tổng quan về điều tài liệu
muốn thể hiện. Bên cạnh đó, ATLAS.ti còn cho chúng ta trực tiếp xem, nghe
video (điều chỉnh âm lượng, tốc độ phát, đánh dấu phân đoạn chứa nội dung
quan trọng),… Hiện nay ATLAS.ti sẵn các phiên bản cho hệ điều hành
Windows, Mac, Android và iPad.
618
2.3 Giới thiệu các tài liệu học tập học sinh thường khai thác trong chương
trình GDPT
Ngày nay, công nghệ thông tin đang phát triển vô cùng nhanh chóng và nó
cũng mang lại những lợi ích to lớn đối với công tác dạy học hiện nay. Đặc biệt
trong bối cảnh đại dịch Covid-19 khi hội giãn cách, mọi việc đều được thực
hiện trực tuyến do đó trong dạy học các loại tài liệu như n bản, video được gửi
đến cho học sinh tìm hiểu và quan sát tại nhà cũng ngày càng phổ biến hơn.Theo
khảo sát của An [1] trong 2 tuần đầu tiên nghỉ học do ảnh hưởng của Covid-19,
số giờ học trực tuyến trung bình của học sinh cấp THCS THPT Nội
3,7 giờ. Theo Hoang et al. [8] các yếu tố ảnh hưởng đến thói quen học tại nhà
trong đại dịch Covid-19: Nguồn tài liệu, môi trường học tập, động lực học tập,
động viên từ gia đình,Trong đó yếu tố nguồn tài liệu với 65% đồng ý trên tổng
số 420 mẫu khảo sát cho thấy tầm quan trọng của tài liệu ảnh hưởng lớn đến
việc học tập của học sinh so với các yếu tố khác. Tổng quan trong một bài báo
của Ta [15] với 294 mẫu khảo sát tỉ lệ giáo viên cho rằng công tác dạy học trực
tuyến hiệu quả chiếm số ợng khá tương đối nhưng số ng cho rằng không
đồng ý phân vân trong nhận định dạy học trực tuyến rất hiệu quả cũng đang
chiếm tỉ lệ vô cùng cao. Qua đó nhận thấy rằng các thầy cô cần có biện pháp hiệu
quả hơn để giúp cải thiện hiệu quả dạy học trực tuyến nếu bối cảnh dịch cứ
tiếp tục diễn biến phc tạp.
Do đó các công cụ hỗ trdạy học cho giáo viên tiếp cận, truyền đạt bài
giảng bằng các i liệu Online để giúp quá trình học của học sinh đạt hiệu qu
cao hơn là điều vô cùng cần thiết và ATLAS.ti sẽ là một công cụ hữu ích để thc
hiện điều này.
3. Phương pháp nghiên cứu và kết quả
3.1 Phương pháp nghiên cứu
Bằng những công cụ được cung cấp sẵn trong phần mềm ATLAS.ti 9, Bui
et al. [3] đã đưa ra quy trình phân tích dữ liệu định tính ở Hình 2.
Hình 2. Quy trình phân tích dliu định tính bằng phần mềm ATLAS.ti
619
ớc 1, lựa chọn tích hợp các tài liệu cần phân tích. Tạo dự án với tên
cụ th trong ATLAS.ti, các file được đưa vào d án bằng chức năng Add
Document trên thanh công cụ.
ớc 2, tiến hành xvăn bản, video bằng các thuật phân tích văn
bản khác nhau. Các dliệu được thể hiện và truy xuất trực quan ở bước 3. Theo
Gupta và Lehal [6] các kĩ thuật cần được lặp đi lặp lại cho đến khi thông tin được
trích xuất. Do đó các dliệu ớc 3 trở thành dữ liệu đầu vào của Bước 2 để
tiếp tục quá trình x. Quá trình y kết thúc khi dữ liệu được trích xuất thỏa
mãn yêu cầu của người phân tích.
Để hiểu hơn quy trình làm việc y, nhóm tiến hành phân tích mẫu tác
phẩm văn học “Chí Phèovà SGK Đại số 10 để làm tiền đề phân tích các loại tài
liệu ơng tự cho các sinh viên phm tìm hiểu thúc đẩy sự sáng tạo, hiệu
quả hơn trong công tác giảng dạy.
+ Tớc hết ta sdụng công cụ Word Cloud để thống tần số xuất hiện
của tất ccác từ trong tác phẩm giúp dễ dàng nắm bắt được chđề ct
truyện xoay quang nhân vật trong truyện với khoảng thời gian rất ngắn. Trên
thanh công cụ nhấp chuột chọn mục Word List/Word Cloud trong mục Document
(Hình 3).
Hình 3. Thanh công cụ của ATLAS.ti
Tiếp đó, tiến hành tạo Network để xem xét trực quan mối liên hệ của từ ngữ
trong tác phẩm. Vào Home/New Entities/New Network để tạo đồ thhiện sự
liên kết các t/cm từ trong văn bản.
+ Ngoài việc phân tích các dữ liệu văn bản ATLAS.ti còn được biết đến
công cụ hỗ trphân tích Video hiệu quả. Trước hết chúng ta thêm Video vào bằng
cách Add Document/ Add Linked Video or Audio. Sau đó đánh dấu các đoạn
nội dung quan trọng cần ghi chú lại vào lệnh Create Quotation (to trích dẫn)
trên thanh công cụ. Sau đó shóa các đoạn đó bằng cách tạo thêm Code(s)
mới hoặc Memo mới để đặt tên ng như ghi chú lại các nội dung chính xuất hiện
trong video (Hình 4).