Luận văn Thạc sĩ Kỹ thuật phần mềm: Nghiên cứu Learning Analytics và áp dụng trong bài toán dự báo kết quả học tập
lượt xem 2
download
Luận văn thiết lập quy trình kiểm thử và đánh giá độ chính xác của các mô hình đã tạo ra dựa trên bộ dữ liệu thực tế. Từ đó giúp các cơ sở đào tạo có được cái nhìn khách quan dành cho các phương pháp được đề xuất, qua đó lựa chọn được phương pháp khả thi nhất, có kết quả tốt nhất để có thể áp dụng trong thực tiễn.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Luận văn Thạc sĩ Kỹ thuật phần mềm: Nghiên cứu Learning Analytics và áp dụng trong bài toán dự báo kết quả học tập
- ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ MINH ĐỨC NGHIÊN CỨU LEARNING ANALYTICS VÀ ÁP DỤNG TRONG BÀI TOÁN DỰ BÁO KẾT QUẢ HỌC TẬP LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT PHẦN MỀM Hà Nội – 2021
- ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ MINH ĐỨC NGHIÊN CỨU LEARNING ANALYTICS VÀ ÁP DỤNG TRONG BÀI TOÁN DỰ BÁO KẾT QUẢ HỌC TẬP Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 LUẬN VĂN THẠC SĨ NGÀNH KỸ THUẬT PHẦN MỀM NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. Nguyễn Việt Anh Hà Nội – 2021
- I TÓM TẮT Thành tích học tập luôn là một trong những vấn đề quan trọng và dành được nhiều sự quan tâm không chỉ của người học, mà còn của các cơ sở giáo dục đào tạo, các cơ quan sử dụng nhân lực. Nó không chỉ thể hiện năng lực của chính bản thân sinh viên đó, mà còn có ảnh hưởng đến địa vị và các cơ hội trong cuộc sống của họ. Chính vì vậy, phần lớn các bạn sinh viên luôn mong muốn biết được trước điểm số cũng như xếp loại cuối kỳ mà họ có thể đạt được, từ đó có những cân nhắc điều chỉnh, thay thế các kế hoạch, phương pháp học tập trong tương lai để đạt được kết quả học tập tốt nhất. Với mục tiêu giúp đỡ sinh viên có thể ước lượng điểm số của bản thân, luận văn tiến hành nghiên cứu phương pháp Learning Analytics cùng các phương pháp học máy phổ biến như Collaborative Filtering và Matrix Factorization. Dựa trên cơ sở đó, kết hợp với các kết quả nghiên cứu về bài toán dự đoán kết quả học tập đã được kiểm chứng, luận văn đề xuất hai loại mô hình: mô hình dự báo kết quả học tập dựa trên hoạt động tương tác của người học trong quá trình học tập trực tuyến, và mô hình dự báo kết quả dựa trên kết quả đã có trong các học kỳ trước đó. Sau khi đề xuất mô hình, nghiên cứu tiến hành kiểm thử các mô hình này trên tập dữ liệu thực tế được thu thập tại trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, qua đó có được những đánh giá về ưu, nhược điểm của các mô hình trong quá trình triển khai, huấn luyện và dự đoán. Chính các ưu, nhược điểm này là những yếu tố đánh giá khả năng ứng dụng trong thực tiễn của các mô hình. Kết quả nghiên cứu hy vọng sẽ giúp các cơ sở giáo dục lựa chọn được mô hình dự báo kết quả học tập phù hợp và đóng góp thêm cho các nghiên cứu liên quan sau này. Từ khóa: Phân tích học tập, Hệ thống gợi ý, Dự đoán kết quả học tập
- II LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Nghiên cứu Learning Analytics và áp dụng trong bài toán dự báo kết quả học tập” là công trình nghiên cứu của tôi, dưới sự hướng dẫn của PGS. TS. Nguyễn Việt Anh. Các số liệu trong luận văn được thu thập và sử dụng một cách trung thực. Kết quả nghiên cứu trình bày trong luận văn không sao chép từ bất cứ luận văn hay công trình nghiên cứu đã công bố nào khác trước đây. Tất cả các nguồn tài liệu tham khảo có xuất xứ rõ ràng và được trích dẫn hợp pháp. Tôi xin chịu toàn bộ trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời cam đoan của tôi. Hà Nội, tháng 10 năm 2021 Lê Minh Đức
- III LỜI CẢM ƠN Để hoàn thành công trình nghiên cứu và luận văn này, tôi xin bày tỏ lòng biết ơn sâu sắc nhất đến thầy giáo hướng dẫn, PGS. TS. Nguyễn Việt Anh, thầy đã tận tình hướng dẫn, chỉ bảo cũng như định hướng tôi trong suốt thời gian thực hiện nghiên cứu. Công trình nghiên cứu trong luận văn được tài trợ một phần từ đề tài KHCN cấp ĐHQGHN, mã số đề tài: QG.20.57. Tôi cũng xin chân thành cảm ơn các thầy trong Ban giám hiệu Nhà trường, cùng toàn thể các thầy cô giáo trường Đại học Công nghệ - Đại học Quốc gia Hà Nội nói chung và Khoa Công nghệ Thông tin nói riêng đã tạo điều kiện cho tôi được học tập những kiến thức mới, những kinh nghiệm, hiểu biết và hoàn thành được luận văn của mình. Tôi xin gửi lời cảm ơn chân thành đến anh em đồng nghiệp tại Trung tâm Máy tính, trường Đại học Công nghệ đã giúp đỡ, hỏi han, nhắc nhở tôi trong suốt quá trình tham gia nghiên cứu luận văn. Cảm ơn mọi người vì đã san sẻ công việc, tạo điều kiện tốt nhất để tôi hoàn thành nghiên cứu. Cuối cùng, tôi xin cảm ơn gia đình, người thân, bạn bè đã luôn bên cạnh giúp đỡ, ủng hộ, động viên và cũng đưa ra những lời khuyên trân thành để tôi có thể hoàn thành luận văn này. Trân trọng cảm ơn!
- IV MỤC LỤC TÓM TẮT........................................................................................................................ I LỜI CAM ĐOAN ........................................................................................................... II LỜI CẢM ƠN ................................................................................................................III MỤC LỤC .................................................................................................................... IV DANH MỤC HÌNH VẼ ............................................................................................... VI DANH MỤC BẢNG BIỂU ......................................................................................... VII DANH MỤC TỪ VIẾT TẮT ..................................................................................... VIII PHẦN MỞ ĐẦU .............................................................................................................1 CHƯƠNG 1. TỔNG QUAN CÁC VẤN ĐỀ NGHIÊN CỨU ........................................5 1.1. Phân tích học tập - Learning Analytics (LA) .......................................................5 1.1.1. Phân tích học tập là gì? ..................................................................................5 1.1.2. Ứng dụng của Phân tích học tập trong giáo dục............................................7 1.2. Hệ thống gợi ý - Recommender Systems (RS) ....................................................8 1.2.1 Khái niệm .......................................................................................................8 1.2.2 Các thành phần cơ bản....................................................................................8 1.2.3 Phân loại Hệ thống gợi ý ................................................................................9 1.3. Tổng quan nghiên cứu hiện nay .........................................................................11 1.3.1 Các nghiên cứu dựa trên kết quả học tập: ....................................................11 1.3.2 Các nghiên cứu dựa trên kết quả phân tích dữ liệu học tập: ........................13 CHƯƠNG 2. XÂY DỰNG MÔ HÌNH .........................................................................17 2.1. Mô hình dự đoán kết quả học tập dựa trên hoạt động tương tác ........................17 2.2. Mô hình dự báo kết quả học tập dựa trên điểm số .............................................18 2.2.1 Mô hình dự đoán kết quả dựa trên User-based Collaborative Filtering (User- based CF) ...............................................................................................................19 2.2.2 Mô hình dự đoán kết quả dựa trên Item-based Collaborative Filtering (Item- based CF) ...............................................................................................................21 2.2.3 Mô hình dự đoán kết quả dựa trên Matrix Factorization (MF) ....................22 CHƯƠNG 3. THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH .........................................25 3.1 Dự đoán kết quả học tập dựa trên hoạt động tương tác .......................................25
- V 3.1.1 Thực nghiệm .................................................................................................25 3.1.2 Đánh giá........................................................................................................29 3.2 Dự báo kết quả học tập dựa trên điểm số ............................................................30 3.2.1 Thực nghiệm .................................................................................................30 3.2.2 Đánh giá........................................................................................................42 KẾT LUẬN ...................................................................................................................44 DANH MỤC CÔNG TRÌNH KHOA HỌC LIÊN QUAN ĐẾN LUẬN VĂN ............46 TÀI LIỆU THAM KHẢO .............................................................................................47
- VI DANH MỤC HÌNH VẼ Hình 1.1 Các cấp độ phân tích học tập..............................................................................................6 Hình 1.2 Ma trận user-item trong RS ................................................................................................9 Hình 1.3 Phân loại RS .....................................................................................................................10 Hình 2.1 Mô hình dự đoán kết quả học tập dựa trên điểm số .........................................................18 Hình 3.1 Mối tương quan giữa các bài kiểm tra và bài thi cuối kỳ.................................................28 Hình 3.2 Đường cong học tập của bốn mô hình .............................................................................29 Hình 3.3 Biểu đồ kết quả học tập của 275 sinh viên đã hoàn thành 8 học kỳ ................................31 Hình 3.4 Biểu đồ số lượng môn học ...............................................................................................32 Hình 3.5 Phân bố điểm trung bình của sinh viên trong năm thứ 3 và thứ 4 ...................................32 Hình 3.6 Kết quả kiểm thử k-fold mô hình User-based CF với sai số RMSE ................................34 Hình 3.7 Kết quả kiểm thử mô hình User-based dự đoán kỳ kế tiếp với sai số RMSE ..................35 Hình 3.8 Kết quả kiểm thử mô hình User-based dự đoán toàn bộ kỳ kế tiếp với sai số RMSE .....36 Hình 3.9 Kết quả kiểm thử k-fold mô hình Item-based CF với sai số RMSE ................................37 Hình 3.10 Kết quả kiểm thử mô hình Item-based dự đoán kỳ kế tiếp với sai số RMSE ................38 Hình 3.11 Kết quả kiểm thử mô hình Item-based dự đoán toàn bộ kỳ kế tiếp với sai số RMSE ...39 Hình 3.12 Kết quả kiểm thử k-fold mô hình MF với sai số RMSE ................................................40 Hình 3.13 Kết quả kiểm thử mô hình MF dự đoán kỳ kế tiếp với sai số RMSE ............................41 Hình 3.14 Kết quả kiểm thử mô hình MF dự đoán toàn bộ kỳ kế tiếp với sai số RMSE ...............42
- VII DANH MỤC BẢNG BIỂU Bảng 3.1 Thống kê hoạt động tương tác của các sinh viên trong khóa học kết hợp.................... 26 Bảng 3.2 Kết quả đánh giá mô hình ............................................................................................. 28 Bảng 3.3 Thống kê dữ liệu thử nghiệm mô hình dự báo kết quả học tập dựa trên điểm số ........ 30 Bảng 3.4 Kết quả kiểm thử k-fold mô hình User-based CF......................................................... 34 Bảng 3.5 Kết quả kiểm thử mô hình User-based dự đoán kỳ kế tiếp .......................................... 35 Bảng 3.6 Kết quả kiểm thử mô hình User-based dự đoán toàn bộ kỳ kế tiếp ............................. 36 Bảng 3.7 Kết quả kiểm thử k-fold mô hình Item-based CF ......................................................... 37 Bảng 3.8 Kết quả kiểm thử mô hình Item-based dự đoán kỳ kế tiếp ........................................... 38 Bảng 3.9 Kết quả kiểm thử mô hình Item-based dự đoán toàn bộ kỳ kế tiếp .............................. 38 Bảng 3.10 Kết quả kiểm thử k-fold mô hình MF ......................................................................... 40 Bảng 3.11 Kết quả kiểm thử mô hình MF dự đoán kỳ kế tiếp ..................................................... 41 Bảng 3.12 Kết quả kiểm thử mô hình MF dự đoán toàn bộ kỳ kế tiếp ........................................ 42
- VIII DANH MỤC TỪ VIẾT TẮT LA Learning Analytics RS Recommender System Item-based CF Item based collaborative filtering User-based CF User based collaborative filtering CF Collaborative Filtering MF Matrix factorization MAE Mean absolute error MSE Mean squared error RMSE Root mean squared error CSDL Cơ sở dữ liệu (dataset)
- 1 PHẦN MỞ ĐẦU Tính cấp thiết Trong những năm gần đây, ngành Khoa học máy tính, đặc biệt là lĩnh vực về Trí tuệ nhân tạo (Artificial Intelligence - AI) đang ngày càng phát triển và xuất hiện trong mọi lĩnh vực của đời sống. Nó giúp con người giải quyết các vấn đề từ cơ bản đến phức tạp, cải thiện và nâng cao chất lượng cuộc sống, mở ra thời đại mới: thời đại công nghệ 4.0. Sự phát triển của ngành Khoa học máy tính cũng đi kèm với lượng dữ liệu, thông tin mới xuất hiện ngày một tăng, đòi hỏi con người phải phân loại và chọn lọc được những thông tin nào là cần thiết, thông tin nào là không cần thiết. Từ đó, bài toán phân tích dữ liệu được đặc biệt quan tâm hơn bao giờ hết. Mục tiêu là áp dụng các kỹ thuật của Trí tuệ nhân tạo, cụ thể là Học máy, để thực hiện tự động các thao tác thu thập, phân tích hành vi, sở thích, thói quen của mỗi người sử dụng, từ đó đưa ra các kết quả cần thiết và có ích cho người dùng. Kỹ thuật Phân tích học tập (Learning Analytics) chính là một khía cạnh trong bài toán phân tích dữ liệu đó. Bài toán dự báo kết quả học tập Trong lĩnh vực giáo dục, mỗi bạn sinh viên hay người học, khi bước chân vào cánh cổng đại học luôn mong muốn cho mình làm sao ra trường có được một kết quả học tập cao. Kết quả học tập không chỉ phản ánh được kỹ năng chuyên môn mà còn thể hiện sự cố gắng, nỗ lực trong học tập, tiếp thu kiến thức mới của mỗi người. Một kết quả học tập tốt còn giúp nâng tầm giá trị bản thân của người học trong mắt người thân, gia đình và bạn bè… Đặc biệt, đối với các nhà tuyển dụng, kết quả học tập luôn là tiêu chí đầu tiên để đánh giá khả năng của một ứng viên. Kết quả học tập tốt sẽ giúp ứng viên vượt qua vòng xét tuyển một cách dễ dàng hơn và có cơ hội nhận được một công việc tốt nhất có thể. Chính vì thế, trong suốt quá trình học tập, mỗi sinh viên đều mong muốn cố gắng đạt được một kết quả cao. Tuy nhiên, khi xem xét thực tế tại các trường đại học, cao đẳng hiện nay, có một thực trạng đáng buồn đó là hàng năm luôn có một lượng không nhỏ sinh viên không tiếp tục học hoặc bị buộc thôi học cũng như có một lượng sinh viên tốt nghiệp với kết quả không được như mong đợi. Lý giải nguyên nhân cho vấn đề này có thể kể đến việc thay đổi môi trường học tập từ phổ thông lên đại học, từ học gần nhà đến học xa nhà, tiếp đó là sự thay đổi trong cách học, phương pháp học tập…dẫn đến việc chưa thể nhanh chóng thích nghi với hình thức học tập mới. Ngoài ra thì công tác sinh viên, cố vấn học tập cũng khó có thể đi sâu quan tâm đến từng sinh viên một cách thấu đáo và kỹ lưỡng, dẫn đến sinh viên thiếu hiểu biết về các môn mà mình đang học và sẽ học, không biết phải
- 2 trang bị những hành trang gì cho quá trình học tập, dẫn đến việc lựa chọn sai môn học, sai thời điểm học khiến kết quả học tập giảm sút. Từ thực tế trên, tôi nhận thấy phần lớn các học sinh, sinh viên đều có nhu cầu muốn dự báo trước được kết quả học tập cuối kỳ mà họ sẽ có thể đạt được ở mức nào. Từ đó có thể cân nhắc việc điều chỉnh, hay thay đổi kế hoạch, phương pháp học tập trong tương lai để có thể đạt được mục tiêu nói chung, hay có được kết quả học tập tốt nhất nói riêng. Ngoài ra, việc dự báo trước điểm học tập của sinh viên cũng giúp ích rất nhiều cho Nhà trường trong công tác giảng dạy và quản lý học tập của sinh viên. Từ những dự đoán này, Nhà trường sẽ sát sao hơn đối với những sinh viên có kết quả học tập chưa được tốt, đề ra những phương pháp, cách học giúp sinh viên cải thiện và nâng cao thành tích bản thân, cũng như định hướng những sinh viên đã có kết quả tốt có thể đạt được những kết quả tốt hơn. Phạm vi bài toán và mục tiêu nghiên cứu Việc sử dụng các kỹ thuật trong học máy, mà cụ thể là sử dụng kỹ thuật Learning Analytics (LA), hay còn gọi là Phân tích học tập, để xây dựng và đưa ra một mô hình dự đoán về điểm số cuối kỳ của sinh viên là vô cùng cần thiết. Đây cũng chính là mục tiêu chính của nghiên cứu trong luận văn. Xa hơn nữa, ngoài dự đoán về điểm số, nghiên cứu cũng mong muốn xây dựng mô hình đưa ra các gợi ý cho sinh viên về tổng số môn cũng như liệt kê những môn mà sinh viên nên đăng ký trong học kỳ kế tiếp để có thể đạt được kết quả tốt nhất với cách học tập hiện tại của mình. Đồng thời, mô hình cũng giúp ích cho Nhà trường trong công tác quản lý và giúp đỡ sinh viên tốt hơn trong học tập bằng cách đưa ra những gợi ý, cảnh báo về tình hình học tập của từng sinh viên được sớm hơn. Câu hỏi nghiên cứu Để đạt được mục tiêu đó, luận văn nghiên cứu và áp dụng phương pháp Phân tích học tập, một trong những giải pháp được nhiều nghiên cứu hiện nay tiếp cận và sử dụng, đồng thời kết hợp với các kỹ thuật trong học máy để giải quyết bài toán. Các nhóm công cụ được cung cấp trong kỹ thuật Phân tích học tập giúp khai thác dữ liệu và tạo ra những mô hình cải thiện các hệ thống học tập. Việc sử dụng các kỹ thuật của Phân tích học tập không những mang lại những thông tin hữu ích về tiến trình học, mối quan hệ giữa các người học mà còn hỗ trợ đưa ra những hành động, gợi ý, hỗ trợ cho người học để nâng cao kết quả học tập. Cùng với đó, hệ thống gợi ý Recommender System (RS) được sử dụng để đề xuất các mô hình dự báo kết quả học tập cho người học. Luận văn sẽ tập trung nghiên cứu lĩnh vực phân tích dữ liệu học tập trong hoạt động dạy và học. Trong đó tập trung vào kỹ thuật dự báo và gợi ý, ứng dụng trong hoạt
- 3 động đào tạo, cụ thể nghiên cứu các phương pháp và kỹ thuật áp dụng cho hệ thống gợi ý, tập trung giải quyết hai câu hỏi sau: Câu hỏi 1: Dự đoán kết quả học tập dựa trên các hoạt động tương tác của người học? Đây là một trong những kết quả chính cần phải đạt được và cũng là một mục tiêu chính của đề tài nghiên cứu. Cụ thể, chúng ta sẽ dự báo trước điểm tổng kết khóa học trực tuyến có thể đạt được của sinh viên dựa vào những tương tác của sinh viên đó trong suốt quá trình tham gia khóa học. Chúng ta cần phải biết được những yếu tố gì có thể ảnh hưởng đến kết quả học tập, từ đó mới có được những gợi ý chính xác và cụ thể giúp người học cải thiện được kết quả học tập của mình. Câu hỏi 2: Dự đoán kết quả học tập của sinh viên dựa trên điểm số các môn đã có kết quả của sinh viên đó? Dựa trên điểm số của các môn học đã đạt được trước đó của sinh viên, nghiên cứu sẽ dự đoán trước điểm số mà sinh viên đó có thể đạt được vào cuối học kì hiện tại, hoặc xa hơn nữa là điểm tổng kết trung bình chung tích lũy mà sinh viên đó sẽ đạt được khi tốt nghiệp. Dự đoán này giúp sinh viên có thể hình dung được kết quả mà mình có thể đạt được nếu như vẫn tiếp tục áp dụng các cách thức, kế hoạch học tập cũ của mình. Từ đó, sinh viên sẽ cân nhắc liệu có nên thay đổi để có thể đạt được kết quả tốt hơn hay không. Đóng góp chính của luận văn Với kết quả mà bài toán đạt được, cụ thể là trả lời được hai câu hỏi nêu trên, luận văn đã xây dựng lên mô hình dự đoán kết quả học tập nhằm giúp sinh viên giải quyết nhu cầu muốn biết trước kết quả học tập có thể đạt được của mình, để sinh viên có cái nhìn chuẩn xác hơn về việc học của mình, qua đó sẽ điều chỉnh cho phù hợp. Mô hình dự đoán kết quả học tập được đề xuất sẽ giúp Nhà trường cũng như các cơ sở giáo dục đào tạo có thêm một công cụ đánh giá năng lực của sinh viên và người học, qua đó nhanh chóng giúp đỡ các sinh viên cải thiện được kết quả học tập chưa được tốt, hay phát huy hơn nữa những sinh viên khá giỏi. Ngoài ra, luận văn cũng sẽ thiết lập quy trình kiểm thử và đánh giá độ chính xác của các mô hình đã tạo ra dựa trên bộ dữ liệu thực tế. Từ đó giúp các cơ sở đào tạo có được cái nhìn khách quan dành cho các phương pháp được đề xuất, qua đó lựa chọn được phương pháp khả thi nhất, có kết quả tốt nhất để có thể áp dụng trong thực tiễn.
- 4 Cấu trúc của luận văn Để đạt được mục tiêu và kết quả mong muốn đó, các nội dung tiếp theo trong luận văn gồm ba chương chính sau: Chương I: Tổng quan các vấn đề nghiên cứu. Cụ thể, trong chương này, luận văn sẽ trình bày tổng quan về kỹ thuật Phân tích học tập sẽ áp dụng trong nghiên cứu để xây dựng bài toán dự đoán kết quả học tập. Đồng thời, luận văn cũng sẽ khái quát tình hình các nghiên cứu liên quan đến bài toán. Chương II: Mô hình dự đoán kết quả học tập. Trong chương này, dựa trên những kiến thức đã khái quát trong chương I, luận văn sẽ trình bày các mô hình đề xuất để dự đoán kết quả học tập dựa trên các hoạt động tương tác, dự đoán kết quả học tập dựa trên điểm số các môn học đã đạt được trước đó của sinh viên. Chương III: Thực nghiệm và đánh giá, sử dụng tập dữ liệu thực tế đã thu thập được, luận văn sẽ tiến hành thực nghiệm các mô hình đã đề xuất được trong chương II. Sau đó đánh giá các kết quả thu được sau quá trình thực nghiệm, và đưa ra kết luận khách quan về độ chính xác của các mô hình. Phần Kết luận tổng kết lại các kết quả mà nghiên cứu đã đạt được cũng như những mặt hạn chế còn đang tồn tại, đồng thời là những định hướng phát triển của nghiên cứu trong tương lai. Cuối cùng là Tài liệu tham khảo, bao gồm các tài liệu nghiên cứu, bài báo khoa học được tham khảo và trích dẫn trong luận văn.
- 5 CHƯƠNG 1. TỔNG QUAN CÁC VẤN ĐỀ NGHIÊN CỨU 1.1. Phân tích học tập - Learning Analytics (LA) 1.1.1. Phân tích học tập là gì? Khái niệm: Với sự phát triển nhanh chóng và tiến bộ của các công cụ học trực tuyến, và sự kết nối của các công cụ này trong các khóa học truyền thống, đã tạo ra các dữ liệu của sinh viên, người học. Trên cơ sở đó, hướng nghiên cứu mới LA ra đời, sử dụng công nghệ và phân tích dữ liệu để thu thập thông tin chi tiết về các hoạt động và tương tác của người học. Bằng cách sử dụng các phần mềm khai phá dữ liệu để so sánh, nghiên cứu dữ liệu học tập, các nhà nghiên cứu có thể xác định những quy trình nào là thành công, hay những hoạt động nào cần được loại bỏ hoặc thay đổi trong chương trình học hiện tại của người học. Phân tích học tập không chỉ là một công cụ, mà nó là một quá trình trải qua nhiều cách tiếp cận đa dạng để giúp cải thiện kết quả học tập. Trọng tâm của phân tích học tập là cung cấp thông tin hữu ích có thể cải thiện việc dạy và học. Qua đó, LA cung cấp cho các nhà nghiên cứu những công cụ hữu ích để nghiên cứu việc dạy và học. Khi cơ sở hạ tầng dữ liệu được cải thiện, từ việc thu thập và phân tích dữ liệu đến trực quan hoá và khuyến nghị, LA cũng giúp cung cấp các phản hồi đến với người học một cách kịp thời, chính xác và chủ động hơn. Ngoài ra, các nhà giáo dục, nhà thiết kế, nhà hướng dẫn và các nhà lãnh đạo tổ chức sẽ có được những hiểu biết mới khi quá trình học tập diễn ra liên tục và có thể nhìn thấy được. Về khái niệm, LA được định nghĩa lần đầu tiên vào năm 2011 trong Hội nghị Quốc tế đầu tiên về Phân tích học tập và Kiến thức (Learning Analytics and Knowledge - LAK)1. Theo đó, LA là những phép đo, thu thập, phân tích và báo cáo dữ liệu về người học và bối cảnh của họ, nhằm mục đích hiểu và tối ưu hoá việc học cũng như môi trường mà nó xảy ra. Là một lĩnh vực trong giảng dạy và nghiên cứu, LA hội tụ đủ ba yếu tố là Học, Phân tích và Thiết kế lấy con người làm trung tâm. Trong đó, Học là các ngành như nghiên cứu giáo dục, khoa học học tập và đánh giá, công nghệ giáo dục…; Phân tích là các hoạt động như thống kê, đánh giá trực quan, khoa học máy tính, khoa học dữ liệu, trí tuệ nhân tạo…; và Thiết kế là khả năng sử dụng, thiết kế có sự tham gia, tư duy hệ thống công nghệ xã hội... 1 https://tekri.athabascau.ca/analytics/
- 6 Mặt khác, theo Uỷ ban Lộ trình Phân tích học tập của UW-Madison (UW- Madison’s Learning Analytics Roadmap Committee - LARC)[1], LA là việc thực hiện các hoạt động được thiết kế để cải thiện kết quả của học sinh bằng cách cung cấp cấu trúc, nội dung, phân phối hoặc hỗ trợ môi trường học tập. Trong điều kiện thực tế, phân tích học tập sử dụng những dữ liệu được tạo ra trong các khóa học để cung cấp thông tin và cải thiện việc giảng dạy và học tập trong môi trường giáo dục. Phương pháp phân tích: Theo Gartner [2], có bốn loại hình của phân tích học tập được mô tả như Hình 1.1. Thứ nhất, đó chính là phân tích mô tả, cho chúng ta cái nhìn về quá khứ và trả lời câu hỏi rằng chuyện gì đã xảy ra. Nó sử dụng khai thác dữ liệu để cung cấp thông tin chi tiết và hiểu được xu hướng cũng như các chỉ số đánh giá theo thời gian. Thứ hai, phân tích chẩn đoán, trả lời câu hỏi tại sao điều đó xảy ra. Phương pháp phân tích này đặc trưng bởi các kỹ thuật như khám phá dữ liệu, khai thác dữ liệu và các mối tương quan để kiểm tra dữ liệu hoặc nội dung. Thứ ba, phân tích dự đoán, cho chúng ta hiểu tương lai, trả lời câu hỏi điều gì có thể sẽ xảy ra. Phương pháp này kết hợp dữ liệu lịch sử để xác định các mẫu trong dữ liệu, và sử dụng các mô hình thống kê và thuật toán để nắm bắt mối quan hệ giữa các tập dữ liệu, từ đó dự báo xu hướng trong tương lai. Thứ tư, phân tích gợi ý, sử dụng các thuật toán mô phỏng và tối ưu hoá để đưa ra lời khuyên về các kết quả có thể xảy ra và trả lời cho câu hỏi chúng ta nên làm gì. Hình 1.1 Các cấp độ phân tích học tập [2]
- 7 1.1.2. Ứng dụng của Phân tích học tập trong giáo dục Xét trong lĩnh vực giáo dục, có nhiều cách để áp dụng kỹ thuật LA. Tuy nhiên các nhà khoa học ở UW-Madison đã mô tả sáu cách tiếp cận theo phân loại chức năng của LA [1]. Đây cũng là sáu ứng dụng chính của LA trong giáo dục. Tiếp cận hành vi học tập Phân tích học tập có thể thu thập dữ liệu do người học tạo ra từ các hoạt động học tập và đưa ra các xu hướng trong việc tham gia học tập. Phân tích những xu hướng đó sẽ cho chúng ta biết được hành vi học tập của sinh viên và phong cách học của họ. Hướng tiếp cận này cho phép đo lường mức độ tương tác và hành vi của sinh viên thay vì hiệu suất học tập của họ. Nó cung cấp cho người giảng viên cái nhìn cụ thể về cách sinh viên của họ tương tác với khoá học. Đánh giá học tập xã hội Phân tích học tập có thể được áp dụng để điều tra các hoạt động của người học trên bất kỳ nền tảng xã hội kỹ thuật số để đánh giá lợi ích của việc học tập trên mạng xã hội. Điều này giúp đo lường và theo dõi các tương tác giữa sinh viên với sinh viên và giữa sinh viên với giảng viên, từ đó giúp hiểu được liệu sinh viên có được hưởng lợi từ việc học tập xã hội trong khóa học của họ hay không. Cải thiện tài liệu và công cụ học tập Phân tích học tập có thể theo dõi việc sử dụng tài liệu và công cụ học tập của sinh viên để xác định các vấn đề và lỗi sai tiềm ẩn, đồng thời đưa ra đánh giá khách quan về tài liệu và công cụ học tập. Điều này cho phép giảng viên đưa ra quyết định cân nhắc có nên sửa đổi các phương pháp giảng dạy hay không. Sử dụng dữ liệu tổng hợp của sinh viên, giảng viên có thể thấy nhiều cách cải thiện quá trình học tập hoặc cấu trúc khóa học của họ. Cá nhân hóa học tập Phân tích học tập được áp dụng trong các hệ thống học tập thích ứng hay cá nhân hóa giúp tùy chỉnh nội dung khóa học phù hợp cho từng người học. Hơn nữa, hồ sơ người dùng và các bộ dữ liệu khác có thể được thu thập và phân tích để trải nghiệm học tập được cá nhân hóa cao hơn. Cách tiếp cận này sử dụng phản hồi liên tục để giúp cá nhân sinh viên trong quá trình học tập của họ. Dự đoán năng lực sinh viên Dựa trên dữ liệu hiện có về mức độ tương tác và hiệu suất học tập, phân tích học tập áp dụng các mô hình thống kê và kỹ thuật học máy để dự đoán năng lực học tập
- 8 trong tương lai của sinh viên. Bằng cách này, các sinh viên có khả năng đạt kết quả thấp sẽ được xác định để từ đó các cơ sở giáo dục sẽ kịp thời hỗ trợ. Trọng tâm là sử dụng dữ liệu để hỗ trợ giảng viên thực hiện hành động ngay lập tức để can thiệp và giúp đỡ sinh viên sửa sai trước khi quá muộn. Hình dung hóa các hoạt động học tập Cách tiếp cận này theo dõi tất cả các hoạt động học tập được thực hiện bởi người dùng trong một hệ sinh thái kỹ thuật số để tạo ra các báo cáo trực quan về quá trình học tập. Các báo cáo hỗ trợ cả giảng viên và sinh viên để thúc đẩy động lực học tập, điều chỉnh thực hành và đẩy cao hiệu quả học tập. Điều này tạo điều kiện cho sinh viên nhận thức và tự phản ánh về các phương pháp học tập và hành vi của họ. 1.2. Hệ thống gợi ý - Recommender Systems (RS) 1.2.1 Khái niệm Từ khoảng đầu thế kỷ XXI trở lại đây, với sự phát triển của mạng Internet dẫn đến một lượng lớn thông tin được lưu trữ và tìm kiếm hằng ngày. Người dùng Internet lại có khá ít thời gian để tìm kiếm những thông tin mình cần trong vô vàn dữ liệu liên tục được cập nhật thậm chí hằng giờ. Sự bùng nổ về thông tin và dữ liệu kéo theo nhu cầu về bài toán hệ thống gợi ý ngày càng tăng. Trong thực tế, RS rất gần gũi với chúng ta, nó được áp dụng trong nhiều lĩnh vực của đời sống, đặc biệt là trong lĩnh vực thương mại điện tử nhằm hỗ trợ người dùng tìm kiếm hoặc quảng cáo các sản phẩm. Về khái niệm, theo [3] định nghĩa RS là một thành phần trong hệ thống thông tin, được sử dụng để hỗ trợ người dùng (user) tìm kiếm những thông tin cần thiết, dự đoán sở thích hay xếp hạng mà người dùng có thể dành cho một mục thông tin (item) nào đó mà họ chưa xem xét tới trong quá khứ. Kết quả trả lại của RS chính là các gợi ý, được tính toán dựa trên việc thu thập dữ liệu về người dùng. RS sử dụng các thuật toán Học máy (Machine Learning) để tính toán và đưa ra các dự đoán tốt nhất về sản phẩm mà người dùng có thể thích. Sản phẩm này có thể là hàng hóa nếu áp dụng trong hệ thống bán hàng, hoặc cũng có thể là một bộ phim, một bản nhạc nếu áp dụng trong hệ thống dịch vụ giải trí. Tổng quát hơn, để bảo toàn ý nghĩa của các thành phần trong RS, trong phần sau của nghiên cứu sẽ gọi sản phẩm được gợi ý là item và người dùng sẽ là user. Tùy thuộc vào item được gợi ý là gì mà RS có thể có các mục đích sử dụng cụ thể khác nhau. 1.2.2 Các thành phần cơ bản Một hệ thống cơ bản sẽ có 3 thành phần chính[3], đó là: ● Người dùng (user), là đối tượng nhận được gợi ý từ hệ thống.
- 9 ● Mục tin (item), là đối tượng hệ thống sẽ gợi ý cho người dùng. Nó có thể là các mặt hàng trên một trang thương mại điện tử, một video ở trên Youtube, cũng có thể là một người trên Facebook, còn trong luận văn này mục tin chính là kết quả học tập của sinh viên. ● Phản hồi (feedback) của mỗi người dùng cho mục tin đó. Nó có thể là điểm đánh giá, hoặc một chỉ số nào đó thể hiện độ quan tâm hoặc yêu thích của người dùng đối với mục tin đó… Sau khi đã thu thập được các thông tin về 3 thành phần cơ bản trên, ta cần phải biểu diễn các thông tin đó dưới dạng mô hình toán học có thể tính toán được. Ý tưởng ở đây chính là dùng ma trận. Một ma trận 2 chiều sẽ được tạo ra, được gọi là ma trận người dùng – mục tin (user – item) như Hình 1.2, thể hiện độ yêu thích của từng người dùng đối với các mục tin tương ứng. Hình 1.2 Ma trận user-item trong RS [3] 1.2.3 Phân loại Hệ thống gợi ý Các hệ thống gợi ý sử dụng nhiều loại thuật toán khác nhau, và dựa vào mỗi loại thuật toán mà nó áp dụng, ta sẽ có các hướng tiếp cận khác nhau. Trong các hướng tiếp cận đó, có 2 hướng chính và thường xuyên được sử dụng: ● Hệ thống gợi ý dựa trên nội dung - Content based recommender systems ● Hệ thống gợi ý dựa trên các user - Collaborative filtering recommender systems
- 10 Hình 1.3 Phân loại RS 1.2.3.1 Hệ thống gợi ý dựa trên kỹ thuật lọc cộng tác - Collaborative filtering recommender systems Kỹ thuật Collaborative filtering hay còn được gọi là lọc cộng tác hoạt động bằng cách xây dựng một cơ sở dữ liệu sở thích về các item của user, chính là ma trận user- item đã nêu ở phía trên. Sau đó kết hợp những user với các sở thích và mối quan tâm thích hợp bằng cách tính toán các độ tương tự giữa những user để tạo ra gợi ý. Kỹ thuật lọc cộng tác lại có thể được tiếp cận theo nhiều hướng khác nhau. Hai hướng tiếp cận chính trong đó là phương pháp dựa trên dữ liệu bộ nhớ và phương pháp dựa trên mô hình.
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Luận văn thạc sĩ kỹ thuật: Nghiên cứu các công nghệ cơ bản và ứng dụng truyền hình di động
143 p | 348 | 79
-
Tóm tắt luận văn thạc sĩ kỹ thuật: Nghiên cứu xây dựng hệ thống hỗ trợ quản lý chất lượng sản phẩm in theo tiêu chuẩn Iso 9001:2008 tại Công ty TNHH MTV In Bình Định
26 p | 302 | 75
-
Tóm tắt luận văn thạc sĩ kỹ thuật: Nghiên cứu xây dựng hệ thống phục vụ tra cứu thông tin khoa học và công nghệ tại tỉnh Bình Định
24 p | 290 | 70
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Tính toán hệ dầm sàn liên hợp thép - bê tông nhà nhiều tầng có kể đến tương tác không hoàn toàn giữa bản bê tông và dầm thép hình theo tiêu chuẩn Eurocode 4
26 p | 204 | 48
-
Luận văn thạc sĩ kỹ thuật: Đánh giá các chỉ tiêu về kinh tế kỹ thuật của hệ thống truyền tải điện lạnh và siêu dẫn
98 p | 185 | 48
-
Tóm tắt luận văn thạc sĩ kỹ thuật: Nghiên cứu xây dựng chương trình tích hợp xử lý chữ viết tắt, gõ tắt
26 p | 333 | 35
-
Tóm tắt luận văn thạc sĩ kỹ thuật - Đề tài: Xây dựng kho ngữ vựng song ngữ Việt - Êđê trong xử lý tiếng Êđê
26 p | 227 | 31
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng khai phá dữ liệu để trích rút thông tin theo chủ đề từ các mạng xã hội
26 p | 226 | 30
-
Tóm tắt luận văn thạc sĩ kỹ thuật: Nghiên cứu và xây dựng hệ thống Uni-Portal hỗ trợ ra quyết định tại trường Đại học Bách khoa, Đại học Đà Nẵng
26 p | 212 | 25
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng giải thuật di truyền giải quyết bài toán tối ưu hóa xếp dỡ hàng hóa
26 p | 240 | 23
-
Tóm tắt luận văn thạc sĩ kỹ thuật: Nghiên cứu xây dựng giải pháp kiểm tra hiệu năng FTP server
26 p | 170 | 22
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng web ngữ nghĩa và khai phá dữ liệu xây dựng hệ thống tra cứu, thống kê các công trình nghiên cứu khoa học
26 p | 160 | 17
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Khai phá dữ liệu từ các mạng xã hội để khảo sát ý kiến đánh giá các địa điểm du lịch tại Đà Nẵng
26 p | 201 | 15
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Nghiên cứu ứng dụng luật kết hợp trong khai phá dữ liệu phục vụ quản lý vật tư, thiết bị trường Trung học phổ thông
26 p | 152 | 15
-
Tóm tắt luận văn thạc sĩ kỹ thuật: Nghiên cứu xây dựng giải pháp phòng vệ nguy cơ trên ứng dụng web
13 p | 146 | 14
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Tính toán dầm thép chịu cắt theo TCXDVN 338:2005 và theo Quy phạm Hoa Kỳ AISC-2005
25 p | 95 | 13
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Nghiên cứu ứng dụng thuật toán ACO cho việc định tuyến mạng IP
26 p | 156 | 8
-
Luận văn Thạc sĩ Kỹ thuật: Nghiên cứu đề xuất một số giải pháp kỹ thuật phòng chống cháy nổ khí metan khi khai thác xuống sâu dưới mức -35, khu Lộ Trí - Công ty than Thống Nhất - TKV
73 p | 10 | 7
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn