Luận văn Thạc sĩ Hệ thống thông tin: Ứng dụng học sâu để tối ưu hóa quá trình in 3D SLM để đạt được đường in ổn định

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:70

Thêm vào BST

Báo xấu

15
lượt xem 5
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn "Ứng dụng học sâu để tối ưu hóa quá trình in 3D SLM để đạt được đường in ổn định" được hoàn thành với mục tiêu nhằm tiến hành nhận dạng các đường in Laser từ dữ liệu có sẵn, gán nhãn cho dữ liệu; Tiến hành xây dựng bộ dữ liệu mới từ hình chụp các đường in Laser; Áp dụng thử nghiệm các mô hình học máy CNN để nhận diện các đường in tốt, xấu từ đó mục tiêu đưa ra các thông số in.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Luận văn Thạc sĩ Hệ thống thông tin: Ứng dụng học sâu để tối ưu hóa quá trình in 3D SLM để đạt được đường in ổn định

ỦY BAN NHÂN DÂN TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT TRẦN THỊ NHƯ QUỲNH ỨNG DỤNG HỌC SÂU ĐỂ TỐI ƯU HOÁ QUÁ TRÌNH IN 3D SLM ĐỂ ĐẠT ĐƯỢC ĐƯỜNG IN ỔN ĐỊNH CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8 48 01 04 LUẬN VĂN THẠC SĨ BÌNH DƯƠNG – 2022
UỶ BAN NHÂN DÂN TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT TRẦN THỊ NHƯ QUỲNH ỨNG DỤNG HỌC SÂU ĐỂ TỐI ƯU HOÁ QUÁ TRÌNH IN 3D SLM ĐỂ ĐẠT ĐƯỢC ĐƯỜNG IN ỔN ĐỊNH CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8 48 01 04 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. MAI HOÀNG BẢO ÂN BÌNH DƯƠNG – 2022
i MỤC LỤC LỜI CAM ĐOAN ............................................................................................................ iii LỜI CẢM ƠN .................................................................................................................. iv DANH MỤC CHỮ VIẾT TẮT ........................................................................................ v DANH MỤC BẢNG ....................................................................................................... vi DANH MỤC BẢNG ..................................................................................................... viii MỞ ĐẦU .......................................................................................................................... 1 1. Lý do chọn đề tài .................................................................................................. 1 2. Mục tiêu nghiên cứu: ............................................................................................ 2 3. Tổng quan nghiên cứu của đề tài .......................................................................... 2 4. Đối tượng, phạm vi nghiên cứu ............................................................................ 2 5. Phương pháp nghiên cứu ...................................................................................... 2 6. Đóng góp của đề tài .............................................................................................. 3 7. Cấu trúc của đề tài ................................................................................................ 3 CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN ................ 5 1.1. Mạng Nơ- ron tích chập ...................................................................................... 5 1.1.1. Mạng Nơ- ron nhân tạo ................................................................................... 5 1.1.2. Mạng Nơ-ron tích chập ................................................................................. 14 1.2. Các mô hình học sâu CNN .................................................................................. 21 1.2.1. Sự hình thành và phát triển ........................................................................... 21 1.3. Tiểu kết chương ............................................................................................... 27 CHƯƠNG 2: XỬ LÝ DỮ LIỆU ĐƯỜNG IN ĐƠN 3D SLM ....................................... 28 2.1. Giới thiệu bộ dữ liệu ............................................................................................ 28 2.2. Tổng quan về xử lý dữ liệu .................................................................................. 30 2.3. Phân loại các đường in đơn trong quá trình in 3D SLM ...................................... 32 2.3.1. Tổng quan ..................................................................................................... 32 2.3.2. Hướng tiếp cận .............................................................................................. 36 2.3.3. Hướng đề xuất nghiên cứu ............................................................................ 36 2.4. Tiểu kết chương ................................................................................................... 37 CHƯƠNG 3: MÔ HÌNH ĐỀ XUẤT VÀ THỰC NGHIỆM .......................................... 38 3.1. Giới thiệu bộ dữ liệu ............................................................................................ 38 3.2. Tổng quan mô hình đề xuất ................................................................................. 39 3.3. Các đặc trưng của mô hình .................................................................................. 40 3.3.1. Gán nhãn cho dữ liệu .................................................................................... 40 3.3.2. Nhận dạng các đường in đơn 3D với CNN ................................................... 41
ii 3.3.3. Phương pháp đánh giá kết quả .......................................................................... 42 3.4. Huấn luyện mô hình ............................................................................................. 44 3.5. Đánh giá ............................................................................................................... 45 KẾT LUẬN..................................................................................................................... 48 HƯỚNG NGHIÊN CỨU ................................................................................................ 49 TÀI LIỆU THAM KHẢO .............................................................................................. 50
iii LỜI CAM ĐOAN Tên tôi là: Trần Thị Như Quỳnh Sinh ngày: 10/07/1995 Học viên lớp cao học CH20HT01 – Trường Đại học Thủ Dầu Một Xin cam đoan: Đề tài “Ứng dụng học sâu để tối ưu hóa quá trình in 3D SLM để đạt được đường in ổn định” do Thầy TS. Mai Hoàng Bảo Ân hướng dẫn là công trình nghiên cứu của riêng tôi. Tất cả tài liệu tham khảo đều có nguồn gốc, trích dẫn rõ ràng. Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như trong đề cương và yêu cầu của Giảng viên hướng dẫn. Nếu sai tôi hoàn toàn chịu trách nhiệm trước hội đồng khoa học. Bình Dương, ngày tháng năm 2022 Tác giả luận văn Trần Thị Như Quỳnh
iv LỜI CẢM ƠN Sau một thời gian nghiên cứu và làm việc nghiêm túc, được sự động viên, giúp đỡ và hướng dẫn tận tình của Giảng viên Hướng dẫn TS. Mai Hoàng Bảo Ân, Luận văn Cao học “Ứng dụng học sâu để tối ưu hóa quá trình in 3D SLM để đạt được đường in ổn định” đã hoàn thành. Tôi xin bày tỏ lòng biết ơn sâu sắc đến: Giảng viên Hướng dẫn TS. Mai Hoàng Bảo Ân đã tận tình chỉ dẫn, giúp đỡ tôi hoàn thành luận văn này. Đồng thời tôi gửi lời cảm ơn đến các thầy, cô đã giảng dạy truyền đạt kiến thức, kinh nghiệm cho tôi trong suốt thời gian học tập và nghiên cứu. Tôi chân thành cảm ơn bạn bè, đồng nghiệp và gia đình đã động viên, khích lệ, tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập, thực hiện và hoàn thành luận văn này.
v DANH MỤC CHỮ VIẾT TẮT KÝ HIỆU TÊN TIẾNG ANH ANN Artificial Neural Network CNN Convolution Neural Network FC Fully Connected Conv Convolution layer Modified National Institute of Standards and MNIST Technology database ReLU Rectified Linear Unit RGB Red Green Blue SLM Selective Laser Melting AM Additive Manufacturing
vi DANH MỤC BẢNG Hình 1. 1: Mạng Nơ-ron sinh học ..................................................................................... 5 Hình 1. 2: Cấu trúc mạng Nơ-ron nhân tạo [2] ................................................................. 6 Hình 1. 3: Quá trình xử lý của một nơ-ron trong ANN [1]............................................... 7 Hình 1. 4: Đồ thị và công thức các hàm kích hoạt: (a) Hàm Sigmoid; (b) Hàm Tanh; (c) Hàm ReLU ........................................................................................................................ 8 Hình 1. 5: Trò chơi Alpha Go ......................................................................................... 11 Hình 1. 6: Mô phỏng cách tính của thuật toán lan truyền ngược [3] .............................. 13 Hình 1. 7: Mô hình các lớp cơ bản CNN [4] .................................................................. 15 Hình 1. 8: Ví dụ về mô hình CNN .................................................................................. 16 Hình 1. 9: Cơ chế hoạt động của tích chập ..................................................................... 17 Hình 1. 10: Minh họa cách tính tích chập trên ma trận ảnh ............................................ 18 Hình 1. 11: Phép tương quan chéo hai chiều .................................................................. 18 Hình 1. 12: Tính toán trong Conv2D .............................................................................. 19 Hình 1. 13: Phương thức Average Pooling và Max Pooling .......................................... 20 Hình 1. 14: Các cột mốc phát triển của mạng CNN ....................................................... 22 Hình 1. 15. Sự phát triển của các mô hình CNN ............................................................ 22 Hình 1. 16: Kiến trúc LeNet ........................................................................................... 23 Hình 1. 17: Kiến trúc AlexNet ........................................................................................ 23 Hình 1. 18: Kiến trúc VGG-16 ....................................................................................... 24 Hình 1. 19: Mô hình Inception........................................................................................ 25 Hình 1. 20: Kiến trúc mạng GoogleNet – Inception V1 ................................................. 25 Hình 1. 21: Kiến trúc mạng ResNets (2015) .................................................................. 26 Hình 1. 22: Kiến trúc DenseNet (2016) .......................................................................... 27 Hình 2. 1: Ảnh chụp các đường đơn dài 10 mm (các đường ngang mảnh) được tạo bởi quá trình SLM ................................................................................................................. 28 Hình 2. 2: Ba loại đường in trong bộ dữ loại: (a): loại 1, (b): loại 2, (c): loại 3 ............. 29 Hình 2. 3: Thống kê bộ dữ liệu chia làm 3 loại theo mức năng lượng và vận tốc quét [10] .................................................................................................................................. 30 Hình 2. 4: Các bước xử lý bộ dữ liệu .............................................................................. 30 Hình 2. 5: Quá trình phân hoạch chia thành các đường in đơn ...................................... 31 Hình 2. 6: Chia dữ liệu thành 10 đường in đơn .............................................................. 31 Hình 2. 7: Chia một đường in đơn thành 12 đường in đơn ............................................. 31
vii Hình 2. 8:Gán nhãn các bộ dữ liệu sau phân hoạch (0 là đường xấu, 1 là đường tốt) .... 32 Hình 2. 9: Nguyên lý hoạt động của công nghệ in 3D SLM .......................................... 33 Hình 2. 10: Hình vi quang học đường in 3D SLM tốt .................................................... 34 Hình 2. 11: Hình vi quang học đường in 3D SLM xấu .................................................. 34 Hình 2. 12: Các loại lỗi của đường in đơn SLM [10] ..................................................... 34 Hình 2. 13: Cấu trúc mô hình nhận dang đường in 3D SLM tốt, xấu ............................ 35 Hình 3. 1: Dữ liệu các đường in đơn sau khi tách ra từ bộ dữ liệu hình gốc .................. 38 Hình 3. 2: Mô hình tổng quan ......................................................................................... 39 Hình 3. 3: Tỷ lệ đường in tốt và đường in xấu bộ dữ liệu chia 10 - 4220 hình .............. 40 Hình 3. 4: Tỷ lệ đường in tốt và đường in xấu bộ dữ liệu chia 12 - 5064 hình .............. 40 Hình 3. 5: Góc nhìn của máy tính với một bức ảnh ........................................................ 41 Hình 3. 6: Hình minh hoạ mô hình xử lý ảnh qua các lớp CNN .................................... 41 Hình 3. 7: Ma trận nhầm lẫn – Confusion Matrix .......................................................... 42 Hình 3. 8: Cấu trúc mạng CNN 9 tầng 4 lớp .................................................................. 44 Hình 3. 9: Hình ảnh nhận dạng các đường in 3D tốt và xấu theo bộ huấn luyện 5064 ảnh ........................................................................................................................................ 47
viii DANH MỤC BẢNG Bảng 1: Giá trị công suất laser và tốc độ quét được sử dụng để tạo ra các đường in đơn bằng quy trình SLM [10] ................................................................................................ 29 Bảng 2: Đánh giá độ chính xác của mô hình đối với 2 bộ dữ liệu................................. 46
1 MỞ ĐẦU 1. Lý do chọn đề tài Ngày nay, công nghệ in 3D ngày càng phát triển, phương pháp in SLM (Selective Laser Melting), một tên khác DMLS (Direct Metal Laser Sintering) là kỹ thuật tạo mẫu nhanh, in 3D, hoặc bồi đắp vật liệu (Additive Manufacturing - AM) được thiết kế để sử dụng laser công suất cao để làm tan chảy và liên kết bột kim loại với nhau. Quá trình SLM có khả năng làm tan chảy hoàn toàn vật liệu kim loại và tạo thành sản phẩm 3D, có thể áp dụng cho nhiều hợp kim khác nhau, cho phép các nguyên mẫu có độ cứng bằng với vật liệu tạo ra sản phẩm. Ưu điểm của phương pháp là có thể sản xuất các chi tiết phức tạp, gồm các dạng khối, dạng lưới hoặc mạng được kết hợp để tạo thành một sản phẩm duy nhất, chẳng hạn như thân cây, mô hình cấy ghép,... Phần lớn ứng dụng chính của công nghệ SLM là các chi tiết nhẹ trong lĩnh vực hàng không vũ trụ mà các phương pháp truyền thống không thể tạo ra được do có những hạn chế như dụng cụ, phương pháp gia công vật lý vào các bề mặt gia công, hạn chế trong thiết kế. SLM có thể tạo ra các chi tiết dạng lưới bằng phương pháp bồi đắp vật liệu thay vì phải cắt bỏ vật liệu như các phương pháp gia công truyền thống. Với mỗi mức năng lượng in và tốc độ khác nhau của tia Laser đường in lớn, đường in nhỏ không đều. Song khi thực hiện in các chi tiết nhỏ thì các đường in không ổn định và sẽ không cho ta sản phẩm mong muốn. Mặt khác, chi phí để chạy thử nghiệm cho từng chi tiết là rất cao vì vậy cần áp dụng mô hình học máy để nhận diện các đường in từ đó đưa ra các phương án dự đoán để tạo ra các đường in ổn định từ đó cài đặt các máy laser để tiết kiệm chi phí hoạt động và thử nghiệm. Đó là lý do tôi chọn đề tài “Ứng dụng học sâu để tối ưu hóa quá trình in 3D SLM để đạt được đường in ổn định” cho luận văn tốt nghiệp cao học của mình.
2 2. Mục tiêu nghiên cứu: Mục tiêu của đề tài là Ứng dụng học sâu để tối ưu các thông số đầu vào của phương pháp in SLM để đạt được đường in ổn định. Để đạt được mục tiêu trên, đề tài cần thực hiện các mục tiêu sau: - Xử lý dữ liệu hình ảnh ban đầu - Tiến hành nhận dạng các đường in Laser từ dữ liệu có sẵn, gán nhãn cho dữ liệu. - Tiến hành xây dựng bộ dữ liệu mới từ hình chụp các đường in Laser - Áp dụng thử nghiệm các mô hình học máy CNN để nhận diện các đường in tốt, xấu từ đó mục tiêu đưa ra các thông số in. 3. Tổng quan nghiên cứu của đề tài Trong luận văn này, chúng tôi trình bày phương pháp xử lý dữ liệu thô hình vi quang học được chụp từ máy in 3D. Đồng thời, từ bộ dữ liệu nhỏ ban đầu có được từ những thực nghiệm của 1 phòng Lab tại Pháp thực hiện phân tích từ đó phần hoạch dữ liệu để có bộ dữ liệu đủ lớn đáp ứng được quá trình huấn luyện. Sau nhiều thực nghiệm, tôi nhận thấy rằng phương pháp học máy Mạng nơ-ron tích chập CNN mang lại hiệu quả nhận dạng đối với bộ dữ liệu khá cao và có tính ổn định. Kết quả cho thấy việc nhận dạng các đường in có độ chính xác khá ổn định song việc chia bộ dữ liệu đủ lớn giúp thuật toán trở nên chính xác hơn. 4. Đối tượng, phạm vi nghiên cứu Dữ liệu các đường in đơn được chụp từ máy in 3D SLM trong quá trình in. 5. Phương pháp nghiên cứu Để thực hiện đề tài này, tác giả sử dụng các phương pháp nghiên cứu sau: - Phương pháp phân tích và tổng hợp lý thuyết: Tìm kiếm, tổng hợp và nghiên cứu các tài liệu về chọn lọc hình ảnh, chia dữ liệu, Tìm kiếm và nghiên cứu các tài liệu về Mạng nơ-ron tích chập (Convolutional Neural Network – CNN). Tìm hiểu các kiến thực kỹ thuật lập trình liên quan.
3 - Phương pháp xử lý ảnh: xử lý ảnh đầu vào, lọc nhiễu từ ảnh thực nghiệm, phân hoạch hình,… - Phương pháp thực nghiệm: Sau khi nghiên cứu lý thuyết, xác định các vấn đề của bài toán từ đó đề xuất môn hình, dựa trên kết quả chạy thử cải tạo mô hình kết hợp với các phương pháp xử lý dữ liệu để đưa ra thuật toán tốt nhất. - Phương pháp so sánh và đánh giá: để phân tích đánh giá mô hình đề xuất với các mô hình nghiên cứu trước. 6. Đóng góp của đề tài - Bộ dự liệu được xử lý và gán nhãn theo góc nhìn của người viết. - Đoạn chương trình để xử lý hình ảnh, phương pháp xử lý. - Các đoạn chương trình để nhận biết hình ảnh tốt và xấu. 7. Cấu trúc của đề tài Chương 1: Cơ sở lý thuyết và các nghiên cứu liên quan 1.1. Mạng Nơ- ron tích chập 1.1.1. Mạng Nơ- ron nhân tạo 1.1.2. Mạng Nơ-ron tích chập 2.2. Các mô hình học sâu CNN 2.2.1. Sự hình thành và phát triển 2.3. Phân loại các đường in đơn trong quá trình in 3D SLM 2.3.1. Tổng quan 2.3.2. Hướng tiếp cận 2.3.3. Hướng đề xuất nghiên cứu 2.4. Tiểu kết chương Chương 2: Xử lý dữ liệu đường in đơn 3D SLM 2.1. Giới thiệu bộ dữ liệu 2.2. Tổng quan về xử lý dữ liệu 2.3. Tiểu kết chương Chương 3: Mô hình đề xuất và thực nghiệm
4 3.1. Giới thiệu bộ dữ liệu 3.2. Tổng quan mô hình đề xuất 3.3. Các đặc trưng của mô hình 3.3.1. Gán nhãn cho dữ liệu 3.3.2. Nhận dạng các đường in đơn 3D với CNN 3.3.3. Phương pháp đánh giá kết quả 3.4. Huấn luyện mô hình 3.5. Đánh giá Kết luận Hướng nghiên cứu
5 CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN 1.1. Mạng Nơ- ron tích chập 1.1.1. Mạng Nơ- ron nhân tạo Mạng Nơ-ron nhân tạo (Artificial Neural Network – ANN hay Neural Network) là mô hình xử lý thông tin được mô phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật hay còn gọi là mạng Nơ-ron sinh học (Hình 1.1 [1]. Cấu tạo từ số lượng lớn các nơ-ron được kết nối với nhau để xử lý thông tin. ANN giống như bộ não con người, được học bởi kinh nghiệm thông qua huấn luyện, có khả năng lưu giữ những kinh nghiệm tri thức và sử dụng những tri thức đó trong việc dự đoán các dữ liệu chưa biết. ANN được giới thiệu năm 1943 bởi nhà thần kinh học Warren McCulloch và nhà logic học Walter Pits. [1] Hình 1. 1: Mạng Nơ-ron sinh học1 Một số ứng dụng của Mạng Nơ-ron được sử dụng trong nhiều lĩnh vực khác nhau như kinh tế, giáo dục, y tế, công nghệ thông tin, công nghệ blockchain,… để giải quyết một số bài toán phúc tạp đòi hỏi độ chính xác cao trong khai phá dữ liệu, nhận dạng hình ảnh…..đỉnh hình là các giao dịch chứng khoán, nén hình ảnh, tối ưu quãng đường di chuyển,…. 1 vinmec.com
6 Cấu trúc của một mô hình ANN gồm 3 tầng: lớp đầu vào (input layer), các lớp ẩn (hidden layers) và lớp cuối cùng là lớp đầu ra (output layer); các hình tròn được gọi là node được mô tả trong hình 1.2 [2], trong đó, lớp ẩn có thể có nhiều lớp nơ-ron để nhận dữ liệu từ các lớp trước để xử lý sau đó chuyển đổi các dữ liệu này cho các lớp kế tiếp. Hình 1. 2: Cấu trúc mạng Nơ-ron nhân tạo [2] Mỗi mô hình luôn có một lớp đầu vào, một lớp cuối cùng, có thể có hoặc không có các lớp ẩn. Tổng số các lớp trong môn hình được quy ước là số lớp (không tính lớp đầu vào) Mỗi node trong mạng ANN được gọi là một Nơ-ron. Các dữ liệu đầu vào được truyền đến mỗi Nơ-ron nhận xử lý chúng và trả ra một kết quả duy nhất. Kết quả đầu ra của nơ- ron này có thể làm dữ liệu đầu vào của các nơ-ron khác. Quá trình xử lý của một nơ-ron trong ANN được mô tả như Hình 1.3 [1]. Trong đó, đầu vào là dữ liệu input, còn đầu ra là dữ liệu output. Trọng số liên kết hay trọng số (connection weights hay gọi tắt là weights) là thành phần rất quan trọng, thể hiện mức độ quan trọng đối với quá trình xử lý dữ liệu từ lớp này sang lớp khác. Quá trình học của ANN thực ra là quá trình điều chỉnh trọng số của các dữ liệu đầu vào.
7 Hình 1. 3: Quá trình xử lý của một nơ-ron trong ANN [1] Hàm tính tổng của tích trọng số và dữ liệu vào của một Nơ -ron có k dữ liệu đầu vào của lớp thứ i là: ai   xk wi ,k (1. 1) Hàm kích hoạt hay hàm chuyển đổi (activation function) tính toán đầu ra của một nơ-ron để chuyển đến lớp tiếp theo trong mạng nơ-ron. Trong mạng Hàm kích hoạt phi tuyến được sử dụng vì mạng chỉ sử dụng các hàm kích hoạt tuyến tính có thể lược giản thông qua các biến đổi đại số thành mô hình perceptron một lớp (là mô hình ANN đơn giản nhất, không có lớp ẩn). Một số hàm kích hoạt phi tuyến thường dùng là ReLU (Rectified Linear Unit), sigmoid, logistic, Gaussian, tanh, softmax. Hình 1.4 1 Hàm sigmoid: x x (1. 2) 1 e ex e x Hàm tanh: tanh x (1. 3) ex e x Hàm ReLU: ReLU x max 0, x (1. 4)
8 (a) (b) (c) Hình 1. 4: Đồ thị và công thức các hàm kích hoạt: (a) Hàm Sigmoid; (b) Hàm Tanh; (c) Hàm ReLU2
9 Hàm tổng của mạng Nơ-ron đầu ra tùy thuộc và bộ dữ liệu mà nó có thể có giá trị rất lớn, vì vậy hàm kích hoạt được dùng để xử lý đầu ra để chuyển đến lớp tiếp theo. Ngoài việc sử dụng hàm kích hoạt, ta cũng có thể sử dụng các hàm ngưỡng (threshold function) để kiểm soát đầu ra của mạng nơ-ron. Một số dạng mạng nơ-ron nhân tạo: Một ANN được gọi là mạng liên kết đầy đủ (fully connected) nếu mọi đầu ra từ một tầng liên kết với mọi nơ-ron của tầng kế tiếp. Một ANN được gọi là mạng liên truyền tiến (feedforward network) nếu không có bất kỳ đầu ra của một nút là đầu vào của một nút khác thuộc cùng tầng (hoặc thuộc một tầng phía trước). Một ANN được gọi là mạng phản hồi (feedback network) nếu các đầu ra của một nút liên kết ngược lại làm các đầu vào của một nút thuộc cùng tầng (hoặc thuộc một tầng phía trước). Nếu phản hồi là liên kết đầu vào đối với các nút thuộc cùng tầng, thì đó gọi là mạng phản hồi bên (lateral feedback network). Một ANN được gọi là mạng hồi quy (recurrent network) nếu các mạng phản hồi có các vòng lặp kín (closed loops). Quá trình học của mạng nơ-ron là quá trình xử lý và truyền dữ liệu theo các kết nối và thay đổi giá trị trọng số tại các nút để đạt được kết quả tốt nhất. Mạng nơ-ron thường được huấn luyện theo ba phương pháp học, đó là học có giám sát, học không giám sát và học tăng cường: Học có giám sát (supervised learning): là phương pháp học từ một tập dữ liệu huấn luyện ta đã biết trước nhãn của dữ liệu cần học và số lớp cần phân loại của bộ dữ liệu được đem đi huấn luyện. Đây là phương pháp học phổ biến nhất trong các phương pháp học của mạng nơ-ron. Mục đích của phương pháp này là từ tập dữ liệu đã gán nhãn qua quá trình học tạo ra một hàm số thật tốt để khi có dữ liệu mới ta có thể tính hay dự đoán được nhãn tương ứng của dữ liệu đó [1].
10 Phương pháp học có giám sát được chia làm hai loại chính: - Phân loại (classification): Nếu các nhãn của bộ dữ liệu đầu vào được chia thành một số hữu hạn nhóm. Ví dụ: Gmail xác định xem một email có spam hay không, bài toán nhận dạng chữ viết tay,… - Hồi quy (Regression): Nếu các nhãn của bộ dữ liệu đầu vào không được chia thành các nhóm mà là một giá trị thực cụ thể. Ví dụ bài toán về dự đoán giá nhà, dự đoán tuổi,….. Học không giám sát (Unsupervised Learning): trong thuật toán này chúng ta không biết được dữ liệu đầu ra hay nhãn của nó mà chỉ có dữ liệu đầu vào. Thuật toán sẽ dựa vào cấu trúc của dữ liệu để thực hiện các công việc như phân nhóm hay giảm chiều của dữ liệu,…để thuận tiện trong lưu trữ và tính toán. Học không giám sát dựa trên các quan hệ tương tự, sự đồng xuất hiện, hay các phép biến đổi ma trận. Một số thuật toán học không giám sát như K-mean, DBSCAN, Spectral Clustering, Hierarchical clustering- Apriori (Association Rule Mining)- PCA, SVD,… Học tăng cường (Reinforcement Learning): là phương pháp học để đưa ra một chuỗi các quyết định. Học tăng cường bằng cách thử nghiệm dữ liệu để khám phá ra hành động nào là tốt nhất như trò chơi. Máy tính sử dụng thử và sai (trial and error) để đưa ra giải pháp cho vấn đề. Các máy (agent) sẽ nhận được phần thưởng (reward) hoặc hình phạt (penalty) cho những hành động(action) mà nó thực hiện. Mục tiêu của nó là tối đa hóa tổng phần thưởng. Môi trường học thường được biểu diễn dưới dạng quy trình quyết định markov (Markov Decision Process - MDP) trạng thái hữu hạn và các thuật toán học tăng cường liên quan đến các kỹ thuật quy hoạch động. Hiện tại, học tăng cường được ứng dụng trong các lĩnh vực kinh doanh, tiếp thị, quảng cáo giúp phân tích hành vi khách hàng từ đó đưa ra các chiến lược kinh