intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Khoa học máy tính: Phân lớp đồng phục sinh viên dùng mô hình học sâu

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:88

37
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục tiêu hướng đến của bài toán là thử nghiệm phân lớp đồng phục sinh viên trên một số khoa để tìm hiểu một mô hình CNN phù hợp cho việc phân lớp hình ảnh đồng phục sinh viên. Bài toán áp dụng với đối tượng đầu vào là ảnh màu, cụ thể là ảnh chụp sinh viên đang mặc áo đồng phục. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Khoa học máy tính: Phân lớp đồng phục sinh viên dùng mô hình học sâu

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH Dương Xuân Huy PHÂN LỚP ĐỒNG PHỤC SINH VIÊN DÙNG MÔ HÌNH HỌC SÂU Chuyên ngành: Khoa học máy tính Mã số: 8 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HOC: PGS.TS. LÊ HOÀNG THÁI Thành phố Hồ Chí Minh - 2019
  2. Lời cam đoan Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tôi xin cam đoan đây là công trình nghiên cứu của bản thân tôi, dưới sự hướng dẫn khoa học của Thầy PGS.TS. Lê Hoàng Thái (Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên - Đại học Quốc gia Thành phố Hồ Chí Minh). Các thông tin và số liệu của luận văn có nguồn gốc rõ ràng, cụ thể, các trích dẫn theo đúng quy định hiện hành. Tôi xin cam đoan nội dung và kết quả của luận văn này xuất phát từ công sức và quá trình lao động, nghiên cứu hoàn toàn trung thực, khách quan. Tp. Hồ Chí Minh, tháng 12 năm 2019 Tác giả Dương Xuân Huy
  3. Lời cám ơn Lời đầu tiên, tôi xin gửi lời cám ơn sâu sắc nhất đến thầy PGS.TS. Lê Hoàng Thái (Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên - Đại học Quốc gia Thành phố Hồ Chí Minh) đã hướng dẫn luận văn cũng như phát triển định hướng. Tôi cũng xin cám ơn thầy ThS. Trần Sơn Hải (Khoa Công nghệ Thông tin, Trường Đại học Sư Phạm Thành phố Hồ Chí Minh) đã góp công sức hướng dẫn, hỗ trợ và các đồng chí trong Ban Chấp hành Đoàn Trường, Ban Chấp hành đoàn các khoa Giáo dục Tiểu học, Giáo dục Mầm non, Giáo dục Đặc Biệt, Công nghệ Thông tin của Trường Đại học Sư phạm Thành phố Hồ Chí Minh đã bỏ nhiều thời gian hỗ trợ trong việc thu thập, kiểm tra và gán nhãn dữ liệu để thực hiện được đề tài trong luận văn này. Tôi cũng gửi lời cám ơn chân thành đến quý Thầy/ Cô giảng dạy các môn ngành Khoa học máy tính khóa K28 đã cung cấp kiến thức quý báu làm nền tảng cơ bản trong quá trình học tập nghiên cứu. Đồng thời, xin gửi lời cám ơn đến quý Thầy/Cô Ban Chủ nhiệm khoa Công nghệ Thông tin và quý Thầy/Cô phòng Sau Đại học Trường Đại học Sư phạm Thành phố Hồ Chí Minh đã hỗ trợ, tạo điều kiện thuận lợi cho tôi trong suốt thời gian qua. Trong quá trình thực hiện và tìm hiểu nghiên cứu đề tài, tôi đã gặp rất nhiều khó khăn và được quý Thầy/Cô hỗ trợ, động viên để tôi hoàn thành tốt Luận văn này. Cuối cùng, tôi xin bày tỏ lòng biết ơn đến gia đình, bạn bè đã động viên, hỗ trợ vật chất lẫn tinh thần trong suốt quá trình học tập cũng như nghiên cứu thực hiện luận văn này. Chân thành cám ơn quý vị. Tác giả
  4. Dương Xuân Huy MỤC LỤC Trang Lời cam đoan Lời cảm ơn Mục lục Danh mục thuật ngữ và viết tắt Danh mục các bảng biểu Danh mục hình vẽ CHƯƠNG 1. TỔNG QUAN .................................................................................... 1 1.1. Khái quát về đồng phục sinh viên ................................................................... 1 1.2. Bài toán phân lớp đồng phục sinh viên ........................................................... 6 1.3. Mục tiêu hướng đến của bài toán .................................................................... 7 1.4. Hướng tiếp cận và giải pháp cho bài toán ....................................................... 7 CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN ... 10 2.1. Hệ thống phân lớp hình ảnh........................................................................... 10 2.1.1. Bài toán phân lớp .................................................................................. 10 2.1.2. Các kỹ thuật phân lớp cơ bản................................................................ 12 2.1.3. Các tiêu chuẩn đánh giá ........................................................................ 23 2.2. Kỹ thuật phân lớp ảnh dùng Convolutional Neural Network ........................ 23 2.2.1. Kiến trúc cơ bản của mô hình CNN ..................................................... 26 2.2.2. Một số kiến trúc CNN thông dụng ....................................................... 33 2.2.3. Tập dữ liệu đầu vào cho mô hình CNN ................................................ 41 2.2.4. Độ đo đánh giá mô hình ........................................................................ 42 CHƯƠNG 3. MÔ HÌNH CNN CHO PHÂN LỚP ĐỒNG PHỤC SINH VIÊN CÁC KHOA CỦA TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HCM .. 46 3.1. Tiền xử lý ảnh và chuẩn hóa dữ liệu.............................................................. 46
  5. 3.2. Đề xuất mô hình CNN ................................................................................... 49 3.3. Quá trình huấn luyện mô hình và phân lớp hình ảnh .................................... 53 CHƯƠNG 4. THỰC NGHIỆM VÀ BÀN LUẬN ................................................ 55 4.1. Cơ sở dữ liệu .................................................................................................. 55 4.2. Môi trường thực nghiệm ................................................................................ 58 4.3. Quá trình thực nghiệm ................................................................................... 59 4.4. Kết quả thực nghiệm ...................................................................................... 59 4.4.1. Tỉ lệ tập huấn luyện và kiểm tra ........................................................... 59 4.4.2. Kích thước ảnh đầu vào ........................................................................ 65 4.4.3. Tăng thêm số lượng ảnh đầu vào .......................................................... 68 4.4.4. Tổng kết kết quả thực nghiệm .............................................................. 73 CHƯƠNG 5. KẾT LUẬN VÀ KHUYẾN NGHỊ ................................................. 75 5.1. Kết luận .......................................................................................................... 75 5.2. Kiến nghị ....................................................................................................... 76 TÀI LIỆU THAM KHẢO...................................................................................... 77
  6. DANH MỤC THUẬT NGỮ VÀ VIẾT TẮT Chữ viết Nguyên mẫu Diễn giải tắt Convolutional Neural CNN Mạng nơ-ron tích chập Networks NN Neural Networks Mạng nơ-ron SVM Support Vector Machine Máy vector hỗ trợ KNN K-Nearest Neighbor K Láng giềng gần nhất ReLU Rectified Linear Unit Hàm kích hoạt ReLU GPU Graphics Processing Unit Bộ xử lý đồ họa CONV Covolutional layer Tầng tích chập POOL Pooling layer Tầng giảm số chiều FC Fully connected layer Tầng kết nối đầy đủ
  7. DANH MỤC CÁC BẢNG BIỂU Bảng 4.1. Thống kê số lượng và dung lượng của tập ảnh đồng phục sinh viên. ..... 56 Bảng 4.2. Thống kê số liệu tập dữ liệu đầu vào ....................................................... 58 Bảng 4.3. Thống kê kết quả thực nghiệm thay đổi tỉ lệ phân bố tập dữ liệu ........... 64 Bảng 4.4. Thống kê kết quả thực nghiệm với 3 kích thước ảnh đầu vào ................ 68 Bảng 4.5. Thống kê kết quả thực nghiệm với bộ dữ liệu tăng thêm ........................ 70 Bảng 4.6. Thống kê kết quả thực nghiệm huấn luyện 300 lần với bộ dữ liệu tăng thêm ......................................................................................................... 71
  8. DANH MỤC HÌNH VẼ Hình 1.1. Đồng phục sinh viên một số khoa trực thuộc Trường Đại học Sư phạm Thành phố Hồ Chí Minh. .......................................................................... 2 Hình 1.2. Chương trình Perfect Student do Đoàn Trường triển khai. ....................... 2 Hình 1.3. Ảnh sinh viên đang mặc đồng phục được đăng tải trên mạng xã hội. ....... 3 Hình 1.4. Mô tả đồng phục của một số khoa nhiều đặc điểm gần giống nhau. ......... 4 Hình 1.5. Minh họa vấn đề phân lớp đồng phục sinh viên ........................................ 5 Hình 1.6. Các bước thực hiện bài toán phân lớp đồng phục dùng mô hình CNN ..... 6 Hình 2.1. Mô tả bài toán phân lớp và bài toán phân cụm ........................................ 11 Hình 2.2. Thuật toán K-Mean với 3 vùng dữ liệu ................................................... 13 Hình 2.3. Phân vùng đối tượng trong SVM với đường thẳng (trái), siêu phẳng (phải) ....................................................................................................... 16 Hình 2.4. Mô tả nhiều siêu phẳng có thể phân chia tập dữ liệu thành 2 vùng ......... 17 Hình 2.5. Biểu diễn một mô hình phân lớp cơ bản .................................................. 19 Hình 2.6. Minh họa một mô hình nơ-ron thần kinh ................................................. 20 Hình 2.7. Mô hình toán học mô tả cấu trúc của nơ-ron ........................................... 21 Hình 2.8. Mô hình mạng nơ-ron cơ bản .................................................................. 22 Hình 2.9. Bộ dữ liệu chữ ký số MNIST ................................................................... 25 Hình 2.10. Bộ dữ liệu hình ảnh với 10 phân lớp CIFAR-10 [11]............................ 25 Hình 2.11. Một mô hình CNN với các thành phần cơ bản ...................................... 26 Hình 2.12. Một số bộ lọc Kernel trong xử lý ảnh .................................................... 29 Hình 2.13. Tích chập bộ lọc vào ảnh với stride = 1 ................................................. 29 Hình 2.14. Tích chập bộ lọc vào ảnh với stride = 1 có thêm padding ..................... 30 Hình 2.15. Minh họa tầng Pooling với pooling window = 2 và stide = 2 ............... 32 Hình 2.16. Mô hình CNN với tầng FC cho kết quả dự đoán 4 phân lớp ................. 33 Hình 2.17. Mô hình LeNet-1 ................................................................................... 34 Hình 2.18. Mô hình LeNet-4 ................................................................................... 34 Hình 2.19. Mô hình LeNet-5 ................................................................................... 34 Hình 2.20. Mô hình VGG-16 ................................................................................... 36 Hình 2.21. Mô tả quá trình xử lý của mô hình VGG-16 ......................................... 37 Hình 2.22. Mô tả một residual block ....................................................................... 38 Hình 2.23. Cấu trúc của ResNet 34 và ResNet 50 ................................................... 39
  9. Hình 2.24. Mô tả qui trình tính toán của ResNet 50 ................................................ 39 Hình 2.25. Biểu diễn mô hình DenseNet ................................................................. 40 Hình 2.26. Số lượng liên kết giữa các tầng trong DenseNet ................................... 40 Hình 2.27. Biểu đồ Confusion-Matrix với 5 phân lớp ............................................. 43 Hình 3.1. Minh họa một số ảnh thu thập trong tập dữ liệu đồng phục sinh viên .... 47 Hình 3.2. Mô tả giai đoạn chuẩn hóa hình ảnh ........................................................ 49 Hình 3.3. Cấu trúc mô hình CNN trong quá trình thực nghiệm thay đổi tỉ lệ tập huấn luyện và kiểm tra ............................................................................ 51 Hình 3.4. Minh họa mô hình CNN đề xuất cho bài toán phân lớp đồng phục ........ 52 Hình 4.1. Mô tả một số hình ảnh sau khi tổng hợp và chuẩn hóa cơ bản ................ 56 Hình 4.2. Mô tả quá trình áp dụng các phép biến đổi trên ảnh gốc ......................... 57 Hình 4.3. Môi trường thực nghiệm .......................................................................... 58 Hình 4.4. Kết quả thực nghiệm khi chia bộ dữ liệu theo tỉ lệ 10-90 ....................... 61 Hình 4.5. Kết quả thực nghiệm khi chia bộ dữ liệu theo tỉ lệ 20-80 ....................... 62 Hình 4.6. Kết quả thực nghiệm khi chia bộ dữ liệu theo tỉ lệ 30-70 ....................... 62 Hình 4.7. Kết quả thực nghiệm khi chia bộ dữ liệu theo tỉ lệ 50-50 ....................... 63 Hình 4.8. Kết quả thực nghiệm thay đổi tỉ lệ phân bố tập dữ liệu ........................... 65 Hình 4.9. Cấu trúc mô hình khi thay đổi kích thước các tập ảnh đầu vào ............... 66 Hình 4.10. Kết quả mô hình sử dụng tập ảnh đầu vào 50 x 75 pixel....................... 66 Hình 4.11. Kết quả mô hình sử dụng tập ảnh đầu vào 100 x 150 pixel................... 67 Hình 4.12. Kết quả mô hình sử dụng tập ảnh đầu vào 150 x 225 pixel................... 67 Hình 4.13. Kết quả thực nghiệm với bộ dữ liệu tăng thêm kích thước 50 x75 ....... 69 Hình 4.14. Kết quả thực nghiệm với bộ dữ liệu tăng thêm kích thước 150x225 .... 70 Hình 4.15. Tổng hợp kết quả sau khi huấn luyện 100 lần với bộ dữ liệu tăng thêm ... 71 Hình 4.16. Tổng hợp kết quả sau khi huấn luyện 300 lần với bộ dữ liệu tăng thêm ... 72 Hình 4.17. Huấn luyện 300 lần với bộ dữ liệu tăng thêm kích thước 50 x 75 ........ 72
  10. 1 CHƯƠNG 1. TỔNG QUAN Ngày nay, vấn đề nhận dạng thương hiệu đang được khá nhiều trường đại học quan tâm, trong đó những bộ đồng phục cho sinh viên là sản phẩm vừa gần gũi vừa mang lại hiệu quả về mặc truyền thông khá cao. Hiện nay việc nhận dạng hình ảnh thương hiệu thông qua những bộ đồng phục này chỉ được thực hiện bằng mắt thường. Trong khi đó việc nhận dạng hình ảnh hiện nay đã trở thành một chủ đề lớn trong lĩnh vực Thị giác máy tính được nhiều người nghiên cứu và thực hiện. Tại chương này chúng ta sẽ tiến hành khảo sát những vấn đề cơ bản liên quan đến những bộ đồng phục sinh viên và vấn đề về việc nhận dạng và phân lớp những bộ đồng phục này. Khái quát về đồng phục sinh viên Bộ đồng phục là trang phục thiêng liêng, thân thương trong mỗi thế hệ học sinh, sinh viên. Nó tạo ra một nét đẹp tập thể, đồng đều, mang đến không khí sinh hoạt sôi nổi trong nhà trường, tạo ra một môi trường mang tính văn hóa cao. Một bộ đồng phục đẹp, tinh tế, gây ấn tượng không những góp phần tạo nên vẻ đẹp truyền thống của nhà trường mà còn để lại nhiều kỉ niệm cho bao thế hệ học sinh, sinh viên. Hiện nay, chỉ tính riêng tại Trường Đại học Sư phạm Thành phố Hồ Chí Minh có 22 khoa đang đào tạo sinh viên. Trong đó, 22/22 khoa đều đã có đồng phục riêng hoặc đang thử nghiệm, khảo sát để lựa chọn mẫu đồng phục phù hợp [1]. Những bộ đồng phục cho sinh viên là sản phẩm vừa thiết yếu, gần gũi vừa mang lại hiệu quả về mặc truyền thông khá cao cho đơn vị. Bên cạnh đó, ta có thể dễ phân biệt một sinh viên đang học tập tại khoa nào thông qua bộ đồng phục. Tùy theo đặc trưng của từng khoa thì đồng phục có thể là áo thun hoặc áo sơ mi có logo, kiểu dáng, màu sắc, họa tiết trang trí khác nhau. Đoàn Thanh niên Cộng sản Hồ Chí Minh và Hội Sinh viên Việt Nam Trường cũng ban hành Chương trình “Perfect Student” trong đó có khuyến khích sinh viên sử dụng trang phục lịch sự, đồng phục áo khoa khi đến trường. Ngoài những giờ học tập tại giảng đường, trong các hoạt động phong trào, sinh hoạt dã ngoại, hoạt
  11. 2 động tình nguyện, sinh viên cũng được khuyến khích mặc đồng phục khoa khi tham dự để tạo nên một môi trường sinh hoạt tập thể cũng như tăng cường hiệu quả truyền thông hình ảnh cho các khoa. Hình 1.1. Đồng phục sinh viên một số khoa trực thuộc Trường Đại học Sư phạm Thành phố Hồ Chí Minh. Hình 1.2. Chương trình Perfect Student do Đoàn Trường triển khai.
  12. 3 Các hoạt động ngoại khóa cho sinh viên được tổ chức theo nhiều cấp độ như lớp, khoa, trường [2]. Do đó, trong một năm học, trung bình mỗi tháng sẽ có ít nhất một hoạt động ngoại khóa cho sinh viên tham gia. Để lưu lại kỉ niệm cũng như minh chứng cho việc tham gia hoạt động, sinh viên thường chụp ảnh để lưu trữ hoặc đăng tải lên các mạng xã hội. Trước đây, để chụp ảnh bạn phải có một chiếc máy ảnh kỹ thuật số đắt tiền nhưng với sự phát triển vượt bậc của công nghệ, điều này có thể thực hiện dễ dàng với một chiếc điện thoại thông minh giá thành rẻ. Theo một số thống kê cho thấy 1/3 người Việt Nam có sử dụng điện thoại thông minh và tập trung nhiều ở độ tuổi từ 18 đến 24 tuổi, lứa tuổi của học sinh, sinh viên. Bên cạnh đó là sự bùng nổ của các phương tiện truyền thông, các kênh thông tin đại chúng, các mạng xã hội như Facebook, Instagram, Zalo… không khó để tìm thấy hình ảnh của các bạn sinh viên đang mặc bộ đồng phục của khoa, trường khi đang học tập hoặc tham gia các hoạt động tại trường. Ta có thể nhận thấy khối lượng hình ảnh này là vô cùng lớn và liên tục tăng nhanh. Hình 1.3. Ảnh sinh viên đang mặc đồng phục được đăng tải trên mạng xã hội. Song việc nhận biết và phân lớp xem các bạn sinh viên đang mặc đồng phục của khoa nào chỉ có thể thực hiện được khi người phân lớp có hiểu biết đề các đặc
  13. 4 trưng riêng của các bộ đồng phục này. Chưa kể đến việc nhằm đảm bảo tính đơn giản, phù hợp với nhiều mục đích sử dụng nên các mẫu đồng phục thường được tối giản các họa tiết thiết kế nên việc hai bộ đồng phục của hai khoa khác nhau có nhiều điểm gần giống nhau rất dễ xảy ra. Để phân biệt một bộ đồng phục ta cần phải xem xét đến nhiều chi tiết trên áo chứ không đơn giản dựa trên kiểu dáng, màu sắc. Khi số lượng hình ảnh lớn, những đặc trưng chi tiết của đồng phục làm cho công việc này tốn nhiều thời gian. Tại hình bên dưới ta có thể thấy, hai mẫu đồng phục của sinh viên khoa Ngữ văn và khoa Địa lí có cùng hình dạng là áo sơ mi với màu trắng chủ đạo và một số đường nét trang trí màu đỏ. Có 2 điểm khác biệt để phân biệt ở hai mẫu đồng phục này. Thứ nhất, ống tay áo đồng phục sinh viên khoa Ngữ văn có viền màu đỏ còn ở sinh viên khoa Địa lí có màu trắng trơn. Thứ hai, đồng phục sinh viên khoa Địa lí có thêm cầu vai màu đỏ còn ở khoa Ngữ văn thì công có chi tiết này. Hình 1.4. Mô tả đồng phục của một số khoa nhiều đặc điểm gần giống nhau. Vấn đề được đặt ra là từ một ảnh chụp bất kỳ có sinh viên đang mặc áo khoa, làm sao tự động phân lớp ảnh để xác định sinh viên có trên hình là sinh viên của khoa nào. Kết quả phân lớp cho mục đích thống kê số liệu phục vụ cho các mục tiêu kiểm tra, giám sát hoặc các nghiên cứu khác. Bài toán phân lớp ảnh tự động hiện nay đã trở nên khá phổ biến như phân lớp ảnh động vật, phương tiện, các loài hoa,
  14. 5 trái cây…[3] sử dụng các kỹ thuật máy học truyền thống hoặc các kỹ thuật học sâu [4]. Vận dụng ý tưởng về bài toán phân lớp và các kỹ thuật máy học này, ta cũng có thể giải quyết bài toán phân lớp đồng phục của sinh viên. Hình 1.5. Minh họa vấn đề phân lớp đồng phục sinh viên Qua hình minh họa ta phân tích bài toán được xây dựng cơ bản gồm 3 bước: Bước 1: Hình ảnh đồng phục sinh viên. Bước 2: Mô hình phân lớp sử dụng các kỹ thuật xử lý hình ảnh, phân lớp để nhận dạng và dự đoán phân lớp hình ảnh. Bước 3: Đưa ra kết luận sinh viên trong ảnh mặc đồng phục của khoa nào. Đây là bài toán phân lớp tập ảnh thành nhiều lớp riêng biệt. Bộ ảnh đầu vào là ảnh màu kỹ thuật số, ở đây là hình ảnh sinh viên mặc đồng phục của khoa. Nguồn ảnh có thể thu thập trực tiếp từ các thiết bị ghi hình như máy quay phim, máy ảnh, điện thoại hoặc tải từ các website, mạng xã hội, trích xuất từ hệ thống camera giám sát… Tập ảnh này sẽ được đưa vào bộ xử lý của máy tính để xử lý rút trích các đặc trưng của ảnh để đưa vào các mô hình huấn luyện, học với kết quả mong muốn trả về là xác định ảnh thuộc phân lớp nào, đồng phục sinh viên đang mặc là của khoa nào. Ta có thể thấy để thực hiện bài toán này quan trọng nhất là phải tìm kỹ thuật trích xuất đặc trưng của ảnh và mô hình huấn luyện phù hợp để có kết quả phân lớp tối ưu nhất. Hệ thống phân lớp này cần phải có độ chính xác cao, khả năng thích ứng nhanh, giải quyết vấn đề nhanh với nguồn dữ liệu lớn được bổ sung liên tục, nhưng vẫn phải đảm bảo tốc độ xử lý ổn định và chi phí hoạt động. Đây là những yêu cầu mà các mô hình học sâu đang hướng đến để giải quyết [5]. Hiện nay có một mô hình học sâu tiên tiến tích hợp cả quá trình trích xuất đặc trưng và huấn luyện ảnh để phân lớp đó là mô hình mạng nơ-ron tích chập CNN.
  15. 6 Mô hình CNN đã được khá nhiều nhà nghiên cứu lựa chọn vì khả năng linh hoạt trong việc giải quyết các bài toán phân lớp với nhiều loại hình ảnh [3]. Đặc điểm của nó là dễ triển khai và điều chỉnh cấu trúc tạo nên những biến thể khác nhau để xử lý những yêu cầu tính toán khác nhau. Bài toán phân lớp đồng phục sinh viên Hình 1.6. Các bước thực hiện bài toán phân lớp đồng phục dùng mô hình CNN Đầu vào: tập ảnh chụp sinh viên đang mặc đồng phục. Đầu ra: ảnh đồng phục thuộc về phân lớp của khoa nào. Bài toán phân lớp đồng phục sinh viên thực hiện qua 3 bước: Bước 1: Tổng hợp tập hình ảnh sinh viên mặc đồng phục. Bước 2: Những hình ảnh trên được đưa vào hệ thống phân lớp bằng CNN để tiến hành huấn luyện. Bước 3: Kết quả huấn luyện của hệ thống phân lớp CNN xác định hình ảnh thuộc về phân lớp ảnh của khoa nào. Kết quả của hệ thống phân lớp CNN đã xây dựng sẽ cho kết quả với N lớp từ 1…N. N là số lớp hệ thống phân lớp CNN sẽ phân chia sau quá trình xử lý ảnh và huấn luyện. Số N tùy thuộc chúng ta xác định ban đầu khi đưa N tập dữ liệu khác biệt vào hệ thống phân lớp CNN. Ý nghĩa của N tập dữ liệu ở đây chính là số lượng khoa chúng ta đưa vào để phân lớp. Giả sử tại Trường Đại học Sư phạm Thành phố Hồ Chí Minh đang quản lý 22 khoa có đồng phục khác nhau thì số lượng tập dữ liệu sẽ là N = 22.
  16. 7 Mục tiêu hướng đến của bài toán Với sự hạn chế về lượng thời gian cũng và giới hạn của một luận văn, tác giả không thực hiện việc phân lớp cho tất cả các loại đồng phục khoa như đã nêu ở trên mà chỉ thử nghiệm trên một số khoa để tìm hiểu một mô hình CNN phù hợp cho việc phân lớp hình ảnh đồng phục sinh viên. Phạm vi bài toán: - Bài toán áp dụng với đối tượng đầu vào là ảnh màu, cụ thể là ảnh chụp sinh viên đang mặc áo đồng phục. - Hình ảnh được lấy từ các thiết bị ghi hình như máy ảnh, điện thoại hay thu thập từ mạng xã hội facebook. - Bài toán thử nghiệm phân lớp ảnh đồng phục sinh viên được tổng hợp từ 4 khoa trực thuộc Trường Đại học Sư phạm Thành phố Hồ Chí Minh bao gồm các khoa: Giáo dục Tiểu học, Giáo dục Mầm non, Giáo dục Đặc biệt và Công nghệ Thông tin. Yêu cầu bài toán: - Đề xuất mô hình CNN để giải quyết việc phân lớp dữ liệu đầu vào là hình ảnh đồng phục sinh viên. - Phân tích, làm rõ mô hình CNN đề đã xuất. - Chỉnh sửa mô hình CNN đã đề xuất trong luận văn sao cho kết quả phân lớp đạt hiệu quả tốt. Dự kiến kết quả: - Đề xuất mô hình CNN phù hợp với việc phân lớp ảnh đồng phục sinh viên. - Độ chính xác của việc phân lớp sau khi áp dụng thử nghiệm mô hình CNN ở mức chấp nhận được. - Dữ liệu sau khi đưa vào mô hình CNN huấn luyện có khả năng áp dụng cho nhiều bài toán khác. Hướng tiếp cận và giải pháp cho bài toán Để có thể huấn luyện mô hình phân lớp đồng phục sinh viên hiệu quả bước đầu tiên là chuẩn bị bộ dữ liệu huấn luyện. Để đảm bảo độ chính xác của dữ liệu, tôi
  17. 8 đã liên hệ trực tiếp với Ban Chấp hành Đoàn Thanh niên, Hội Sinh viên của các khoa để tổng hợp và xác nhận hình ảnh. Bên cạnh đó, qua hơn 8 năm học tập và công tác tại Trường Đại học Sư phạm Thành phố Hồ Chí Minh, tôi được trực tiếp tiếp xúc khá nhiều với sinh viên các khoa thông qua các hoạt động ngoại khóa, bản thân tôi cũng có thể kiểm tra lại các hình ảnh đồng phục sinh viên các khoa được cung cấp có chính xác hay không. Sử dụng một số kỹ thuật để tiền xử lý và chuẩn hóa dữ liệu ảnh thu thập ban đầu với mục đích tập trung vào vùng ảnh cần xử lý, loại bỏ bớt những ảnh quá nhỏ, mờ, bị che phủ quá nhiều các chi tiết cần thấy để xác định phân lớp, ảnh có nhiều chi tiết thừa, gây nhiễu cao ảnh hưởng đến kết quả huấn luyện và đưa hình ảnh về cùng một chuẩn kích thước để đưa vào hệ thống phân lớp. Bên cạnh đó sử dụng một số phép biến đổi cơ bản để tăng lượng dữ liệu đầu vào để phục vụ cho việc huấn luyện. Đối với việc lựa chọn mô hình phân lớp hình ảnh, tôi tiến hành khảo sát các phương pháp, mô hình có liên quan đã được sử dụng trong việc giải quyết các bài toán phân lớp hình ảnh. Thông qua đó để có cơ sở đánh giá, so sánh các phương pháp, mô hình khác nhau để lựa chọn hướng tiếp cận thích hợp. Cuối cùng là lựa chọn phương pháp, mô hình có khả năng tính toán giải quyết yêu cầu đặt ra và tiến hành thực nghiệm. Tiến hành cài đặt để thử nghiệm mô hình đã đề xuất. Trong quá trình thực nghiệm cần tinh chỉnh chất lượng ảnh đầu vào, các tham số của mô hình huấn luyện để nâng cao kết quả phân lớp. Nhận xét, đánh giá mô hình dựa vào các tiêu chí cụ thể như độ phân lớp chính xác sau khi huấn luyện, hiệu suất huấn luyện, hàm lỗi, tốc độ huấn luyện... Tóm lại, ở chương này ta đã cơ bản khái quát được bức tranh tổng thể về bài toán phân lớp đồng phục sinh viên. Với những thành tựu khoa học hiện tại của ngành khoa học máy tính mà cụ thể là lĩnh vực thị giác máy tính và máy học, người ta đã có nghiên cứu ra những kỹ thuật để máy tính có thể nhận diện và tiến hành phân lớp dựa trên hình ảnh. Bài toán cơ bản được đặt ra là phù hợp với khả năng xử lý của hiện tại của máy tính với những kỹ thuật nhận diện và phân lớp. Trong những
  18. 9 phần tiếp theo ta sẽ tiến hành tìm hiểu sâu hơn về những kỹ thuật này và nghiên cứu thử nghiệm, đề xuất kỹ thuật phù hợp để giải quyết bài toán được đặt ra.
  19. 10 CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN Trong chương này ta sẽ nghiên cứu sâu hơn về cấu trúc của một bài toán phân lớp hình ảnh. Trong các bài toán xử lý bằng thị giác máy tính trên hình ảnh, có 2 khái niệm cần phân biệt là phân cụm và phân lớp. Do đó ta phải tìm hiểu rõ khái niệm nào là phù hợp với bài toán mà ta đã phát biểu. Từ việc xác định đúng khái niệm, ta sẽ tìm hiểu và áp dụng những kỹ thuật phù hợp để xử lý vấn đề. Để tiến tới việc thực nghiệm và để xuất mô hình phù hợp ở phần sau, trước hết ta phải ta có một cái nhìn tổng quát về những kỹ thuật, mô hình xử lý ảnh cơ bản, tiêu biểu nhất để học hỏi những lợi thế của từng kỹ thuật mang lại và những mặt hạn chế của nó. Hệ thống phân lớp hình ảnh 2.1.1. Bài toán phân lớp Bài toán phân lớp dữ liệu là một trong những nghiên cứu rộng rãi nhất trong cộng đồng khai thác dữ liệu và máy học. Vấn đề này đã được nghiên cứu bởi các nhà khoa học ở nhiều ngành trong nhiều thập kỷ. Dữ liệu của bài toán phân lớp rất đa dạng, có thể kể đến một số loại dữ liệu điển hình như số học, chữ viết, hình ảnh, âm thanh, dữ liệu sinh học... Ứng dụng của bài toán phân lớp được sử dụng ở nhiều lĩnh vực như phân tích thị trường tiêu dùng, chẩn đoán y khoa, giám sát hành vi, phân tích dữ liệu đa phương tiện, phân tích dữ liệu sinh học, lọc và phân lớp tài liệu, phân tích mạng xã hội. Một bài toán khác có nhiều điểm tương đồng và dễ gây nhầm lẫn với bài toán phân lớp là bài toán phân cụm. Ý tưởng chung của hai bài toán thành là đưa từng dữ liệu con từ tập dữ liệu lớn về các nhóm được xác định bằng các nhãn. Kết quả của bài toán phân cụm (Clustering) là phân chia các dữ liệu về các nhóm dựa trên những đặc trưng tương đồng của dữ liệu mà không quan tâm đến cấu trúc của nhóm dữ liệu. Trong khi đó, bài toán phân lớp (Classification) dựa trên nền tảng của tập dữ liệu được huấn luyện, phân tích cấu trúc của nhóm dữ liệu để xác định phân lớp của dữ liệu.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2