intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Tổng quan nghiên cứu về học liên kết và tiềm năng ứng dụng trong thị giác máy tính

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:3

6
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết này trình bày tổng quan tình hình nghiên cứu của FL nói chung trên thế giới và ứng dụng trong CV nói riêng, làm nổi bật tầm quan trọng, các ứng dụng tiềm năng, thách thức và triển vọng trong tương lai của nó trong thị giác máy tính.

Chủ đề:
Lưu

Nội dung Text: Tổng quan nghiên cứu về học liên kết và tiềm năng ứng dụng trong thị giác máy tính

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 TỔNG QUAN NGHIÊN CỨU VỀ HỌC LIÊN KẾT VÀ TIỀM NĂNG ỨNG DỤNG TRONG THỊ GIÁC MÁY TÍNH Kiều Tuấn Dũng1, Lê Thị Lan2, Trần Thị Thanh Hải2 1 Trường Đại học Thủy lợi, email: dungkt@tlu.edu.vn 2 Viện Nghiên cứu Quốc tế MICA, Trường Điện - Điện tử, Đại học Bách khoa Hà Nội 1. GIỚI THIỆU CHUNG Bài báo này trình bày tổng quan tình hình nghiên cứu của FL nói chung trên thế giới và Cuộc Cách mạng công nghiệp lần thứ tư ứng dụng trong CV nói riêng, làm nổi bật tầm với nền tảng trí tuệ nhân tạo (Artificial quan trọng, các ứng dụng tiềm năng, thách Intelligence - AI), robot, dữ liệu lớn và thức và triển vọng trong tương lai của nó internet kết nối vạn vật (Internet of Thing - trong thị giác máy tính. Với tầm quan trọng IoT) tạo ra tiền đề cho phép thực hiện các thay ngày càng tăng của quyền riêng tư dữ liệu và đổi mạnh mẽ trong nhiều lĩnh vực của đời nhu cầu về các mô hình học tập phi tập trung, sống. Là một nhánh của AI, thị giác máy tính các mô hình nghiên cứu ứng dụng FL trong (Computer Vision - CV), đã trở thành một bài toán CV được thiết lập để xác định lại lĩnh vực nghiên cứu ngày càng quan trọng do cách xử lý và diễn giải dữ liệu trực quan. sự phổ biến của các camera từ các khu vực công cộng đến các hộ gia đình cũng như khối lượng khổng lồ các dữ liệu hình ảnh mà con người lưu trữ và chia sẻ trên các nền tảng xã hội. Các bộ dữ liệu qui mô lớn tạo ra các thách thức với các thuật toán học máy tập trung: khối lượng tính toán khổng lồ và rủi ro quyền riêng tư liên quan đến lưu trữ và xử lý dữ liệu. Để giải quyết những vấn đề này, học Hình 1. Kiến trúc học liên kết cho bài toán liên kết (Federated Learning - FL) đã ra đời và phân tích ảnh CT từ nguồn đa quốc gia [2] trở thành một giải pháp đầy hứa hẹn, cho phép bảo vệ quyền riêng tư bằng cách huấn luyện Hình 1 cho thấy cách các bệnh viện hợp các mô hình cục bộ tại các máy trạm/khách và tác để huấn luyện mô hình học máy nhưng gửi các mô hình này lên máy chủ để tạo ra mô không chia sẻ dữ liệu nhằm đảm bảo quyền hình tổng thể thay vì việc gửi dữ liệu lên máy riêng tư thông tin của bệnh nhân. chủ như trong các mô hình tập trung. Ngoài ra, tải tính toán được phân phối trên nhiều 2. PHƯƠNG PHÁP NGHIÊN CỨU máy trạm, giúp giảm gánh nặng cho các máy Để đảm bảo đánh giá toàn diện, chúng tôi chủ trung tâm. FL đã được chứng minh là có đã tiến hành tìm kiếm các tài liệu liên quan từ hiệu quả trong nhiều tác vụ của thị giác máy các cơ sở dữ liệu đáng tin cậy như IEEE tính, bao gồm phân loại hình ảnh, phát hiện Xplore, Google Scholar và Thư viện số ACM đối tượng và phân đoạn ngữ nghĩa [1]. Sự ra cũng như các hội thảo, hội nghị quốc tế có uy đời của học liên kết và sự kết hợp của nó với tín ở các hội nghị quốc tế có uy tín hàng đầu thị giác máy tính đánh dấu một bước tiến đổi về học máy như ICML, ICLR, NeurIPS; các mới trong lĩnh vực học máy và trí tuệ nhân tạo. hội nghị về thị giác máy tính hàng đầu như 87
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8 CVPR, ICCV, ECCV và các hội nghị hàng tập dữ liệu của chính máy khách đó và tập dữ đầu về trí tuệ nhân tạo và khai thác dữ liệu liệu của các máy khách khác. như AAAI, AISTATS, KDD trong 5 năm trở  Hướng nghiên cứu về bảo mật (security) lại đây (từ 2018 - 2013). Sau quá trình sàng bao gồm 2 nhánh con là tấn công (attack) và lọc, các nghiên cứu được phân loại dựa trên phòng thủ (defense). các lĩnh vực trọng tâm của chúng - các nguyên  Hướng nghiên cứu Dạng khảo sát tắc cơ bản của FL, ứng dụng FL trong CV, các (Survey) với 1 số nhóm định hướng gồm các từ thách thức và xu hướng trong tương lai. khóa: General, Security, Personalization, Aggregation, Incentive, Applications, Fairness, 3. KẾT QUẢ NGHIÊN CỨU Graph, System. Trên thế giới, số lượng công trình nghiên  Hướng nghiên cứu về Cải thiện sự hiệu cứu có công bố về học liên kết tăng mạnh và quả (Efficiency) dựa trên truyền thông đa dạng các chủ đề, lĩnh vực nghiên cứu cho (Communication-Based); dựa trên phần cứng thấy sức hút của nó trong những năm tới. (Hardware-Based); dựa trên thuật toán (Algorithm-Based). 3.1. Kết quả nghiên cứu chung về FL  Hướng nghiên cứu về Tối ưu hóa Học liên kết được Google giới thiệu lần (Optimization): Các phương pháp tối ưu hóa đầu tiên vào năm 2016. Từ 2019 tới nay, trong FL thường sử dụng các thuật toán tối Google đã tổ chức các hội thảo về học liên ưu hóa phân tán như Federated Averaging, kết tập trung. Gần đây, các bài báo về FL Federated SGD hoặc Federated Adam. xuất hiện nhiều trong các hội thảo, hội nghị  Hướng nghiên cứu về Tính công bằng như chỉ ra trong Hình 2, được dự báo là chủ (Fairness): Các phương pháp và công cụ để đề nghiên cứu quan tâm trong những năm tới.  đảm bảo tính công bằng và bình đẳng trong trí tuệ nhân tạo bao gồm việc thu thập và sử dụng các dữ liệu đại diện cho tất cả các nhóm, đánh giá và đo lường sự công bằng và bình đẳng của các thuật toán và hệ thống, và thiết kế các thuật toán và hệ thống để đảm bảo tính công bằng và bình đẳng trong quá trình hoạt động.  Hướng nghiên cứu về FL cho phép làm việc với các thách thức về tính không đồng nhất (Heterogeneity) bao gồm một số nhánh như: không đồng nhất về dữ liệu (data heterogeneity - non-iid), không đồng nhất về Hình 2. Số bài báo về chủ đề FL tại mô hình (model heterogeneity), không đồng các hội nghị quốc tế uy tín từ 2019 - 2023 nhất về thiết bị (device heterogeneity). Từ phân tích tổng quát 433 bài báo trên  Hướng nghiên cứu về Lựa chọn máy các tạp chí và hội nghị/hội thảo hàng đầu kể khách (client selection) nhằm mục tiêu tối ưu trên, có thể thấy các nghiên cứu tập trung vào chi phí tính toán, truyền thông. các nhóm chính gồm:  Hướng nghiên cứu về Mạng nơ ron đồ  Hướng nghiên cứu về Tổng hợp mô hình thị (Graph Neural Networks) được sử dụng hay hợp nhất mô hình (Model Aggregation) để xử lý các dữ liệu có cấu trúc đồ thị trên đề cập đến cách kết hợp các mô hình cục bộ các thiết bị địa phương. thành một mô hình toàn cục được chia sẻ.  Các mã nguồn, thư viện được phát triển  Hướng nghiên cứu về Cá nhân hóa cho học liên kết được chia làm 2 nhóm cho (Personalization) đề cập đến việc huấn luyện công nghiệp (FedML, OpenFL ..) và nghiên một mô hình cho từng máy khách, dựa trên cứu (Flower, EasyFL ..). 88
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2023. ISBN: 978-604-82-7522-8  Các hướng nghiên cứu khác: hướng FL để sàng lọc hình ảnh X-quang ngực (CXR) nghiên cứu ứng dụng, cơ chế khuyến khích, của COVID-19 được triển khai bởi [6]. học không giám sát ... Trong lái xe tự hành, việc nhận biết các Tại Việt Nam, hiện nay, hướng nghiên cứu đường và dự đoán hành vi là không thể thiếu. liên quan đến học liên kết vẫn đang là một Cách tiếp cận ML trên thiết bị sử dụng FL và hướng đi mới và nghiên cứu về học liên kết xác nhận thông qua nghiên cứu điển hình về ứng dụng trong thị giác máy tính còn hạn dự đoán góc lái của bánh xe cho xe tự lái chế. Một số công trình nghiên cứu từ các được trình bày trong [7]. nhóm nghiên cứu trong nước liên quan đến Bên cạnh đó, FL còn hứa hẹn thực hiện học liên kết công bố trong các năm gần đây các tác vụ như tạo chú thích cho hình ảnh, đến chủ yếu từ Đại học Bách khoa và Đại học sinh video. Quốc gia Hồ Chí Minh xoay quanh các chủ 4. KẾT LUẬN đề về bảo mật. Nhìn chung, những thách thức về nghiên Khai phá và ứng dụng học liên kết trong cứu cần giải quyết về học liên kết bao gồm: lĩnh vực thị giác máy tính mang đến một tài nguyên tính toán, chi phí truyền thông và hướng đi đầy hứa hẹn cho quá trình xử lý dữ tối ưu hóa hiệu suất mô hình [3]. liệu trực quan bảo vệ quyền riêng tư và phi tập trung. Tuy nhiên, những thách thức vẫn tồn 3.2. Kết quả nghiên cứu về FL trong CV tại, đòi hỏi phải tiếp tục nỗ lực nghiên cứu. Các nghiên cứu về FL trong CV chủ yếu Nghiên cứu trong tương lai nên tập trung vào mới công bố trong năm 2022, 2023 và tập việc phát triển các thuật toán học tập liên kết trung vào một số bài toán như: phát hiện đối hiệu quả có thể giải quyết những thách thức tượng, giám sát video và lái xe tự hành. này và cho phép đào tạo quy mô lớn các mô Phát hiện đối tượng, một nhiệm vụ CV quan hình học liên kết trong thị giác máy tính. trọng, sử dụng FL để phân biệt các đối tượng nổi bật trong hình ảnh, rất quan trọng để theo 5. TÀI LIỆU THAM KHẢO dõi và phân đoạn ngữ nghĩa. Trong [4], tác giả [1] C. He et al., “FedCV: A Federated Learning đề xuất FedHarm - một phương pháp kết hợp Framework for Diverse Computer Vision FL và Dampened Harmonic Optimization để Tasks,” 2021, doi: 10.48550/ARXIV.2111. huấn luyện mô hình phát hiện đối tượng trên 11066. dữ liệu phân tán nhưng vẫn đảm bảo quyền [2] Q. Dou et al., “Author Correction: Federated riêng tư. Phương pháp này cải thiện mô hình deep learning for detecting COVID-19 lung abnormalities in CT: a privacy-preserving học cục bộ trên các thiết bị cá nhân, giảm chi multinational validation study,” Npj Digit. phí truyền thông trong quá trình huấn luyện. Med., vol. 5, no. 1, p. 56, Apr. 2022, doi: Giám sát video được hưởng lợi từ các mô 10.1038/s41746-022-00600-1. hình được huấn luyện bởi FL để theo dõi các [3] F. A. KhoKhar, J. H. Shah, M. A. Khan, M. luồng video theo thời gian thực, hỗ trợ bảo Sharif, U. Tariq, and S. Kadry, “A review on mật, giao thông và nhận dạng cảm xúc. Một federated learning towards image processing,” kiến trúc FL chung xử lý dữ liệu cảm biến để Comput. Electr. Eng., vol. 99, p. 107818, Apr. nhận dạng hoạt động của con người đã được 2022, doi: 10.1016/j.compeleceng.2022.107818. trình bày bởi [5]. Kiến trúc FL được đề xuất [4] D. K. Jain, A. Khanna, B. Gera, and D. Sangwan, “Federated Learning based dựa trên bộ tổng hợp liên kết được huấn Object Detection using Dampened luyện bằng cách sử dụng dữ liệu cục bộ trên Harmonic Optimization,” in 2023 The 7th các nút biên. International Conference on Machine Trong chăm sóc sức khỏe, FL hỗ trợ phân Learning and Soft Computing (ICMLSC), tích hình ảnh y tế, dự đoán bệnh tật và đề xuất Chongqing China: ACM, Jan. 2023, pp. phương pháp điều trị. Một giải pháp dựa trên 181-187. doi: 10.1145/3583788.3583815. 89
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2