
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ - ĐẠI HỌC ĐÀ NẴNG, VOL. 23, NO. 2, 2025 71
PHƯƠNG PHÁP PHÁT HIỆN DỮ LIỆU DA TRÊN HỌC SÂU CHO
HỆ THỐNG TRUYỀN THÔNG SỢI QUANG CÓ NHIỄU PHI TUYẾN
A DEEP LEARNING-BASED DATA DETECTOR FOR
FIBER COMMUNICATION SYSTEM IN THE PRESENCE OF NONLINEAR NOISE
Nguyễn Duy Nhật Viễn1*, Vương Quang Phước1,2
1Trường Đại học Bách khoa - Đại học Đà Nẵng, Việt Nam
2Trường Đại học Khoa học - Đại học Huế, Việt Nam
*Tác giả liên hệ / Corresponding author: ndnvien@dut.udn.vn
(Nhận bài / Received: 25/12/2024; Sửa bài / Revised: 19/02/2025; Chấp nhận đăng / Accepted: 20/02/2025)
DOI: 10.31130/ud-jst.2025.577
Tóm tắt - Trong bài báo này, nhóm tác giả trình bày phương pháp
phát hiện dữ liệu cho hệ thống truyền thông sợi quang có nhiễu
phi tuyến, v mô hnh hóa hệ thống này như một mạng nơ-ron học
sâu từ đầu đến cuối, bao gồm bộ phát, kênh truyền và bộ thu. Trên
cơ sở đó, nhóm tác giả đề xuất kiến trúc mạng nơ-ron autoencoder
cho hệ thống truyền thông sợi quang đường dài để phát hiện dữ
liệu. Thông qua các mô phỏng, nhóm tác giả đã so sánh, đánh giá
phương pháp đề xuất so với phương pháp phát hiện ML
(Maximum likelihood) và autoencoder khác trong trường hợp
không có và có nhiễu phi tuyến với tín hiệu 16-QAM. Kết quả mô
phỏng cho thấy, tính hiệu quả của phương pháp đề xuất về độ
chính xác lẫn độ phức tạp. Nghiên cứu này s là cơ sở để hướng
tới việc tối ưu hóa hệ thống truyền thông sợi quang dựa trên học
sâu từ đầu đến cuối.
Abstract - In this paper, the authors introduce a data detection
method for optical fiber communication systems affected by
nonlinear noise and model the entire system as an end-to-end deep
learning (DL) neural network, incorporating the transmitter,
transmission channel, and receiver. Based on this framework, the
authors propose an autoencoder-based neural network architecture
for long-haul optical communication systems to enhance data
detection performance. Through simulations, the authors compare
and evaluate the proposed method against Maximum Likelihood
(ML) detection and other autoencoder models, considering both
linear and nonlinear noise scenarios with a 16-QAM signal. The
simulation results demonstrate that, the proposed approach achieves
superior accuracy and computational efficiency. This study hence
provides a foundation for optimizing optical fiber communication
systems using end-to-end deep learning techniques.
Từ khóa - Hệ thống thông tin sợi quang; bộ tự mã hóa; phát hiện;
mạng nơ-ron; học máy; học sâu
Key words - Optical fiber communication; autoencoder;
detection; neural networks; machine learning; deep learning
1. Giới thiệu
Hệ thống truyền thông sợi quang sử dụng kỹ thuật điều
chế biên độ cầu phương đa mức M-QAM (M-ary Quadrature
Amplitude Modulation) đã đem lại sự gia tăng đáng kể về
tốc độ dữ liệu so với tín hiệu nhị phân truyền thống [1]. Tuy
nhiên, các hệ thống M-QAM nhạy cảm với các suy giảm
kênh, do việc mã hóa dữ liệu vào pha của tín hiệu quang và
chòm sao có mật độ cao. Sự tương tác giữa tín hiệu và nhiễu
từ bộ khuếch đại quang thông qua hiệu ứng phi tuyến Kerr
dẫn đến nhiễu pha phi tuyến [2]. Các kỹ thuật thông thường
để xử lý nhiễu phi tuyến bao gồm thiết kế bộ phát hiện cải
tiến và các định dạng điều chế tối ưu [3-5].
Trong [6], các tác giả đã đề xuất thuật toán phát hiện dữ
liệu dựa trên tối đa khả năng ML (maximum likelihood)
dưới dạng công thức tường minh cho các kênh truyền dẫn
quang đường dài có nhiễu phi tuyến. Trong thời gian gần
đây, kỹ thuật học sâu được khai thác để giải quyết các bài
toán trong thông tin sợi quang [7- 9]. Các công trình [10,
11] đề xuất phương pháp thiết kế chòm sao và bộ phát hiện
dựa vào học sâu cho các hệ thống truyền dẫn hữu tuyến
cũng như vô tuyến.
Autoencoder (AE) là một loại mạng nơ-ron nhân tạo
1 The University of Danang - University of Science and Technology, Vietnam (Vien Nguyen-Duy-Nhat)
2 Hue University - University of Science, Vietnam (Vuong Quang Phuoc)
học sâu DL (deep learning) được thiết kế cho việc học
không giám sát [12]. AE học cách biểu diễn hiệu quả dữ
liệu đầu vào mà không cần dữ liệu được gán nhãn. Khả
năng học các biểu diễn dữ liệu hiệu quả và thực hiện các
tác vụ như nén, phát hiện bất thường và giảm nhiễu khiến
chúng trở thành những ứng dụng rất giá trị trong nhiều lĩnh
vực truyền thông [13].
Trên cơ sở đó, bài báo này đề xuất giải thuật phát hiện
dữ liệu trên cơ sở AE nhằm giảm thiểu t lệ lỗi ký hiệu
SER (symbol error rate).
Các ký hiệu được sử dụng trong bài báo:
- Các chữ in đậm viết thường và viết hoa được dùng để
biểu diễn vector và ma trận.
- CN×M mô tả ma trận phức kích thước N × M và IM biểu
thị ma trận đơn vị M × M.
- |X|, XH, và tr(X) là trị tuyệt đối, chuyển đổi Hermitian
và phép tính trace của ma trận X.
- E{·} và ∥·∥ là kỳ vọng và phép tính chuẩn (norm)
Euclidean.
- Ma trận hay vector phức z ngẫu nhiên Gaussian có kỳ
vọng µ và phương sai σ2 được biểu diễn là z ∼ CN(µ, σ2).