Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
<br />
mét ph¬ng ph¸p míi<br />
nhóng d÷ liÖu vµo tÝn hiÖu audio<br />
VŨ VĂN TÂM*, PHAN TRỌNG HANH**<br />
Tóm tắt: Nhúng dữ liệu vào tín hiệu audio là một kỹ thuật mới trong lĩnh<br />
vực xử lý tín hiệu số hiện nay. Quá trình nhúng phải thỏa mãn một số yêu cầu<br />
liên quan, đặc biệt là yêu cầu về tỷ số tín/tạp ( ) phải ở mức cao [1], hay nói<br />
cách khác là dữ liệu phụ được nhúng phải ít ảnh hưởng đến tín hiệu audio. Trên<br />
cơ sở phân tích các yêu tố ảnh hưởng đến của tín hiệu nhúng, chúng tôi đã<br />
xây dựng mô hình, các thuật toán để nhúng dữ liệu phụ vào tín hiệu audio. Kết<br />
quả thử nghiệm cho thấy đã được cải thiện, từ đó giảm thiểu ảnh hưởng của<br />
dữ liệu phụ lên tín hiệu audio.<br />
<br />
Từ khóa: Nhúng tín hiệu, LSB, Dữ liệu phụ, Tín hiệu audio.<br />
<br />
1. ĐẶT VẤN ĐỀ<br />
Không giống như hệ thống nhúng (embeded systems), tín hiệu nhúng (embeded<br />
signals) là thuật ngữ còn mới và được đề xuất bởi các nhà khoa học Mỹ [1]. Tín<br />
hiệu nhúng dùng để chỉ một loại tín hiệu chủ mang trong nó dữ liệu phụ, nhưng dữ<br />
liệu phụ này hầu như không ảnh hưởng tới các tính chất của tín hiệu chủ và chỉ<br />
được tách ra bằng một thuật toán đặc biệt. Tiềm năng ứng dụng của tín hiệu nhúng<br />
là rất lớn như: Sử dụng để ghi dấu bản quyền trong các tác phẩm điện tử như âm<br />
thanh, hình ảnh, bài báo… hoặc được sử dụng để truyền, lưu trữ các bản tin mà<br />
không cần thêm đường truyền, vùng nhớ riêng biệt.<br />
Đã có nhiều công trình nghiên cứu về tín hiệu nhúng, khi tín hiệu chủ là dạng<br />
ảnh, video, tuy nhiên các công trình nghiên cứu về tín hiệu nhúng khi tín hiệu chủ<br />
là âm thanh thì còn ít [2,3], do tín hiệu audio có ít đặc tính để có thể cho phép<br />
nhúng dữ liệu phụ vào, vì vậy dữ liệu phụ dễ bị "lộ" và thường có dung lượng thấp.<br />
Nhằm mục đích nâng cao chất lượng của tín hiệu nhúng, chúng tôi đã phân tích<br />
các tham số của tín hiệu nhúng, từ đó xây dựng mô hình, xây dựng thuật toán<br />
nhúng mới để giảm thiểu ảnh hưởng của dữ liệu phụ lên tín hiệu audio.<br />
<br />
2. CƠ SỞ TOÁN HỌC<br />
Hình 1 mô tả quá trình nhúng, giải nhúng theo phương pháp thông thường [2],<br />
tín hiệu chủ (C ) và dữ liệu phụ ( B ) được đưa tới khối nhúng tại đây, B sẽ được<br />
kết hợp với C theo cách thức được qui định bởi thuật toán nhúng và hình thành tín<br />
hiệu nhúng (C ') . C ' được truyền, thu nhận và lưu trữ theo cách thức của hệ thống<br />
truyền dẫn vốn có. Để tách B từ C ' , phía thu cần phải giải nhúng với quy trình<br />
ngược lại so với phía phát.<br />
<br />
<br />
<br />
<br />
58 V.V. Tâm, P.T.Hanh, "Một phương pháp mới nhúng dữ liệu vào tín hiệu audio."<br />
Nghiên cứu khoa học công nghệ<br />
<br />
<br />
Dữ liệu Tín hiệu Dữ liệu<br />
phụ B chủ C phụ B<br />
<br />
<br />
Nhúng Giải nhúng C '<br />
Tín hiệu nhúng C '<br />
Truyền dẫn, lưu trữ<br />
<br />
Hình 1. Sơ đồ mô tả quá trình nhúng, giải nhúng.<br />
Giả sử khối nhúng sử dụng thuật toán nhúng trên miền thời gian LSB [2,4], B<br />
gồm M các byte dữ liệu Bi và C là tín hiệu audio gồm N mẫu âm thanh C j .<br />
M<br />
B Bi (1)<br />
i 1<br />
N<br />
C Cj (2)<br />
j 1<br />
N<br />
Khi đó: C ' C 'j (3)<br />
j 1<br />
<br />
Để đảm bảo nhúng được hết các Bi thì:<br />
M N (4)<br />
- Lỗi nhúng e :<br />
Đối với mỗi mẫu C ' , lỗi nhúng e j được tính theo công thức sau:<br />
ej C 'j C j (5)<br />
Dẫn tới:<br />
| e j || C ' j C j | Bi (6)<br />
Dấu "=" ứng với trường hợp cả 8 bit LSB của C j khác hoàn toàn với 8 bit của<br />
Bi được nhúng tương ứng.<br />
- Tỷ số tín/tạp :<br />
Để đơn giản trong tính toán, chúng ta coi N M H (số mẫu của C bằng số<br />
byte của B ), khi đó của C ' chính là tỷ số giữa tổng bình phương công suất của<br />
C và tổng bình phương công suất của e :<br />
H H<br />
<br />
| C j |2 | C j |2<br />
j 1<br />
j 1 (7)<br />
H H<br />
2 2<br />
| e<br />
j 1<br />
j | | B |<br />
i 1<br />
i<br />
<br />
<br />
Hay ở dạng Đề xi ben:<br />
H 2 H 2 <br />
j | C | | C j | <br />
(dB) 10 log10 j H1 10 log10 jH1 (8)<br />
2 2 <br />
| ej | | Bi | <br />
j 1 i 1 <br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 59<br />
Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
Từ vế trái của (8) chúng ta nhận thấy để có lớn phải thỏa mãn một hoặc cả<br />
hai điều kiện sau:<br />
H<br />
- Điều kiện 1: | e j |2 phải nhỏ => e j phải nhỏ, kết hợp với (6) => phải giảm<br />
j 1<br />
<br />
số bit của dữ liệu phụ khi nhúng vào C j (chia Bi thành các đoạn nhỏ trước khi<br />
nhúng). Khi đó H sẽ tăng, tuy tổng lỗi nhúng e không giảm, nhưng lỗi nhúng e j<br />
của từng mẫu C j sẽ giảm.<br />
H<br />
- Điều kiện 2: | C j |2 phải lớn => C j lớn => chọn các C j có giá trị lớn để<br />
j 1<br />
<br />
nhúng. Điều này hoàn toàn thực hiện được, bởi vì tín hiệu audio thường có tần số<br />
lấy mẫu cao (từ 32KHz đến 48KHz), dữ liệu phụ cần nhúng thường ngắn gọn, do<br />
vậy N M .<br />
<br />
3. XÂY DỰNG MÔ HÌNH<br />
3.1. Mô hình<br />
Ở phía phát, B được chia thành M đoạn nhỏ 4 bit Bi , chọn M mẫu C j có giá<br />
trị lớn nhất trong N mẫu của C và thực hiện nhúng LSB [2] Bi vào C j (thuật<br />
toán 1). Ở phía thu, thực hiện tìm M mẫu C ' j có chứa dữ liệu phụ và giải nhúng<br />
LSB [2] lấy ra M đoạn bit Bi (thuật toán 2), ghép M đoạn bit Bi để hình thành B<br />
(hình 2).<br />
<br />
<br />
<br />
<br />
Hình 2. Sơ đồ mô hình nhúng, giải nhúng mới. Hình 3. Thứ tự nhúng tín hiệu với M=3.<br />
<br />
Thứ tự mẫu C j được nhúng là ngẫu nhiên; mẫu có giá trị lớn nhất sẽ được<br />
nhúng trước, sau đó đến các mẫu có giá trị nhỏ hơn và liền kề với giá trị của mẫu<br />
đã nhúng trước đó (hình 3).<br />
<br />
<br />
<br />
60 V.V. Tâm, P.T.Hanh, "Một phương pháp mới nhúng dữ liệu vào tín hiệu audio."<br />
Nghiên cứu khoa học công nghệ<br />
<br />
3.2. Xây dựng thuật toán<br />
3.2.1. Thuật toán 1(nhúng tín hiệu)<br />
Private Sub nhung_Click()<br />
file1 tinhieuchu<br />
file2 tinhieunhung<br />
Open file1 ‘mở file chứa tín hiệu chủ C<br />
Open file2 ‘mở file để ghi tín hiệu nhúng C’<br />
For k 1,2..length(head for file1) do ‘ghi lại phần head của file<br />
a data[k] for file1<br />
data[k] to file2 a<br />
end for<br />
N somau for file1<br />
gk<br />
For j 1,2..N do ‘đọc các mẫu, cho 4 bit cuối = 0<br />
g g+1<br />
C j data[g] for file1<br />
D j C j - (4 bit LSB=0000)<br />
end for<br />
For H 1,2..M do ‘tìm M mẫu giá trị lớn nhất và nhúng<br />
D0 0<br />
find 0<br />
For j 1,2..N do<br />
if D j D0 then<br />
find j<br />
D0 D j<br />
end if<br />
end for<br />
C find D find BH (embeded LSB)<br />
D find 0<br />
end for<br />
For j 1,2..N do ‘ghi các mẫu vào file2<br />
k k 1<br />
data[k] to file2 C j<br />
end for<br />
close fiel1 ’đóng file tín hiệu chủ C<br />
close file2 ’đóng file tín hiệu nhúng C’<br />
End Sub<br />
3.2.2. Thuật toán 2 (giải nhúng tín hiệu)<br />
Private Sub giai_nhung_Click()<br />
file1 tinhieunhung<br />
Open file1 ‘mở file để đọc tín hiệu nhúng C’<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 61<br />
Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
N somau for file1 ‘đọc số mẫu audio<br />
s length(head for file1) ‘độ lớn phần head của file<br />
For j 1,2..N do ‘đọc các mẫu audio<br />
s s+1<br />
C ' j data[s] for file1<br />
D j C ' j - (4 bit LSB=0000)<br />
end for<br />
close fiel1 ‘đóng file tín hiệu nhúng<br />
For H 1,2..M do ‘tìm M mẫu lớn nhất và giải nhúng<br />
D0 0<br />
find 0<br />
For j 1,2..N do<br />
if D j D0 then<br />
find j<br />
D0 D j<br />
end if<br />
end for<br />
BH (4 bit LSB for C ' find )<br />
D find 0<br />
end for<br />
End Sub<br />
<br />
4. THỰC NGHIỆM VÀ ĐÁNH GIÁ<br />
Tín hiệu chủ được dùng thử nghiệm là bài hát Love Srory có các tham số như<br />
hình 4, dữ liệu phụ cần nhúng là ảnh xám có kích thước (300 300) Pixel.<br />
Chương trình nhúng và giải nhúng được thực hiện trong môi trường VisualBasic.<br />
Kết quả thử nghiệm cho thấy: C ' hầu như không thay đổi so với C , e rất nhỏ<br />
(hình 6), ảnh khôi phục có chất lượng tương đương với ảnh gốc (hình 5);<br />
Quá trình nhúng được thực hiện từ mẫu C j có biên độ lớn nhất, đến khi đủ M<br />
số mẫu cần thiết thì dừng lại. Do vậy e phân bố rải rác trên toàn C ' (chất lượng âm<br />
thanh của C ' sẽ suy giảm trên toàn bộ C ' mà không tập trung tại một đoạn như<br />
phương pháp nhúng LSB thông thường). Đặc biệt e , sẽ thay đổi khi dung lượng<br />
của B , C thay đổi. Ngoài ra, do thứ tự các C j được nhúng là ngẫu nhiên và giá trị<br />
M phụ thuộc vào B nên phía thu cần phải có M của phía phát mới có thể giải<br />
nhúng được, vì vậy dữ liệu phụ đã được bảo mật.<br />
<br />
<br />
<br />
<br />
62 V.V. Tâm, P.T.Hanh, "Một phương pháp mới nhúng dữ liệu vào tín hiệu audio."<br />
Nghiên cứu khoa học công nghệ<br />
<br />
<br />
<br />
<br />
Hình 4. Các tham số cơ bản của tín hiệu<br />
chủ (audio) thử nghiệm.<br />
Trước nhúng Sau nhúng<br />
<br />
<br />
<br />
<br />
Hình 5. Ảnh xám trước nhúng và sau Hình 6. Tín hiệu audio trước nhúng, sau<br />
giải nhúng. nhúng và lỗi nhúng.<br />
<br />
<br />
4. KẾT LUẬN<br />
Việc chia nhỏ các byte của dữ liệu phụ B và lựa chọn các mẫu tín hiệu chủ C j<br />
có biên độ lớn để nhúng là một phương pháp tiếp cận mới trong lĩnh vực nhúng dữ<br />
liệu vào tín hiệu audio. Trên cơ sở phân tích các yếu tố ảnh hưởng đến lỗi nhúng e<br />
và tỷ số tín/tạp của tín hiệu nhúng, chúng tôi đã xây dựng mô hình, các thuật<br />
toán mới nhằm nâng cao chất lượng của tín hiệu nhúng. Qua thử nghiệm mô hình<br />
với tín hiệu chủ là âm thanh, dữ liệu phụ là dạng ảnh xám cho thấy e và đã được<br />
cải thiện rõ rệt, đặc biệt khi ứng dụng trong lĩnh vực truyền tin quảng bá, do C là<br />
rất lớn vì vậy e sẽ giảm rất nhỏ, từ đó đạt giá trị lớn.<br />
Ngoài ra phương pháp mới này còn cho phép bảo mật được nội dung dữ liệu<br />
phụ đã nhúng. Kết quả nghiên cứu này không chỉ có giá trị về mặt ứng dụng, mà<br />
còn rất có ý nghĩa trong lĩnh vực nghiên cứu về tín hiệu nhúng hiện nay.<br />
<br />
TÀI LIỆU THAM KHẢO<br />
[1]. Poulami Dutta, Debnath Bhattacharyya, and Tai-hoon Kim, “Data Hiding in<br />
Audio Signal”, International Journal of Database Theory and Application Vol.<br />
2, No. 2, June 2009.<br />
[2]. Prof. Samir Kumar, BandyopadhyayBarnali, Gupta Banik, “LSB Modification<br />
and Phase Encoding Technique of Audio Steganography Revisited”,<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 63<br />
Kỹ thuật điện tử & Khoa học máy tính<br />
<br />
International Journal of Advanced Research in Computer and Communication<br />
Engineering Vol. 1, Issue 4, June 2012.<br />
[3]. Kriti Saroha, Pradeep Kumar Singh, “A Variant of LSB Steganography for<br />
Hiding Images in Audio”, International Journal of Computer Applications<br />
(0975 – 8887)<br />
[4]. Volume 11– No.6, December 2010.<br />
[5]. Randa A.Al-Dallah, Aseel M.Al-Anani, Rola I. Al-Khalid, Samah A.<br />
Massadeh, “An Efficient technique for data hiding in audio Signals”,<br />
American Academic & Scholarly Research Journal Special Issue Vol. 4, No.<br />
5, Sept 2012.<br />
[6]. F.Siebenhaar, C. Neubauer, R. Bauml, and J. Herre, “New High Data Rate<br />
Audio Watermarking based on SCS (Scalar Costa Scheme)”, in 113th<br />
Convention of the AES, Los Angeles, USA, October 5-8 2002.<br />
[7]. M. Namita Verma M. Vinay Kumar Jain, “Audio Steganography – A Review”,<br />
International Journal of Advanced Research in Electronics and<br />
Communication Engineering (IJARECE) Volume 2, Issue 1, January 2013.<br />
<br />
ABSTRACT<br />
<br />
A NEW METHOD TO EMBED DATA INTO AUDIO SIGNALS<br />
<br />
Nowadays, embedding data in audio signals is a new technique in<br />
terms of digital signal processing. The process of embedding signal must<br />
meet a number of relevant requirements, in particular the ratio of message<br />
interference must be at a high level [1], in other words, the sub-data which<br />
is embedded must have little impact on audio signals. On the basis of<br />
analyzing the factors impacting the ratio of message / interference of the<br />
embedded signals, we have built the model, the algorithm for embedding<br />
auxiliary data in audio signals. The testing results show that the ratio of<br />
message / interference has been improved, thereby minimizing the impact<br />
of sub-data on the audio signals.<br />
<br />
Keywords: Embedded signal, LSB, Sub-data, Audio signals.<br />
<br />
<br />
<br />
<br />
Nhận bài ngày 28 tháng 7 năm 2014<br />
Hoàn thiện ngày 15 tháng 9 năm 2014<br />
Chấp nhận đăng ngày 25 tháng 9 năm 2014<br />
<br />
<br />
<br />
Địa chỉ: * Đại học Kỹ thuật - Hậu cần Công an nhân dân;<br />
** Học viện Kỹ thuật Quân sự.<br />
<br />
<br />
<br />
64 V.V. Tâm, P.T.Hanh, "Một phương pháp mới nhúng dữ liệu vào tín hiệu audio."<br />