intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Đề tài: " Nén âm thanh file WAV theo chuẩn MPEG "

Chia sẻ: Nguyễn Thị Ngọc Huỳnh | Ngày: | Loại File: PDF | Số trang:78

399
lượt xem
99
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Công nghệ thông tin là ngành công nghiệp mũi nhọn của thế giới nói chung và của việt nam nói riêng, nó đã phát triển mạnh mẽ không ngừng trong những năm gần đây. Khi đời sống được nâng lên khoa học kỹ thuật phát triển nhu cầu về giải trí cũng đa dạng lên.Ở Việt Nam, khái niệm Công nghệ Thông tin được hiểu và định nghĩa trong nghị quyết Chính phủ 49/CP kí ngày 04/08/1993: "Công nghệ thông tin là tập hợp các phương pháp khoa học, các phương tiện và công cụ kĩ thuật hiện đại -...

Chủ đề:
Lưu

Nội dung Text: Đề tài: " Nén âm thanh file WAV theo chuẩn MPEG "

  1. TRƯỜNG……………………… KHOA…………………… ĐỒ ÁN TỐT NGHIỆP: Đề tài: " Nén âm thanh file WAV theo chuẩn MPEG "
  2. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình Mục lục................................ ................................ ................................ ................. 1 Lời nó i đầ u ........................................................................................................... 3 PHẦN I . LÝ THUYẾT ................................ ................................ ...................... 4 CHƯƠNG 1. CÁC KIẾN THỨC CƠ BẢN VỀ ÂM THANH............................ 5 I. NHỮNG KHÁI NIỆM CƠ BẢN - SÓNG CƠ................................ ................. 6 1.1. Sự hình thà nh sóng trong môi trường đàn hồi ................................. 6 1.2. Các đặ c trưng của só ng. ................................ ................................ .... 7 1.3. Phương trình só ng. ............................................................................ 8 II. SÓNG ÂM VÀ ĐẶC TÍNH ÂM THANH. ..................................................... 8 2.1 Dao động âm và sự truyền dao động. ................................................ 8 2.2 Đơn vị vật lý của â m thanh. ................................ ............................... 9 2.3. Đặc tính sinh lý về sự cả m thụ âm. ................................................... 12 CHƯƠNG 2. WAVE FILE. ................................ ................................ ................. 16 I. MULTIMEDIA WINDOWS. ......................................................................... 16 II. CẤU TRÚC WAVE FILE. ................................ ................................ ............. 17 2.1 RIFF file.............................................................................................. 17 2.2 Cấ u trúc File Wave............................................................................. 17 III. ĐỌC RIFF FILES ......................................................................................... 21 CHƯƠNG 3. LÝ THUYẾT XỬ LÝ TÍN HIỆU SỐ ........................................... 25 I. TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC ................................ ........................... 25 1. Giới thiệu ................................................................................................ 25 2. Đá p ứng xung trong hệ TTBB ................................ ............................... 25 3. Tính chất của tổng chập của hệ TTBB .................................................. 26 4. Hệ nhân quả ................................................................ ........................... 27 5. Tính ổn định ................................................................ ........................... 27 6. Phương trình sai phân tuyến tính hệ số hằ ng ....................................... 28 7. Biểu diễn cá c hệ rời rạ c trong miền tần số ............................................ 28 8. Định lý lấy mẫ u Shannon ....................................................................... 30 II. PHÉP BIẾN ĐỔI FOURIER RỜI RẠC ....................................................... 30 1. Chuỗi Fourier rời rạ c của tín hiệu rời rạc tuần hồn ............................ 30 2. Biến đổi Fourier rời rạc của tín hiệu có độ dài hữu hạn ................................ . 31 3. Phép biến đổi nhanh Fourier (FFT) ................................................................ 32 CHƯƠNG 4. GIỚI THIỆU VỀ MPEG. ............................................................. 33 I. GIỚI THIỆU. .................................................................................................. 33 1. MPEG là g ì?................................................................ ........................... 33 2. So sá nh cá c chuẩn MPEG ..................................................................... 33 3. Aâm thanh MPEG ................................ ................................ ................. 34 4. Các khá i niệm cơ bản ............................................................................ 35 5. Hoạt động ................................ ................................ ............................... 38 II. CÁC KHÁI NIỆM TRONG ÂM THANH MPEG ....................................... 40 1. Lược đồ mã hóa Perceptual Sub-band.................................................. 40 2. Giải thích hiệu qủa che (masking efficiency) ................................ ........ 41 3 . Cá c lớp của â m thanh MPEG ................................................................. 43 III. CÁC THÔNG SỐ. ......................................................................................... 45 CHƯƠNG 5. CÁC GIẢI THUẬT NÉN ÂM THANH ....................................... 50 I. LÝ THUYẾT THÔNG TIN ............................................................................ 50 II. CÁC GIẢI THUẬT NÉN KHÔNG CÓ TỔN THẤT ................................ .... 51 1. Mã hóa Huffman .................................................................................... 51 2. Mã hóa Huffman sửa đổi ....................................................................... 53 SVTH: Đỗ Vă n Tuấn Trang 1
  3. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình 3. Mã hóa số học ......................................................................................... 54 4. Giả i thuật Lempel-Ziv-Welch (LZW) ................................................... 55 III. CÁC GIẢI THUẬT NÉN CÓ TỔN THẤT ................................ ................. 57 1. Cá c phương pháp nén â m thanh đơn giả n ............................................ 57 2. Nén âm thanh dùng mô hình âm tâ m lý ................................................ 57 3. Nén âm thanh theo chuẩn MPEG .......................................................... 58 PHẦN II. THIẾT KẾ CHƯƠNG TRÌNH .......................................................... 60 CHƯƠNG 6. LƯU ĐỒ GIẢI THUẬT VÀ CẤU TRÚC DỮ LIỆU ................... 61 I. SƠ ĐỒ KHỐI. .................................................................................................. 61 II. CẤU TRÚC DỮ LIỆU VÀ ĐỊNH NGHĨA .................................................... 62 A. CẤU TRÚC DỮ LIỆU ................................................................................... 62 1. Cá c cấu trúc về file ................................................................................ 62 2.Các cấu trúc về dòng bít dữ liệu............................................................. 63 3.Các cấu trúc để định dạng dòng bít dữ liệu ........................................... 63 4.Các cấu trúc huffmancodetab. ................................ ............................... 67 5.Các cấu trúc tính MDCT ................................ ................................ ........ 67 6.Các cấu trúc scalefac_struct ................................................................... 67 B. CÁC ĐỊNH NGHĨA ........................................................................................ 68 1.Các định nghĩa dùng trong truy xuất dữ liệu ................................ ........ 68 2.Các định nghĩa dùng trong tính tốn FFT............................................... 68 3.Các định nghĩa dùng trong định dạ ng dò ng dữ liệu .............................. 68 4.Các định nghĩa dùng trong bộ mã hố Huffman..................................... 68 5.Các định nghĩa dùng trong phâ n tích dữ liệu ................................ ........ 69 6.Các định nghĩa dùng trong mô hình â m tâm lý ..................................... 69 7.Các định nghĩa dùng trong truy xuất nhập dữ liệu ............................... 69 8.Các định nghĩa dùng trong cấ u trúc file Wave và file Mpeg ................ 69 III. LƯU ĐỒ ................................ ................................ ................................ ........ 71 CHƯƠNG 7: GIAO DIỆN VÀ THUYẾT MINH CHƯƠNG TRÌNH ............... 75 I. GIỚI THIỆU ................................ ................................................................... 75 II. GIAO DIỆN ..................................................................................................... 75 III.CHƯƠNG TRÌNH ......................................................................................... 77 TÀI LIỆU THAM KHẢO ................................................................................... 87 Lời nói đầu Công ngh ệ thông tin là n gành công nghiệp mũ i nhọn của th ế giới nói chung và củ a việt nam nói riêng, nó đã ph át triển m ạnh mẽ không ngừng trong nh ững năm gần đây. Khi đời sống được n âng lên khoa học kỹ thuật phát triển nhu cầu về giải trí cũng đa d ạng lên, các loại hình giải trí không ngừng gia tăng và ngày càng phong phú, đ a dạng các lo ại h ình giải trí như: trò chơi điện tử, nghe nh ạc xem phim, xem ca nhạc(video), và đặc biệt là những trong chơi dạng không gian ba chiều. Sự phát triển ồ ạt này đã dẫn tới ngành công ngh ệ phần cứng đ ã không thể đáp ứng được nh ững đòi hỏi về lưu trữ, đồng hành với sự ph át triển này là mạng m áy tính đó chính là Internet ngày càng phát triển số lượng người tham gia truy cập ngày càng lớn và nhu cầu của họ thì ngày càng phong phú và đ a dạng về tất cả các loại hình nó i trên. Do đó tốc đ ộ truy cập, tốc độ truyền tải trên SVTH: Đỗ Vă n Tuấn Trang 2
  4. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình mạng được quan tâm h ơn để cho người dùng không ph ải số t ruộ t ngồi chờ những trang web mà mình truy cập, họ không phải bực mình khi download những file âm thanh và những bài hát mà họ ưa th ích vì đường truyền quá chậm trong khi công ngh ệ phần cứng đã phát triển m ạnh. Chính vì vậy các nhà nghiên cứu phần mềm đ ã chú ý đến việc phát triển ph ần mềm để hỗ trợ phần cứng. Họ đã tạo ra nh ững ch ương trình ph ần mềm hỗ trợ tích cực phần cứng, từ đó đ ã ra đời những ph ần m ềm nén âm thanh, hình ảnh, nén video, tách âm th anh từ những file video…để tạo ra những dạng âm thanh, hình ảnh, video như m indi, mpeg, mp3, mp4… những file ảnh d ạng gif, jpeg…với dung lượng lưu trữ vô cùng nhỏ mặc dù ch ất lượng có giảm đi đôi chút nhưng không đáng kể so với những gì n ó đạt được để truyền tải, truy cập nhanh hơn. Sự tồn tại củ a chuẩn JPEG (Joint Photographic Experts Group) ch ỉ đ ể giảm tốc độ bit và chủ yếu phụ c vụ cho hình ảnh, rõ ràng là không đủ đáp ứng cho hình ảnh động có kèm âm thanh. Để đáp ứng nhu cầu của thị trường, một nhóm các chuyên gia về hình ảnh động (Moving Picture Experts Group), gọi tắt là MPEG, được th ành lập để nghiên cứu đưa ra những lược đồ mã hóa phù hợp cho việc truyền hình ảnh động và ghi lại chúng theo tiêu chu ẩn trong các thiết bị lưu trữ số như CD-ROM, Video CD.. Ph ần trình bày của luận văn ch ỉ nằm trong khuôn khổ "Aâm thanh". Do đó mọi vấn đ ề liên quan tới h ình ảnh sẽ không được đề cập tới, dù chu ẩn MPEG là dùng cho cả âm thanh và hình ảnh. Mục tiêu của đề tài chủ yếu chỉ để tìm hiểu về các phương pháp m ã hố và nén âm thanh theo chuẩn Mpeg, từ đó dựa trên một số source code (viết bằng C) đã có trên mạng Internet viết lại b ằng ngôn ngữ Visual C++, nhằm hiểu sâu hơn về giải thuật, đồng thời tạo ra mộ t giao diện thân thiện hơn. Do trình độ và kiến thức có hạn n ên không tránh khỏi những thiếu só t, em kính mong th ầy tham gia và giúp đỡ em đ ể em hồn thành được tốt h ơn. Em xin chân thành cám ơn th ầy đã tạo đ iều kiện thu ân lợi nhất giúp em hồn th ành b áo cáo này. SVTH: Đỗ Vă n Tuấn Trang 3
  5. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình PHẦN I LÝ THUYẾT CƠ BẢN SVTH: Đỗ Vă n Tuấn Trang 4
  6. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình SVTH: Đỗ Vă n Tuấn Trang 5
  7. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình CHUƠNG 1. CÁC KIẾN THỨC CƠ BẢN V Ề ÂM THANH. I. NHỮNG KHÁI NIỆM CƠ BẢN - SÓNG CƠ 1.1. Sự hình th ành sóng trong môi trường đàn hồi. a. Định nghĩa: Các môi trư ờng ch ất khí, ch ất lỏng, chất rắn là mô i trường đàn hồ i. Mô i trường đàn hồi có th ể coi là những mô i trường liên tục gồm những phân tử liên kết chặt chẽ với nhau, lúc bình thường mỗi phân tử có một vị trí cân bằng bền. b. Sự hình th ành sóng trong môi trường đàn hồi:  Do tính ch ất của môi trường đ àn hồi, cho n ên nếu tác dụng lên ph ân tử nào đó của môi trư ờng thì phân tử này rời khỏi vị trí cân bằng bền.  Do tương tác, các phân tử lân cận mộ t mặt kéo phân tử A về vị trí cân bằng, mặt kh ác nhận một phần năng lư ợng do phân tử A truyền sang, do đó cũ ng dao động theo, hiện tượng này xả y ra liên tiếp tạo thành sóng. Sóng đ àn hồi (sóng cơ) là sự lan truyền dao động trong mô i trường đàn hồi. Sóng cơ không th ể truyền đ ược trong ch ân không, vì ch ân không không phải là môi trường đ àn hồi.  Cần lưu ý trong khi truyền dao động, các phân tử của môi trường không di chuyển theo các dao động được lan truyền mà chỉ dao động quanh vị trí cân bằng củ a nó. c. Mộ t số khái niệm về sóng:  Nguồn sóng: là ngoại vật gây ra kích động sóng.  Tia sóng: là phương truyền sóng.  Môi trư ờng sóng: là không gian mà sóng truyền qua.  Mặt sóng: là m ặt chứa những điểm (phân tử) có cùng trạng thái dao động tại mộ t thời điểm nào đó. Tia sóng luôn vuông góc với mặt sóng.  Sóng cầu: m ặt sóng là những m ặt cầu phân bố đều trong không gian, tâm là nguồn sóng. Trong môi trường đồng chất và đ ẳng hư ớng sẽ có sóng cầu. Đối với sóng cầu tia sóng trùng với b án kính của mặt cầu.  Sóng phẳng: mặt sóng là những m ặt ph ẳng song song nhau, tia sóng vuông gó c với m ặt sóng. Nếu nguồn sóng ở rất xa m ôi trường đang xét thì m ặt sóng có thể coi là nh ững mặt phẳng song song. SVTH: Đỗ Vă n Tuấn Trang 6
  8. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình  Sóng dọ c: là sóng trong đó các phân tử củ a môi trường dao động quanh vị trí cân bằng trên phương trùng với tia sóng. Khi có sóng d ọc, trên phương của tia sóng các phân tử củ a môi trường khi thì bị n én ch ặt, khi thì giãn ra làm cho các ph ân tử của môi trường có chỗ d ày ch ỗ thưa.  Sóng ngang: là sóng trong đó các phân tử củ a mô i trường dao động quanh vị trí cân bằng trên phương vuông góc với tia sóng. d. Nguyên nh ân gây ra sóng ngang và só ng dọc:  Tù y tính ch ất của môi trư ờng đàn hồi m à trong đó có thể xu ất hiện sóng ngang hay sóng dọ c. - Khi mộ t lớp của mô i trường bị lệch đố i với lớp kh ác làm xu ất hiện các lực đàn hồ i có xu hướng kéo lớp bị lệch về vị trí cân b ằng thì trong môi trường đó có thể truyền được sóng ngang. Vậy vật rắn là m ột mô i trường có tính chất đó. - Nếu trong mô i trường không có các lực đàn hồi khi các lớp song song bị lệch đối với nhau th ì sóng ngang không thể hình th ành đ ược. Chất lỏng và chất kh í là nh ững môi trường đó. - Khi bị b iến dạng n én hay căng mà trong môi trường có các lự c đàn h ồi xuất hiện th ì trong mô i trường đó có th ể truyền đ ược sóng dọc. Chẳng hạn khi bị n én, ch ất lỏng hay ch ất khí sẽ tăng áp suất, lự c nén giữ vai trò lực đàn hồi.  Nh ư vậy trong chất lỏng và chất khí chỉ có sóng dọc truyền đ ược, còn trong chất rắn có thể truyền được cả h ai loại sóng. 1.2. Các đ ặc trưng của sóng. a. Vận tốc truyền sóng (C) : Là qu ãng đường mà sóng truyền được trong một đơn vị thời gian. b. Bước sóng : Là quãng đường mà sóng truyền đ ược sau một thời gian bằng 1 chu kỳ T. Như vậy  là khoảng cách b é nh ất giữa các ph ân tử dao động cùng pha. Theo định nghĩa ta có :  = CT. c. Chu kỳ và tần số:  Chu k ỳ T là thời gian cần thiết để sóng truyền được 1 b ước sóng .  Tần số f là số chu kỳ thực hiện được trong 1 giây : SVTH: Đỗ Vă n Tuấn Trang 7
  9. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình F = 1/T (Hz) 1.3. Phương trình sóng.  Sóng phẳng truyền dọ c theo ph ương OY với vận tốc C thì phương trình sóng biểu thị mối quan hệ giữa độ chuyển d ời X củ a phân tử d ao động kể từ vị trí cân bằng với th ời gian t và kho ảng cách y đ ến các vị trí cân bằng các ph ân tử d ao động trên phương truyền sóng nh ư sau : X = asin(t – y/c)  Nếu sóng phẳng truyền theo hướng ngược với hướng tính kho ảng cách y thì : X = asin(t + y/c)  Đố i với sóng cầu thì biên độ a của dao động sóng tại vị trí cách nguồn bằng bán kính r, tỉ lệ n gh ịch với r, ph ương trình sóng có d ạng: X = a/r sin(t – r/c) II. SÓNG ÂM. 2.1. Dao động âm và sự truyền dao động.  Sóng âm là một loại sóng cơ có b iên độ d ao động nhỏ mà thính giác nhận biết được. Thí dụ d ao động phát ra từ dây đàn, mặt trống.. đ ang rung động. Sóng âm là một loại sóng cơ n ên mọi khái niệm và hiện tượng về dao động và sóng cơ trên đây đ ều áp dụng cho sóng âm.  Trong không khí cũng như trong m ọi chất khí kh ác, nh ững dao động truyền đi dưới d ạng sóng dọc, khi đến tai người những dao động có tần số từ 16 đến 20000 Hz sẽ gây cảm giác đặc biệt về âm.  Các dao động đàn hồi có tần số f>20.000 Hz là sóng siêu âm.  Các dao động đàn hồi có tần số f
  10. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình 2.2. Đơn vị vật lý của âm thanh.  Âm thanh hay tiếng động mà con người nh ận biết được do tác động củ a sóng âm lên màng nhĩ tai.  Các dao động âm ph át ra từ n guồn lan truyền trong m ôi trường đàn hồi như không khí.. dưới dạng sóng đ àn hồi gọi là sóng âm. Sóng âm đ ến kích động m àng nhĩ tai gây cảm giác về âm, do đó cần phân biệt hai lo ại đại lượng về âm: - Đại lư ợng âm khách quan: những đại lượng thu ần tú y vật lý, không phụ thuộc vào tai người. - Đại lượng âm chủ quan: những đại lượng tâm lý vật lý phụ thuộc vào tai người. 2.2.1. Đơn vị âm khách quan: a. Aùp su ất âm: Khi sóng âm tới mộ t m ặt n ào đó, do các phân tử mô i trường dao động tác dụ ng lên mặt đó mộ t lực gây ra áp suất. Aùp suất ở đây là áp su ất dư do sóng âm gây ra ngồi áp su ất khí quyển. Trong ph ạm vi nghe được, áp su ất âm trong khoảng từ 2.10 -4 đến 2.10 bar, ch ênh lệch 10 6 lần, đó là một phạm vi rất rộng. 2 b. Cường độ âm (I): - Cường đ ộ âm ở một điểm nào đó trên phương đ ã cho trong trường âm là số n ăng lượng âm đi qua đơn vị diện tích của m ặt S vuông góc với phương truyền âm, tại đ iểm đó trong đ ơn vị th ời gian. - Mộ t vài cường độ âm đ áng chú ý: I = 2.10 -3 W/m2 Người nó i thư ờng I = 5 W/m2 Còi ô-tô Còi báo động I = 3.000 W/m 2 - Trong đ iều kiện chuẩn (to = 20oC, áp su ất 760mmHg): Vận tốc âm trong không khí : C = 340 m/s  = 0,00121 gr/cm 3.  = Cp/Cv = 1 ,4 SVTH: Đỗ Vă n Tuấn Trang 9
  11. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình - Trong tính tốn ngư ời ta quy ước lấy âm đơn tần số f = 1000 Hz làm chuẩn để so sánh (gọi là âm chu ẩn). - Đối với âm chuẩn, trong phạm vi nghe được Pmin = 2.10 -4 bar Áp suất âm nhỏ nhất Imin = 10-16 W/cm2. Cường độ âm nhỏ nhất - Aùp suất âm và cường độ âm lớn nhất mà tai người có thể ch ịu được là: Pmax = 2 .10 2 bar Imax = 10 -4 W/cm2. - Công suất âm nhỏ nh ất có thể nghe thấy đ ược Wmin = 10 -12 Watt. 2.2.2. Đơn vị âm chủ quan:  Tai người trung bình có thể nh ận được những sóng âm có tần số từ 16 đến 20000 Hz, hiệu qủa n ày có liên quan tới kh ả năng sinh lý của tai người.  Nh ư vậy, âm thanh là mộ t hiện tư ợng tâm lý vật lý , không ph ải b ất cứ sóng âm nào tới tai cũng gây ra cảm giác âm thanh như nhau. Aâm có tần số khác nhau gây ra cảm giác kh ác nhau.  Cư ờng độ âm nhỏ nhất của mộ t sóng âm xác định mà tai người nghe th ấy được gọ i là “Ngưỡng nghe”. Aâm có tần số khác nhau giá trị ngưỡng nghe cũng khác nhau. Tai người thính nh ất với âm có tần số trong kho ảng từ 1000 đến 3000 Hz, trong ph ạm vi này cường độ âm ngưỡng nghe nhỏ nhất. Nh ững tần số kh ác, tai kém thính hơn, ngưỡng nghe có giá trị lớn hơn.  Đố i với âm chuẩn, cường độ và áp suất ở n gưỡng nghe b ằng: Po = 2.10-5 N/ m2. Io = 1 0-12 W/m2.  Do cảm giác âm thanh phụ thuộc vào đ ặc tính sinh lý của tai người, cho nên phải có mộ t số đại lượng đ ặc trưng cho cảm giác âm thanh phụ thuộc vào tai người, những đ ại lượng nh ư vậy gọi là đại lượng âm chủ quan. a. Bel và decibel (db): SVTH: Đỗ Vă n Tuấn Trang 10
  12. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình Theo định lý sinh lý của Vebe-Fécne, cảm giác nghe to đối với một âm không tỉ lệ thuận với cường độ âm củ a âm đó. Khi cường độ âm tăng từ Io tới I thì cảm giác nghe to tăng tỉ lệ với lg(I/Io). Do đó người ta dùng thang lô -ga-rít cơ số 10 để đo mứ c cảm giác so với mức ngưỡng. Mức ngưỡng gọi là m ức zero qui ước : lg(I/Io) = lg(10-12/ 10-12) = 0 bel. Đơn vị là Bel hay db. 10db = 1 bel. b. Mức cường độ âm (LI): Nếu gọi I là cường độ âm củ a âm đ ang xét và Io là cường độ âm của mứ c zero qui ước của âm chuẩn th ì mức cường độ âm LI b ằng : LI = 10lg(I/Io) db I tính b ằng W/m 2. c. Mức áp suất âm (Lp): Mức áp suất âm suy d ẫn từ mức cường độ âm Lp = 20lg(P/Po) db. Trong đó: P :áp suất âm có ích của âm đ ang xét (N/m2) Po:áp su ất âm củ a âm chuẩn ở ngưỡng nghe. Thự c tế áp suất âm là đ ại lượng cơ b ản hơn cường độ âm, n ên thường dùng mức áp suất âm sau đó suy ra mứ c cường độ âm. Đơn vị chung là bel hay db. Đơn vị n ày cũng dùng đ ể đo mức công suất, mứ c n ăng lư ợng âm. Vài mức áp suất âm đ áng chú ý : Nói chuyện thường : 30db. Nói chuyện to : 70db. 2.2.3. Quãng độ cao (qu ãng tần số):  Qu ãng tần số của hai âm là kho ảng cách tần số của hai âm đó. Nếu một âm tần số là f1, mộ t âm khác tần số là f2 (f2 > f1) thì f2 / f1 = 2x. Khi x=1 tức f2 / f1 = 2 gọ i là 1 quãng tần số (hay 1 ốc-ta). Khi x=1/2 tức f2 / f1 = 1.41 gọi là nử a ố c-ta. SVTH: Đỗ Vă n Tuấn Trang 11
  13. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình Khi x=1/3 tức f2 / f1 = 1.26 gọi là 1/3 ốc-ta. - Mức áp suất âm của 1 ốc-ta bằng mức áp suất âm của 1/2 ố c-ta cộng th êm 3db. - Mức áp suất âm của 1 ốc-ta bằng mức áp suất âm của 1/3 ố c-ta cộng th êm 5db.  Vì quãng tần số củ a một âm qui định độ cao củ a âm đó nên còn gọi là quãng độ cao. Theo tập quán âm nhạc thì q uãng độ cao gọi là quãng 8 (bát độ).  Ch ẳng h ạn âm LA, tần số f=440 Hz tăng 1 bát độ là tăng gấp đôi tần số, tức là 880 Hz.  Trong thực tế thường gặp nhữ ng âm phức tạp bao gồm nhiều tần số. Tập hợp tất cả những tần số cấu tạo trong một âm thanh gọi là “tần phổ ” của âm đó, tần phổ có thể gián đo ạn hay liên tụ c. Mộ t âm có tần phổ liên tụ c được đặc trưng bằng “Mứ c tần phổ B” với đ ịnh nghĩa: - Mứ c tần phổ là mức áp suất âm trong chiều rộng của dải tần số bằng 1. - Mộ t âm có mức tần phổ B không đổi với mọi tần số gọ i là tiếng ồn trắng. - Mộ t âm có tần phổ gián đoạn được đặc trưng bằng “mức dải tần số ” với định ngh ĩa: mức dải tần số là mức áp suất âm trong chiều rộng của dải tần số lớn h ơn 1 Hz. 2.3. Đặc tính sinh lý về sự cảm thụ âm thanh. 2.3.1. Mức to, độ to, mức âm cảm giác:  Mức áp suất âm, mứ c cư ờng độ âm trên đây vừ a mang tính chất chủ quan vừa mang tính chất kh ách quan vì những đại lượng này xác định từ những đại lượng thuần tú y vật lý. Vấn đề có ý ngh ĩa to lớn trong th ực tế là cần biết được sứ c m ạnh của âm thanh đo b ằng tai người.  Mức to, độ to của mộ t âm là sức mạnh cảm giác do âm thanh gây nên trong tai người, nó không nh ững phụ thuộ c vào áp suất âm m à còn phụ thuộc vào tần số của âm đó. Thí dụ 2 âm có tần số 100 Hz và 1000 Hz áp suất âm đều bằng 0,02 bar nhưng nghe to nhỏ khác nhau, âm 1000 Hz nghe to hơn âm 100 Hz. Muốn nghe to b ằng âm 1000 Hz thì âm 100 Hz phải có áp su ất b ằng 0,25 bar. Nh ư vậy tai n gười không nhạy đ ối với âm 100 Hz bằng âm 1000 Hz. Tần số càng thấp tai người càng kém nhạy. a. Mức to: SVTH: Đỗ Vă n Tuấn Trang 12
  14. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình - Để b iểu thị m ức to trên cảm giác chủ quan, ta d ùng đại lượng “mức to”, đơn vị là “Fôn” với định ngh ĩa như sau : Fôn là m ức to của âm chu ẩn, về giá trị b ằng mức áp suất âm của âm chuẩn tức là : L = 20lg P/Po (Fô n). - Vậy mức to củ a một âm b ất k ỳ đ o bằng Fôn, về giá trị b ằng mứ c áp suất âm của âm chuẩn đo b ằng db có cùng mức to với âm đ ó. Th í dụ : âm có tần số 500 Hz mức áp suất âm bằng 25 db và âm có tần số 50 Hz mứ c áp suất âm b ằng 64 db sẽ có cùng mức to bằng 20 Fôn, b ằng mức to của âm 1000 Hz mức áp suất bằng 20 db. - Muốn biết mứ c to của mộ t âm bất k ỳ p hải so sánh với âm chu ẩn. - Đối với âm chu ẩn, mức to ở n gưỡng nghe là 0 Fôn, ngưỡng chói tai là 120 Fôn. - Cùng một giá trị áp suất, âm tần số càng cao, mứ c to càng lớn. b. Độ to: - Khi so sánh âm này to hơn âm kia bao nhiêu lần, dùng khái niệm “độ to” đơn vị là “Sôn” với định ngh ĩa như sau: Số lượng Sôn biểu th ị số lần mạnh hơn của một âm n ào đó so với âm chuẩn mà tai người có thể phân biệt được. - Độ to là mộ t thuộc tính của thính giác, cho phép phán đốn tính chất m ạnh yếu củ a âm thanh. Căn cứ vào độ to mà sắp xếp âm từ nhỏ tới to. - Mứ c to tăng 10 Fôn thì độ to tăng gấp đôi và n gược lại. 2.3.2. Aâm điệu và âm sắc:  Âm điệu ch ỉ âm cao hay thấp, trầm hay b ổng. Âm điệu chủ yếu phụ thuộc vào tần số của âm, tần số càng cao, âm nghe càng cao, tần số càng th ấp âm nghe càng trầm.  Âm sắc ch ỉ sắc thái của âm du dương hay thô kệch, thanh hay rè, trong hay đ ục. Âm sắc phụ thuộc vào cấu tạo của sóng âm điều hòa, biểu thị bằng số lượng các loại tần số, cường độ và sự phân bố củ a chúng quanh âm cơ bản. Âm sắc có quan hệ mật thiết với cường độ, âm đ iệu và th ời gian âm vang, sự trưởng thành và tắt dần của trườn g âm. SVTH: Đỗ Vă n Tuấn Trang 13
  15. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình  Khi hai ca sĩ cù ng h át một câu ở cùng một độ cao, ta vẫn phân biệt được giọng h át của từng người. Khi đ àn ghi-ta, sáo, kèn.. cùng tấu lên m ột đoạn nhạc ở cùng một độ cao, ta vẫn phân biệt được tiếng củ a từng nhạc cụ. Mỗi người, mỗ i nh ạc cụ ph át ra những âm có sắc th ái khác nhau m à tai ta ph ân biệt đ ược. Đặc tính đó của âm ch ính là âm sắc.  Âm sắc là một đ ặc tính sinh lý của âm, được h ình thành trên cơ sở các đặc tính vật lý củ a âm là tần số và biên độ. Thực nghiệm chứng tỏ rằng khi một nhạc cụ phát ra một âm có tần số f1 th ì đồng thời cũng phát ra các âm có tần số f2=2f1, f3=3f1...  Âm có tần số f1 gọ i là âm cơ b ản hay họ a âm thứ nh ất, các âm có tần số f2 , f3 .. gọ i là các họa âm thứ hai, thứ b a... Âm cơ b ản bao giờ cũng m ạnh nh ất, các họa âm có tác dụn g quyết định âm sắc của âm cơ b ản, giúp ta phân biệt các nguồn âm kh ác nhau. Chẳng hạn tiếng đ àn Pi-a-nô và tiếng sáo tuy cùng một âm cơ bản nhưng lại rất dễ ph ân biệt, nguyên nhân là do số lư ợng, cấu trú c những họa âm quanh âm cơ bản củ a chúng khác nhau. Họa âm càng nhiều âm nghe càng du dương phong phú. 3. Thính giác định vị (hiệu ứng Stereo):  Khi nghe âm tuy mắt không nhìn thấy nguồn âm nhưng có th ể xác định chính xác vị trí củ a nguồn âm. Đặc điểm này là kết qủa của hai tác dụng: - Do cường độ, độ to, âm sắc củ a âm đến hai tai không giống nhau. - Do âm đến hai tai lệch pha nhau, vì thời gian đ ến hai tai không giống nhau.  Cư ờng độ , độ to của âm đến hai tai chênh lệch nhau là do nhiễu xạ gây ra. Âm có tần số f < 1000 Hz sự ch ênh lệch cường độ do nhiễu xạ gây ra rất bé nhưng ở những tần số cao, sự chênh lệch này có th ể đ ạt tới 20 - 30 db.  Do khả năng đ ịnh vị củ a tai như vậy cho nên khi nghe âm có th ể tập trung chú ý vào nguồn âm cần nghe, bỏ qua một cách tự nhiên những âm không cần nghe. Nhờ hiệu qủ a n ày mà tiếng ồn bị phủ lấp hoặc giảm nhỏ một cách tự nhiên. Nếu chỉ n ghe âm một tai th ì hiệu qủa n ày mất. 4. Nghe âm và chênh lệch thời gian:  Tương tự như tác dụng lưu ảnh của mắt, tai người cũng có tác dụng lưu âm.  Thí n ghiệm với nhiều thính giác bình thường cho th ấy rằng, n ếu hai âm như nhau đến tai người cách nhau < 50 ms th ì tai người không phân biệt được, nghe nh ư một âm duy nhất. SVTH: Đỗ Vă n Tuấn Trang 14
  16. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình CHƯƠNG 2. TẬP TIN DẠNG SÓNG (WAVE FILE). I. MULTIMEDIA WINDOWS  Từ phiên bản Windows 3.1, Multimedia đ ã trở thành một tính năng của Windows. Multimedia Windows đã bổ sung một tính năng m ới: đó là sự độc lập thiết bị trong việc xử lý âm thanh. Sự độ c lập thiết bị n ày thể hiện qua bộ API (Applycation Program Interface – Bộ giao diện lập trình ứng dụng). Bộ API độ c lập về thiết bị đố i với phần cứng và đó là mộ t chứ c năng quan trọng của Windows. Người lập trình sẽ lập trình đ iều khiển phần cứng trên Windows dựa trên chức năng của ph ần cứng h ơn là các chi tiết cụ thể củ a nó. Các nh à cung cấp ph ần cứng chỉ cần cung cấp một bộ điều khiển thiết bị (device driver) cho Windows, nh ờ đó một ứng dụng trên Windows có thể đ iều khiển phần cứng thông qua Windows API.  Với Multimedia Windows, h ãng Microsoft đã thực hiện được ba đ iều :  Định nghĩa một tiêu chu ẩn phần cứng tối thiểu cho loại máy Multimedia PC (viết tắt là MPC). Tiêu chuẩn này dự a trên chức năng tổng qu át h ơn là sản phẩm cụ th ể. Ví dụ nếu PC có thêm ổ đ ĩa CD-ROM và mộ t card âm thanh th ì trở th ành MPC cấp 1.  Microsoft đã cung cấp phần m ềm Multimedia Extension cho Windows 3.0 và đ ã được ghép luôn vào hệ điều hành Windows từ phiên bản 3.1. Ph ần mềm n ày bao gồm các bộ điều khiển thiết bị dành cho việc truy xu ất đến các phần cứng gắn thêm vào MPC.  Microsoft đư a ra công cụ ph át triển Multimedia Development Kit (MDK). Lập trình viên kết h ợp công cụ trên với bộ Windows Software Development Kit (SDK) đ ể viết các ứng dụng về Multimedia.  Có h ai dạng xử lý âm thanh số hó a trên Windows. Loại thứ nhất m icrosoft gọi là “Wave Form Audio” (Aâm thanh d ạng sóng), dựa trên nguyên tắc số hóa sóng âm, MPC lưu chúng trên bộ n hớ h ay tập tin .WAV trên đĩa. Các dữ liệu số n ày có thể thông qua ph ần cứng biến đổi lại th ành âm thanh.  Dạng thứ h ai là MIDI. Khác với âm thanh dạng sóng, MIDI chỉ lưu lại những thông điệp đ iều khiển bộ tổng hợp phát ra âm thanh. Do đó kích thước củ a tập tin .MID nhỏ hơn nhiều so với tập tin.WAV. II. CẤU TRÚC WAVE FILE. 1. RIFF file. SVTH: Đỗ Vă n Tuấn Trang 15
  17. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình Wave File là tập tin chứa các dữ liệu của mẫu âm thanh đã được số hó a. Phương ph áp số hóa âm thanh hiện nay là phương ph áp PCM. Ph ương ph áp này sẽ lấ y m ẫu âm thanh với tần số kho ảng 11.025 kHz cho đến 44.1 kHz. Mỗi lần lấy mẫu, số liệu này lại được lượng tử hóa b ằng một hay hai byte cho mộ t mẫu âm thanh. Như vậy tần số lấy m ẫu càng cao, số b yte dùng lượng tử hóa càng nhiều thì âm thanh phát lại càng trung thực, nhưng lại tăng số b yte cần lư u trữ. Với mộ t mẫu âm thanh phát ra trong một phút cần phải lưu trữ ít nhất 660 kB. Đó là lý do tại sao các File Wave luôn có kích thước khá lớn so với MIDI File. Cấu trúc của Wave File thuộc vào lớp file được sử dụng bởi các hàm Multimedia của Windows: đó là RIFF FILE. RIFF là chũ viết tắt củ a Resource Interchange File Format (dạng file trao đổ i tài nguyên). Một RIFF file gồ m mộ t ho ặc nhiều lo ại chunks, trong mỗi chunk lại chứa con trỏ chỉ đ ến chunk kế tiếp. Mỗi chunk bao gồm loại chunk và dữ liệu theo sau loại chunk đó. Một ứng dụng muốn đọc RIFF file có thể đi qua lần lượt từng chunk, đọc dữ liệu ở chunk nó quan tâm và có thể bỏ q ua các chunk mà nó không quan tâm, một chunk của RIFF file lu ôn b ắt đ ầu bởi một header có cấu trúc như sau: Typedef struct { FOURCC ckid; DWORD ckSize; } CK; Trường FOURCC có 4 b ytes ch ỉ ra lo ại chunk. Đố i với File Wave, trường n ày có giá trị là “WAVE”. Nếu lo ại chunk ít hơn 4 ký tự thì các ký tự còn lại b ên ph ải sẽ được đệm thêm vào các khoảng trắng. Cần chú ý là các ký tự trong FOURCC có ph ân biệt chữ hoa và chữ thường. Trường DWORD chứa kích thước vùng dữ liệu củ a chunk, vùng dữ liệu n ày nằm ngay sau header và có kích thước là ckSize bytes. Chunk có thể chứa các subchunks. Subchunk cũng là một chunk. Mộ t RIFF file lu ôn bắt đầu b ằng một chunk loại “RIFF”. 2. Cấu trúc Wave file. Wave file bắt đầu là chunk lo ại “RIFF”. Hai subchunk trong wave chunk đặc tả thông tin về âm thanh của wave file và tiếp đó là d ữ liệu của từ ng subchunk. Đó là subchunk “fmt” và subchunk “data”. a. subchunk “fmt”: SVTH: Đỗ Vă n Tuấn Trang 16
  18. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình Dữ liệu củ a “fmt” chunk là đố i tượng WAVEFORMAT có cấu trú c như sau: Typedef struct waveformat_tag { WORD wFormatTag; WORD nChannels; DWORD nSamplesPerSec; DWORD nAvgBytesPerSec; WORD nBlockAlign; } WAVEFORMAT; - wFormatTag thường có giá trị là WAVE_FORMAT_PCM được định nghĩa trong tập tin MMSYSTEM.H nh ư sau : #define WAVE_FORMAT_PCM 1 Giá trị này b áo cho phần m ềm đang đọc Wave File biết kiểu mã hó a dữ liệu âm thanh sang dữ liệu số là kiểu mã hóa PCM. Hiện nay đ ây là kiểu mã hó a duy nhất của Wave file. - nChannels: có hai giá trị bằng 1 cho âm thanh mono và bằng 2 cho âm thanh stereo. - n SamplesPerSec: cho biết tốc độ lấy m ẫu, có các giá trị: 11025 -- 11.025 kHz 22050 -- 22.050 kHz 44100 -- 44.100 kHz - n AvgBytesPerSec: cho biết số b ytes yêu cầu trung bình trong một giây đ ể phát lại mẫu d ữ liệu của sóng âm. - nBlockAlign: cho biết số b yte dù ng để chứa một mẫu âm thanh. Như vậy m ẫu 8 bit hay ít hơn sẽ yêu cầu 1 byte, m ẫu 9 đến 16 bit sẽ yêu cầu 2 b ytes. Nếu âm thanh là Stereo thì yêu cầu gấp 2 lần số b yte d ùng cho âm thanh mono. Ta thấy trong WAVEFORMAT chưa có thông tin về số bit dùng đ ể lượng tử hóa một m ẫu dữ liệu của sóng âm. Thự c tế Wave File sẽ xác lập SVTH: Đỗ Vă n Tuấn Trang 17
  19. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình số bit dùng cho mộ t mẫu dữ liệu bằng một trường gắn vào cuối cấu trú c của WAVEFORMAT. Cấu trúc đó nh ư sau: Typedef struct pcmwaveformat_tag { WAVEFORMAT wf; WORD wBitsPerSample; } PCMWAVEFORMAT; - wBitsPerSample: cho biết số bit trong một m ẫu dữ liệu. Chú ý rằng các m ẫu dữ liệu vẫn phải lưu trữ ở dạng byte ho ặc word. Do đó, nếu một Wave File d ùng 12 bit đ ể lư ợng tử hóa mộ t mẫu sóng âm th ì sẽ phải lưu trữ 4 bit thừa không dùng đ ến. b. Subchunk “data”. Dữ liệu của “data” subchunk của wave file chứa các số liệu của âm thanh đã được số hó a. Đối với m ẫu âm thanh 8 bit, dữ liệu của “data” subchunk bao gồm các giá trị 1 b yte (có giá trị từ 0 – 255) của các mẫu âm thanh. Đối với m ẫu âm thanh 16 bits, mỗi m ẫu dữ liệu gồm 2 bytes (có giá trị từ – 32768 đ ến 32767). Điều này kh ông có nghĩa là file wave 16 bits sẽ nghe to hơn 256 lần file wave 8 bits, m à nó có n ghĩa là âm thanh được lượng tử hó a chính xác h ơn, nghe trung thự c hơn. Trong m ẫu mono 8 bits, dữ liệu củ a subchunk “data” gồm chuỗi các giá trị 1 b yte. Với stereo 8 bits, mỗ i mẫu gồm 2 bytes, dữ liệu sẽ được sắp xếp xen kẽ (interleave), với byte đầu (byte ch ẵn) là m ẫu âm thanh củ a kênh bên trái, byte sau (byte lẻ) là của kênh bên ph ải. Tóm laị cấu trúc củ a Wave File như sau: Kích thư ớc Giá trị Tên trường (số b yte) 4 “RIFF” Kích thước file RIFF 4 4 “WAVE” 4 “fmt” Kích thước subchunk “fmt” 4 SVTH: Đỗ Vă n Tuấn Trang 18
  20. Khoa CNTT – ĐHBKHN GVHD thầy: Dư Thanh Bình Kiểu mã hó a dữ liệu củ a file 2 WORD nFormatTag wave (thường là PCM) Số kênh : 1 - mono 2 WORD nChannels 2 - stereo Số m ẫu/1giây 4 DWORD nSamplesPerSec Số b ytes/1giây 4 DWORD nAvgBytesPerSec Số b yte/1m ẫu 2 DWORD nBlockAlign Số b it/1mẫu 2 WORD wBitsPerSample 4 “data” Kích thước dữ liệu 4 III. ĐỌC RIFF FILES  Để làm việc với file RIFF, ta phải mở nó và “descend” vào chunk m à ta cần. Điều n ày có ngh ĩa là ta cần phải định vị được chunk này, rồi chuyển con trỏ file vào đầu khối dữ liệu củ a chunk. Khi làm việc xong với 1 chunk, ta phải “ascend” ra khỏi chunk và “descend” xuống chunk kh ác.  Các hàm dùng xử lý RIFF file đ ều có tiền tố là mmio và làm việc với file handle d ạng HMMIO, để b ắt đ ầu, ta ph ải mở file b ằng đoạn m ã sau: HMMIO h; If ((h=mmioOpen(path,NULL,MMIO_READ))==NULL) { /*báo lỗi*/ return(0); } Thông số p ath chứ a đường d ẫn của file wave. Cờ MMIO_READ báo cho mmioOpen m ở file để đọ c. Ta cũng có thể m ở nó đ ể ghi b ằng thông số MMIO_WRITE hay cả đọ c và ghi bằng thông số MMIO_READWRITE. Nếu mở file th ành công, mmioOpen sẽ trả về m ột SVTH: Đỗ Vă n Tuấn Trang 19
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2