Áp dụng thuật toán Dynamic time wraping (DTW) cho ứng dụng nhận dạng mẫu tiếng việt

Chia sẻ: Quanghai Quanghai | Ngày: | Loại File: DOC | Số trang:16

0
253
lượt xem
76
download

Áp dụng thuật toán Dynamic time wraping (DTW) cho ứng dụng nhận dạng mẫu tiếng việt

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

: Tự động nhận dạng tiếng nói (Automatic Speech Recognition ASR) là một lĩnh vực nghiên cứu quan trọng để đưa các ứng dụng tiếng nói vào nhiều ngành. Một vấn đề liên quan cần nghiên cứu trong lĩnh vực này được dựa trên cơ sở lưu trữ một hoặc nhiều mẫu tín hiệu cho mỗi từ cần nhận dạng. Quá trình nhận dạng là quá trình thực hiện việc so sánh hai mẫu tín hiệu của cùng một âm để tím ra mẫu có sai số nhỏ nhất. Bởi vì tín hiệu âm thanh được tạo ra tại các......

Chủ đề:
Lưu

Nội dung Text: Áp dụng thuật toán Dynamic time wraping (DTW) cho ứng dụng nhận dạng mẫu tiếng việt

  1. LÜnh vùc C«ng nghÖ th«ng tin ¸p dông thuËt to¸n Dynamic Time wraping (dtW) cho øng dông nhËn d¹ng mÉu TiÕng ViÖt ThS.§oµn Phan Long Trung t©m C«ng nghÖ th«ng tin Tãm t¾t: Tù ®éng nhËn d¹ng tiÕng nãi (Automatic Speech Recognition ASR) lµ mét lÜnh vùc nghiªn cøu quan träng ®Ó ®a c¸c øng dông tiÕng nãi vµo nhiÒu ngµnh. Mét vÊn ®Ò liªn quan cÇn nghiªn cøu trong lÜnh vùc nµy ®îc dùa trªn c¬ së l u tr÷ mét hoÆc nhiÒu mÉu tÝn hiÖu cho mçi tõ cÇn nhËn d¹ng. Qu¸ tr×nh nhËn d¹ng lµ qu¸ tr×nh thùc hiÖn viÖc so s¸nh hai mÉu tÝn hiÖu cña cïng mét ©m ®Ó tÝm ra mÉu cã sai sè nhá nhÊt. Bëi v× tÝn hiÖu ©m thanh ®îc t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau kh«ng bao giõo gièng nhau hoµn toµn. Nã lu«n cã sù sai lÖch do c¸c yÕu tè vÒ träng ©m, ng÷ ®iÖu, tèc ®é,... V× vËy cÇn ph¶i thùc hiÖn sã s¸nh hai mÉu theo c¸c thuËt to¸n biÕn d¹ng nh»m gi¶m thiÓu sai sè. ThuËt to¸n DTW (Dynamic Time Wraping) lµ thuËt to¸n hiÖu qu¶ nhÊt cho viÖc øng dông sao s¸nh hai mÉu tÝn hiÖu cã chiÒu dµi kh¸c nhau vµ cho sai sè nhá nhÊt [4]. Tuy nhiªn viÖc øng dông DTW cã nhiÒu híng kh¸c nhau vµ cho c¸c kÕt qu¶ kh¸c nhau, viÖc lùa chän ph¬ng ph¸p ¸p dông cã hiÖu qu¶ ®èi víi ng«n ng÷ tiÕng ViÖt lµ mét vÊn ®Ò cÇn quan t©m. Më ®Çu: HiÖn nay víi sù trî gióp cña c¸c hÖ thèng m¸y tÝnh cã rÊt nhiÒu xu híng nh»m ¸p dông c¸c m« h×nh ng«n ng÷ trong c¸c hÖ thèng sö dông c«ng nghÖ nhËn d¹ng tiÕng nãi, trong ®ã cã thÓ kÓ ®Õn nh m« h×nh tõ, ©m tiÕt vµ m« h×nh ©m vÞ, m« h×nh ©m ®Çu+vÇn. ViÖc lùa chän c¸c m« h×nh nµy ®Ó gi¶i quyÕt c¸c bµi to¸n cô thÓ phô thuéc vµo yªu cÇu cña c¸c øng dông. Nã quyÕt ®Þnh ®Õn ®é phøc t¹p, tÝnh bao trïm vµ chÊt l îng cña hÖ thèng. HÖ thèng nhËn d¹ng ¸p dông c¸c m« h×nh ng«n ng÷ trªn ®Òu cã thÓ sö dông c«ng nghÖ nhËn d¹ng mÉu theo tõ, ©m tiÕt, ©m vÞ hoÆc theo c¸c ©m ®Çu vµ vÇn. §Ó cã thÓ so s¸nh gi÷a tÝn hiÖu ®Çu vµo vµ mÉu, ngêi ta th êng ph¸p ¸p dông thuËt to¸n DTW. ThuËt to¸n DTW ®îc øng dông ®Ó gi¶i quyÕt viÖc so s¸nh gi÷a hai mÉu tÝn hiÖu cã ®é dµi kh¸c nhau theo thêi gian. Nh ta biÕt, kÕt qu¶ cña qu¸ tr×nh Häc viÖn C«ng nghÖ BCVT
  2. Héi nghÞ Khoa häc lÇn thø 5 ph©n tÝch tÝnh hiÖu theo ph¬ng ph¸p m· ho¸ dù b¸o tuyÕn tÝnh (Linear Predictive Coding LPC) hay ng©n hµng bé läc (Filter Bank) bao giê còng cho ta kÕt qu¶ d¹ng chuçi c¸c vÐct¬ ®Æc tr ng. §é dµi cña chuçi vÐc t¬ nµy phô thuéc vµo ®é dµi cña cña hai tÝn hiÖu mµ ta ph©n tÝch. Nh vËy, qu¸ tr×nh so s¸nh hai tÝn hiÖu sÏ t ¬ng øng víi qu¸ tr×nh so s¸nh 2 chuçi vÐc t¬ ®Æc tr ng cña hai tÝn hiÖu. ThuËt to¸n DTW sÏ thùc hiÖn viÖc so s¸nh 2 chuçi vÐc t¬ nµy theo mét sè luËt sao cho tæng ®é lÖch gi÷a hai chuçi lµ nhá nhÊt t ¬ng øng víi ®êng ®i gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ tèi u nhÊt. ViÖc chän lùa luËt chän ®- êng ®i vµ giíi h¹n biªn cña c¸c ®êng ®i sÏ cho ta kÕt qu¶ tÝnh to¸n lµ nhá nhÊt vµ hiÖu qu¶ nhÊt. 1 Kh¸i qu¸t vÒ tiÕng ViÖt 1.1) C¸c d©n téc vµ ng«n ng÷ ë ViÖt Nam Trong sè 54 d©n téc ë ViÖt Nam th× d©n téc ViÖt (cßn gäi lµ Kinh) chiÕm sè lîng tuyÖt ®èi, tæng sè d©n lªn tíi trªn 70 triÖu ngêi. D©n téc Tµy cã 1,2 triÖu, d©n téc Th¸i trªn 1 triÖu, c¸c d©n téc Hoa, Kh¬ me, M êng, C¬ Ho, Chµm, S¸n D×u trªn 900 ngh×n ngêi. C¨n cø vµo ng«n ng÷, ch÷ viÕt ta cã thÓ ph©n bè c¸c thµnh phÇn d©n téc nh sau:  TiÕng N«m - Kh¬me. Gåm nhiÒu nhãm ngêi ë T©y B¾c, T©y Nguyªn, Qu¶ng TrÞ vv...  TiÕng Th¸i. Gåm ngêi Th¸i T©y B¾c, Thîng du Thanh Hãa, NghÖ An, khu ViÖt B¾c, Qu¶ng Ninh. Ngoµi ra cßn cã nhãm ngêi Gi¸y, Cao Lan, Lù vv...  TiÕng Anh-®«-nª-diªng. Gåm ngêi Chµm, Gia rai, £-®ª (T©y Nguyªn).  TiÕng MÌo-Dao. Gåm ngêi MÌo Dao (ViÖt B¾c, Hßa B×nh Thanh Hãa)  TiÕng T¹ng - MiÕn: Gåm ngêi L« L« (Hµ Giang), Hµ Nh×, La Khu, Cèng, Xila (T©y B¾c).  TiÕng H¸n: Ngêi Hoa (Qu¶ng Ninh), S¸n D×u (B¾c Giang, B¾c C¹n, Th¸i Nguyªn vv....). TiÕng ViÖt lµ ng«n ng÷ céng ®ång cña d©n téc ViÖt vµ còng lµ c«ng cô giao tiÕp chung cho c¸c d©n téc sèng trong níc ViÖt Nam. NhiÒu c«ng tr×nh nghiªn cøu theo ph¬ng ph¸p lÞch sö so s¸nh ®Òu ®i ®Õn kÕt luËn c¸c ng«n ng÷ ë ViÖt Häc viÖn C«ng nghÖ BCVT
  3. LÜnh vùc C«ng nghÖ th«ng tin Nam thuéc vµo c¸c hä H¸ n T¹ng, Th¸ i, MÌo-Dao, Nam §¶o, Nam ¸ ; riªng t iÕng ViÖt t huéc hä t iÕng Nam ¸ . Hä Nam ¸ (aust roasiat ique) lµ mét hä ng«n ng÷ kh¸ lín bao gåm mét phÇn Ên ® é, mét phÇn Malaysia, mét phÇn MiÕn ® iÖn, phÇn lín Campuchia, phÇn lín ViÖt Nam . Hä nµy l¹i ph© n t hµnh nhiÒu nhãm: ViÖt - M êng, M«ng-Khm er, Kh¬ mó, C¬ t u, Bana, Mn«ng, Ka® ai. Hä Nam §¶o (aust ronesien hay malayo-polyesien) còng lµ mét hä lín, víi nhiÒu ng«n ng÷ , t rªn mét khu vùc réng bao gåm quÇn ® ¶o Madagascar, Malaysia, Indonesia, Philippines, New Guinea, Taiwan vµ phÝa Nam ViÖt Nam . VÒ ng«n ng÷ thuéc hä nµy ë ViÖt Nam cã Chµm , Raglai, Chru, £® ª, Giarai, t Êt c¶ ® Òu thuéc nhãm Ch¨ m. Hä H¸ n T¹ng bao gåm t iÕng Hoa vµ mét sè ng«n ng÷ phÝa T© y nam Trung hoa vµ phÇn lín MiÕn §iÖn. C¸ c ng«n ng÷ thuéc hä nµy ë ViÖt Nam bao gåm L« L«, Phï L¸ , Hµ Nh× , La Hñ, Cèng, Si La t huéc nhãm T¹ng-MiÕn, c¸c t iÕng Hoa, S¸ n ChØ, S¸ n D× u thuéc nhãm H¸ n. 1.2) Vµi nÐt vÒ lÞch sö ph¸t triÓn cña tiÕng ViÖt Theo mét sè tµi liÖu nghiªn cøu th× tiÕng ViÖt thêi th îng cæ lµ thø tiÕng cha cã thanh ®iÖu. HÖ thèng phô ©m ®Çu trong tiÕng ViÖt cã nh÷ng phô ©m ®¬n vµ phô ©m kÐp nh bl, tl, pr, pl ... C¸c ©m cuèi bÞ mÊt dÇn mét sè trong qu¸ tr×nh ph¸t triÓn (nh ©m cuèi l mÊt ®i, ©m cuèi r chuyÓn thµnh i), nãi riªng ©m h mÊt ®i vµ xuÊt hiÖn dÊu ng· trong tiÕng ViÖt. HÖ thèng thanh ®iÖu ®· xuÊt hiÖn dÇn. Vµo ®Çu c«ng nguyªn, tiÕng ViÖt cha cã thanh ®iÖu, ®Õn thÕ kØ VI xuÊt hiÖn ba thanh vµ ®Õn thÕ kØ XII míi cã ®ñ s¸u thanh nh hiÖn nay. Sù biÕn ®æi cña ©m ®Çu vµ cuèi lµ nguyªn nh©n lµm xuÊt hiÖn hÖ thèng thanh ®iÖu trong tiÕng ViÖt. Sù biÕn ®æi trong hÖ thèng c¸c ©m ®Çu diÔn ra t ¬ng ®èi râ h¬n trong hÖ thèng nguyªn ©m: ©m v« thanh chuyÓn thµnh h÷u thanh (p V b, t ô d vµ k g). C¸c phô ©m kÐp kl, tl, bl, khl ... mÊt dÇn, lµm xuÊt hiÖn c¸c ©m uèn l ìi tr vµ s (tl¨m h tr¨m (thÕ kØ 17); bl¨ng . tr¨ng (thÕ kØ 18), khl«ng (thÕ kØ 15) ‰ s«ng (thÕ kØ 17), nhãm ml chuyÓn thµnh l hoÆc nh (nlÇm h lÇm, nhÇm, mlÏ lÏ, nhÏ) Kho tõ vùng tiÕng ViÖt phong phó víi nh÷ng tõ c¬ b¶n cã nguån gèc Nam ¸ vµ Tµy Th¸i cæ. Kho tõ vùng trong qu¸ tr×nh ph¸t triÓn cßn tiÕp nhËn vµ Häc viÖn C«ng nghÖ BCVT
  4. Héi nghÞ Khoa häc lÇn thø 5 t huÇn ho¸ c¶ vÒ ng÷ © m lÉn ý nghÜa mét bé phËn kh¸ nhiÒu tõ gèc H¸ n (nh ®òa, ®ôc, mu«n, mòi, mãc, mïa...). HÖ thèng ng÷ ph¸p tá ra bÒn v÷ng h¬n hÖ thèng tõ vùng, trËt tù có ph¸p, trËt tù tæ hîp tõ gi÷ ®Æc ®iÓm riªng cña tiÕng ViÖt. 1.3) Mét sè ®Æc ®iÓm cña tiÕng ViÖt TiÕng ViÖt lµ lo¹i h×nh ng«n ng÷ ®¬n lËp (ng«n ng÷ kh«ng biÕn h×nh - amorphous) vµ cã thanh ®iÖu. TiÕng ViÖt lµ tiÕng ®¬n ©m cã ranh giíi cè ®Þnh, mang thanh ®iÖu, cã cÊu tróc ®¬n gi¶n, thanh ®iÖu vµ cã ©m tiÕt trïng víi h×nh vÞ, ®¬n vÞ nhá nhÊt cã tæ chøc mang ý nghÜa ng÷ ph¸p. Do mçi ©m tiÕt lµ vá ng÷ ©m cña h×nh vÞ nªn kh¸c víi c¸c ng«n ng÷ ¢u-Ên, tiÕng ViÖt cã sè lîng ©m tiÕt h÷u h¹n víi 17.000 vá ng÷ ©m vµ 6.900 ©m tiÕt tån t¹i thùc [3]. ¢m tiÕt, h×nh vÞ trong tiÕng ViÖt lµ cè ®Þnh, kh«ng biÕn ®æi h×nh th¸i theo ng÷ ph¸p vµ thêi, gièng vµ sè nh c¸c ng«n ng÷ kh¸c. Tõ th êng cã hai lo¹i lµ ®¬n tiÕt vµ ®a tiÕt. Mét phÇn rÊt lín tõ ®a tiÕt lµ H¸n ViÖt (kÓ c¶ tõ míi). Trong c¸c tõ ®a tiÕt th êng cã d¹ng l¸y ©m hoÆc ghÐp c¸c tõ ®¬n tiÕt. ¢m tiÕng ViÖt cã cÊu tróc chÆt chÏ víi c¸c lo¹i ©m ë c¸c vÞ trÝ cè ®Þnh trong thµnh phÇn ©m tiÕt. TiÕng ViÖt lµ ng«n ng÷ cã thanh ®iÖu, tiÕng ViÖt cã 6 thanh (tiÕng Th¸i, Lµo cã 5 thanh, tiÕng H¸n 4 thanh, tiÕng MiÕn §iÖn 3 thanh, Trung Quèc cã 4 thanh) lµ ngang (kh«ng dÊu), huyÒn, ng·, hái, s¾c vµ nÆng. Mçi thanh ®Òu cã thÓ tham gia vµo viÖc cÊu t¹o tõ vµ t¹o nghÜa cho tõ. Thanh ®iÖu tiÕng ViÖt cã tÝnh nh¹c, c©u v¨n cã vÇn, nhÞp ®iÖu, trÇm bæng nhÞp nhµng. Mçi ©m tiÕt ®Òu mang mét thanh ®iÖu nhÊt ®Þnh. Thanh ®iÖu kÕt hîp víi thµnh phÇn cña ©m tiÕt t¹o thµnh c¸c tõ kh¸c nhau, vÝ dô nh /ma, mµ, m¸, m¶, m·, m¹/. Trong tiÕng ViÖt kh«ng ph¶i vÇn nµo còng ph¸t ©m ®îc ®ñ s¸u thanh. §èi víi ©m tiÕt ®ãng chØ cã hai thanh lµ s¾c vµ nÆng ¢m tiÕt tiÕng ViÖt ë d¹ng ®Çy ®ñ bao gåm 3 thµnh phÇn cã møc ®é ®éc lËp kh¸c nhau lµ ©m ®Çu (phô ©m), phÇn vÇn vµ thanh ®iÖu. Víi phÇn vÇn bao gåm 3 thµnh phÇn lµ ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m ®¬n hoÆc nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m). Trong ®ã nguyªn ©m vµ thanh ®iÖu lµ h¹t nh©n cña ©m tiÕt. Trõ phô ©m ®Çu, phÇn cßn l¹i cña ©m tiÕt tiÕng ViÖt ®îc gäi lµ vÇn. TiÕng ViÖt cã 512 vÇn Häc viÖn C«ng nghÖ BCVT
  5. LÜnh vùc C«ng nghÖ th«ng tin (Theo t hèng kª t rong mét sè t µi liÖu cña GS. Hoµng Phª). VÇn vµ thanh t¹o nªn sù hµi hoµ vÒ ng÷ © m vµ ng÷ nghÜa t rong c¸c tõ t îng h× nh, t îng t hanh. Tõ song t iÕt chiÕm phÇn kh¸ lín t rong tæng sè tõ. Tõ ghÐp ® a t iÕt chia ra t hµnh c¸c lo¹i tõ ghÐp nghÜa, tõ l¸ y, tõ ghÐp t ù do, c¸c tõ vay mîn níc ngoµi. Vèn tõ vùng t iÕng ViÖt bao gåm c¸c tõ, c¸c t hµnh ng÷ , thuËt ng÷ . Mét bé phËn tõ t iÕng ViÖt cã gèc H¸ n. Ph ¬ ng t iÖn biÓu hiÖn ý nghÜa ng÷ ph¸ p t rong t iÕng ViÖt lµ t rËt t ù c¸c t hµnh tè (tõ vµ c© u), ng÷ ® iÖu, d¹ng l¸ y, ng÷ c¶nh. Tõ vµ côm tõ lµ c¸c ® ¬ n vÞ cÊu t¹o nªn c© u. Ng«n ng÷ nãi vµ ng«n ng÷ viÕt kh«ng c¸ch xa nhau vÒ qui t¾c ng÷ © m, ng÷ ph¸ p. 1.4) Mèi quan hÖ gi÷a ch÷ c¸i, thanh vµ ©m tiÕt, tõ - ChØ c¸c nguyªn ©m míi cã quyÒn mang dÊu thanh trong biÓu diÔn ©m tiÕt hay tõ. - Mçi nguyªn ©m cã thÓ ®îc mang nhiÒu nhÊt lµ mét trong c¸c dÊu thanh trªn. - C¸c dÊu thanh: huyÒn, hái, ng·, s¾c ®îc ®Æt ë phÝa trªn cña nguyªn ©m mang dÊu. DÊu nÆng ®îc ®Æt ë phÝa díi nguyªn ©m mang dÊu. - C¸c ©m tiÕt ch÷ ViÖt ®îc t¹o ra trªn c¬ së biÓu diÔn h×nh ¶nh cho c¸c ©m ph¸t ra cã mang thanh ®iÖu. Mçi ©m tiÕt ®Òu ®îc biÓu diÔn b»ng viÖc viÕt liÒn c¸c ch÷ c¸i m« t¶ cho ©m tiÕt ®ã vµ ®îc mang nhiÒu nhÊt lµ mét thanh, ®Æt trªn mét nguyªn ©m. C¸c ©m tiÕt t¸ch lÉn nhau b»ng dÊu c¸ch. - Thanh lµ thuéc tÝnh cña ©m tiÕt, kh«ng ph¶i lµ thuéc tÝnh cña nguyªn ©m. Thanh ®îc ®Æt vµo vÞ trÝ cña nguyªn ©m ®Ó ph©n biÖt trong c¸ch ph¸t ©m. - Mét tõ trong tiÕng ViÖt lµ mét ®¬n vÞ ng÷ nghÜa, mang mét ý nghÜa nµo ®ã, vµ bao gåm mét hai, ba hay nhiÒu ©m tiÕt. - Dùa trªn c¸ch biÓu diÔn ch÷ ViÖt theo ch÷ c¸i vµ thanh nµy, cã thÓ nªu ra ®- îc c¸c tËp sinh kh¸c cho ch÷ ViÖt, nh:  TËp sinh díi d¹ng tæ hîp cña c¸c phô ©m ®Çu vµ vÇn theo sau  TËp sinh víi 33 ch÷ c¸i vµ 5 thanh  TËp sinh víi c¸c phô ©m ®Çu vµ kho¶ng 800 vÇn - MÆc dÇu c¸ch biÓu diÔn theo phô ©m vµ vÇn cã thÓ cã mét sè Ých lîi trong xö lÝ nhng Ých lîi ®ã khã bï ®îc cho nh÷ng bÊt lîi mµ nã ®em l¹i nh: Häc viÖn C«ng nghÖ BCVT
  6. Héi nghÞ Khoa häc lÇn thø 5  Víi ® Æc t hï ph¸ t © m cña t iÕng ViÖt khã biÓu diÔn nh÷ ng t× nh huèng cã chen lÉn t iÕng ViÖt vµ kh«ng ph¶i t iÕng ViÖt .  ViÖc lµm nµy ® i ngîc víi xu t hÕ hoµ ® ång c¸c ng«n ng÷ t rªn thÕ giíi, do ® ã khã kh¨ n cho viÖc t iÕp t hu nh÷ ng t iÕn bé c«ng nghÖ m íi. 1.5) Ch÷ viÕt Theo c¸c tµi liÖu lÞch sö §¹i ViÖt sö l îc, An nam chÝ nguyªn, ViÖt sö th«ng gi¸m tæng luËn th× ®Òu cã chÐp thêi Hïng v¬ng "chÝnh sù dïng lèi kÕt nót." Tuy nhiªn cha cã tµi liÖu nµo cho biÕt râ h¬n vÒ viÖc khi nµo cã ch÷ viÕt ®îc b¾t ®Çu dïng ë ViÖt Nam. ViÖc sö dông ch÷ H¸n ®i kÌm víi viÖc v¨n ho¸ Trung quèc lan xuèng phÝa Nam ®Õn cïng víi viÖc chinh phôc vµ th«n tÝnh ®Êt ®ai cña c¸c triÒu ®¹i phong kiÕn Trung quèc. 1.6) CÊu tróc ©m tiÕt trong tiÕng ViÖt Nh ®· nªu trªn, ¢m tiÕt cña tiÕng viÖt ë d¹ng ®Çy ®ñ ®îc t¹o bëi 5 thµnh phÇn lµ phô ©m ®Çu, ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m ®¬n hoÆc nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m) vµ thanh ®iÖu. VÒ cÊu tróc, ©m tiÕt tiÕng ViÖt cã cÊu tróc hai bËc. BËc mét gåm ba thµnh phÇn lµ thanh ®iÖu, phô ©m ®Çu vµ vÇn. BËc hai lµ c¸c thµnh tè cña phÇn vÇn gåm ©m ®Öm lµ b¸n nguyªn ©m, nguyªn ©m chÝnh vµ phô ©m hoÆc b¸n nguyªn ©m cuèi. C¸c thµnh phÇn ©m tiÕt ®îc thÓ hiÖn ë h×nh 1. Thanh ®iÖu ¢m ®Çu VÇn ¢m ®Öm ¢m chÝnh ¢m cuèi H×nh 1: S¬ ®å ©m tiÕt tiÕng ViÖt 1.6.1) ¢m ®Çu Phô ©m më ®Çu ©m tiÕt gåm cã 22 vÇn. C¸c phô ©m ®Çu ®îc ph©n biÖt theo c¸c tiªu chÝ vÒ ph¬ng thøc cÊu ©m (t¾c, x¸t), vÒ thanh tÝnh (vang, ån)... phô ©m vang ®îc ph©n biÖt gi÷a phô ©m mòi vµ phô ©m bªn (phô ©m kh«ng mòi). Trong phô ©m ån ®îc chia thµnh lo¹i ©m v« thanh vµ ©m h÷u thanh. Nh vËy ph©n theo líp ng÷ ©m r«ng ta cã thÓ chia phô ©m ®Çu tiÕng ViÖt thµnh b¶y lo¹i theo h×nh 2 díi ®©y. Ph¬ng thøc cÊu ©m C¸c phô ©m T¾c V« thanh BËt h¬i th Häc viÖn C«ng nghÖ BCVT
  7. LÜnh vùc C«ng nghÖ th«ng tin ån Kh«ng bËt h¬ i (p), t, t r, ch, k, c H÷ u thanh b, ® X¸ t V« t hanh ph, x, s, kh H÷ u thanh v, d, r, g-gh, h Vang Mòi m, n, nh, ng-ngh Kh«ng mòi l H× nh 2: Ph© n lo¹i phô © m ® Çu 1.6.2) PhÇn vÇn PhÇn vÇn cã 3 thµnh phÇn lµ ©m ®Öm, ©m chÝnh vµ ©m cuèi. VÝ dô ©m tiÕt /to¸n/ cã phÇn vÇn lµ oan, trong ®ã ©m vÞ ©m ®Öm lµ /o/, ©m chÝnh lµ /a/ vµ ©m cuèi lµ /n/. - ¢m ®Öm ®ãng vai trß lµm biÕn ®æi ©m s¾c cña ©m tiÕt nh ng nã kh«ng t¹o nªn ®Ønh cña ©m tiÕt. ¢m ®Öm ®îc viÕt b»ng ch÷ c¸i /o/ khi ®øng tr íc 3 nguyªn ©m /e/, /a/, /¨/ vµ b»ng ch÷ c¸i /u/ trong c¸c tr êng hîp cßn l¹i. NÕu ®øng sau phô ©m ®Çu /k/ th× chØ ®îc viÕt lµ /u/ vµ /k/ ®îc viÕt lµ /q/ - ¢m chÝnh lµ mét ©m trong hÖ thèng nguyªn ©m gåm 11 nguyªn ©m ®¬n lµ /a/, /¨/, /©/, /e/, /ª/, /o/, /«/, /¬/, /u/, //, /i/ vµ 3 nguyªn ©m ®«i lµ /iª/, /¬/, /a/. ¢m chÝnh lµ yÕu tè t¹o nªn ®Ønh ©m tiÕt, cã biªn ®é vµ cêng ®é lín nhÊt trong c¸c thµnh phÇn ©m tiÕt. - ¢m cuèi lµ ©m kÕt thóc ©m tiÕt. Nã biÕn ®æi ©m s¾c cña ©m chÝnh do t¸c ®éng t¸c khÐp l¹i cña bé m¸y ph¸t ©m. HÖ thèng ©m cuèi trong tiÕng ViÖt gåm hai b¸n nguyªn ©m lµ /i/ vµ /o/ vµ s¸u phô ©m. C¸c phô ©m nµy lµ /m/, /n/, /ng (nh)/, /p/, /t/, /c/. 1.6.3) Thanh ®iÖu Thanh ®iÖu lµ lo¹i ©m vÞ siªu ®o¹n tÝnh, nã ®îc biÓu hiÖn trong tiµn bé phÇn h÷u thanh cña ©m tiÕt. ë møc vËt lý, phÇn thanh cña thanh ®iÖu chÝnh lµ ®- êng nÐt cña tÇn sè ©m c¬ b¶n F 0. VÒ c¶m thô, thanh ®iÖu lµ sù c¶m nhËn vÒ ®é thay ®æi cao ®é tÇn sè c¬ b¶n F 0 cña ©m tiÕt. Häc viÖn C«ng nghÖ BCVT
  8. Héi nghÞ Khoa häc lÇn thø 5 S¸ u thanh ® iÖu t rong t iÕng ViÖt ®îc chia t hµnh hai nhãm lín lµ b»ng vµ t r¾c. Thanh kh«ng dÊu vµ t hanh huyÒn t huéc lo¹i t hanh b»ng cã ®êng nÐt t ¬ ng ® èi ® ¬ n gi¶n. Thanh ng·, thanh hái, t hanh s¾c vµ thanh nÆng lµ nh÷ ng t hanh t r¾c cã ®êng nÐt thanh ® iÖu phøc t¹p. C¸ c t hanh ngang, s¾c, ng· t huéc © m vùc cao cßn c¸c © m huyÒn, hái vµ nÆng thuéc © m vùc thÊp. Ngoµi t Ýnh chÊt thanh t Ýnh, c¸c thanh ® iÖu cßn cã mét sè ® Æc t r ng phi ® iÖu t Ýnh nh hiÖn t îng yÕt hÇu ho¸, thanh hÇu ho¸ ... t¹o t hµnh c¸c hÖ t hèng c¸c ® Æc t r ng phô ® Ó ph© n biÖt c¸c thanh ® iÖu ® Æc biÖt cña thanh ng· vµ s¾c, t hanh hái vµ t hanh nÆng. 1.6.4) Lo¹i ©m tiÕt Phô thuéc vµo c¸ch thøc kÕt thóc, ©m tiÕt tiÕng ViÖt ®îc chia thµnh 4 lo¹i nh sau: • ¢m tiÕt më: Lµ lo¹i ©m tiÕt kh«ng cã ©m cuèi, kÕt thóc ©m tiÕt b»ng nguyªn ©m chÝnh, vÝ dô cha, mÑ • ¢m tiÕt nöa më: Khi ©m cuèi kÕt thóc ©m tiÕt lµ mét b¸n nguyªn ©m, vÝ dô mai, sau • ¢m tiÕt nöa ®ãng: Khi ©m cuèi lµ mét phô ©m mòi /n/, /m/, /ng/, /nh/, vÝ dô lµm, ngµnh, m«ng. • ¢m tiÕt ®ãng: Khi ©m cuèi lµ mét phô ©m t¾c v« thanh /p/, /t/, /c/, vÝ dô: tËp, häc, mÖt. 2. §¬n vÞ nhËn d¹ng c¬ b¶n cho c¸c hÖ thèng nhËn d¹ng lêi ViÖt 2.1. M« h×nh tõ vµ ©m tiÕt ViÖc lùa chän tõ lµm ®¬n vÞ nhËn d¹ng lµ ph¬ng ph¸p th«ng th êng vµ dÔ dµng nhÊt, nã bao trïm ®îc tÝnh biÕn thÓ ©m vÞ. §èi víi mét sè øng dông nhËn d¹ng tiÕng nãi cÇn sè tõ kh«ng lín nh hÖ thèng ®iÒu khiÓn häc, ®Õm sè ... cã thÓ ¸p dông tèt m« h×nh tõ ®Ó nhËn d¹ng do dÔ dµng thu thËp ®ñ sè mÉu huÊn luyÖn cho mçi tõ. Xem h×nh 3 díi ®©y. Trong tÊt c¶ c¸c ng«n ng÷, tõ lµ ®¬n vÞ tù nhiªn nhá nhÊt cña tiÕng nãi vµ tõ lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng tiÕng nãi. TiÕng ViÖt lµ ng«n ng÷ ®¬n ©m tiÕt. Trong tiÕng ViÖt, ©m tiÕt lµ nh÷ng ®¬n vÞ ©m thanh nhá nhÊt vµ nh vËy ©m tiÕt lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng lêi ViÖt. Do vËy nã cã thÓ ®îc lùa chän lµm ®¬n vÞ nhËn d¹ng tiÕng nãi cho c¸c øng dông nhËn d¹ng lêi ViÖt. Tuy nhiªn, do trong tiÕng ViÖt, sè l îng ©m tiÕt rÊt lín trªn 10.000 Häc viÖn C«ng nghÖ BCVT
  9. LÜnh vùc C«ng nghÖ th«ng tin © m t iÕt nªn r Êt khã cã t hÓ ¸p dông cho c¸c hÖ t hèng nhËn d¹ng t iÕng viÖt cì lín do viÖc thu thËp m Éu t iÕng nãi cÇn thiÕt cho c¸c © m t iÕt sÏ gÆp nhiÒu khã kh¨ n do sã l îng m Éu qu¸ lín vµ thêi gian xö lý so s¸ nh, lùa chän m Éu t rong c¬ së d÷ liÖu l© u. Ngoµi ra , mçi m Éu huÊn luyÖn cña mét © m t iÕt chØ cã t hÓ sö dông ® Ó huÊn luyÖn vµ so s¸ nh lùa chän cho chÝnh © m t iÕt ® ã chø kh«ng t hÓ sö dông chung ® Ó huÊn luyÖn vµ lùa chän cho c¸c © m t iÕt kh¸ c. Xong bï l¹i, ph¬ ng ph¸ p nµy cã nhiÒu ® ¬ n gi¶n do kh«ng cÇn ph¶i sö dông mét sè c¸c ph¬ ng ph¸ p ® Ó ph© n ® o¹n vµ g¸ n nh·n. §ång hå b¸o t høc 1 §iÒu khiÓn häc (cã/kh«ng) §Õm, sè 10 + x H× nh 1.1. Sè tõ t rong c¸c øng dông cô thÓ H× nh 3. Vèn tõ t rung b× nh theo c¸c øng dông 2.2. M« h×nh ©m vÞ Nh»m gi¶m bít sè l îng mÉu huÊn luyÖn, nhËn d¹ng vµ ®Ó sö dông chung c¸c mÉu nµy, m« h×nh ©m vÞ th êng ®îc sö dông lµm ®¬n vÞ nhËn d¹ng c¬ b¶n cho c¸c hÖ thèng nhËn d¹ng tiÕng nãi. Trong tiÕng ViÖt chØ cã 38 ©m vÞ trong ®ã cã 22 phô ©m vµ 16 nguyªn ©m ®¬n vµ ®«i [1], khi kÕt hîp víi thanh ®iÖu (huyÒn, hái, ng·, s¾c, nÆng, kh«ng dÊu) th× tæng céng cã 228 ©m vÞ cã thanh ®iÖu. Víi sè lîng ©m vÞ h¹n chÕ nh vËy, hoµn toµn cã thÓ x©y dùng mét m« h×nh nhËn d¹ng tiÕng ViÖt víi tõ ®iÓn cì lín kh«ng h¹n chÕ víi kho¶ng 1.500 - 2000 c©u huÊn luyÖn. Mét ®Æc ®iÓm n÷a lµ c¸c tõ trong tiÕng ViÖt cã sè l îng ©m vÞ rÊt Ýt, nhiÒu nhÊt còng chØ tíi 6 ©m vÞ (vÝ dô khuÕch tr ¬ng). Tuy nhiªn, m« h×nh ©m vÞ cã mét sè nhîc ®iÓm chÝnh: Häc viÖn C«ng nghÖ BCVT
  10. Héi nghÞ Khoa häc lÇn thø 5 - C¸ c © m vÞ nh nhau ë c¸c vÞ t rÝ kh¸ c nhau kh«ng h¼n ® · cã ® Æc t Ýnh © m häc, ng÷ © m häc nh nhau. Mét sè © m vÞ võa ® ãng vai t rß © m chÝnh, võa ® ãng vai t rß © m phô. - ¢m vÞ lµ ® ¬ n vÞ © m nhá nhÊt cña mét tõ, viÖc x¸c ® Þnh gianh giíi cña c¸c © m vÞ r Êt khã, do ® ã viÖc ph© n ® o¹n vµ g¸ n nh·n chÝnh x¸c ë møc © m vÞ r Êt khã kh¨ n nhng l¹i rÊt quan t räng vµ ¶nh hëng nhiÒu ® Õn chÊt lîng cña hÖ t hèng. 2.3. ¢m ®Çu +VÇn TiÕng ViÖt lµ ng«n ng÷ ®¬n ©m tiÕt. ¢m tiÕt tuy ®îc ph¸t ©m liÒn nhng l¹i cã cÊu t¹o l¾p ghÐp vµ hÇu nh theo mét quy luËt nhÊt ®Þnh. §iÒu nµy dÔ thÊy ë c¸c em bÐ häc ®¸nh vÇn trong n¨m ®Çu ®i häc. Mçi tõ trong tiÕng ViÖt cã 3 bé phËn chÝnh lµ thanh ®iÖu, ©m ®Çu vµ vÇn. ¢m ®Çu cã mét ©m vÞ tham gia cÊu t¹o, vÇn ®îc cÊu t¹o bíi ©m ®Öm, ©m chÝnh vµ ©m cuèi. Theo [4] th× trong tiÕng ViÖt cã 22 ©m ®Çu vµ 155 vÇn. KÕt hîp víi thanh ®iÖu th× tæng sè ©m ®Çu+vÇn cã thanh ®iÖu nhá h¬n (22+155)*6=1062 v× cã nhiÒu ©m ®Çu, vÇn vµ thanh ®iÖu kh«ng kÕt hîp ®îc víi nhau. M« h×nh ©m ®Çu+vÇn cho phÐp gi¶m bít nhiÒu khã kh¨n cho viÖc ph©n ®o¹n, g¸n nh·n trong qu¸ tr×nh lËp c¬ së d÷ liÖu vµ gi¶m bít yªu cÇu tÝnh to¸n cña m¸y khi ph¶i ph©n ®o¹n tõ thu nhËn tõ Micro. 3. VÊn ®Ò nhËn d¹ng mÉu Trong c¸c ph¬ng ph¸p nhËn d¹ng mÉu, ngêi ta th êng hay sö dông nhËn d¹ng mÉu cho c¸c tõ ®¬n lÎ. HÖ thèng kh¸ ®¬n gi¶n do kh«ng ph¶i qua c¸c c«ng ®o¹n ph©n ®o¹n vµ g¸n nh·n. Nh trªn ®· tr×nh bµy, ph¬ng ph¸p nµy th êng chØ ¸p dông cho c¸c hÖ thèng nhËn d¹ng víi th viÖn tõ h¹n chÕ. Ta cã thÓ ¸p dông nhËn d¹ng mÉu cho m« h×nh nhËn d¹ng theo ©m vÞ, hoÆc ©m ®Çu+vÇn. Víi ph ¬ng ph¸p nµy, c¸c tõ ®îc ph©n ®o¹n, g¸n nh·n vµ tÝnh to¸n c¸c ®Æc tÝnh. ¢m thanh thu ®îc còng sÏ ®îc ph©n ®o¹n vµ so s¸nh víi th viÖn mÉu vµ quyÕt ®Þnh lùa chän mÉu cã ®Æc tÝnh gièng ®o¹n ©m thu ®îc nhÊt (h×nh 4). Do ©m thanh ®îc t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau lu«n cã sù sai kh¸c bëi c¸c yÕu tè träng ©m, ng÷ ®iÖu, tèc ®é... Do vËy ©m thanh thu ®îc cÇn ®îc so s¸nh víi ©m mÉu víi thuËt to¸n biÕn d¹ng DTW nh»m gi¶m thiÓu sai sè. Häc viÖn C«ng nghÖ BCVT
  11. LÜnh vùc C«ng nghÖ th«ng tin M NI M UM X TÝn hiÖu TÝnh to¸n Wl* Ph©n ®o¹n ©m thanh G¸n nh·n ®é sai sè vµo §Æc t Ýnh D(X,Yl ) MÉu so s¸nh Y1, ....., Yl H× nh 4: Nh Ën d¹ng t heo ph¬ ng ph¸p so s¸ nh m Éu 4. ThuËt to¸n Dynamic Time Wraping (DTW) Cho chuçi ©m tiÕt ®Çu vµo w = { w1 , w2 ,...wL } cã ®é dµi L vµ cã chuçi vector ®Æc tÝnh X = { x1 , x 2 ,...xT } , nhiÖm vô cña hÖ thèng lµ ph¶i nhËn d¹ng xem chuçi ©m ®Çu vµo lµ c¸c ký tù g× vµ trong qu¸ tr×nh xö lý cÇn ph¶i gi¶m thiÓu tèi ®a c¸c sai sè quyÕt ®Þnh. Mçi tÝn hiÖu ©m tiÕt ®Çu vµo W l sÏ ®îc so s¸nh víi c¸c mÉu Y l . Mçi Y l lµ chuçi c¸c vector ®Æc tÝnh cña tÝn hiÖu ©m tiÕt W l . Nh»m t¨ng kh¶ n¨ng nhËn d¹ng, mçi ©m tiÕt cã mét tËp hîp c¸c mÉu kh¸c nhau: Yl ,1 ,..., Yl , M l . Qu¸ tr×nh quyÕt ®Þnh ©m tiÕt phï hîp víi mét mÉu dùa theo nguyªn t¾c sau: l * = arg min min D( X , Yl ,m ) l m Nh vËy ©m tiÕt W l* lµ ©m tiÕt phï hîp nhÊt víi mÉu Y l t×m ®îc. Kho¶ng c¸ch D(X,Y) gi÷a d÷ liÖu ®Çu vµo vµ d÷ liÖu mÉu Y=y 1….y s cã ®é dµi thêi gian kh¸c nhau S ≠ T ®îc x¸c ®Þnh b»ng tæng c¸c kho¶ng c¸ch côc bé d ij = d ( xi , y j ) trªn c¶ ®êng ®i cña qu¸ tr×nh biÕn d¹ng thêi gian. Kho¶ng c¸ch tÝch luü Dij = D( x1 ...xi , y1 ... y j ) ®îc x¸c ®Þnh theo c«ng thøc 0 I=J=0 min{ Di −1, j −1 , Di −1, j , Di , j −1 } + d ij  I>0, J>0  ∞ Kh¸ c Vµ kho¶ng c¸ch tæng D(X,Y)=D TS. Häc viÖn C«ng nghÖ BCVT
  12. Héi nghÞ Khoa häc lÇn thø 5 → Gi¶ sö cho hai chuçi vec t¬ t ¬ng øng víi mÉu tÝn hiÖu lµ a = { a1 , a 2 , a3 ,....a I } vµ → → → b = { b1 , b2 , b3 ,....bJ } . Cho r»ng tÝn hiÖu mÉu a cã chiÒu dµi lín h¬n mÉu b tøc lµ gi¸ trÞ (I > J ). ThuËt to¸n sÏ thùc hiÖn viÖc t×m ®êng ®i tèi u cña chuçi b theo chuçi a (tøc lµ c¸c vÞ trÝ kh¸c nhau gi÷a hai chuçi theo thêi gian) sao cho tæng chªnh lÖch gi÷a hai chuçi vec t¬ lµ nhá nhÊt. §Ó thùc hiÖn ®îc ®iÒu nµy thuËt to¸n dïng ma trËn líi c¸c ®iÓm h×nh 5. H×nh 1: L íi ma trËn H×nh 5: Ma trËn líi c¸c ®iÓm Hai chuçi vÐc t¬ sÏ t ¬ng øng víi hai c¹nh cña ma trËn. Gi¶ sö , vÐc t¬ a theo trôc x vµ vÐc t¬ b theo trôc y. C¸c nót cña ma trËn t ¬ng øng víi kho¶ng c¸ch tÝnh ®îc cña hai chuçi vÐc t¬ t¹i c¸c thêi ®iÓm thø i cña vÐc t¬ a t ¬ng øng thêi ®iÓm thø j cña vÐc t¬ b t ¬ng øng nót (i,j). Nh vËy, ®êng ®i tèi u trong ma trËn sÏ cã d¹ng nh h×nh 6. H ×nh 6: H ×nh d¹ng ®-êng ®i t r ong ma t r Ën Häc viÖn C«ng nghÖ BCVT
  13. LÜnh vùc C«ng nghÖ th«ng tin ViÖc x¸c ®Þnh ®êng ®i tèi u trong ma trËn líi ®îc thùc hiÖn sao tæng kho¶ng c¸ch sai lÖch gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ nhá nhÊt. Ký hiÖu, d(i,j) lµ ®é chªnh lÖch cña hai vÐc t¬ a vµ b t¹i thêi ®iÓm i vµ j t ¬ng øng. Yªu cÇu cña thuËt to¸n DTW cho hai chuçi vec t¬ bÊt kú lµ cïng b¾t ®Çu t¹i c¸c vÞ trÝ (0,0) vµ kÕt thóc t¹i vÞ trÝ (I,J) . Gi¸ trÞ t¹i nót (0,0) x¸c ®Þnh b»ng 0. §êng ®i ®îc x¸c ®Þnh theo c¸c cÆp nót liªn tiÕp (i k-1,j k-1) → (i k,j k ) . Dïng ký hiÖu i k ®Ó biÓu diÔn chØ sè cña vÐc t¬ a t¹i thêi ®iÓm k vµ j k lµ chØ sè cña vÐc t¬ b t¹i thêi ®iÓm k. Nh vËy tæng kho¶ng c¸ch gi÷a hai chuçi vÐc t¬ lµ : D(i k , j k ) = D(ik −1 , j k −1 ) + d (i k , j k ) ViÖc t×m gi¸ trÞ min D(i,j) theo c«ng thøc sau: D * (i k , j k ) = min[ D(i k −1 , j k −1 )] + d (i k , j k ) m=k  = min  ∑ d (im , j m )   m =0  Mét sè b¾t buéc cña DTW: - ChØ sè cña i ph¶i t¨ng ®Òu tøc lµ : i k - i k-1 =1 - ChØ sè cña j t¨ng theo i víi ®iÒu kiÖn: j k -j k-1 ≥ 0 Giíi h¹n cña ®êng ®i kh«ng thÓ tuú ý ®îc v× nh thÕ nã sÏ g©y ra kÕt qu¶ sai lÖch vµ lµm t¨ng khèi lîng tÝnh to¸n (nÕu xÐt trªn toµn bé ma trËn ®iÓm). V× vËy, cÇn ph¶i giíi h¹n ph¹m vi cña ®êng ®i sao cho viÖc tÝnh to¸n gi¶m vµ ®é chÝnh x¸c cao. Ph¹m vi cho ®êng ®i ®îc chän nh h×nh vÏ 7: H×nh 3: §êng ®i trong ma trËn theo thuËt to¸n DTW Häc viÖn C«ng nghÖ BCVT
  14. Héi nghÞ Khoa häc lÇn thø 5 H×nh 7: Ph¹m vi cho ®êng ®i LuËt ®êng ®i ®îc lùa chän theo nh h×nh 8 : H×nh 8: LuËt ®êng ®i Gi¶ sö vÞ trÝ hiÖn t¹i ®ang ë thêi ®iÓm i k-1 vµ ®iÓm ®i tiÕp lµ i k . Nh vËy c¸c gi¸ trÞ j k cã thÓ lµ j k , j k+1, j k+2 t ¬ng øng víi c¸c mòi tªn trªn ma trËn. KÕt qu¶: KÕt qu¶ ®îc so s¸nh víi ph¬ng ph¸p biÕn d¹ng kh¸c lµ biÕn d¹ng tuyÕn tÝnh theo thêi gian hay cßn gäi lµ ®ång bé theo thêi gian víi thuËt to¸n biÕn d¹ng nh sau: ChØ sè theo thêi gian cña tÝn hiÖu b liªn quan ®Õn chØ sè theo thêi gian cña J tÝn hiÖu a lµ : j = i vµ kÕt qu¶ cho nh trªn h×nh 8. I Trªn h×nh vÏ thÓ hiÖn ®êng ®Æc tr ng cña ©m sè 2 (“hai ”) cã ®é dµi kh¸c nhau (a) vµ (b). Víi ph¬ng ph¸p biÕn d¹ng tuyÕn tÝnh th× gi¸ trÞ thêi gian chØ sè mÉu b ®îc gi·n ®Òu theo chØ sè thêi gian cña mÉu tÝn hiÖu a. Nh vËy, hai kho¶ng thêi gian ®îc kÐo d·n b»ng nhau song c¸c gi¸ trÞ th× vÉn cßn ®é sai lÖch lín do tû lÖ biÕn d¹ng lµ ®Òu mµ kh«ng cã sù chän lùa theo gi¸ trÞ h×nh (c). ThÓ hiÖn viÖc kÐo gi·n t¹i c¸c ®iÓm cã ®êng nèi ngang gi÷a hai tÝn hiÖu. Häc viÖn C«ng nghÖ BCVT
  15. LÜnh vùc C«ng nghÖ th«ng tin Cßn sö dông thuËt to¸n DTW ta thÊy tû lÖ biÕn d¹ng kh«ng ®ång ®Òu t¹i c¸c thêi ®iÓm tuú thuéc vµo gi¸ trÞ tÝch luü tõ tr íc nªn hai mÉu so s¸nh sÏ cã ®é (a) (b) (c) (d) chªnh lÖch lµ nhá nhÊt h×nh (d), c¸c ®êng nèi chÐo thÓ hiÖn sù biÕn d¹ng kh«ng tuyÕn tÝnh theo thêi gian. H×nh 8. BiÓu diÔn t huËt t o¸n biÕn d¹ng ©m “hai ” (a)(b) Hai t Ýn hiÖu cã chiÒu dµi kh¸c nhau. (c) BiÕn d¹ng t uyÕn t Ýnh t heo t hêi gian (d) BiÕn d¹ng DTW 5. KÕt luËn Trªn ®©y lµ øng dông cña thuËt to¸n DTW cho hÖ thèng nhËn d¹ng tiÕng nãi ®ang ®îc nghiªn cøu vµ triÓn khai. øng dông luËt ®êng ®i vµ c¸ch x¸c ®Þnh ®êng giíi h¹n cho thuËt to¸n DTW ®· gãp phÇn n©ng cao chÊt l îng cña bé nhËn d¹ng. Tuy nhiªn, luËt ®êng ®i vµ giíi h¹n cña ®êng ®i cßn cã thÓ cã nhiÒu d¹ng kh¸c cÇn nghiªn cøu thªm, song víi øng dông nhËn d¹ng mÉu rêi r¹c th× luËt ®- êng ®i x¸c ®Þnh theo ph¬ng ph¸p trªn lµ cã chÊt lîng h¬n c¶. Häc viÖn C«ng nghÖ BCVT
  16. Héi nghÞ Khoa häc lÇn thø 5 Tµi liÖu tham kh¶o [1]. §oµn ThiÖn ThuËt - Ng÷ ©m tiÕng ViÖt, Nhµ xuÊt b¶n §¹i häc vµ Trung häc chuyªn nghiÖp, Hµ néi. 1977 [2]. H.Sakoe and S.Chiba - Dynamic programming optimization for spoken word recognition. 1978. [3]. Hoang Tue and Hoang Minh, “Remarks on the phonological Structure of vietnamese”, Vietnamese Studies, Ha noi, 1979 [4]. Lawrence Rabiner, Biing – Hwang Juang; Fundamentals of speech recognition. 1999. [5]. R. M Gray, A. Buzo, A.H.Gray, Jr., and Y. Matsuyama - Distortion measures for speech processing. 1980. S¬ lîc t¸c gi¶ §oµn Phan Long, Tèt nghiÖp §¹i häc t¹i tr êng ®¹i häc tæng hîp Karl- Marx- Stadt –CHLB §øc t¹i Thµnh phè Chemnitz khoa tù ®éng ho¸, chuyªn ngµnh ®iÒu khiÓn häc n¨m 1985, hiÖn nay c«ng t¸c t¹i Trung t©m C«ng nghÖ Th«ng tin – CDIT, Häc viÖn C«ng nghÖ Bu chÝnh ViÔn th«ng – Tæng C«ng ty BCVT ViÖt nam. Nh÷ng vÊn ®Ò ®ang quan t©m bao trïm c¸c lÜnh vùc tù ®éng nhËn d¹ng tiÕng nãi, h×nh ¶nh... vµ tæng hîp tiÕng nãi ¸p dông trong c¸c hÖ thèng cung cÊp dÞch vô trong ngµnh Bu chÝnh-ViÔn th«ng. Häc viÖn C«ng nghÖ BCVT
Đồng bộ tài khoản