LÜnh vùc C«ng nghÖ th«ng tin

¸p dông thuËt to¸n Dynamic Time wraping (dtW)

cho øng dông nhËn d¹ng mÉu TiÕng ViÖt

ThS.§oµn Phan

Long

Trung t©m C«ng nghÖ th«ng tin

Tãm t¾t: Tù ®éng nhËn d¹ng tiÕng nãi (Automatic Speech Recognition ASR) lµ

mét lÜnh vùc nghiªn cøu quan träng ®Ó ®a c¸c øng dông tiÕng nãi vµo nhiÒu

ngµnh. Mét vÊn ®Ò liªn quan cÇn nghiªn cøu trong lÜnh vùc nµy ®îc dùa trªn

c¬ së l u tr÷ mét hoÆc nhiÒu mÉu tÝn hiÖu cho mçi tõ cÇn nhËn d¹ng. Qu¸

tr×nh nhËn d¹ng lµ qu¸ tr×nh thùc hiÖn viÖc so s¸nh hai mÉu tÝn hiÖu cña

cïng mét ©m ®Ó tÝm ra mÉu cã sai sè nhá nhÊt. Bëi v× tÝn hiÖu ©m thanh ®îc

t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau kh«ng bao giõo gièng nhau hoµn toµn. Nã lu«n

cã sù sai lÖch do c¸c yÕu tè vÒ träng ©m, ng÷ ®iÖu, tèc ®é,... V× vËy cÇn ph¶i

thùc hiÖn sã s¸nh hai mÉu theo c¸c thuËt to¸n biÕn d¹ng nh»m gi¶m thiÓu sai

sè. ThuËt to¸n DTW (Dynamic Time Wraping) lµ thuËt to¸n hiÖu qu¶ nhÊt cho

viÖc øng dông sao s¸nh hai mÉu tÝn hiÖu cã chiÒu dµi kh¸c nhau vµ cho sai sè

nhá nhÊt [4]. Tuy nhiªn viÖc øng dông DTW cã nhiÒu híng kh¸c nhau vµ cho c¸c

kÕt qu¶ kh¸c nhau, viÖc lùa chän ph¬ng ph¸p ¸p dông cã hiÖu qu¶ ®èi víi ng«n

ng÷ tiÕng ViÖt lµ mét vÊn ®Ò cÇn quan t©m.

Më ®Çu:

HiÖn nay víi sù trî gióp cña c¸c hÖ thèng m¸y tÝnh cã rÊt nhiÒu xu híng

nh»m ¸p dông c¸c m« h×nh ng«n ng÷ trong c¸c hÖ thèng sö dông c«ng nghÖ nhËn

d¹ng tiÕng nãi, trong ®ã cã thÓ kÓ ®Õn nh m« h×nh tõ, ©m tiÕt vµ m« h×nh

©m vÞ, m« h×nh ©m ®Çu+vÇn. ViÖc lùa chän c¸c m« h×nh nµy ®Ó gi¶i quyÕt

c¸c bµi to¸n cô thÓ phô thuéc vµo yªu cÇu cña c¸c øng dông. Nã quyÕt ®Þnh ®Õn

®é phøc t¹p, tÝnh bao trïm vµ chÊt l îng cña hÖ thèng. HÖ thèng nhËn d¹ng ¸p

dông c¸c m« h×nh ng«n ng÷ trªn ®Òu cã thÓ sö dông c«ng nghÖ nhËn d¹ng mÉu

theo tõ, ©m tiÕt, ©m vÞ hoÆc theo c¸c ©m ®Çu vµ vÇn. §Ó cã thÓ so s¸nh gi÷a

tÝn hiÖu ®Çu vµo vµ mÉu, ngêi ta th êng ph¸p ¸p dông thuËt to¸n DTW.

ThuËt to¸n DTW ®îc øng dông ®Ó gi¶i quyÕt viÖc so s¸nh gi÷a hai mÉu tÝn

Häc viÖn C«ng nghÖ BCVT

hiÖu cã ®é dµi kh¸c nhau theo thêi gian. Nh ta biÕt, kÕt qu¶ cña qu¸ tr×nh

Héi nghÞ Khoa häc lÇn thø 5

ph©n tÝch tÝnh hiÖu theo ph¬ng ph¸p m· ho¸ dù b¸o tuyÕn tÝnh (Linear

Predictive Coding LPC) hay ng©n hµng bé läc (Filter Bank) bao giê còng cho ta

kÕt qu¶ d¹ng chuçi c¸c vÐct¬ ®Æc tr ng. §é dµi cña chuçi vÐc t¬ nµy phô thuéc

vµo ®é dµi cña cña hai tÝn hiÖu mµ ta ph©n tÝch. Nh vËy, qu¸ tr×nh so s¸nh

hai tÝn hiÖu sÏ t ¬ng øng víi qu¸ tr×nh so s¸nh 2 chuçi vÐc t¬ ®Æc tr ng cña hai

tÝn hiÖu. ThuËt to¸n DTW sÏ thùc hiÖn viÖc so s¸nh 2 chuçi vÐc t¬ nµy theo

mét sè luËt sao cho tæng ®é lÖch gi÷a hai chuçi lµ nhá nhÊt t ¬ng øng víi ®êng

®i gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ tèi u nhÊt. ViÖc chän lùa luËt chän ®-

êng ®i vµ giíi h¹n biªn cña c¸c ®êng ®i sÏ cho ta kÕt qu¶ tÝnh to¸n lµ nhá nhÊt

vµ hiÖu qu¶ nhÊt.

1 Kh¸i qu¸t vÒ tiÕng ViÖt

1.1) C¸c d©n téc vµ ng«n ng÷ ë ViÖt Nam

Trong sè 54 d©n téc ë ViÖt Nam th× d©n téc ViÖt (cßn gäi lµ Kinh)

chiÕm sè lîng tuyÖt ®èi, tæng sè d©n lªn tíi trªn 70 triÖu ngêi. D©n téc Tµy cã

1,2 triÖu, d©n téc Th¸i trªn 1 triÖu, c¸c d©n téc Hoa, Kh¬ me, M êng, C¬ Ho,

Chµm, S¸n D×u trªn 900 ngh×n ngêi.

C¨n cø vµo ng«n ng÷, ch÷ viÕt ta cã thÓ ph©n bè c¸c thµnh phÇn d©n téc nh

sau:

 TiÕng N«m - Kh¬me. Gåm nhiÒu nhãm ngêi ë T©y B¾c, T©y Nguyªn,

Qu¶ng TrÞ vv...

 TiÕng Th¸i. Gåm ngêi Th¸i T©y B¾c, Thîng du Thanh Hãa, NghÖ An, khu

ViÖt B¾c, Qu¶ng Ninh. Ngoµi ra cßn cã nhãm ngêi Gi¸y, Cao Lan, Lù vv...

 TiÕng Anh-®«-nª-diªng. Gåm ngêi Chµm, Gia rai, £-®ª (T©y Nguyªn).

 TiÕng MÌo-Dao. Gåm ngêi MÌo Dao (ViÖt B¾c, Hßa B×nh Thanh Hãa)

 TiÕng T¹ng - MiÕn: Gåm ngêi L« L« (Hµ Giang), Hµ Nh×, La Khu, Cèng,

Xila (T©y B¾c).

 TiÕng H¸n: Ngêi Hoa (Qu¶ng Ninh), S¸n D×u (B¾c Giang, B¾c C¹n, Th¸i

Nguyªn vv....).

TiÕng ViÖt lµ ng«n ng÷ céng ®ång cña d©n téc ViÖt vµ còng lµ c«ng cô giao

tiÕp chung cho c¸c d©n téc sèng trong níc ViÖt Nam. NhiÒu c«ng tr×nh nghiªn

Häc viÖn C«ng nghÖ BCVT

cøu theo ph¬ng ph¸p lÞch sö so s¸nh ®Òu ®i ®Õn kÕt luËn c¸c ng«n ng÷ ë ViÖt

LÜnh vùc C«ng nghÖ th«ng tin

Nam thuéc vµo c¸c hä H¸ n T¹ng, Th¸ i, MÌo-Dao, Nam §¶o, Nam ¸ ; riªng t iÕng

ViÖt t huéc hä t iÕng Nam ¸ . Hä Nam ¸ (aust roasiat ique) lµ mét hä ng«n ng÷ kh¸

lín bao gåm mét phÇn Ên ® é, mét phÇn Malaysia, mét phÇn MiÕn ® iÖn, phÇn

lín Cam puchia, phÇn lín ViÖt Nam . Hä nµy l¹i ph© n t hµnh nhiÒu nhãm: ViÖt -

M êng, M«ng-Khm er, Kh¬ mó, C¬ t u, Bana, Mn«ng, Ka® ai.

Hä Nam §¶o (aust ronesien hay malayo-polyesien) còng lµ mét hä lín, víi

nhiÒu ng«n ng÷ , t rªn mét khu vùc réng bao gåm quÇn ® ¶o Madagascar,

Malaysia, Indonesia, Philippines, New Guinea, Taiwan vµ phÝa Nam ViÖt

Nam . VÒ ng«n ng÷ thuéc hä nµy ë ViÖt Nam cã Chµm , Raglai, Chru, £® ª,

Giarai, t Êt c¶ ® Òu thuéc nhãm Ch¨ m.

Hä H¸ n T¹ng bao gåm t iÕng Hoa vµ mét sè ng«n ng÷ phÝa T© y nam Trung

hoa vµ phÇn lín MiÕn §iÖn. C¸ c ng«n ng÷ thuéc hä nµy ë ViÖt Nam bao gåm L«

L«, Phï L¸ , Hµ Nh× , La Hñ, Cèng, Si La t huéc nhãm T¹ng-MiÕn, c¸c t iÕng Hoa,

S¸ n ChØ, S¸ n D× u thuéc nhãm H¸ n.

1.2) Vµi nÐt vÒ lÞch sö ph¸t triÓn cña tiÕng ViÖt

Theo mét sè tµi liÖu nghiªn cøu th× tiÕng ViÖt thêi th îng cæ lµ thø tiÕng

cha cã thanh ®iÖu. HÖ thèng phô ©m ®Çu trong tiÕng ViÖt cã nh÷ng phô ©m

®¬n vµ phô ©m kÐp nh bl, tl, pr, pl ... C¸c ©m cuèi bÞ mÊt dÇn mét sè trong qu¸

tr×nh ph¸t triÓn (nh ©m cuèi l mÊt ®i, ©m cuèi r chuyÓn thµnh i), nãi riªng ©m

h mÊt ®i vµ xuÊt hiÖn dÊu ng· trong tiÕng ViÖt.

HÖ thèng thanh ®iÖu ®· xuÊt hiÖn dÇn. Vµo ®Çu c«ng nguyªn, tiÕng

ViÖt cha cã thanh ®iÖu, ®Õn thÕ kØ VI xuÊt hiÖn ba thanh vµ ®Õn thÕ kØ

XII míi cã ®ñ s¸u thanh nh hiÖn nay. Sù biÕn ®æi cña ©m ®Çu vµ cuèi lµ

nguyªn nh©n lµm xuÊt hiÖn hÖ thèng thanh ®iÖu trong tiÕng ViÖt.

Sù biÕn ®æi trong hÖ thèng c¸c ©m ®Çu diÔn ra t ¬ng ®èi râ h¬n trong

hÖ thèng nguyªn ©m: ©m v« thanh chuyÓn thµnh h÷u thanh (p V b, t ô d vµ k

g). C¸c phô ©m kÐp kl, tl, bl, khl ... mÊt dÇn, lµm xuÊt hiÖn c¸c ©m uèn l ìi tr

vµ s (tl¨m h tr¨m (thÕ kØ 17); bl¨ng . tr¨ng (thÕ kØ 18), khl«ng (thÕ kØ 15) (cid:137)

s«ng (thÕ kØ 17), nhãm ml chuyÓn thµnh l hoÆc nh (nlÇm h lÇm, nhÇm, mlÏ

lÏ, nhÏ)

Kho tõ vùng tiÕng ViÖt phong phó víi nh÷ng tõ c¬ b¶n cã nguån gèc Nam

Häc viÖn C«ng nghÖ BCVT

¸ vµ Tµy Th¸i cæ. Kho tõ vùng trong qu¸ tr×nh ph¸t triÓn cßn tiÕp nhËn vµ

Héi nghÞ Khoa häc lÇn thø 5

t huÇn ho¸ c¶ vÒ ng÷ © m lÉn ý nghÜa mét bé phËn kh¸ nhiÒu tõ gèc H¸ n (nh

®òa, ®ôc, mu«n, mòi, mãc, mïa...).

HÖ thèng ng÷ ph¸p tá ra bÒn v÷ng h¬n hÖ thèng tõ vùng, trËt tù có ph¸p, trËt

tù tæ hîp tõ gi÷ ®Æc ®iÓm riªng cña tiÕng ViÖt.

1.3) Mét sè ®Æc ®iÓm cña tiÕng ViÖt

TiÕng ViÖt lµ lo¹i h×nh ng«n ng÷ ®¬n lËp (ng«n ng÷ kh«ng biÕn h×nh -

amorphous) vµ cã thanh ®iÖu. TiÕng ViÖt lµ tiÕng ®¬n ©m cã ranh giíi cè

®Þnh, mang thanh ®iÖu, cã cÊu tróc ®¬n gi¶n, thanh ®iÖu vµ cã ©m tiÕt trïng

víi h×nh vÞ, ®¬n vÞ nhá nhÊt cã tæ chøc mang ý nghÜa ng÷ ph¸p. Do mçi ©m

tiÕt lµ vá ng÷ ©m cña h×nh vÞ nªn kh¸c víi c¸c ng«n ng÷ ¢u-Ên, tiÕng ViÖt cã sè

lîng ©m tiÕt h÷u h¹n víi 17.000 vá ng÷ ©m vµ 6.900 ©m tiÕt tån t¹i thùc [3].

¢m tiÕt, h×nh vÞ trong tiÕng ViÖt lµ cè ®Þnh, kh«ng biÕn ®æi h×nh th¸i

theo ng÷ ph¸p vµ thêi, gièng vµ sè nh c¸c ng«n ng÷ kh¸c. Tõ th êng cã hai lo¹i lµ

®¬n tiÕt vµ ®a tiÕt. Mét phÇn rÊt lín tõ ®a tiÕt lµ H¸n ViÖt (kÓ c¶ tõ míi).

Trong c¸c tõ ®a tiÕt th êng cã d¹ng l¸y ©m hoÆc ghÐp c¸c tõ ®¬n tiÕt. ¢m tiÕng

ViÖt cã cÊu tróc chÆt chÏ víi c¸c lo¹i ©m ë c¸c vÞ trÝ cè ®Þnh trong thµnh phÇn

©m tiÕt.

TiÕng ViÖt lµ ng«n ng÷ cã thanh ®iÖu, tiÕng ViÖt cã 6 thanh (tiÕng

Th¸i, Lµo cã 5 thanh, tiÕng H¸n 4 thanh, tiÕng MiÕn §iÖn 3 thanh, Trung Quèc

cã 4 thanh) lµ ngang (kh«ng dÊu), huyÒn, ng·, hái, s¾c vµ nÆng. Mçi thanh

®Òu cã thÓ tham gia vµo viÖc cÊu t¹o tõ vµ t¹o nghÜa cho tõ. Thanh ®iÖu

tiÕng ViÖt cã tÝnh nh¹c, c©u v¨n cã vÇn, nhÞp ®iÖu, trÇm bæng nhÞp nhµng.

Mçi ©m tiÕt ®Òu mang mét thanh ®iÖu nhÊt ®Þnh. Thanh ®iÖu kÕt hîp víi

thµnh phÇn cña ©m tiÕt t¹o thµnh c¸c tõ kh¸c nhau, vÝ dô nh /ma, mµ, m¸, m¶,

m·, m¹/. Trong tiÕng ViÖt kh«ng ph¶i vÇn nµo còng ph¸t ©m ®îc ®ñ s¸u thanh.

§èi víi ©m tiÕt ®ãng chØ cã hai thanh lµ s¾c vµ nÆng

¢m tiÕt tiÕng ViÖt ë d¹ng ®Çy ®ñ bao gåm 3 thµnh phÇn cã møc ®é ®éc

lËp kh¸c nhau lµ ©m ®Çu (phô ©m), phÇn vÇn vµ thanh ®iÖu. Víi phÇn vÇn

bao gåm 3 thµnh phÇn lµ ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m

®¬n hoÆc nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m).

Trong ®ã nguyªn ©m vµ thanh ®iÖu lµ h¹t nh©n cña ©m tiÕt. Trõ phô ©m ®Çu,

Häc viÖn C«ng nghÖ BCVT

phÇn cßn l¹i cña ©m tiÕt tiÕng ViÖt ®îc gäi lµ vÇn. TiÕng ViÖt cã 512 vÇn

LÜnh vùc C«ng nghÖ th«ng tin

(Theo t hèng kª t rong mét sè t µi liÖu cña GS. Hoµng Phª). VÇn vµ thanh t¹o nªn

sù hµi hoµ vÒ ng÷ © m vµ ng÷ nghÜa t rong c¸c tõ t îng h× nh, t îng t hanh.

Tõ song t iÕt chiÕm phÇn kh¸ lín t rong tæng sè tõ. Tõ ghÐp ® a t iÕt chia

ra t hµnh c¸c lo¹i tõ ghÐp nghÜa, tõ l¸ y, tõ ghÐp t ù do, c¸c tõ vay mîn níc ngoµi.

Vèn tõ vùng t iÕng ViÖt bao gåm c¸c tõ, c¸c t hµnh ng÷ , thuËt ng÷ . Mét bé phËn

tõ t iÕng ViÖt cã gèc H¸ n.

Ph ¬ ng t iÖn biÓu hiÖn ý nghÜa ng÷ ph¸ p t rong t iÕng ViÖt lµ t rËt t ù c¸c

t hµnh tè (tõ vµ c© u), ng÷ ® iÖu, d¹ng l¸ y, ng÷ c¶nh. Tõ vµ côm tõ lµ c¸c ® ¬ n vÞ

cÊu t¹o nªn c© u.

Ng«n ng÷ nãi vµ ng«n ng÷ viÕt kh«ng c¸ch xa nhau vÒ qui t¾c ng÷ © m, ng÷

ph¸p.

Mèi quan hÖ gi÷a ch÷ c¸i, thanh vµ ©m tiÕt, tõ

1.4)

- ChØ c¸c nguyªn ©m míi cã quyÒn mang dÊu thanh trong biÓu diÔn ©m tiÕt

hay tõ.

- Mçi nguyªn ©m cã thÓ ®îc mang nhiÒu nhÊt lµ mét trong c¸c dÊu thanh

trªn.

- C¸c dÊu thanh: huyÒn, hái, ng·, s¾c ®îc ®Æt ë phÝa trªn cña nguyªn ©m

mang dÊu. DÊu nÆng ®îc ®Æt ë phÝa díi nguyªn ©m mang dÊu.

- C¸c ©m tiÕt ch÷ ViÖt ®îc t¹o ra trªn c¬ së biÓu diÔn h×nh ¶nh cho c¸c ©m

ph¸t ra cã mang thanh ®iÖu. Mçi ©m tiÕt ®Òu ®îc biÓu diÔn b»ng viÖc viÕt

liÒn c¸c ch÷ c¸i m« t¶ cho ©m tiÕt ®ã vµ ®îc mang nhiÒu nhÊt lµ mét thanh,

®Æt trªn mét nguyªn ©m. C¸c ©m tiÕt t¸ch lÉn nhau b»ng dÊu c¸ch.

- Thanh lµ thuéc tÝnh cña ©m tiÕt, kh«ng ph¶i lµ thuéc tÝnh cña nguyªn ©m.

Thanh ®îc ®Æt vµo vÞ trÝ cña nguyªn ©m ®Ó ph©n biÖt trong c¸ch ph¸t

©m.

- Mét tõ trong tiÕng ViÖt lµ mét ®¬n vÞ ng÷ nghÜa, mang mét ý nghÜa nµo

®ã, vµ bao gåm mét hai, ba hay nhiÒu ©m tiÕt.

- Dùa trªn c¸ch biÓu diÔn ch÷ ViÖt theo ch÷ c¸i vµ thanh nµy, cã thÓ nªu ra ®-

îc c¸c tËp sinh kh¸c cho ch÷ ViÖt, nh:

 TËp sinh díi d¹ng tæ hîp cña c¸c phô ©m ®Çu vµ vÇn theo sau

 TËp sinh víi 33 ch÷ c¸i vµ 5 thanh

 TËp sinh víi c¸c phô ©m ®Çu vµ kho¶ng 800 vÇn

- MÆc dÇu c¸ch biÓu diÔn theo phô ©m vµ vÇn cã thÓ cã mét sè Ých lîi trong

Häc viÖn C«ng nghÖ BCVT

xö lÝ nhng Ých lîi ®ã khã bï ®îc cho nh÷ng bÊt lîi mµ nã ®em l¹i nh:

Héi nghÞ Khoa häc lÇn thø 5

 Víi ® Æc t hï ph¸ t © m cña t iÕng ViÖt khã biÓu diÔn nh÷ ng t× nh huèng

cã chen lÉn t iÕng ViÖt vµ kh«ng ph¶i t iÕng ViÖt .

 ViÖc lµm nµy ® i ngîc víi xu t hÕ hoµ ® ång c¸c ng«n ng÷ t rªn thÕ giíi, do

® ã khã kh¨ n cho viÖc t iÕp t hu nh÷ ng t iÕn bé c«ng nghÖ m íi.

1.5) Ch÷ viÕt

Theo c¸c tµi liÖu lÞch sö §¹i ViÖt sö l îc, An nam chÝ nguyªn, ViÖt sö th«ng gi¸m

tæng luËn th× ®Òu cã chÐp thêi Hïng v¬ng "chÝnh sù dïng lèi kÕt nót." Tuy

nhiªn cha cã tµi liÖu nµo cho biÕt râ h¬n vÒ viÖc khi nµo cã ch÷ viÕt ®îc b¾t

®Çu dïng ë ViÖt Nam. ViÖc sö dông ch÷ H¸n ®i kÌm víi viÖc v¨n ho¸ Trung quèc

lan xuèng phÝa Nam ®Õn cïng víi viÖc chinh phôc vµ th«n tÝnh ®Êt ®ai cña c¸c

triÒu ®¹i phong kiÕn Trung quèc.

1.6) CÊu tróc ©m tiÕt trong tiÕng ViÖt

Nh ®· nªu trªn, ¢m tiÕt cña tiÕng viÖt ë d¹ng ®Çy ®ñ ®îc t¹o bëi 5 thµnh phÇn

lµ phô ©m ®Çu, ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m ®¬n hoÆc

nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m) vµ thanh ®iÖu.

VÒ cÊu tróc, ©m tiÕt tiÕng ViÖt cã cÊu tróc hai bËc. BËc mét gåm ba thµnh

phÇn lµ thanh ®iÖu, phô ©m ®Çu vµ vÇn. BËc hai lµ c¸c thµnh tè cña phÇn

vÇn gåm ©m ®Öm lµ b¸n nguyªn ©m, nguyªn ©m chÝnh vµ phô ©m hoÆc b¸n

nguyªn ©m cuèi. C¸c thµnh phÇn ©m tiÕt ®îc thÓ hiÖn ë h×nh 1.

Thanh ®iÖu

¢m ®Çu VÇn

¢m ®Öm ¢m chÝnh ¢m cuèi

H×nh 1: S¬ ®å ©m tiÕt tiÕng ViÖt

1.6.1) ¢m ®Çu

Phô ©m më ®Çu ©m tiÕt gåm cã 22 vÇn. C¸c phô ©m ®Çu ®îc ph©n biÖt

theo c¸c tiªu chÝ vÒ ph¬ng thøc cÊu ©m (t¾c, x¸t), vÒ thanh tÝnh (vang, ån)...

phô ©m vang ®îc ph©n biÖt gi÷a phô ©m mòi vµ phô ©m bªn (phô ©m kh«ng

mòi). Trong phô ©m ån ®îc chia thµnh lo¹i ©m v« thanh vµ ©m h÷u thanh. Nh

vËy ph©n theo líp ng÷ ©m r«ng ta cã thÓ chia phô ©m ®Çu tiÕng ViÖt thµnh

b¶y lo¹i theo h×nh 2 díi ®©y.

Ph¬ng thøc cÊu ©m C¸c phô ©m

Häc viÖn C«ng nghÖ BCVT

T¾c V« thanh BËt h¬i th

LÜnh vùc C«ng nghÖ th«ng tin

ån Kh«ng bËt h¬ i (p), t, t r, ch, k, c

H÷ u thanh b, ®

X¸ t V« t hanh ph, x, s, kh

H÷ u thanh v, d, r, g-gh, h

Vang

Mòi m , n, nh, ng-ngh

Kh«ng mòi l

H× nh 2: Ph© n lo¹i phô © m ® Çu

1.6.2) PhÇn vÇn

PhÇn vÇn cã 3 thµnh phÇn lµ ©m ®Öm, ©m chÝnh vµ ©m cuèi. VÝ dô ©m

tiÕt /to¸n/ cã phÇn vÇn lµ oan, trong ®ã ©m vÞ ©m ®Öm lµ /o/, ©m chÝnh lµ /a/

vµ ©m cuèi lµ /n/.

-

¢m ®Öm ®ãng vai trß lµm biÕn ®æi ©m s¾c cña ©m tiÕt nh ng nã kh«ng t¹o

nªn ®Ønh cña ©m tiÕt. ¢m ®Öm ®îc viÕt b»ng ch÷ c¸i /o/ khi ®øng tr íc 3

nguyªn ©m /e/, /a/, /¨/ vµ b»ng ch÷ c¸i /u/ trong c¸c tr êng hîp cßn l¹i. NÕu ®øng

sau phô ©m ®Çu /k/ th× chØ ®îc viÕt lµ /u/ vµ /k/ ®îc viÕt lµ /q/

-

¢m chÝnh lµ mét ©m trong hÖ thèng nguyªn ©m gåm 11 nguyªn ©m ®¬n lµ

/a/, /¨/, /©/, /e/, /ª/, /o/, /«/, /¬/, /u/, //, /i/ vµ 3 nguyªn ©m ®«i lµ /iª/, /¬/, /a/. ¢m

chÝnh lµ yÕu tè t¹o nªn ®Ønh ©m tiÕt, cã biªn ®é vµ cêng ®é lín nhÊt trong

c¸c thµnh phÇn ©m tiÕt.

-

¢m cuèi lµ ©m kÕt thóc ©m tiÕt. Nã biÕn ®æi ©m s¾c cña ©m chÝnh do t¸c

®éng t¸c khÐp l¹i cña bé m¸y ph¸t ©m. HÖ thèng ©m cuèi trong tiÕng ViÖt

gåm hai b¸n nguyªn ©m lµ /i/ vµ /o/ vµ s¸u phô ©m. C¸c phô ©m nµy lµ /m/,

/n/, /ng (nh)/, /p/, /t/, /c/.

1.6.3) Thanh ®iÖu

Thanh ®iÖu lµ lo¹i ©m vÞ siªu ®o¹n tÝnh, nã ®îc biÓu hiÖn trong tiµn bé phÇn

h÷u thanh cña ©m tiÕt. ë møc vËt lý, phÇn thanh cña thanh ®iÖu chÝnh lµ ®-

êng nÐt cña tÇn sè ©m c¬ b¶n F 0. VÒ c¶m thô, thanh ®iÖu lµ sù c¶m nhËn vÒ

Häc viÖn C«ng nghÖ BCVT

®é thay ®æi cao ®é tÇn sè c¬ b¶n F0 cña ©m tiÕt.

Héi nghÞ Khoa häc lÇn thø 5

S¸ u thanh ® iÖu t rong t iÕng ViÖt ®îc chia t hµnh hai nhãm lín lµ b»ng vµ t r¾c.

Thanh kh«ng dÊu vµ t hanh huyÒn t huéc lo¹i t hanh b»ng cã ®êng nÐt t ¬ ng ® èi

® ¬ n gi¶n. Thanh ng·, thanh hái, t hanh s¾c vµ thanh nÆng lµ nh÷ ng t hanh

t r¾c cã ®êng nÐt thanh ® iÖu phøc t¹p. C¸ c t hanh ngang, s¾c, ng· t huéc © m vùc

cao cßn c¸c © m huyÒn, hái vµ nÆng thuéc © m vùc thÊp.

Ngoµi t Ýnh chÊt thanh t Ýnh, c¸c thanh ® iÖu cßn cã mét sè ® Æc t r ng phi ® iÖu

t Ýnh nh hiÖn t îng yÕt hÇu ho¸, thanh hÇu ho¸ ... t¹o t hµnh c¸c hÖ t hèng c¸c

® Æc t r ng phô ® Ó ph© n biÖt c¸c thanh ® iÖu ® Æc biÖt cña thanh ng· vµ s¾c,

t hanh hái vµ t hanh nÆng.

1.6.4) Lo¹i ©m tiÕt

Phô thuéc vµo c¸ch thøc kÕt thóc, ©m tiÕt tiÕng ViÖt ®îc chia thµnh 4 lo¹i nh

sau:

• ¢m tiÕt më: Lµ lo¹i ©m tiÕt kh«ng cã ©m cuèi, kÕt thóc ©m tiÕt b»ng

nguyªn ©m chÝnh, vÝ dô cha, mÑ

• ¢m tiÕt nöa më: Khi ©m cuèi kÕt thóc ©m tiÕt lµ mét b¸n nguyªn ©m, vÝ

dô mai, sau

• ¢m tiÕt nöa ®ãng: Khi ©m cuèi lµ mét phô ©m mòi /n/, /m/, /ng/, /nh/, vÝ

dô lµm, ngµnh, m«ng.

• ¢m tiÕt ®ãng: Khi ©m cuèi lµ mét phô ©m t¾c v« thanh /p/, /t/, /c/, vÝ dô:

tËp, häc, mÖt.

2. §¬n vÞ nhËn d¹ng c¬ b¶n cho c¸c hÖ thèng nhËn d¹ng lêi ViÖt

2.1. M« h×nh tõ vµ ©m tiÕt

ViÖc lùa chän tõ lµm ®¬n vÞ nhËn d¹ng lµ ph¬ng ph¸p th«ng th êng vµ dÔ

dµng nhÊt, nã bao trïm ®îc tÝnh biÕn thÓ ©m vÞ. §èi víi mét sè øng dông nhËn

d¹ng tiÕng nãi cÇn sè tõ kh«ng lín nh hÖ thèng ®iÒu khiÓn häc, ®Õm sè ... cã

thÓ ¸p dông tèt m« h×nh tõ ®Ó nhËn d¹ng do dÔ dµng thu thËp ®ñ sè mÉu

huÊn luyÖn cho mçi tõ. Xem h×nh 3 díi ®©y.

Trong tÊt c¶ c¸c ng«n ng÷, tõ lµ ®¬n vÞ tù nhiªn nhá nhÊt cña tiÕng nãi

vµ tõ lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng tiÕng nãi. TiÕng ViÖt lµ ng«n ng÷

®¬n ©m tiÕt. Trong tiÕng ViÖt, ©m tiÕt lµ nh÷ng ®¬n vÞ ©m thanh nhá nhÊt

vµ nh vËy ©m tiÕt lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng lêi ViÖt. Do vËy nã

cã thÓ ®îc lùa chän lµm ®¬n vÞ nhËn d¹ng tiÕng nãi cho c¸c øng dông nhËn

Häc viÖn C«ng nghÖ BCVT

d¹ng lêi ViÖt. Tuy nhiªn, do trong tiÕng ViÖt, sè l îng ©m tiÕt rÊt lín trªn 10.000

LÜnh vùc C«ng nghÖ th«ng tin

© m t iÕt nªn r Êt khã cã t hÓ ¸p dông cho c¸c hÖ t hèng nhËn d¹ng t iÕng viÖt cì

lín do viÖc thu thËp m Éu t iÕng nãi cÇn thiÕt cho c¸c © m t iÕt sÏ gÆp nhiÒu

khã kh¨ n do sã l îng m Éu qu¸ lín vµ thêi gian xö lý so s¸ nh, lùa chän m Éu t rong

c¬ së d÷ liÖu l© u. Ngoµi ra , mçi m Éu huÊn luyÖn cña mét © m t iÕt chØ cã t hÓ

sö dông ® Ó huÊn luyÖn vµ so s¸ nh lùa chän cho chÝnh © m t iÕt ® ã chø kh«ng

t hÓ sö dông chung ® Ó huÊn luyÖn vµ lùa chän cho c¸c © m t iÕt kh¸ c. Xong bï l¹i,

ph¬ ng ph¸ p nµy cã nhiÒu ® ¬ n gi¶n do kh«ng cÇn ph¶i sö dông mét sè c¸c ph¬ ng

§ång hå b¸o t høc 1

§iÒu khiÓn häc (cã/kh«ng)

§Õm, sè 10 + x

ph¸p ® Ó ph© n ® o¹n vµ g¸ n nh·n.

H× nh 1.1. Sè tõ t rong c¸c øng dông cô thÓ

H× nh 3. Vèn tõ t rung b× nh theo c¸c øng dông

2.2. M« h×nh ©m vÞ

Nh»m gi¶m bít sè l îng mÉu huÊn luyÖn, nhËn d¹ng vµ ®Ó sö dông chung c¸c

mÉu nµy, m« h×nh ©m vÞ th êng ®îc sö dông lµm ®¬n vÞ nhËn d¹ng c¬ b¶n cho

c¸c hÖ thèng nhËn d¹ng tiÕng nãi. Trong tiÕng ViÖt chØ cã 38 ©m vÞ trong ®ã

cã 22 phô ©m vµ 16 nguyªn ©m ®¬n vµ ®«i [1], khi kÕt hîp víi thanh ®iÖu

(huyÒn, hái, ng·, s¾c, nÆng, kh«ng dÊu) th× tæng céng cã 228 ©m vÞ cã thanh

®iÖu. Víi sè lîng ©m vÞ h¹n chÕ nh vËy, hoµn toµn cã thÓ x©y dùng mét m«

h×nh nhËn d¹ng tiÕng ViÖt víi tõ ®iÓn cì lín kh«ng h¹n chÕ víi kho¶ng 1.500 -

2000 c©u huÊn luyÖn. Mét ®Æc ®iÓm n÷a lµ c¸c tõ trong tiÕng ViÖt cã sè l îng

©m vÞ rÊt Ýt, nhiÒu nhÊt còng chØ tíi 6 ©m vÞ (vÝ dô khuÕch tr ¬ng). Tuy

Häc viÖn C«ng nghÖ BCVT

nhiªn, m« h×nh ©m vÞ cã mét sè nhîc ®iÓm chÝnh:

Héi nghÞ Khoa häc lÇn thø 5

- C¸ c © m vÞ nh nhau ë c¸c vÞ t r Ý kh¸ c nhau kh«ng h¼n ® · cã ® Æc t Ýnh © m

häc, ng÷ © m häc nh nhau. Mét sè © m vÞ võa ® ãng vai t rß © m chÝnh, võa

® ãng vai t rß © m phô.

- ¢m vÞ lµ ® ¬ n vÞ © m nhá nhÊt cña mét tõ, viÖc x¸c ® Þnh gianh giíi cña c¸c

© m vÞ r Êt khã, do ® ã viÖc ph© n ® o¹n vµ g¸ n nh·n chÝnh x¸c ë møc © m vÞ

r Êt khã kh¨ n nhng l¹i r Êt quan t räng vµ ¶nh hëng nhiÒu ® Õn chÊt lîng cña

hÖ t hèng.

2.3. ¢m ®Çu +VÇn

TiÕng ViÖt lµ ng«n ng÷ ®¬n ©m tiÕt. ¢m tiÕt tuy ®îc ph¸t ©m liÒn nhng l¹i

cã cÊu t¹o l¾p ghÐp vµ hÇu nh theo mét quy luËt nhÊt ®Þnh. §iÒu nµy dÔ

thÊy ë c¸c em bÐ häc ®¸nh vÇn trong n¨m ®Çu ®i häc. Mçi tõ trong tiÕng ViÖt

cã 3 bé phËn chÝnh lµ thanh ®iÖu, ©m ®Çu vµ vÇn. ¢m ®Çu cã mét ©m vÞ

tham gia cÊu t¹o, vÇn ®îc cÊu t¹o bíi ©m ®Öm, ©m chÝnh vµ ©m cuèi. Theo [4]

th× trong tiÕng ViÖt cã 22 ©m ®Çu vµ 155 vÇn. KÕt hîp víi thanh ®iÖu th×

tæng sè ©m ®Çu+vÇn cã thanh ®iÖu nhá h¬n (22+155)*6=1062 v× cã nhiÒu

©m ®Çu, vÇn vµ thanh ®iÖu kh«ng kÕt hîp ®îc víi nhau. M« h×nh ©m

®Çu+vÇn cho phÐp gi¶m bít nhiÒu khã kh¨n cho viÖc ph©n ®o¹n, g¸n nh·n

trong qu¸ tr×nh lËp c¬ së d÷ liÖu vµ gi¶m bít yªu cÇu tÝnh to¸n cña m¸y khi

ph¶i ph©n ®o¹n tõ thu nhËn tõ Micro.

3. VÊn ®Ò nhËn d¹ng mÉu

Trong c¸c ph¬ng ph¸p nhËn d¹ng mÉu, ngêi ta th êng hay sö dông nhËn d¹ng

mÉu cho c¸c tõ ®¬n lÎ. HÖ thèng kh¸ ®¬n gi¶n do kh«ng ph¶i qua c¸c c«ng ®o¹n

ph©n ®o¹n vµ g¸n nh·n. Nh trªn ®· tr×nh bµy, ph¬ng ph¸p nµy th êng chØ ¸p

dông cho c¸c hÖ thèng nhËn d¹ng víi th viÖn tõ h¹n chÕ. Ta cã thÓ ¸p dông nhËn

d¹ng mÉu cho m« h×nh nhËn d¹ng theo ©m vÞ, hoÆc ©m ®Çu+vÇn. Víi ph ¬ng

ph¸p nµy, c¸c tõ ®îc ph©n ®o¹n, g¸n nh·n vµ tÝnh to¸n c¸c ®Æc tÝnh. ¢m thanh

thu ®îc còng sÏ ®îc ph©n ®o¹n vµ so s¸nh víi th viÖn mÉu vµ quyÕt ®Þnh lùa

chän mÉu cã ®Æc tÝnh gièng ®o¹n ©m thu ®îc nhÊt (h×nh 4). Do ©m thanh ®îc

t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau lu«n cã sù sai kh¸c bëi c¸c yÕu tè träng ©m,

ng÷ ®iÖu, tèc ®é... Do vËy ©m thanh thu ®îc cÇn ®îc so s¸nh víi ©m mÉu víi

Häc viÖn C«ng nghÖ BCVT

thuËt to¸n biÕn d¹ng DTW nh»m gi¶m thiÓu sai sè.

LÜnh vùc C«ng nghÖ th«ng tin

X

M N

I

Wl*

M U M

TÝn hiÖu ©m thanh vµo

TÝnh to¸n ®é sai sè ) D(X,Y

Ph©n ®o¹n G¸n nh·n §Æc t Ýnh

l

MÉu so s¸nh Y1, ....., Yl

H× nh 4: Nh Ën d¹ng t heo ph¬ ng ph¸ p so s¸ nh m Éu

4. ThuËt to¸n Dynamic Time Wraping (DTW)

{

}

2

Lw

= w ,... cã ®é dµi L vµ cã chuçi vector , ww 1

{

}

Tx

2

= ,... X ®Æc tÝnh , nhiÖm vô cña hÖ thèng lµ ph¶i nhËn d¹ng xem chuçi Cho chuçi ©m tiÕt ®Çu vµo , xx 1

©m ®Çu vµo lµ c¸c ký tù g× vµ trong qu¸ tr×nh xö lý cÇn ph¶i gi¶m thiÓu tèi ®a

c¸c sai sè quyÕt ®Þnh. Mçi tÝn hiÖu ©m tiÕt ®Çu vµo W l sÏ ®îc so s¸nh víi c¸c

mÉu Yl. Mçi Yl lµ chuçi c¸c vector ®Æc tÝnh cña tÝn hiÖu ©m tiÕt Wl . Nh»m

1, ,...,

, lMl

Y t¨ng kh¶ n¨ng nhËn d¹ng, mçi ©m tiÕt cã mét tËp hîp c¸c mÉu kh¸c nhau: Y l . Qu¸ tr×nh quyÕt ®Þnh ©m tiÕt phï hîp víi mét mÉu dùa theo nguyªn

*

t¾c sau:

ml ,

l = arg YXD ( , ) min m min l

Nh vËy ©m tiÕt Wl* lµ ©m tiÕt phï hîp nhÊt víi mÉu Yl t×m ®îc.

T ®îc x¸c ®Þnh b»ng tæng c¸c kho¶ng c¸ch côc bé

ij

j

( , yxd i trªn c¶ ®êng ®i cña qu¸ tr×nh biÕn d¹ng thêi gian. Kho¶ng c¸ch

ij

j

Kho¶ng c¸ch D(X,Y) gi÷a d÷ liÖu ®Çu vµo vµ d÷ liÖu mÉu Y=y 1….ys cã ®é dµi thêi gian kh¸c nhau S „ d = ) D = ... ... y ) yx , 1 i xD ( 1 ®îc x¸c ®Þnh theo c«ng thøc tÝch luü

I=J=0

(cid:236) 0 (cid:239)

{

}

,1

j

, ji

1

,1

j

1

ij

I>0, J>0 Kh¸ c

+ (cid:237) min , , D d - - - - D i D i (cid:239) ¥ (cid:238)

Häc viÖn C«ng nghÖ BCVT

Vµ kho¶ng c¸ch tæng D(X,Y)=D TS.

Héi nghÞ Khoa häc lÇn thø 5

{

}

3

Ia

= Gi¶ sö cho hai chuçi vec t¬ t ¬ng øng víi mÉu tÝn hiÖu lµ vµ a , , ,.... aaa 1 2 fi fi fi

{

}

Jb

= . Cho r»ng tÝn hiÖu mÉu b , , ,.... a cã chiÒu dµi lín h¬n mÉu b tøc lµ bbb 1 2 3

gi¸ trÞ (I > J ). ThuËt to¸n sÏ thùc hiÖn viÖc t×m ®êng ®i tèi u cña chuçi b theo

chuçi a (tøc lµ c¸c vÞ trÝ kh¸c nhau gi÷a hai chuçi theo thêi gian) sao cho tæng

chªnh lÖch gi÷a hai chuçi vec t¬ lµ nhá nhÊt.

§Ó thùc hiÖn ®îc ®iÒu nµy thuËt to¸n dïng ma trËn líi c¸c ®iÓm h×nh 5.

H×nh 1: L íi ma trËn

H×nh 5: Ma trËn líi c¸c ®iÓm

Hai chuçi vÐc t¬ sÏ t ¬ng øng víi hai c¹nh cña ma trËn. Gi¶ sö , vÐc t¬ a

theo trôc x vµ vÐc t¬ b theo trôc y. C¸c nót cña ma trËn t ¬ng øng víi kho¶ng c¸ch

tÝnh ®îc cña hai chuçi vÐc t¬ t¹i c¸c thêi ®iÓm thø i cña vÐc t¬ a t ¬ng øng thêi

®iÓm thø j cña vÐc t¬ b t ¬ng øng nót (i,j). Nh vËy, ®êng ®i tèi u trong ma trËn

sÏ cã d¹ng nh h×nh 6.

Häc viÖn C«ng nghÖ BCVT

H ×nh 6: H ×nh d¹ng ® êng ®i t r ong ma t r Ën

LÜnh vùc C«ng nghÖ th«ng tin

ViÖc x¸c ®Þnh ®êng ®i tèi u trong ma trËn líi ®îc thùc hiÖn sao tæng kho¶ng

c¸ch sai lÖch gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ nhá nhÊt. Ký hiÖu, d(i,j) lµ

®é chªnh lÖch cña hai vÐc t¬ a vµ b t¹i thêi ®iÓm i vµ j t ¬ng øng.

Yªu cÇu cña thuËt to¸n DTW cho hai chuçi vec t¬ bÊt kú lµ cïng b¾t ®Çu t¹i c¸c

vÞ trÝ (0,0) vµ kÕt thóc t¹i vÞ trÝ (I,J) . Gi¸ trÞ t¹i nót (0,0) x¸c ®Þnh b»ng 0.

§êng ®i ®îc x¸c ®Þnh theo c¸c cÆp nót liªn tiÕp (i k-1,j k-1) fi (i k,j k) . Dïng ký hiÖu

i k ®Ó biÓu diÔn chØ sè cña vÐc t¬ a t¹i thêi ®iÓm k vµ j k lµ chØ sè cña vÐc t¬

b t¹i thêi ®iÓm k. Nh vËy tæng kho¶ng c¸ch gi÷a hai chuçi vÐc t¬ lµ :

k

k

k

1

k

1

k

k

= + iD ( , j ) iD ( , j ) id ( , j ) - -

ViÖc t×m gi¸ trÞ min D(i,j) theo c«ng thøc sau:

=

]

+

[

* iD (

k

k

k

1

k

1

k

k

= km

, j ) min iD ( , j ) id ( , j ) - -

m

=

m

0

ø Ø = min ( id ) (cid:229) œ Œ , m j ß º

Mét sè b¾t buéc cña DTW:

- ChØ sè cña i ph¶i t¨ng ®Òu tøc lµ : i k - i k-1 =1

- ChØ sè cña j t¨ng theo i víi ®iÒu kiÖn: j k -j k-1 ‡ 0

Giíi h¹n cña ®êng ®i kh«ng thÓ tuú ý ®îc v× nh thÕ nã sÏ g©y ra kÕt qu¶ sai

lÖch vµ lµm t¨ng khèi lîng tÝnh to¸n (nÕu xÐt trªn toµn bé ma trËn ®iÓm). V×

vËy, cÇn ph¶i giíi h¹n ph¹m vi cña ®êng ®i sao cho viÖc tÝnh to¸n gi¶m vµ ®é

chÝnh x¸c cao. Ph¹m vi cho ®êng ®i ®îc chän nh h×nh vÏ 7:

Häc viÖn C«ng nghÖ BCVT

H×nh 3: §êng ®i trong ma trËn theo thuËt to¸n DTW

Héi nghÞ Khoa häc lÇn thø 5

H×nh 7: Ph¹m vi cho ®êng ®i

LuËt ®êng ®i ®îc lùa chän theo nh h×nh 8 :

H×nh 8: LuËt ®êng ®i

Gi¶ sö vÞ trÝ hiÖn t¹i ®ang ë thêi ®iÓm i k-1 vµ ®iÓm ®i tiÕp lµ i k. Nh vËy c¸c

gi¸ trÞ j k cã thÓ lµ j k, j k+1, j k+2 t ¬ng øng víi c¸c mòi tªn trªn ma trËn.

KÕt qu¶:

KÕt qu¶ ®îc so s¸nh víi ph¬ng ph¸p biÕn d¹ng kh¸c lµ biÕn d¹ng tuyÕn tÝnh

theo thêi gian hay cßn gäi lµ ®ång bé theo thêi gian víi thuËt to¸n biÕn d¹ng nh

sau:

ChØ sè theo thêi gian cña tÝn hiÖu b liªn quan ®Õn chØ sè theo thêi gian cña

j = i tÝn hiÖu a lµ : vµ kÕt qu¶ cho nh trªn h×nh 8. J I

Trªn h×nh vÏ thÓ hiÖn ®êng ®Æc tr ng cña ©m sè 2 (“hai ”) cã ®é dµi kh¸c nhau

(a) vµ (b).

Víi ph¬ng ph¸p biÕn d¹ng tuyÕn tÝnh th× gi¸ trÞ thêi gian chØ sè mÉu b ®îc

gi·n ®Òu theo chØ sè thêi gian cña mÉu tÝn hiÖu a. Nh vËy, hai kho¶ng thêi

gian ®îc kÐo d·n b»ng nhau song c¸c gi¸ trÞ th× vÉn cßn ®é sai lÖch lín do tû lÖ

biÕn d¹ng lµ ®Òu mµ kh«ng cã sù chän lùa theo gi¸ trÞ h×nh (c). ThÓ hiÖn viÖc

Häc viÖn C«ng nghÖ BCVT

kÐo gi·n t¹i c¸c ®iÓm cã ®êng nèi ngang gi÷a hai tÝn hiÖu.

LÜnh vùc C«ng nghÖ th«ng tin

Cßn sö dông thuËt to¸n DTW ta thÊy tû lÖ biÕn d¹ng kh«ng ®ång ®Òu t¹i c¸c

(a)

(b)

(c)

(d)

thêi ®iÓm tuú thuéc vµo gi¸ trÞ tÝch luü tõ tr íc nªn hai mÉu so s¸nh sÏ cã ®é

tuyÕn tÝnh theo thêi gian.

H×nh 8. BiÓu diÔn t huËt t o¸n biÕn d¹ng ©m “hai ” (a)(b) Hai t Ýn hiÖu cã chiÒu dµi kh¸c nhau. (c) BiÕn d¹ng t uyÕn t Ýnh t heo t hêi gian (d) BiÕn d¹ng DTW

chªnh lÖch lµ nhá nhÊt h×nh (d), c¸c ®êng nèi chÐo thÓ hiÖn sù biÕn d¹ng kh«ng

5. KÕt luËn

Trªn ®©y lµ øng dông cña thuËt to¸n DTW cho hÖ thèng nhËn d¹ng tiÕng

nãi ®ang ®îc nghiªn cøu vµ triÓn khai. øng dông luËt ®êng ®i vµ c¸ch x¸c ®Þnh

®êng giíi h¹n cho thuËt to¸n DTW ®· gãp phÇn n©ng cao chÊt l îng cña bé nhËn

d¹ng. Tuy nhiªn, luËt ®êng ®i vµ giíi h¹n cña ®êng ®i cßn cã thÓ cã nhiÒu d¹ng

kh¸c cÇn nghiªn cøu thªm, song víi øng dông nhËn d¹ng mÉu rêi r¹c th× luËt ®-

Häc viÖn C«ng nghÖ BCVT

êng ®i x¸c ®Þnh theo ph¬ng ph¸p trªn lµ cã chÊt lîng h¬n c¶.

Héi nghÞ Khoa häc lÇn thø 5

Tµi liÖu tham kh¶o

[1]. §oµn ThiÖn ThuËt - Ng÷ ©m tiÕng ViÖt, Nhµ xuÊt b¶n §¹i häc vµ Trung

häc chuyªn nghiÖp, Hµ néi. 1977

[2]. H.Sakoe and S.Chiba - Dynamic programming optimization for spoken word

recognition. 1978.

[3]. Hoang Tue and Hoang Minh, “Remarks on the phonological Structure of

vietnamese”, Vietnamese Studies, Ha noi, 1979

[4]. Lawrence Rabiner, Biing – Hwang Juang; Fundamentals of speech

recognition. 1999.

[5]. R. M Gray, A. Buzo, A.H.Gray, Jr., and Y. Matsuyama - Distortion measures

for speech processing. 1980.

S¬ lîc t¸c gi¶

§oµn Phan Long, Tèt nghiÖp §¹i häc t¹i tr êng ®¹i häc tæng hîp Karl- Marx-

Stadt –CHLB §øc t¹i Thµnh phè Chemnitz khoa tù ®éng ho¸, chuyªn ngµnh

®iÒu khiÓn häc n¨m 1985, hiÖn nay c«ng t¸c t¹i Trung t©m C«ng nghÖ Th«ng

tin – CDIT, Häc viÖn C«ng nghÖ Bu chÝnh ViÔn th«ng – Tæng C«ng ty BCVT

ViÖt nam. Nh÷ng vÊn ®Ò ®ang quan t©m bao trïm c¸c lÜnh vùc tù ®éng nhËn

d¹ng tiÕng nãi, h×nh ¶nh... vµ tæng hîp tiÕng nãi ¸p dông trong c¸c hÖ thèng

Häc viÖn C«ng nghÖ BCVT

cung cÊp dÞch vô trong ngµnh Bu chÝnh-ViÔn th«ng.