LÜnh vùc C«ng nghÖ th«ng tin
¸p dông thuËt to¸n Dynamic Time wraping (dtW)
cho øng dông nhËn d¹ng mÉu TiÕng ViÖt
ThS.§oµn Phan
Long
Trung t©m C«ng nghÖ th«ng tin
Tãm t¾t: Tù ®éng nhËn d¹ng tiÕng nãi (Automatic Speech Recognition ASR) lµ
mét lÜnh vùc nghiªn cøu quan träng ®Ó ®a c¸c øng dông tiÕng nãi vµo nhiÒu
ngµnh. Mét vÊn ®Ò liªn quan cÇn nghiªn cøu trong lÜnh vùc nµy ®îc dùa trªn
c¬ së l u tr÷ mét hoÆc nhiÒu mÉu tÝn hiÖu cho mçi tõ cÇn nhËn d¹ng. Qu¸
tr×nh nhËn d¹ng lµ qu¸ tr×nh thùc hiÖn viÖc so s¸nh hai mÉu tÝn hiÖu cña
cïng mét ©m ®Ó tÝm ra mÉu cã sai sè nhá nhÊt. Bëi v× tÝn hiÖu ©m thanh ®îc
t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau kh«ng bao giõo gièng nhau hoµn toµn. Nã lu«n
cã sù sai lÖch do c¸c yÕu tè vÒ träng ©m, ng÷ ®iÖu, tèc ®é,... V× vËy cÇn ph¶i
thùc hiÖn sã s¸nh hai mÉu theo c¸c thuËt to¸n biÕn d¹ng nh»m gi¶m thiÓu sai
sè. ThuËt to¸n DTW (Dynamic Time Wraping) lµ thuËt to¸n hiÖu qu¶ nhÊt cho
viÖc øng dông sao s¸nh hai mÉu tÝn hiÖu cã chiÒu dµi kh¸c nhau vµ cho sai sè
nhá nhÊt [4]. Tuy nhiªn viÖc øng dông DTW cã nhiÒu híng kh¸c nhau vµ cho c¸c
kÕt qu¶ kh¸c nhau, viÖc lùa chän ph¬ng ph¸p ¸p dông cã hiÖu qu¶ ®èi víi ng«n
ng÷ tiÕng ViÖt lµ mét vÊn ®Ò cÇn quan t©m.
Më ®Çu:
HiÖn nay víi sù trî gióp cña c¸c hÖ thèng m¸y tÝnh cã rÊt nhiÒu xu híng
nh»m ¸p dông c¸c m« h×nh ng«n ng÷ trong c¸c hÖ thèng sö dông c«ng nghÖ nhËn
d¹ng tiÕng nãi, trong ®ã cã thÓ kÓ ®Õn nh m« h×nh tõ, ©m tiÕt vµ m« h×nh
©m vÞ, m« h×nh ©m ®Çu+vÇn. ViÖc lùa chän c¸c m« h×nh nµy ®Ó gi¶i quyÕt
c¸c bµi to¸n cô thÓ phô thuéc vµo yªu cÇu cña c¸c øng dông. Nã quyÕt ®Þnh ®Õn
®é phøc t¹p, tÝnh bao trïm vµ chÊt l îng cña hÖ thèng. HÖ thèng nhËn d¹ng ¸p
dông c¸c m« h×nh ng«n ng÷ trªn ®Òu cã thÓ sö dông c«ng nghÖ nhËn d¹ng mÉu
theo tõ, ©m tiÕt, ©m vÞ hoÆc theo c¸c ©m ®Çu vµ vÇn. §Ó cã thÓ so s¸nh gi÷a
tÝn hiÖu ®Çu vµo vµ mÉu, ngêi ta th êng ph¸p ¸p dông thuËt to¸n DTW.
ThuËt to¸n DTW ®îc øng dông ®Ó gi¶i quyÕt viÖc so s¸nh gi÷a hai mÉu tÝn
Häc viÖn C«ng nghÖ BCVT
hiÖu cã ®é dµi kh¸c nhau theo thêi gian. Nh ta biÕt, kÕt qu¶ cña qu¸ tr×nh
Héi nghÞ Khoa häc lÇn thø 5
ph©n tÝch tÝnh hiÖu theo ph¬ng ph¸p m· ho¸ dù b¸o tuyÕn tÝnh (Linear
Predictive Coding LPC) hay ng©n hµng bé läc (Filter Bank) bao giê còng cho ta
kÕt qu¶ d¹ng chuçi c¸c vÐct¬ ®Æc tr ng. §é dµi cña chuçi vÐc t¬ nµy phô thuéc
vµo ®é dµi cña cña hai tÝn hiÖu mµ ta ph©n tÝch. Nh vËy, qu¸ tr×nh so s¸nh
hai tÝn hiÖu sÏ t ¬ng øng víi qu¸ tr×nh so s¸nh 2 chuçi vÐc t¬ ®Æc tr ng cña hai
tÝn hiÖu. ThuËt to¸n DTW sÏ thùc hiÖn viÖc so s¸nh 2 chuçi vÐc t¬ nµy theo
mét sè luËt sao cho tæng ®é lÖch gi÷a hai chuçi lµ nhá nhÊt t ¬ng øng víi ®êng
®i gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ tèi u nhÊt. ViÖc chän lùa luËt chän ®-
êng ®i vµ giíi h¹n biªn cña c¸c ®êng ®i sÏ cho ta kÕt qu¶ tÝnh to¸n lµ nhá nhÊt
vµ hiÖu qu¶ nhÊt.
1 Kh¸i qu¸t vÒ tiÕng ViÖt
1.1) C¸c d©n téc vµ ng«n ng÷ ë ViÖt Nam
Trong sè 54 d©n téc ë ViÖt Nam th× d©n téc ViÖt (cßn gäi lµ Kinh)
chiÕm sè lîng tuyÖt ®èi, tæng sè d©n lªn tíi trªn 70 triÖu ngêi. D©n téc Tµy cã
1,2 triÖu, d©n téc Th¸i trªn 1 triÖu, c¸c d©n téc Hoa, Kh¬ me, M êng, C¬ Ho,
Chµm, S¸n D×u trªn 900 ngh×n ngêi.
C¨n cø vµo ng«n ng÷, ch÷ viÕt ta cã thÓ ph©n bè c¸c thµnh phÇn d©n téc nh
sau:
TiÕng N«m - Kh¬me. Gåm nhiÒu nhãm ngêi ë T©y B¾c, T©y Nguyªn,
Qu¶ng TrÞ vv...
TiÕng Th¸i. Gåm ngêi Th¸i T©y B¾c, Thîng du Thanh Hãa, NghÖ An, khu
ViÖt B¾c, Qu¶ng Ninh. Ngoµi ra cßn cã nhãm ngêi Gi¸y, Cao Lan, Lù vv...
TiÕng Anh-®«-nª-diªng. Gåm ngêi Chµm, Gia rai, £-®ª (T©y Nguyªn).
TiÕng MÌo-Dao. Gåm ngêi MÌo Dao (ViÖt B¾c, Hßa B×nh Thanh Hãa)
TiÕng T¹ng - MiÕn: Gåm ngêi L« L« (Hµ Giang), Hµ Nh×, La Khu, Cèng,
Xila (T©y B¾c).
TiÕng H¸n: Ngêi Hoa (Qu¶ng Ninh), S¸n D×u (B¾c Giang, B¾c C¹n, Th¸i
Nguyªn vv....).
TiÕng ViÖt lµ ng«n ng÷ céng ®ång cña d©n téc ViÖt vµ còng lµ c«ng cô giao
tiÕp chung cho c¸c d©n téc sèng trong níc ViÖt Nam. NhiÒu c«ng tr×nh nghiªn
Häc viÖn C«ng nghÖ BCVT
cøu theo ph¬ng ph¸p lÞch sö so s¸nh ®Òu ®i ®Õn kÕt luËn c¸c ng«n ng÷ ë ViÖt
LÜnh vùc C«ng nghÖ th«ng tin
Nam thuéc vµo c¸c hä H¸ n T¹ng, Th¸ i, MÌo-Dao, Nam §¶o, Nam ¸ ; riªng t iÕng
ViÖt t huéc hä t iÕng Nam ¸ . Hä Nam ¸ (aust roasiat ique) lµ mét hä ng«n ng÷ kh¸
lín bao gåm mét phÇn Ên ® é, mét phÇn Malaysia, mét phÇn MiÕn ® iÖn, phÇn
lín Cam puchia, phÇn lín ViÖt Nam . Hä nµy l¹i ph© n t hµnh nhiÒu nhãm: ViÖt -
M êng, M«ng-Khm er, Kh¬ mó, C¬ t u, Bana, Mn«ng, Ka® ai.
Hä Nam §¶o (aust ronesien hay malayo-polyesien) còng lµ mét hä lín, víi
nhiÒu ng«n ng÷ , t rªn mét khu vùc réng bao gåm quÇn ® ¶o Madagascar,
Malaysia, Indonesia, Philippines, New Guinea, Taiwan vµ phÝa Nam ViÖt
Nam . VÒ ng«n ng÷ thuéc hä nµy ë ViÖt Nam cã Chµm , Raglai, Chru, £® ª,
Giarai, t Êt c¶ ® Òu thuéc nhãm Ch¨ m.
Hä H¸ n T¹ng bao gåm t iÕng Hoa vµ mét sè ng«n ng÷ phÝa T© y nam Trung
hoa vµ phÇn lín MiÕn §iÖn. C¸ c ng«n ng÷ thuéc hä nµy ë ViÖt Nam bao gåm L«
L«, Phï L¸ , Hµ Nh× , La Hñ, Cèng, Si La t huéc nhãm T¹ng-MiÕn, c¸c t iÕng Hoa,
S¸ n ChØ, S¸ n D× u thuéc nhãm H¸ n.
1.2) Vµi nÐt vÒ lÞch sö ph¸t triÓn cña tiÕng ViÖt
Theo mét sè tµi liÖu nghiªn cøu th× tiÕng ViÖt thêi th îng cæ lµ thø tiÕng
cha cã thanh ®iÖu. HÖ thèng phô ©m ®Çu trong tiÕng ViÖt cã nh÷ng phô ©m
®¬n vµ phô ©m kÐp nh bl, tl, pr, pl ... C¸c ©m cuèi bÞ mÊt dÇn mét sè trong qu¸
tr×nh ph¸t triÓn (nh ©m cuèi l mÊt ®i, ©m cuèi r chuyÓn thµnh i), nãi riªng ©m
h mÊt ®i vµ xuÊt hiÖn dÊu ng· trong tiÕng ViÖt.
HÖ thèng thanh ®iÖu ®· xuÊt hiÖn dÇn. Vµo ®Çu c«ng nguyªn, tiÕng
ViÖt cha cã thanh ®iÖu, ®Õn thÕ kØ VI xuÊt hiÖn ba thanh vµ ®Õn thÕ kØ
XII míi cã ®ñ s¸u thanh nh hiÖn nay. Sù biÕn ®æi cña ©m ®Çu vµ cuèi lµ
nguyªn nh©n lµm xuÊt hiÖn hÖ thèng thanh ®iÖu trong tiÕng ViÖt.
Sù biÕn ®æi trong hÖ thèng c¸c ©m ®Çu diÔn ra t ¬ng ®èi râ h¬n trong
hÖ thèng nguyªn ©m: ©m v« thanh chuyÓn thµnh h÷u thanh (p V b, t ô d vµ k
g). C¸c phô ©m kÐp kl, tl, bl, khl ... mÊt dÇn, lµm xuÊt hiÖn c¸c ©m uèn l ìi tr
vµ s (tl¨m h tr¨m (thÕ kØ 17); bl¨ng . tr¨ng (thÕ kØ 18), khl«ng (thÕ kØ 15) (cid:137)
s«ng (thÕ kØ 17), nhãm ml chuyÓn thµnh l hoÆc nh (nlÇm h lÇm, nhÇm, mlÏ
lÏ, nhÏ)
Kho tõ vùng tiÕng ViÖt phong phó víi nh÷ng tõ c¬ b¶n cã nguån gèc Nam
Häc viÖn C«ng nghÖ BCVT
¸ vµ Tµy Th¸i cæ. Kho tõ vùng trong qu¸ tr×nh ph¸t triÓn cßn tiÕp nhËn vµ
Héi nghÞ Khoa häc lÇn thø 5
t huÇn ho¸ c¶ vÒ ng÷ © m lÉn ý nghÜa mét bé phËn kh¸ nhiÒu tõ gèc H¸ n (nh
®òa, ®ôc, mu«n, mòi, mãc, mïa...).
HÖ thèng ng÷ ph¸p tá ra bÒn v÷ng h¬n hÖ thèng tõ vùng, trËt tù có ph¸p, trËt
tù tæ hîp tõ gi÷ ®Æc ®iÓm riªng cña tiÕng ViÖt.
1.3) Mét sè ®Æc ®iÓm cña tiÕng ViÖt
TiÕng ViÖt lµ lo¹i h×nh ng«n ng÷ ®¬n lËp (ng«n ng÷ kh«ng biÕn h×nh -
amorphous) vµ cã thanh ®iÖu. TiÕng ViÖt lµ tiÕng ®¬n ©m cã ranh giíi cè
®Þnh, mang thanh ®iÖu, cã cÊu tróc ®¬n gi¶n, thanh ®iÖu vµ cã ©m tiÕt trïng
víi h×nh vÞ, ®¬n vÞ nhá nhÊt cã tæ chøc mang ý nghÜa ng÷ ph¸p. Do mçi ©m
tiÕt lµ vá ng÷ ©m cña h×nh vÞ nªn kh¸c víi c¸c ng«n ng÷ ¢u-Ên, tiÕng ViÖt cã sè
lîng ©m tiÕt h÷u h¹n víi 17.000 vá ng÷ ©m vµ 6.900 ©m tiÕt tån t¹i thùc [3].
¢m tiÕt, h×nh vÞ trong tiÕng ViÖt lµ cè ®Þnh, kh«ng biÕn ®æi h×nh th¸i
theo ng÷ ph¸p vµ thêi, gièng vµ sè nh c¸c ng«n ng÷ kh¸c. Tõ th êng cã hai lo¹i lµ
®¬n tiÕt vµ ®a tiÕt. Mét phÇn rÊt lín tõ ®a tiÕt lµ H¸n ViÖt (kÓ c¶ tõ míi).
Trong c¸c tõ ®a tiÕt th êng cã d¹ng l¸y ©m hoÆc ghÐp c¸c tõ ®¬n tiÕt. ¢m tiÕng
ViÖt cã cÊu tróc chÆt chÏ víi c¸c lo¹i ©m ë c¸c vÞ trÝ cè ®Þnh trong thµnh phÇn
©m tiÕt.
TiÕng ViÖt lµ ng«n ng÷ cã thanh ®iÖu, tiÕng ViÖt cã 6 thanh (tiÕng
Th¸i, Lµo cã 5 thanh, tiÕng H¸n 4 thanh, tiÕng MiÕn §iÖn 3 thanh, Trung Quèc
cã 4 thanh) lµ ngang (kh«ng dÊu), huyÒn, ng·, hái, s¾c vµ nÆng. Mçi thanh
®Òu cã thÓ tham gia vµo viÖc cÊu t¹o tõ vµ t¹o nghÜa cho tõ. Thanh ®iÖu
tiÕng ViÖt cã tÝnh nh¹c, c©u v¨n cã vÇn, nhÞp ®iÖu, trÇm bæng nhÞp nhµng.
Mçi ©m tiÕt ®Òu mang mét thanh ®iÖu nhÊt ®Þnh. Thanh ®iÖu kÕt hîp víi
thµnh phÇn cña ©m tiÕt t¹o thµnh c¸c tõ kh¸c nhau, vÝ dô nh /ma, mµ, m¸, m¶,
m·, m¹/. Trong tiÕng ViÖt kh«ng ph¶i vÇn nµo còng ph¸t ©m ®îc ®ñ s¸u thanh.
§èi víi ©m tiÕt ®ãng chØ cã hai thanh lµ s¾c vµ nÆng
¢m tiÕt tiÕng ViÖt ë d¹ng ®Çy ®ñ bao gåm 3 thµnh phÇn cã møc ®é ®éc
lËp kh¸c nhau lµ ©m ®Çu (phô ©m), phÇn vÇn vµ thanh ®iÖu. Víi phÇn vÇn
bao gåm 3 thµnh phÇn lµ ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m
®¬n hoÆc nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m).
Trong ®ã nguyªn ©m vµ thanh ®iÖu lµ h¹t nh©n cña ©m tiÕt. Trõ phô ©m ®Çu,
Häc viÖn C«ng nghÖ BCVT
phÇn cßn l¹i cña ©m tiÕt tiÕng ViÖt ®îc gäi lµ vÇn. TiÕng ViÖt cã 512 vÇn
LÜnh vùc C«ng nghÖ th«ng tin
(Theo t hèng kª t rong mét sè t µi liÖu cña GS. Hoµng Phª). VÇn vµ thanh t¹o nªn
sù hµi hoµ vÒ ng÷ © m vµ ng÷ nghÜa t rong c¸c tõ t îng h× nh, t îng t hanh.
Tõ song t iÕt chiÕm phÇn kh¸ lín t rong tæng sè tõ. Tõ ghÐp ® a t iÕt chia
ra t hµnh c¸c lo¹i tõ ghÐp nghÜa, tõ l¸ y, tõ ghÐp t ù do, c¸c tõ vay mîn níc ngoµi.
Vèn tõ vùng t iÕng ViÖt bao gåm c¸c tõ, c¸c t hµnh ng÷ , thuËt ng÷ . Mét bé phËn
tõ t iÕng ViÖt cã gèc H¸ n.
Ph ¬ ng t iÖn biÓu hiÖn ý nghÜa ng÷ ph¸ p t rong t iÕng ViÖt lµ t rËt t ù c¸c
t hµnh tè (tõ vµ c© u), ng÷ ® iÖu, d¹ng l¸ y, ng÷ c¶nh. Tõ vµ côm tõ lµ c¸c ® ¬ n vÞ
cÊu t¹o nªn c© u.
Ng«n ng÷ nãi vµ ng«n ng÷ viÕt kh«ng c¸ch xa nhau vÒ qui t¾c ng÷ © m, ng÷
ph¸p.
Mèi quan hÖ gi÷a ch÷ c¸i, thanh vµ ©m tiÕt, tõ
1.4)
- ChØ c¸c nguyªn ©m míi cã quyÒn mang dÊu thanh trong biÓu diÔn ©m tiÕt
hay tõ.
- Mçi nguyªn ©m cã thÓ ®îc mang nhiÒu nhÊt lµ mét trong c¸c dÊu thanh
trªn.
- C¸c dÊu thanh: huyÒn, hái, ng·, s¾c ®îc ®Æt ë phÝa trªn cña nguyªn ©m
mang dÊu. DÊu nÆng ®îc ®Æt ë phÝa díi nguyªn ©m mang dÊu.
- C¸c ©m tiÕt ch÷ ViÖt ®îc t¹o ra trªn c¬ së biÓu diÔn h×nh ¶nh cho c¸c ©m
ph¸t ra cã mang thanh ®iÖu. Mçi ©m tiÕt ®Òu ®îc biÓu diÔn b»ng viÖc viÕt
liÒn c¸c ch÷ c¸i m« t¶ cho ©m tiÕt ®ã vµ ®îc mang nhiÒu nhÊt lµ mét thanh,
®Æt trªn mét nguyªn ©m. C¸c ©m tiÕt t¸ch lÉn nhau b»ng dÊu c¸ch.
- Thanh lµ thuéc tÝnh cña ©m tiÕt, kh«ng ph¶i lµ thuéc tÝnh cña nguyªn ©m.
Thanh ®îc ®Æt vµo vÞ trÝ cña nguyªn ©m ®Ó ph©n biÖt trong c¸ch ph¸t
©m.
- Mét tõ trong tiÕng ViÖt lµ mét ®¬n vÞ ng÷ nghÜa, mang mét ý nghÜa nµo
®ã, vµ bao gåm mét hai, ba hay nhiÒu ©m tiÕt.
- Dùa trªn c¸ch biÓu diÔn ch÷ ViÖt theo ch÷ c¸i vµ thanh nµy, cã thÓ nªu ra ®-
îc c¸c tËp sinh kh¸c cho ch÷ ViÖt, nh:
TËp sinh díi d¹ng tæ hîp cña c¸c phô ©m ®Çu vµ vÇn theo sau
TËp sinh víi 33 ch÷ c¸i vµ 5 thanh
TËp sinh víi c¸c phô ©m ®Çu vµ kho¶ng 800 vÇn
- MÆc dÇu c¸ch biÓu diÔn theo phô ©m vµ vÇn cã thÓ cã mét sè Ých lîi trong
Häc viÖn C«ng nghÖ BCVT
xö lÝ nhng Ých lîi ®ã khã bï ®îc cho nh÷ng bÊt lîi mµ nã ®em l¹i nh:
Héi nghÞ Khoa häc lÇn thø 5
Víi ® Æc t hï ph¸ t © m cña t iÕng ViÖt khã biÓu diÔn nh÷ ng t× nh huèng
cã chen lÉn t iÕng ViÖt vµ kh«ng ph¶i t iÕng ViÖt .
ViÖc lµm nµy ® i ngîc víi xu t hÕ hoµ ® ång c¸c ng«n ng÷ t rªn thÕ giíi, do
® ã khã kh¨ n cho viÖc t iÕp t hu nh÷ ng t iÕn bé c«ng nghÖ m íi.
1.5) Ch÷ viÕt
Theo c¸c tµi liÖu lÞch sö §¹i ViÖt sö l îc, An nam chÝ nguyªn, ViÖt sö th«ng gi¸m
tæng luËn th× ®Òu cã chÐp thêi Hïng v¬ng "chÝnh sù dïng lèi kÕt nót." Tuy
nhiªn cha cã tµi liÖu nµo cho biÕt râ h¬n vÒ viÖc khi nµo cã ch÷ viÕt ®îc b¾t
®Çu dïng ë ViÖt Nam. ViÖc sö dông ch÷ H¸n ®i kÌm víi viÖc v¨n ho¸ Trung quèc
lan xuèng phÝa Nam ®Õn cïng víi viÖc chinh phôc vµ th«n tÝnh ®Êt ®ai cña c¸c
triÒu ®¹i phong kiÕn Trung quèc.
1.6) CÊu tróc ©m tiÕt trong tiÕng ViÖt
Nh ®· nªu trªn, ¢m tiÕt cña tiÕng viÖt ë d¹ng ®Çy ®ñ ®îc t¹o bëi 5 thµnh phÇn
lµ phô ©m ®Çu, ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m ®¬n hoÆc
nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m) vµ thanh ®iÖu.
VÒ cÊu tróc, ©m tiÕt tiÕng ViÖt cã cÊu tróc hai bËc. BËc mét gåm ba thµnh
phÇn lµ thanh ®iÖu, phô ©m ®Çu vµ vÇn. BËc hai lµ c¸c thµnh tè cña phÇn
vÇn gåm ©m ®Öm lµ b¸n nguyªn ©m, nguyªn ©m chÝnh vµ phô ©m hoÆc b¸n
nguyªn ©m cuèi. C¸c thµnh phÇn ©m tiÕt ®îc thÓ hiÖn ë h×nh 1.
Thanh ®iÖu
¢m ®Çu VÇn
¢m ®Öm ¢m chÝnh ¢m cuèi
H×nh 1: S¬ ®å ©m tiÕt tiÕng ViÖt
1.6.1) ¢m ®Çu
Phô ©m më ®Çu ©m tiÕt gåm cã 22 vÇn. C¸c phô ©m ®Çu ®îc ph©n biÖt
theo c¸c tiªu chÝ vÒ ph¬ng thøc cÊu ©m (t¾c, x¸t), vÒ thanh tÝnh (vang, ån)...
phô ©m vang ®îc ph©n biÖt gi÷a phô ©m mòi vµ phô ©m bªn (phô ©m kh«ng
mòi). Trong phô ©m ån ®îc chia thµnh lo¹i ©m v« thanh vµ ©m h÷u thanh. Nh
vËy ph©n theo líp ng÷ ©m r«ng ta cã thÓ chia phô ©m ®Çu tiÕng ViÖt thµnh
b¶y lo¹i theo h×nh 2 díi ®©y.
Ph¬ng thøc cÊu ©m C¸c phô ©m
Häc viÖn C«ng nghÖ BCVT
T¾c V« thanh BËt h¬i th
LÜnh vùc C«ng nghÖ th«ng tin
ån Kh«ng bËt h¬ i (p), t, t r, ch, k, c
H÷ u thanh b, ®
X¸ t V« t hanh ph, x, s, kh
H÷ u thanh v, d, r, g-gh, h
Vang
Mòi m , n, nh, ng-ngh
Kh«ng mòi l
H× nh 2: Ph© n lo¹i phô © m ® Çu
1.6.2) PhÇn vÇn
PhÇn vÇn cã 3 thµnh phÇn lµ ©m ®Öm, ©m chÝnh vµ ©m cuèi. VÝ dô ©m
tiÕt /to¸n/ cã phÇn vÇn lµ oan, trong ®ã ©m vÞ ©m ®Öm lµ /o/, ©m chÝnh lµ /a/
vµ ©m cuèi lµ /n/.
-
¢m ®Öm ®ãng vai trß lµm biÕn ®æi ©m s¾c cña ©m tiÕt nh ng nã kh«ng t¹o
nªn ®Ønh cña ©m tiÕt. ¢m ®Öm ®îc viÕt b»ng ch÷ c¸i /o/ khi ®øng tr íc 3
nguyªn ©m /e/, /a/, /¨/ vµ b»ng ch÷ c¸i /u/ trong c¸c tr êng hîp cßn l¹i. NÕu ®øng
sau phô ©m ®Çu /k/ th× chØ ®îc viÕt lµ /u/ vµ /k/ ®îc viÕt lµ /q/
-
¢m chÝnh lµ mét ©m trong hÖ thèng nguyªn ©m gåm 11 nguyªn ©m ®¬n lµ
/a/, /¨/, /©/, /e/, /ª/, /o/, /«/, /¬/, /u/, //, /i/ vµ 3 nguyªn ©m ®«i lµ /iª/, /¬/, /a/. ¢m
chÝnh lµ yÕu tè t¹o nªn ®Ønh ©m tiÕt, cã biªn ®é vµ cêng ®é lín nhÊt trong
c¸c thµnh phÇn ©m tiÕt.
-
¢m cuèi lµ ©m kÕt thóc ©m tiÕt. Nã biÕn ®æi ©m s¾c cña ©m chÝnh do t¸c
®éng t¸c khÐp l¹i cña bé m¸y ph¸t ©m. HÖ thèng ©m cuèi trong tiÕng ViÖt
gåm hai b¸n nguyªn ©m lµ /i/ vµ /o/ vµ s¸u phô ©m. C¸c phô ©m nµy lµ /m/,
/n/, /ng (nh)/, /p/, /t/, /c/.
1.6.3) Thanh ®iÖu
Thanh ®iÖu lµ lo¹i ©m vÞ siªu ®o¹n tÝnh, nã ®îc biÓu hiÖn trong tiµn bé phÇn
h÷u thanh cña ©m tiÕt. ë møc vËt lý, phÇn thanh cña thanh ®iÖu chÝnh lµ ®-
êng nÐt cña tÇn sè ©m c¬ b¶n F 0. VÒ c¶m thô, thanh ®iÖu lµ sù c¶m nhËn vÒ
Häc viÖn C«ng nghÖ BCVT
®é thay ®æi cao ®é tÇn sè c¬ b¶n F0 cña ©m tiÕt.
Héi nghÞ Khoa häc lÇn thø 5
S¸ u thanh ® iÖu t rong t iÕng ViÖt ®îc chia t hµnh hai nhãm lín lµ b»ng vµ t r¾c.
Thanh kh«ng dÊu vµ t hanh huyÒn t huéc lo¹i t hanh b»ng cã ®êng nÐt t ¬ ng ® èi
® ¬ n gi¶n. Thanh ng·, thanh hái, t hanh s¾c vµ thanh nÆng lµ nh÷ ng t hanh
t r¾c cã ®êng nÐt thanh ® iÖu phøc t¹p. C¸ c t hanh ngang, s¾c, ng· t huéc © m vùc
cao cßn c¸c © m huyÒn, hái vµ nÆng thuéc © m vùc thÊp.
Ngoµi t Ýnh chÊt thanh t Ýnh, c¸c thanh ® iÖu cßn cã mét sè ® Æc t r ng phi ® iÖu
t Ýnh nh hiÖn t îng yÕt hÇu ho¸, thanh hÇu ho¸ ... t¹o t hµnh c¸c hÖ t hèng c¸c
® Æc t r ng phô ® Ó ph© n biÖt c¸c thanh ® iÖu ® Æc biÖt cña thanh ng· vµ s¾c,
t hanh hái vµ t hanh nÆng.
1.6.4) Lo¹i ©m tiÕt
Phô thuéc vµo c¸ch thøc kÕt thóc, ©m tiÕt tiÕng ViÖt ®îc chia thµnh 4 lo¹i nh
sau:
• ¢m tiÕt më: Lµ lo¹i ©m tiÕt kh«ng cã ©m cuèi, kÕt thóc ©m tiÕt b»ng
nguyªn ©m chÝnh, vÝ dô cha, mÑ
• ¢m tiÕt nöa më: Khi ©m cuèi kÕt thóc ©m tiÕt lµ mét b¸n nguyªn ©m, vÝ
dô mai, sau
• ¢m tiÕt nöa ®ãng: Khi ©m cuèi lµ mét phô ©m mòi /n/, /m/, /ng/, /nh/, vÝ
dô lµm, ngµnh, m«ng.
• ¢m tiÕt ®ãng: Khi ©m cuèi lµ mét phô ©m t¾c v« thanh /p/, /t/, /c/, vÝ dô:
tËp, häc, mÖt.
2. §¬n vÞ nhËn d¹ng c¬ b¶n cho c¸c hÖ thèng nhËn d¹ng lêi ViÖt
2.1. M« h×nh tõ vµ ©m tiÕt
ViÖc lùa chän tõ lµm ®¬n vÞ nhËn d¹ng lµ ph¬ng ph¸p th«ng th êng vµ dÔ
dµng nhÊt, nã bao trïm ®îc tÝnh biÕn thÓ ©m vÞ. §èi víi mét sè øng dông nhËn
d¹ng tiÕng nãi cÇn sè tõ kh«ng lín nh hÖ thèng ®iÒu khiÓn häc, ®Õm sè ... cã
thÓ ¸p dông tèt m« h×nh tõ ®Ó nhËn d¹ng do dÔ dµng thu thËp ®ñ sè mÉu
huÊn luyÖn cho mçi tõ. Xem h×nh 3 díi ®©y.
Trong tÊt c¶ c¸c ng«n ng÷, tõ lµ ®¬n vÞ tù nhiªn nhá nhÊt cña tiÕng nãi
vµ tõ lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng tiÕng nãi. TiÕng ViÖt lµ ng«n ng÷
®¬n ©m tiÕt. Trong tiÕng ViÖt, ©m tiÕt lµ nh÷ng ®¬n vÞ ©m thanh nhá nhÊt
vµ nh vËy ©m tiÕt lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng lêi ViÖt. Do vËy nã
cã thÓ ®îc lùa chän lµm ®¬n vÞ nhËn d¹ng tiÕng nãi cho c¸c øng dông nhËn
Häc viÖn C«ng nghÖ BCVT
d¹ng lêi ViÖt. Tuy nhiªn, do trong tiÕng ViÖt, sè l îng ©m tiÕt rÊt lín trªn 10.000
LÜnh vùc C«ng nghÖ th«ng tin
© m t iÕt nªn r Êt khã cã t hÓ ¸p dông cho c¸c hÖ t hèng nhËn d¹ng t iÕng viÖt cì
lín do viÖc thu thËp m Éu t iÕng nãi cÇn thiÕt cho c¸c © m t iÕt sÏ gÆp nhiÒu
khã kh¨ n do sã l îng m Éu qu¸ lín vµ thêi gian xö lý so s¸ nh, lùa chän m Éu t rong
c¬ së d÷ liÖu l© u. Ngoµi ra , mçi m Éu huÊn luyÖn cña mét © m t iÕt chØ cã t hÓ
sö dông ® Ó huÊn luyÖn vµ so s¸ nh lùa chän cho chÝnh © m t iÕt ® ã chø kh«ng
t hÓ sö dông chung ® Ó huÊn luyÖn vµ lùa chän cho c¸c © m t iÕt kh¸ c. Xong bï l¹i,
ph¬ ng ph¸ p nµy cã nhiÒu ® ¬ n gi¶n do kh«ng cÇn ph¶i sö dông mét sè c¸c ph¬ ng
§ång hå b¸o t høc 1
§iÒu khiÓn häc (cã/kh«ng)
§Õm, sè 10 + x
ph¸p ® Ó ph© n ® o¹n vµ g¸ n nh·n.
H× nh 1.1. Sè tõ t rong c¸c øng dông cô thÓ
H× nh 3. Vèn tõ t rung b× nh theo c¸c øng dông
2.2. M« h×nh ©m vÞ
Nh»m gi¶m bít sè l îng mÉu huÊn luyÖn, nhËn d¹ng vµ ®Ó sö dông chung c¸c
mÉu nµy, m« h×nh ©m vÞ th êng ®îc sö dông lµm ®¬n vÞ nhËn d¹ng c¬ b¶n cho
c¸c hÖ thèng nhËn d¹ng tiÕng nãi. Trong tiÕng ViÖt chØ cã 38 ©m vÞ trong ®ã
cã 22 phô ©m vµ 16 nguyªn ©m ®¬n vµ ®«i [1], khi kÕt hîp víi thanh ®iÖu
(huyÒn, hái, ng·, s¾c, nÆng, kh«ng dÊu) th× tæng céng cã 228 ©m vÞ cã thanh
®iÖu. Víi sè lîng ©m vÞ h¹n chÕ nh vËy, hoµn toµn cã thÓ x©y dùng mét m«
h×nh nhËn d¹ng tiÕng ViÖt víi tõ ®iÓn cì lín kh«ng h¹n chÕ víi kho¶ng 1.500 -
2000 c©u huÊn luyÖn. Mét ®Æc ®iÓm n÷a lµ c¸c tõ trong tiÕng ViÖt cã sè l îng
©m vÞ rÊt Ýt, nhiÒu nhÊt còng chØ tíi 6 ©m vÞ (vÝ dô khuÕch tr ¬ng). Tuy
Häc viÖn C«ng nghÖ BCVT
nhiªn, m« h×nh ©m vÞ cã mét sè nhîc ®iÓm chÝnh:
Héi nghÞ Khoa häc lÇn thø 5
- C¸ c © m vÞ nh nhau ë c¸c vÞ t r Ý kh¸ c nhau kh«ng h¼n ® · cã ® Æc t Ýnh © m
häc, ng÷ © m häc nh nhau. Mét sè © m vÞ võa ® ãng vai t rß © m chÝnh, võa
® ãng vai t rß © m phô.
- ¢m vÞ lµ ® ¬ n vÞ © m nhá nhÊt cña mét tõ, viÖc x¸c ® Þnh gianh giíi cña c¸c
© m vÞ r Êt khã, do ® ã viÖc ph© n ® o¹n vµ g¸ n nh·n chÝnh x¸c ë møc © m vÞ
r Êt khã kh¨ n nhng l¹i r Êt quan t räng vµ ¶nh hëng nhiÒu ® Õn chÊt lîng cña
hÖ t hèng.
2.3. ¢m ®Çu +VÇn
TiÕng ViÖt lµ ng«n ng÷ ®¬n ©m tiÕt. ¢m tiÕt tuy ®îc ph¸t ©m liÒn nhng l¹i
cã cÊu t¹o l¾p ghÐp vµ hÇu nh theo mét quy luËt nhÊt ®Þnh. §iÒu nµy dÔ
thÊy ë c¸c em bÐ häc ®¸nh vÇn trong n¨m ®Çu ®i häc. Mçi tõ trong tiÕng ViÖt
cã 3 bé phËn chÝnh lµ thanh ®iÖu, ©m ®Çu vµ vÇn. ¢m ®Çu cã mét ©m vÞ
tham gia cÊu t¹o, vÇn ®îc cÊu t¹o bíi ©m ®Öm, ©m chÝnh vµ ©m cuèi. Theo [4]
th× trong tiÕng ViÖt cã 22 ©m ®Çu vµ 155 vÇn. KÕt hîp víi thanh ®iÖu th×
tæng sè ©m ®Çu+vÇn cã thanh ®iÖu nhá h¬n (22+155)*6=1062 v× cã nhiÒu
©m ®Çu, vÇn vµ thanh ®iÖu kh«ng kÕt hîp ®îc víi nhau. M« h×nh ©m
®Çu+vÇn cho phÐp gi¶m bít nhiÒu khã kh¨n cho viÖc ph©n ®o¹n, g¸n nh·n
trong qu¸ tr×nh lËp c¬ së d÷ liÖu vµ gi¶m bít yªu cÇu tÝnh to¸n cña m¸y khi
ph¶i ph©n ®o¹n tõ thu nhËn tõ Micro.
3. VÊn ®Ò nhËn d¹ng mÉu
Trong c¸c ph¬ng ph¸p nhËn d¹ng mÉu, ngêi ta th êng hay sö dông nhËn d¹ng
mÉu cho c¸c tõ ®¬n lÎ. HÖ thèng kh¸ ®¬n gi¶n do kh«ng ph¶i qua c¸c c«ng ®o¹n
ph©n ®o¹n vµ g¸n nh·n. Nh trªn ®· tr×nh bµy, ph¬ng ph¸p nµy th êng chØ ¸p
dông cho c¸c hÖ thèng nhËn d¹ng víi th viÖn tõ h¹n chÕ. Ta cã thÓ ¸p dông nhËn
d¹ng mÉu cho m« h×nh nhËn d¹ng theo ©m vÞ, hoÆc ©m ®Çu+vÇn. Víi ph ¬ng
ph¸p nµy, c¸c tõ ®îc ph©n ®o¹n, g¸n nh·n vµ tÝnh to¸n c¸c ®Æc tÝnh. ¢m thanh
thu ®îc còng sÏ ®îc ph©n ®o¹n vµ so s¸nh víi th viÖn mÉu vµ quyÕt ®Þnh lùa
chän mÉu cã ®Æc tÝnh gièng ®o¹n ©m thu ®îc nhÊt (h×nh 4). Do ©m thanh ®îc
t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau lu«n cã sù sai kh¸c bëi c¸c yÕu tè träng ©m,
ng÷ ®iÖu, tèc ®é... Do vËy ©m thanh thu ®îc cÇn ®îc so s¸nh víi ©m mÉu víi
Häc viÖn C«ng nghÖ BCVT
thuËt to¸n biÕn d¹ng DTW nh»m gi¶m thiÓu sai sè.
LÜnh vùc C«ng nghÖ th«ng tin
X
M N
I
Wl*
M U M
TÝn hiÖu ©m thanh vµo
TÝnh to¸n ®é sai sè ) D(X,Y
Ph©n ®o¹n G¸n nh·n §Æc t Ýnh
l
MÉu so s¸nh Y1, ....., Yl
H× nh 4: Nh Ën d¹ng t heo ph¬ ng ph¸ p so s¸ nh m Éu
4. ThuËt to¸n Dynamic Time Wraping (DTW)
{
}
2
Lw
= w ,... cã ®é dµi L vµ cã chuçi vector , ww 1
{
}
Tx
2
= ,... X ®Æc tÝnh , nhiÖm vô cña hÖ thèng lµ ph¶i nhËn d¹ng xem chuçi Cho chuçi ©m tiÕt ®Çu vµo , xx 1
©m ®Çu vµo lµ c¸c ký tù g× vµ trong qu¸ tr×nh xö lý cÇn ph¶i gi¶m thiÓu tèi ®a
c¸c sai sè quyÕt ®Þnh. Mçi tÝn hiÖu ©m tiÕt ®Çu vµo W l sÏ ®îc so s¸nh víi c¸c
mÉu Yl. Mçi Yl lµ chuçi c¸c vector ®Æc tÝnh cña tÝn hiÖu ©m tiÕt Wl . Nh»m
1, ,...,
, lMl
Y t¨ng kh¶ n¨ng nhËn d¹ng, mçi ©m tiÕt cã mét tËp hîp c¸c mÉu kh¸c nhau: Y l . Qu¸ tr×nh quyÕt ®Þnh ©m tiÕt phï hîp víi mét mÉu dùa theo nguyªn
*
t¾c sau:
ml ,
l = arg YXD ( , ) min m min l
Nh vËy ©m tiÕt Wl* lµ ©m tiÕt phï hîp nhÊt víi mÉu Yl t×m ®îc.
T ®îc x¸c ®Þnh b»ng tæng c¸c kho¶ng c¸ch côc bé
ij
j
( , yxd i trªn c¶ ®êng ®i cña qu¸ tr×nh biÕn d¹ng thêi gian. Kho¶ng c¸ch
ij
j
Kho¶ng c¸ch D(X,Y) gi÷a d÷ liÖu ®Çu vµo vµ d÷ liÖu mÉu Y=y 1….ys cã ®é dµi thêi gian kh¸c nhau S „ d = ) D = ... ... y ) yx , 1 i xD ( 1 ®îc x¸c ®Þnh theo c«ng thøc tÝch luü
I=J=0
(cid:236) 0 (cid:239)
{
}
,1
j
, ji
1
,1
j
1
ij
I>0, J>0 Kh¸ c
+ (cid:237) min , , D d - - - - D i D i (cid:239) ¥ (cid:238)
Häc viÖn C«ng nghÖ BCVT
Vµ kho¶ng c¸ch tæng D(X,Y)=D TS.
Héi nghÞ Khoa häc lÇn thø 5
fi
{
}
3
Ia
= Gi¶ sö cho hai chuçi vec t¬ t ¬ng øng víi mÉu tÝn hiÖu lµ vµ a , , ,.... aaa 1 2 fi fi fi
{
}
Jb
= . Cho r»ng tÝn hiÖu mÉu b , , ,.... a cã chiÒu dµi lín h¬n mÉu b tøc lµ bbb 1 2 3
gi¸ trÞ (I > J ). ThuËt to¸n sÏ thùc hiÖn viÖc t×m ®êng ®i tèi u cña chuçi b theo
chuçi a (tøc lµ c¸c vÞ trÝ kh¸c nhau gi÷a hai chuçi theo thêi gian) sao cho tæng
chªnh lÖch gi÷a hai chuçi vec t¬ lµ nhá nhÊt.
§Ó thùc hiÖn ®îc ®iÒu nµy thuËt to¸n dïng ma trËn líi c¸c ®iÓm h×nh 5.
H×nh 1: L íi ma trËn
H×nh 5: Ma trËn líi c¸c ®iÓm
Hai chuçi vÐc t¬ sÏ t ¬ng øng víi hai c¹nh cña ma trËn. Gi¶ sö , vÐc t¬ a
theo trôc x vµ vÐc t¬ b theo trôc y. C¸c nót cña ma trËn t ¬ng øng víi kho¶ng c¸ch
tÝnh ®îc cña hai chuçi vÐc t¬ t¹i c¸c thêi ®iÓm thø i cña vÐc t¬ a t ¬ng øng thêi
®iÓm thø j cña vÐc t¬ b t ¬ng øng nót (i,j). Nh vËy, ®êng ®i tèi u trong ma trËn
sÏ cã d¹ng nh h×nh 6.
Häc viÖn C«ng nghÖ BCVT
H ×nh 6: H ×nh d¹ng ® êng ®i t r ong ma t r Ën
LÜnh vùc C«ng nghÖ th«ng tin
ViÖc x¸c ®Þnh ®êng ®i tèi u trong ma trËn líi ®îc thùc hiÖn sao tæng kho¶ng
c¸ch sai lÖch gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ nhá nhÊt. Ký hiÖu, d(i,j) lµ
®é chªnh lÖch cña hai vÐc t¬ a vµ b t¹i thêi ®iÓm i vµ j t ¬ng øng.
Yªu cÇu cña thuËt to¸n DTW cho hai chuçi vec t¬ bÊt kú lµ cïng b¾t ®Çu t¹i c¸c
vÞ trÝ (0,0) vµ kÕt thóc t¹i vÞ trÝ (I,J) . Gi¸ trÞ t¹i nót (0,0) x¸c ®Þnh b»ng 0.
§êng ®i ®îc x¸c ®Þnh theo c¸c cÆp nót liªn tiÕp (i k-1,j k-1) fi (i k,j k) . Dïng ký hiÖu
i k ®Ó biÓu diÔn chØ sè cña vÐc t¬ a t¹i thêi ®iÓm k vµ j k lµ chØ sè cña vÐc t¬
b t¹i thêi ®iÓm k. Nh vËy tæng kho¶ng c¸ch gi÷a hai chuçi vÐc t¬ lµ :
k
k
k
1
k
1
k
k
= + iD ( , j ) iD ( , j ) id ( , j ) - -
ViÖc t×m gi¸ trÞ min D(i,j) theo c«ng thøc sau:
=
]
+
[
* iD (
k
k
k
1
k
1
k
k
= km
, j ) min iD ( , j ) id ( , j ) - -
m
=
m
0
ø Ø = min ( id ) (cid:229) œ Œ , m j ß º
Mét sè b¾t buéc cña DTW:
- ChØ sè cña i ph¶i t¨ng ®Òu tøc lµ : i k - i k-1 =1
- ChØ sè cña j t¨ng theo i víi ®iÒu kiÖn: j k -j k-1 ‡ 0
Giíi h¹n cña ®êng ®i kh«ng thÓ tuú ý ®îc v× nh thÕ nã sÏ g©y ra kÕt qu¶ sai
lÖch vµ lµm t¨ng khèi lîng tÝnh to¸n (nÕu xÐt trªn toµn bé ma trËn ®iÓm). V×
vËy, cÇn ph¶i giíi h¹n ph¹m vi cña ®êng ®i sao cho viÖc tÝnh to¸n gi¶m vµ ®é
chÝnh x¸c cao. Ph¹m vi cho ®êng ®i ®îc chän nh h×nh vÏ 7:
Häc viÖn C«ng nghÖ BCVT
H×nh 3: §êng ®i trong ma trËn theo thuËt to¸n DTW
Héi nghÞ Khoa häc lÇn thø 5
H×nh 7: Ph¹m vi cho ®êng ®i
LuËt ®êng ®i ®îc lùa chän theo nh h×nh 8 :
H×nh 8: LuËt ®êng ®i
Gi¶ sö vÞ trÝ hiÖn t¹i ®ang ë thêi ®iÓm i k-1 vµ ®iÓm ®i tiÕp lµ i k. Nh vËy c¸c
gi¸ trÞ j k cã thÓ lµ j k, j k+1, j k+2 t ¬ng øng víi c¸c mòi tªn trªn ma trËn.
KÕt qu¶:
KÕt qu¶ ®îc so s¸nh víi ph¬ng ph¸p biÕn d¹ng kh¸c lµ biÕn d¹ng tuyÕn tÝnh
theo thêi gian hay cßn gäi lµ ®ång bé theo thêi gian víi thuËt to¸n biÕn d¹ng nh
sau:
ChØ sè theo thêi gian cña tÝn hiÖu b liªn quan ®Õn chØ sè theo thêi gian cña
j = i tÝn hiÖu a lµ : vµ kÕt qu¶ cho nh trªn h×nh 8. J I
Trªn h×nh vÏ thÓ hiÖn ®êng ®Æc tr ng cña ©m sè 2 (“hai ”) cã ®é dµi kh¸c nhau
(a) vµ (b).
Víi ph¬ng ph¸p biÕn d¹ng tuyÕn tÝnh th× gi¸ trÞ thêi gian chØ sè mÉu b ®îc
gi·n ®Òu theo chØ sè thêi gian cña mÉu tÝn hiÖu a. Nh vËy, hai kho¶ng thêi
gian ®îc kÐo d·n b»ng nhau song c¸c gi¸ trÞ th× vÉn cßn ®é sai lÖch lín do tû lÖ
biÕn d¹ng lµ ®Òu mµ kh«ng cã sù chän lùa theo gi¸ trÞ h×nh (c). ThÓ hiÖn viÖc
Häc viÖn C«ng nghÖ BCVT
kÐo gi·n t¹i c¸c ®iÓm cã ®êng nèi ngang gi÷a hai tÝn hiÖu.
LÜnh vùc C«ng nghÖ th«ng tin
Cßn sö dông thuËt to¸n DTW ta thÊy tû lÖ biÕn d¹ng kh«ng ®ång ®Òu t¹i c¸c
(a)
(b)
(c)
(d)
thêi ®iÓm tuú thuéc vµo gi¸ trÞ tÝch luü tõ tr íc nªn hai mÉu so s¸nh sÏ cã ®é
tuyÕn tÝnh theo thêi gian.
H×nh 8. BiÓu diÔn t huËt t o¸n biÕn d¹ng ©m “hai ” (a)(b) Hai t Ýn hiÖu cã chiÒu dµi kh¸c nhau. (c) BiÕn d¹ng t uyÕn t Ýnh t heo t hêi gian (d) BiÕn d¹ng DTW
chªnh lÖch lµ nhá nhÊt h×nh (d), c¸c ®êng nèi chÐo thÓ hiÖn sù biÕn d¹ng kh«ng
5. KÕt luËn
Trªn ®©y lµ øng dông cña thuËt to¸n DTW cho hÖ thèng nhËn d¹ng tiÕng
nãi ®ang ®îc nghiªn cøu vµ triÓn khai. øng dông luËt ®êng ®i vµ c¸ch x¸c ®Þnh
®êng giíi h¹n cho thuËt to¸n DTW ®· gãp phÇn n©ng cao chÊt l îng cña bé nhËn
d¹ng. Tuy nhiªn, luËt ®êng ®i vµ giíi h¹n cña ®êng ®i cßn cã thÓ cã nhiÒu d¹ng
kh¸c cÇn nghiªn cøu thªm, song víi øng dông nhËn d¹ng mÉu rêi r¹c th× luËt ®-
Häc viÖn C«ng nghÖ BCVT
êng ®i x¸c ®Þnh theo ph¬ng ph¸p trªn lµ cã chÊt lîng h¬n c¶.
Héi nghÞ Khoa häc lÇn thø 5
Tµi liÖu tham kh¶o
[1]. §oµn ThiÖn ThuËt - Ng÷ ©m tiÕng ViÖt, Nhµ xuÊt b¶n §¹i häc vµ Trung
häc chuyªn nghiÖp, Hµ néi. 1977
[2]. H.Sakoe and S.Chiba - Dynamic programming optimization for spoken word
recognition. 1978.
[3]. Hoang Tue and Hoang Minh, “Remarks on the phonological Structure of
vietnamese”, Vietnamese Studies, Ha noi, 1979
[4]. Lawrence Rabiner, Biing – Hwang Juang; Fundamentals of speech
recognition. 1999.
[5]. R. M Gray, A. Buzo, A.H.Gray, Jr., and Y. Matsuyama - Distortion measures
for speech processing. 1980.
S¬ lîc t¸c gi¶
§oµn Phan Long, Tèt nghiÖp §¹i häc t¹i tr êng ®¹i häc tæng hîp Karl- Marx-
Stadt –CHLB §øc t¹i Thµnh phè Chemnitz khoa tù ®éng ho¸, chuyªn ngµnh
®iÒu khiÓn häc n¨m 1985, hiÖn nay c«ng t¸c t¹i Trung t©m C«ng nghÖ Th«ng
tin – CDIT, Häc viÖn C«ng nghÖ Bu chÝnh ViÔn th«ng – Tæng C«ng ty BCVT
ViÖt nam. Nh÷ng vÊn ®Ò ®ang quan t©m bao trïm c¸c lÜnh vùc tù ®éng nhËn
d¹ng tiÕng nãi, h×nh ¶nh... vµ tæng hîp tiÕng nãi ¸p dông trong c¸c hÖ thèng
Häc viÖn C«ng nghÖ BCVT
cung cÊp dÞch vô trong ngµnh Bu chÝnh-ViÔn th«ng.