intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Báo cáo khoa học: "Nhận dạng từ có thanh điệu khác nhau trong tiếng Việt sử dụng mô hình Markov ẩn"

Chia sẻ: Nguyễn Phương Hà Linh Linh | Ngày: | Loại File: PDF | Số trang:9

108
lượt xem
19
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tuyển tập những báo cáo nghiên cứu khoa học hay nhất của trường đại học vinh tác giả: 14. Hoàng Hữu Việt, Nhận dạng từ có thanh điệu khác nhau trong tiếng Việt sử dụng mô hình Markov ẩn...

Chủ đề:
Lưu

Nội dung Text: Báo cáo khoa học: "Nhận dạng từ có thanh điệu khác nhau trong tiếng Việt sử dụng mô hình Markov ẩn"

  1. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh nhËn d¹ng tõ cã thanh ®iÖu kh¸c nhau trong tiÕng viÖt sö dông m« h×nh markov Èn Ho ng H÷u ViÖt (a) Tãm t¾t. Trªn c¬ së nghiªn cøu m« h×nh Markov Èn (HMM) vµ ng÷ ©m tiÕng ViÖt, bµi b¸o nµy ®−a ra mét sè ®Ò xuÊt nhËn d¹ng tõ cã thanh ®iÖu kh¸c nhau trong tiÕng ViÖt vµ mét sè kÕt qu¶ thö nghiÖm víi hÖ thèng nhËn d¹ng thanh ®iÖu tiÕng ViÖt. C¸c thö nghiÖm giíi h¹n lµ tõ tiÕng ViÖt gièng nhau vÒ ©m ®Çu, vÇn vµ chØ kh¸c nhau vÒ thanh ®iÖu, bé tõ vùng nhá, phô thuéc ng−êi nãi. KÕt qu¶ nhËn d¹ng tèt nhÊt víi ®é chÝnh x¸c lµ 96.67% ë møc ©m tiÕt vµ 82.50% ë møc c©u. 1. Giíi thiÖu NhËn d¹ng tiÕng nãi b»ng m¸y tÝnh cho phÐp con ng−êi giao tiÕp víi m¸y tÝnh b»ng tiÕng nãi. HiÖn nay trªn thÕ giíi ®· cã nh÷ng hÖ thèng nhËn d¹ng tiÕng nãi cì lín, ®é chÝnh x¸c t−¬ng ®èi cao nh−ng chñ yÕu ®−îc ph¸t triÓn trªn nh÷ng c¬ së d÷ liÖu tiÕng nãi kh¸ hoµn chØnh, chñ yÕu lµ tiÕng Anh. ë ViÖt Nam, viÖc nghiªn cøu vµ ph¸t triÓn c¸c hÖ thèng nhËn d¹ng tiÕng nãi míi ë b−íc ®Çu víi rÊt Ýt kÕt qu¶ ®−îc c«ng bè. §Ó x©y dùng ®−îc c¸c hÖ thèng nhËn d¹ng tiÕng nãi thµnh c«ng cña mçi mét d©n téc, ngoµi nh÷ng nguyªn t¾c nhËn d¹ng chung, ®ßi hái ng−êi nghiªn cøu ph¶i quan t©m, khai th¸c triÖt ®Ó c¸c yÕu tè tiÕng nãi ®Æc thï riªng nh»m ph¸t triÓn ®−îc hÖ thèng nhËn d¹ng phï hîp. TiÕng ViÖt lµ mét ng«n ng÷ ®¬n ©m, cã thanh ®iÖu, mçi ©m tiÕt ®Òu cã mét thanh ®iÖu ®ãng vai trß lµ mét ©m vÞ mang tÝnh siªu ®o¹n. §ã lµ lo¹i ©m vÞ kh«ng cã ©m ®o¹n, kh«ng ®éc lËp tån t¹i nh−ng cã chøc n¨ng ph©n biÖt nghÜa [1]. ViÖc ®i s©u nghiªn cøu, tÝch hîp c¸c ®Æc tr−ng cña tiÕng ViÖt vµo c¸c hÖ thèng nhËn d¹ng tiÕng nãi b»ng c¸c ph−¬ng ph¸p nhËn d¹ng hiÖn ®¹i lµ mét h−íng nghiªn cøu nh»m tiÕn tíi x©y dùng c¸c øng dông nhËn d¹ng tiÕng ViÖt phï hîp. Nghiªn cøu ¶nh h−ëng cña thanh ®iÖu, mét trong nh÷ng ®Æc tr−ng c¬ b¶n cña tiÕng ViÖt, lµ cÇn thiÕt gióp cho qu¸ tr×nh x©y dùng mét hÖ thèng nhËn d¹ng tiÕng ViÖt sau nµy. Trong bµi viÕt nµy, chóng t«i tr×nh bµy cÊu tróc c¬ b¶n cña ©m tiÕt tiÕng ViÖt vµ mét sè kÕt qu¶ nghiªn cøu thö nghiÖm nhËn d¹ng ©m tiÕt cã thanh ®iÖu kh¸c nhau trong tiÕng ViÖt sö dông m« h×nh Markov Èn. 2. CÊu tróc c¬ b¶n cña ©m tiÕt tiÕng viÖt 2.1. CÊu tróc c¬ b¶n cña ©m tiÕt tiÕng ViÖt VÒ mÆt cÊu tróc, ©m tiÕt tiÕng ViÖt ®−îc t¹o thµnh tõ 3 thµnh phÇn kh¸ ®éc lËp lµ ©m ®Çu, vÇn vµ thanh ®iÖu, trong ®ã phÇn vÇn cã thÓ ®−îc chia thµnh ©m ®Öm, ©m chÝnh vµ ©m cuèi. NhËn bµi ngµy 18/9/2006. Söa ch÷a xong 28/02/2007. 116
  2. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh B¶ng 2.1. CÊu tróc cña ©m tiÕt tiÕng ViÖt. Thanh ®iÖu VÇn ¢m ®Çu ¢m ®Öm ¢m chÝnh ¢m cuèi ¢m ®Çu lu«n lu«n lµ mét phô ©m hoÆc cã thÓ thiÕu trong mét sè ©m tiÕt. VÇn ®−îc ph©n thµnh ©m ®Öm, ©m chÝnh vµ ©m cuèi. ¢m ®Öm vµ ©m cuèi cã thÓ thiÕu trong mét sè ©m tiÕt. ¢m chÝnh lµ mét nguyªn ©m ®¬n hoÆc mét nguyªn ©m ®«i. ¢m cuèi lµ mét phô ©m hoÆc b¸n nguyªn ©m. TiÕng ViÖt cã 22 ©m ®Çu, 155 vÇn, 1 ©m ®Öm, 16 ©m chÝnh vµ 8 ©m cuèi. Tæng sè ©m tiÕt ph¸t ©m kh¸c nhau kho¶ng 18598 ©m tiÕt nh−ng thùc tÕ chØ cã 7000 ©m tiÕt kh¸c nhau ®−îc sö dông [1]. Thanh ®iÖu lµ mét ©m vÞ siªu ®o¹n tÝnh, nã ®−îc biÓu hiÖn trong toµn bé ©m tiÕt bao gåm c¶ ©m ®Çu, ©m ®Öm, ©m chÝnh vµ ©m cuèi. Thanh ®iÖu tiÕng ViÖt cã 6 thanh lµ thanh ngang (kh«ng dÊu), thanh s¾c, thanh ng·, thanh hái, thanh huyÒn vµ thanh nÆng. Theo c¸c nhµ ng÷ ©m häc, ba tiªu chÝ khu biÖt cho 6 ©m vÞ thanh ®iÖu ®−îc biÓu diÔn theo s¬ ®å h×nh c©y sau: ¢m ®iÖu b»ng - Tr¾c ¢m ®iÖu g y - Kh«ng g y ¢m vùc cao - ThÊp Kh«ng dÊu HuyÒn Ng Hái S¾c NÆng H×nh 2.1. Tiªu chÝ khu biÖt cho 6 ©m vÞ thanh ®iÖu. Trong h×nh 2.1 tÝnh tõ mçi ®iÓm ph©n nh¸nh, nh¸nh tr¸i biÓu thÞ vÕ ®Çu, nh¸nh ph¶i biÓu thÞ vÕ sau cña thÕ ®èi lËp. ¢m vùc lµ ®é cao cña thanh ®iÖu. ¢m ®iÖu lµ sù biÕn thiªn cña ®é cao theo thêi gian. Sù thÓ hiÖn ©m ®iÖu cña c¸c thanh ®iÖu trong nh÷ng ©m tiÕt t¸ch rêi nh− sau: - Thanh kh«ng dÊu lµ mét thanh thuéc ©m vùc cao, ®−êng nÐt ©m ®iÖu b»ng ph¼ng hÇu nh− kh«ng lªn kh«ng xuèng tõ ®Çu ®Õn cuèi. - Thanh huyÒn lµ mét thanh thuéc ©m vùc thÊp, xuÊt ph¸t thÊp h¬n thanh kh«ng dÊu mét n÷a ®é cao. §−êng nÐt ©m ®iÖu b»ng ph¼ng h¬i ®i xuèng thoai tho¶i. 117
  3. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh - Thanh ng· xuÊt ph¸t gÇn ngang víi ®é cao xuÊt ph¸t cña thanh huyÒn. Thanh nµy b¾t ®Çu ë ©m vùc thÊp nh−ng kÕt thóc ë ©m vùc cao. §−êng nÐt ©m ®iÖu kh«ng b»ng ph¼ng, cã hai biÕn thÓ: + §−êng nÐt b¾t ®Çu cao h¬n thanh huyÒn mét chót ®Õn gi÷a ©m tiÕt ®i xuèng ®ét ngét, dèc ®øng trong mét thêi gian ng¾n, sau ®ã vót lªn ngang víi ®é cao ban ®Çu vµ ®i thªm 1 qu·ng n÷a. + §−êng nÐt b¾t ®Çu vµ kÕt thóc t−¬ng tù nh− trªn nh−ng bÞ gi¸n ®o¹n ë gi÷a. - Thanh hái b¾t ®Çu ë møc cao cña ®é xuÊt ph¸t thanh huyÒn. §−êng nÐt ©m ®iÖu thÊp dÇn tõ khi b¾t ®Çu, ®Õn qu·ng gi÷a th× chuyÓn sang mét nÐt ®i lªn c©n ®èi víi nÐt ®i xuèng ban ®Çu, vµ kÕt thóc ngang b»ng víi ®é cao xuÊt ph¸t. - Thanh s¾c cã c¸c biÕn thÓ: + Trong c¸c ©m tiÕt cã ©m cuèi kh«ng ph¶i lµ ©m t¾c, v« thanh, ®−êng nÐt ©m ®iÖu b¾t ®Çu xÊp xØ víi thanh kh«ng dÊu, víi mét ©m ®iÖu b»ng ngang sau ®ã ©m ®iÖu ®i lªn, kÕt thóc cao h¬n thanh kh«ng dÊu. + Trong c¸c ©m tiÕt cã ©m cuèi lµ ©m t¾c, v« thanh. NÕu ©m chÝnh lµ nguyªn ©m dµi th× phÇn b»ng ngang ng¾n h¬n nhiÒu hoÆc cã khi mÊt h¼n. §é cao xuÊt ph¸t vµ ®é cao kÕt thóc vÒ c¬ b¶n nh− tr−êng hîp trªn. NÕu ©m chÝnh lµ nguyªn ©m ng¾n th× thanh ®iÖu b¾t ®Çu cao h¬n kh¸ nhiÒu, ®−êng nÐt ©m ®iÖu ®i lªn m¹nh h¬n vµ kÕt thóc ë mét kho¶ng c¸ch nhá. - Thanh nÆng lµ thanh ®iÖu thuéc ©m vùc thÊp, nã b¾t ®Çu xÊp xØ víi møc cao ban ®Çu cña thanh huyÒn. C¸c biÕn thÓ gåm: + Trong c¸c ©m tiÕt cã ©m cuèi kh«ng ph¶i lµ ©m t¾c, v« thanh, ®−êng nÐt b¾t ®Çu b»ng ngang vµ kÐo dµi trong phÇn lín cña bé phËn vÇn, sau ®ã ®i xuèng víi ®é dèc lín. NÕu ©m cuèi lµ ©m mòi th× phÇn ®i xuèng n»m vµo ©m cuèi. + Trong c¸c ©m tiÕt kÕt thóc b»ng ©m t¾c, v« thanh, phÇn ®i xuèng n»m ngay ë cuèi nguyªn ©m lµm ©m chÝnh. NÕu ©m chÝnh lµ nguyªn ©m ng¾n th× phÇn ngang b»ng thu ng¾n l¹i. Thanh ®iÖu lµ sù n©ng cao hoÆc h¹ thÊp “giäng nãi” trong mét ©m tiÕt, ®iÒu ®ã cã nghÜa lµ sù thay ®æi tÇn sè ©m thanh c¬ b¶n cña nguyªn ©m. D©y thanh chÊn ®éng t¹o ra ©m thanh. Khi ©m c¬ b¶n gi÷ nguyªn, c¸c ho¹ ©m (lµ c¸c tÇn sè b»ng béi sè cña tÇn sè ©m c¬ b¶n) thay ®æi vÒ c−êng ®é vµ ®é cao do hiÖn t−îng céng h−ëng th× toµn bé ©m thanh sÏ thay ®æi ©m s¾c vµ nhËn ®−îc c¸c nguyªn ©m kh¸c nhau vÒ thanh ®iÖu, vÝ dô “µ”, ”ï”, ”×”. Ng−îc l¹i, nÕu tÇn sè ©m c¬ b¶n thay ®æi trong khi c¸c ho¹ ©m kh«ng thay ®æi do kh«ng cã sù biÕn ®æi g× vÒ céng h−ëng th× sÏ chØ cã mét nguyªn ©m víi mét ©m s¾c kh«ng ®æi, nh−ng víi nhiÒu thanh ®iÖu kh¸c nhau, vÝ dô “µ”, ”¸”, ”¹”. 118
  4. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh Nh− vËy thanh ®iÖu ®−îc x¸c ®Þnh bëi tÇn sè ©m c¬ b¶n, tuy nhiªn ®é cao cña ©m c¬ b¶n kh«ng nhÊt thiÕt ph¶i ®ång ®Òu trong thêi gian tån t¹i cña ©m tiÕt mµ cã sù biÕn thiªn theo thêi gian. TÝn hiÖu tiÕng nãi vµ sù biÕn thiªn cña tÇn sè c¬ b¶n cña c¸c ©m tiÕt trong ph¸t ng«n "ma, mµ, m¸, m¹, m¶, m·" ®−îc trÝch chän trong kho¶ng thêi gian 10ms sö dông phÇn mÒm Praat [8] ®−îc chØ ra trong h×nh 2.2. H×nh 2.2. TÝn hiÖu tiÕng nãi vµ sù biÕn thiªn cña tÇn sè c¬ b¶n cña c¸c ©m tiÕt. 2.2. NhËn d¹ng tõ cã thanh ®iÖu kh¸c nhau trong tiÕng ViÖt XÐt viÖc ph¸t ©m c¸c tõ “ma”, “m¸”, “mµ”, “m¶”, “m·”, “m¹”, nÕu bá ®i phÇn thanh ®iÖu th× ®−îc ph¸t ©m lµ /ma/, lµ nh÷ng ©m tiÕt ®ång ©m. Trong mét c©u nãi, ®Ó x¸c ®Þnh chÝnh x¸c ©m tiÕt nµo ®−îc ph¸t ©m cÇn ph¶i sö dông c¸c th«ng tin vÒ ng÷ c¶nh, nghÜa lµ c¸c ©m tiÕt ®−îc ph¸t ©m tr−íc vµ sau nã, ®iÒu nµy ®−îc gi¶i quyÕt b»ng m« h×nh ng«n ng÷. Tuy nhiªn, nÕu nhËn d¹ng chÝnh x¸c ®−îc thanh ®iÖu, th× cã thÓ x¸c ®Þnh ®−îc ©m tiÕt ph¸t ©m thay v× ph¶i sö dông m« h×nh ng«n ng÷. C¨n cø vµo cÊu t¹o ©m tiÕt tiÕng ViÖt, vµo tÝnh chÊt thanh ®iÖu ®−îc x¸c ®Þnh bëi tÇn sè ©m c¬ b¶n Fo vµ vµo tËp tham sè MFCC (Mel - Frequency Cepstral Coefficients) kh«ng chøa tÇn sè ©m c¬ b¶n F0 chóng t«i tiÕn hµnh thö nghiÖm tËp tham sè MFCC kÕt hîp víi tÇn sè c¬ b¶n F0 ®Ó xem xÐt sù chÝnh x¸c cña hÖ thèng nhËn d¹ng ©m tiÕt cã c¸c thanh ®iÖu kh¸c nhau trong tiÕng ViÖt. 119
  5. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh 3. Thùc nghiÖm HÖ thèng nhËn d¹ng tiÕng ViÖt ®−îc x©y dùng b»ng phÇn mÒm Matlab dùa trªn mét sè modul ph©n tÝch tham sè ®Æc tr−ng cña tiÕng nãi [6] vµ modul nhËn d¹ng HMM [7]. 3.1. M« h×nh hÖ thèng nhËn d¹ng M« h×nh hÖ thèng nhËn d¹ng ®−îc m« t¶ ë h×nh 3.1 [5]. M«i tr−êng thö nghiÖm lµ phßng m¸y tÝnh, tÝn hiÖu tiÕng nãi ®−îc ghi b»ng micro th«ng th−êng, tèc ®é lÊy mÉu lµ 11025Hz, PCM 16 bit mono. Chuçi quan s¸t lµ vÐc t¬ ®Æc tr−ng cña c¸c khung tÝn hiÖu. H×nh 3.1. M« h×nh hÖ thèng nhËn d¹ng. S¸u m« h×nh HMM ®−îc sö dông ®Ó nhËn d¹ng s¸u ©m tiÕt cña c¸c thö nghiÖm. Víi c¸c c¬ së d÷ liÖu ®−îc chän lµ tËp c¸c ©m tiÕt cã 3 ©m vÞ, qua c¸c thö nghiÖm cho thÊy mçi m« h×nh HMM cã 3 tr¹ng th¸i, t−¬ng ®−¬ng víi sè ©m vÞ cña mçi ©m tiÕt, cho kÕt qu¶ nhËn d¹ng tèt nhÊt. Mçi m« h×nh HMM ®−îc m« t¶ ë h×nh 3.2. 120
  6. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh H×nh 3.2. M« h×nh Markov Èn 3 tr¹ng th¸i sö dông nhËn d¹ng. Ma trËn x¸c suÊt chuyÓn tr¹ng th¸i cña mçi m« h×nh HMM ®−îc khëi t¹o nh− sau: 0.3333 0.3333 0.3333 0.0000 0.5000 0.5000 0.0000 0.0000 1.0000 TËp c¸c ph©n bè x¸c suÊt cho tr¹ng th¸i khëi ®Çu cña mçi m« h×nh HMM ®−îc chän lµ: (0.3333, 0.3333, 0.3333). 3.2. Thö nghiÖm 1 a. C¬ së d÷ liÖu: Cho tíi nay ch−a cã c¬ së d÷ liÖu tiÕng ViÖt dïng chung nµo ®−îc x©y dùng vµ c«ng bè. §©y lµ mét trë ng¹i trong viÖc nghiªn cøu vµ ®¸nh gi¸ ®é chÝnh x¸c cña tËp tham sè nhËn d¹ng tiÕng ViÖt. C¬ së d÷ liÖu tiÕng nãi sö dông trong thùc nghiÖm do t¸c gi¶ tù thu ©m giäng nãi cña chÝnh m×nh. C¬ së d÷ liÖu ®−îc chia thµnh hai tËp: - TËp huÊn luyÖn: Gåm 100 c©u, mçi c©u cã 6 ©m tiÕt "na, n¸, nµ, n¹, n·, n¶" ®−îc ®äc theo thø tù ngÉu nhiªn. - TËp nhËn d¹ng: Gåm 59 c©u kh«ng thuéc tËp c¸c c©u huÊn luyÖn, mçi c©u cã 6 ©m tiÕt "na, n¸, nµ, n¹, n·, n¶" ®−îc ®äc theo thø tù ngÉu nhiªn. TÊt c¶ c¸c ©m tiÕt cña tËp huÊn luyÖn vµ tËp nhËn d¹ng ®−îc ph©n ®o¹n vµ g¸n nh·n theo tõng ©m tiÕt cña c¸c c©u ®äc vµo dùa trªn 1 thñ tôc tù ®éng. Tiªu chÝ ph©n ®o¹n lµ n¨ng l−îng cña mçi ©m tiÕt, dùa trªn thuËt to¸n ph¸t hiÖn ®iÓm kÕt thóc ©m tiÕt [3]. §é dµi cña c¸c ©m tiÕt lµ kh¸c nhau (kÓ c¶ víi mét ©m tiÕt ®−îc ph¸t ©m nh÷ng lÇn kh¸c nhau), phô thuéc vµo tèc ®é ph¸t ©m cña tõng ©m tiÕt. b. TËp tham sè: TÝn hiÖu cña mçi ©m tiÕt ®−îc ph©n tÝch thµnh c¸c khung víi mçi khung cã chiÒu dµi 256 mÉu, c¸c khung chång lªn nhau 128 mÉu. Sè khung cña mçi ©m tiÕt phô thuéc vµo ®é dµi tÝn hiÖu cña ©m tiÕt. Bèn tËp tham sè cho mçi khung tÝn hiÖu ®−îc thö nghiÖm víi bé nhËn d¹ng gåm [4]: - (MFCC + E): TËp tham sè gåm 12 hÖ sè MFCC (Mel - Frequency Cepstral Coefficients), 1 hÖ sè n¨ng l−îng. VÐc t¬ tham sè cho mçi khung tÝn hiÖu gåm 13 hÖ sè. 121
  7. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh - (MFCC + E )+ D: TËp tham sè gåm 12 hÖ sè MFCC, 1 hÖ sè n¨ng l−îng, 13 hÖ sè ®¹o hµm bËc mét. VÐc t¬ tham sè cho mçi khung tÝn hiÖu gåm 26 hÖ sè. - (MFCC + E) + D + A: TËp tham sè gåm 12 hÖ sè MFCC, 1 hÖ sè n¨ng l−îng, 13 hÖ sè ®¹o hµm bËc mét, 13 hÖ sè ®¹o hµm bËc 2. VÐc t¬ tham sè cho mçi khung tÝn hiÖu gåm 39 hÖ sè. - (MFCC + E + F0) + D + A: TËp tham sè gåm 12 hÖ sè MFCC, 1 hÖ sè n¨ng l−îng, 1 hÖ sè lµ tÇn sè c¬ b¶n F0, 14 hÖ sè ®¹o hµm bËc mét, 14 hÖ sè ®¹o hµm bËc 2. VÐc t¬ tham sè cho mçi khung tÝn hiÖu gåm 42 hÖ sè. 3.3. Thö nghiÖm 2 C¸c tham sè ®−îc chän gièng nh− thö nghiÖm 1 nh−ng thay ®æi vÒ tËp ©m tiÕt huÊn luyÖn vµ nhËn d¹ng. - TËp huÊn luyÖn: Gåm 90 c©u, mçi c©u cã 6 ©m tiÕt "ma, m¸, mµ, m¹, m·, m¶" ®−îc ®äc theo thø tù ngÉu nhiªn. - TËp nhËn d¹ng: Gåm 40 c©u kh«ng thuéc tËp c¸c c©u huÊn luyÖn, mçi c©u cã 6 ©m tiÕt "ma, m¸, mµ, m¹, m·, m¶" ®−îc ®äc theo thø tù ngÉu nhiªn. 4. KÕt qu¶ B¶ng 4.1a lµ kÕt qu¶ nhËn d¹ng ©m tiÕt, b¶ng 4.1b lµ kÕt qu¶ nhËn d¹ng nhÇm c¸c thanh ®iÖu cho tËp tham sè cã ®é chÝnh x¸c cao nhÊt (MFCC + E + F0) + D + A cña thö nghiÖm 1. B¶ng 4.1a. KÕt qu¶ nhËn d¹ng cña thö nghiÖm 1. §é chÝnh x¸c TËp tham sè ¢m tiÕt C©u (MFCC + E) 75.42% 15.25% (MFCC + E) + D 83.62% 28.81% (MFCC + E) + D + A 84.75% 35.59% (MFCC + E + F0) + D + A 92.66% 62.71% B¶ng 4.1b. KÕt qu¶ nhËn d¹ng nhÇm c¸c thanh ®iÖu cña thö nghiÖm 1. Thanh bÞ nhËn d¹ng nhÇm Thanh lçi Thanh Thanh Thanh Thanh Thanh Thanh Tæng kh«ng s¾c huyÒn nÆng ng· hái céng Thanh kh«ng 0 0 8 0 0 0 8 Thanh s¾c 0 0 0 0 3 0 3 Thanh huyÒn 4 0 0 0 0 0 4 Thanh nÆng 0 0 2 0 0 0 2 Thanh ng· 0 0 0 0 0 7 7 Thanh hái 0 0 0 0 2 0 2 122
  8. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh B¶ng 4.2a lµ kÕt qu¶ nhËn d¹ng ©m tiÕt, b¶ng 4.2b lµ kÕt qu¶ nhËn d¹ng nhÇm c¸c thanh ®iÖu cho tËp tham sè cã ®é chÝnh x¸c cao nhÊt (MFCC + E + F0) + D + A cña thö nghiÖm 2. B¶ng 4.2a. KÕt qu¶ nhËn d¹ng cña thö nghiÖm 2. §é chÝnh x¸c TËp tham sè ¢m tiÕt C©u (MFCC + E) 80.00% 25.00% (MFCC + E) + D 92.50% 67.50% (MFCC + E) + D + A 94.58% 72.50% (MFCC + E + F0) + D + A 96.67% 82.50% B¶ng 4.2b. KÕt qu¶ nhËn d¹ng nhÇm c¸c thanh ®iÖu cña thö nghiÖm 2. Thanh bÞ nhËn d¹ng nhÇm Thanh lçi Thanh Thanh Thanh Thanh Thanh Thanh Tæng kh«ng s¾c huyÒn nÆng ng· hái céng Thanh kh«ng 0 0 3 0 0 0 3 Thanh s¾c 0 0 0 0 0 0 0 Thanh huyÒn 2 0 0 0 0 0 2 Thanh nÆng 0 0 1 0 0 0 1 Thanh ng· 0 0 0 0 0 1 1 Thanh hái 0 0 0 0 1 0 1 B¶ng 4.1b vµ b¶ng 4.2b cho thÊy sè l−îng lçi nhËn d¹ng nhÇm gi÷a c¸c thanh ®iÖu. Tû lÖ nhËn d¹ng nhÇm ë thanh kh«ng dÊu sang thanh huyÒn lµ cao nhÊt, tiÕp ®Õn lµ nhËn d¹ng nhÇm ë thanh huyÒn sang thanh kh«ng dÊu. ¢m tiÕt chøa thanh nÆng vµ thanh hái cho kÕt qu¶ nhËn d¹ng chÝnh x¸c cao nhÊt. 5. KÕt luËn Bµi b¸o nµy tr×nh bµy mét sè kÕt qu¶ thùc nghiÖm nhËn d¹ng thanh ®iÖu tiÕng ViÖt dùa trªn tËp gåm c¸c ©m tiÕt cã chung ©m ®Çu, ©m vÇn nh−ng kh¸c nhau vÒ thanh ®iÖu. Ph−¬ng ph¸p nhËn d¹ng ®−îc chän lµ m« h×nh Markov Èn. §¬n vÞ nhËn d¹ng lµ ©m tiÕt. Dùa trªn lý thuyÕt vÒ ng÷ ©m tiÕng ViÖt còng nh− thùc nghiÖm ®· chøng tá viÖc bæ sung tÇn sè c¬ b¶n F0 vµo vector tham sè ®Æc tr−ng ®· t¨ng ®¸ng kÓ ®é chÝnh x¸c nhËn d¹ng cho hÖ thèng nhËn d¹ng thanh ®iÖu tiÕng ViÖt. KÕt qu¶ nhËn d¹ng tèt nhÊt víi ®é chÝnh x¸c lµ 96.67% ë møc ©m tiÕt vµ 82.50% ë møc c©u víi tËp tham sè (MFCC + E + F0) + D + A. Tuy nhiªn nh÷ng kÕt qu¶ trong bµi b¸o nµy chØ lµ nh÷ng kÕt qu¶ b−íc ®Çu ®−îc thö nghiÖm trªn nh÷ng cë së d÷ liÖu nhá. Mét trong nh÷ng nghiªn cøu chÝnh 123
  9. T¹p chÝ khoa häc, tËp XXXVI, sè 2A-2007 §¹i häc Vinh tiÕp theo lµ cÇn ph¶i x©y dùng vµ thö nghiÖm trªn c¸c c¬ së d÷ liÖu lín, cã nhiÒu ng−êi nãi vµ cÇn x¸c ®Þnh m« h×nh phiªn ©m cña c¸c ©m tiÕt hay ©m vÞ phï hîp víi hÖ thèng nhËn d¹ng ®Ó t¨ng ®é chÝnh x¸c nhËn d¹ng. T i liÖu tham kh¶o [1] §Æng Ngäc §øc, L−¬ng Chi Mai, NhËn d¹ng tõ cã thanh ®iÖu kh¸c nhau trong tiÕng ViÖt, T¹p chÝ Tin häc vµ §iÒu khiÓn häc, T.19, S.2, pp.131-138, 2003. [2] §oµn ThiÖn ThuËt, Ng÷ ©m tiÕng ViÖt, Nhµ xuÊt b¶n §¹i häc quèc gia Hµ Néi, 1999. [3] Lawrence R. Rabiner and Ronald W. Schafer, Digital Processing of Speech Signals, Prentice Hall, 1978. [4] Lawrence R. Rabiner and Biing-Hwang Juang, Fundamentals of Speech Recognition, Prentice Hall, 1993. [5] Lawrence R. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, IEEE, Vol.77, No.2, pp. 257 - 285, February, 1989. [6] Barbara Resch, Signal Processing and Speech Communication Laboratory, http://www.igi.tugraz.at/lehre/CI. [7] VOICEBOX: Speech Processing Toolbox for MATLAB, http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html. [8] Paul Boersma and David Weenink, Institute of Phonetic Sciences (IFA) in the University of Amsterdam, www.praat.org. SUMMARY recognition of Vietnamese speech words with different tones by using Hidden Markov Model Based on the study of the hidden Markov model (HMM) and Vietnamese phonetics, this paper presents some proposals of recognition of Vietnamese speech words with differrent tones and some results of recognition experiments with Vietnamese speech databases of words. The recognition task is limited to Vietnamese words, which have the same initial and final, but different tones. The best recognition rate is 96.67% for words and 82.50% for sentences. (a) Khoa C«ng nghÖ Th«ng tin, tr−êng §¹i häc Vinh. 124
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2