H THNG PHIÊN DCH LI NÓI THÀNH NGÔN NG KÍ HIU
I
TÓM TT
Đề tài “H thng phiên dch li nói tiếng Vit thành ngôn ng kí hiệu cho người mt
kh năng thính lựcđược thc hin ti trung tâm nghiên cu giáo dục người
khiếm thính (CED), t tháng 7/2020 đến nay
Nghiên cu v người Mt thính lc và cách giao tiếp vi h
Nghiên cu v ngôn ng kí hiu
Nghiên cu công ngh “Speech to text”
Nghiên cu công ngh “X lí ngôn ng t nhiên” trên nền tng tiếng Vit
Nghiên cứu phương pháp xây dựng đ ho 3D bng ngôn ng Python
Kết qu thu được:
Đưa ra thuật toán giúp nhập văn bản bng li nói hoc th công t bàn phím
Xây dng d liệu tương đương giữa ngôn ng tiếng Vit và ngôn ng kí hiu
X được d liu li thoại đầu vào, t đó đưa ra đưc các t khoá cn s
dng trong vic giao tiếp bng ngôn ng kí hiu
T các t khoá đưc to, tiến hành s dụng đồ ho 3D đểphng ngôn ng
kí hiu
H THNG PHIÊN DCH LI NÓI THÀNH NGÔN NG KÍ HIU
II
MC LC
CHƯƠNG..................................................................................................... TRANG
Trang ta
Tóm tt .................................................................................................. I
Mc lc ............................................................................................... II
Danh sách hình v và đồ th ............................................................... III
1. ĐẶT VN Đ ............................................................................................. 1
1.1 Tính cp thiết ca đ tài ......................................................................... 1
1.2 Ý nghĩa khoa hc và thc tin ca đ tài ............................................... 3
1.3 Mc tiêu nghiên cu ca đ tài .............................................................. 3
1.4 Đối tưng và phm vi nghiên cu .......................................................... 3
1.4.1 Đối tưng nghiên cu .................................................................... 3
1.4.2 Phm vi nghiên cu ....................................................................... 3
1.5 Phương pháp nghiên cứu ........................................................................ 3
2. TỔNG QUAN Đ TÀI ............................................................................... 4
2.1 Tng quan v người Mt thính lc ......................................................... 4
2.1.1 Kh năng của người Mt thính lc ................................................ 4
2.1.2 Phương pháp giao tiếp của người Mt thính lc ........................... 6
2.1.3 Ngôn ng kí hiu chun Ngôn ng ký hiu Vit Nam .................. 6
2.2 Tng quan công ngh Nhn dng ging nói ........................................ 11
2.2.1 Gii thiu v công ngh Nhn dng ging nói ............................ 11
2.2.2 D liu m ca google ................................................................. 11
2.3 Tng quan công ngh X lí ngôn ng t nhiên ................................... 13
2.3.1 Gii thiu v công ngh x lí ngôn ng t nhiên ........................ 13
2.3.2 X lí ngôn ng tiếng Vit ............................................................ 15
2.3.3 Thư viện Underthesea .................................................................. 21
H THNG PHIÊN DCH LI NÓI THÀNH NGÔN NG KÍ HIU
III
2.4 Tng quan công ngh HandTracking ................................................... 22
2.4.1 Gii thiu v pơng pháp OpenPose ......................................... 22
2.4.2 Module OpenMMD ..................................................................... 24
3. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ............................... 26
3.1 Tng quan h thng .............................................................................. 26
3.2 D liệu tương đương giữa ngôn ng tiếng Vit và ngôn ng kí hiu .. 26
3.3 Xây dng thuật toán “Speech to text” .................................................. 30
3.4 X lí lời nói đầu vào ............................................................................. 33
3.5 Mô phng ngôn ng kí hiu ................................................................. 36
4. KT QU VÀ THO LUN .................................................................. 39
4.1 Tiến độ thc hin .................................................................................. 39
4.2 Kết qu thc nghim ............................................................................ 39
5. KT LUẬN VÀ Đ NGH ...................................................................... 42
5.1 Kết qu khoa hc đt đưc ................................................................... 42
5.2 Ý nghĩa của d án ........................................................................... 42
5.3 Hướng phát trin ............................................................................. 42
6. TÀI LIU THAM KHO ....................................................................... 43
H THNG PHIÊN DCH LI NÓI THÀNH NGÔN NG KÍ HIU
IV
DANH SÁCH HÌNH V VÀ ĐỒ TH
Hình
Tên
Trang
2.1
Tr em có vấn đề v thính lc đưc giáo dc sm
5
2.2
Bng ch cái theo ngôn ng kí hiu
8
2.3
Bng ch cái Vit Nam theo chun ngôn ng kí hiu Vit Nam
9
2.4
Mt s các t thông dng trong ngôn nghiu 1
10
2.5
Mt s các t thông dng trong ngôn nghiu 2
10
2.6
Google Cloud speech API
11
2.7
Danh sách ngôn ng đưc h tr trong d liu ca google
12
2.8
Tiền đề xây dng lý thuyết Automata là ngôn ng hình thc
16
2.9
Mô hình phân cp Chomsky
16
2.10
Cây cu trúc ca ví d
20
2.11
Hai trưng hp cây cu trúc t mt câu ging nhau
20
2.12
Kết qu phương pháp OpenPose
22
2.13
Định dng keypoint COCO cho b ơng ngưi (trái)
22
2.14
Sơ đồ khi ca kiến trúc OpenPose
23
2.15
Uc tính tư thế con người bằng phương pháp OpenPose
24
2.16
Ví d mô hình 3D: Anmicius
24
2.17
Video nguyên bn
24
2.18
Tính đ sâu trường nh
25
2.19
Xác định điểm chính cơ thể
25
2.20
Kết qu ca quá trình OpenPose
25
3.1
Sơ đồ khi tng quan h thng
26
3.2
D liu s - Number_data
27
3.3
D liu bng ch cái Spell_data
27
3.4
Mt s d liu trong tp các t thông dng Quick_data 1
28
3.5
Mt s d liu trong tp các t thông dng Quick_data 2
28
H THNG PHIÊN DCH LI NÓI THÀNH NGÔN NG KÍ HIU
V
3.6
Mt s d liu trong tp các t thông dng Quick_data 3
29
3.7
H thng phân tích ging nói ca Google
30
3.8
Sơ đồ khi thut toán Speech to text
30
3.9
Lưu đồ gii thut chc năng Speech to text
31
3.10
Lưu đồ gii thuật chương trình kết ni vi Google Cloude
32
3.11
Sơ đồ khi x lí ngôn ng đầu vào
33
3.12
Danh sanh Stopword Vit Nam
34
3.13
Các bước x lí d liệu đầu vào
35
3.14
Mng tách t cm t
35
3.15
Sơ đồ khi chức năng mô phng
36
3.16
Mảng con được tách t phn t th 3 ca mng chính
36
3.17
Lưu đồ gii thut chc năng so sánh mng chính vi d liu
tương ứng
37
3.18
Giao din phn mm
38
3.19
Các điểm c định trên bàn tay
38
4.1
Kết qu mô phng nhân vt nam
41
4.2
Kết qu mô phng nhân vt n
41
Bng
Tên
Trang
2.1
Bng lut P ca ví d
18
2.2
Phân thích Non-Terminal và Terminal
18
2.3
Kết qu quá trình x ví d
19
3.1
D liệu tương ứng cho các t khác nhau
26
4.1
Thng kê các thc th có trong b d liu VLSP
39