intTypePromotion=1

THIẾT KẾ CHẾ TẠO ROBOT ĐIỀU KHIỂN TỪ XA BẰNG GIỌNG NÓI

Chia sẻ: Phạm Đức Linh | Ngày: | Loại File: PDF | Số trang:6

0
670
lượt xem
199
download

THIẾT KẾ CHẾ TẠO ROBOT ĐIỀU KHIỂN TỪ XA BẰNG GIỌNG NÓI

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Lĩnh vực Robot ngày càng chiếm được sự quan tâm của các nhà nguyên cứu và xã hội. Một trong những vấn đề rất được quan tâm khi nghiên cứu robot là làm thế nào để có thể giao tiếp giữa người - robot. Báo cáo này sẽ trình bày kết quả nghiên cứu, thiết kế chế tạo robot điều khiển từ xa bằng giọng nói. Trong đó giới thiệu các tính toán cơ bản các cơ cấu của robot, thiết kế mạch điều khiển từ xa và chương trình nhận dạng giọng nói tiếng Việt....

Chủ đề:
Lưu

Nội dung Text: THIẾT KẾ CHẾ TẠO ROBOT ĐIỀU KHIỂN TỪ XA BẰNG GIỌNG NÓI

  1. Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010 THIẾT KẾ CHẾ TẠO ROBOT ĐIỀU KHIỂN TỪ XA BẰNG GIỌNG NÓI DESIGN AND MANUFACTURING REMOTE CONTROL ROBOT BY VOICE SVTH: Nguyễn Phú Sinh Lớp 05CĐT1, Khoa Cơ khí, Trường Đại học Bách khoa GVHD: PGS.TS. Trần Xuân Tùy Khoa Cơ khí, Trường Đại học Bách khoa TÓM TẮT Lĩnh vực Robot ngày càng chiếm được sự quan tâm của các nhà nguyên cứu và xã hội. Một trong những vấn đề rất được quan tâm khi nghiên cứu robot là làm thế nào để có thể giao tiếp giữa người - robot. Báo cáo này sẽ trình bày kết quả nghiên cứu, thiết kế chế tạo robot điều khiển từ xa bằng giọng nói. Trong đó giới thiệu các tính toán cơ bản các cơ cấu của robot, thiết kế mạch điều khiển từ xa và chương trình nhận dạng giọng nói tiếng Việt. ABSTRACT Nowadays, robot research field has been attracted attenti on from researchers and society. One of the most concerned matters when researching on robot is how to get into communication between human and robot. This report will present results of researching, designing and manufacturing remote control robot by voic e. In which, we would like to introduce basic calculations of robot’s structures, the design of remote control circuit and the program for Vietnamese voice identification. 1. Mở đầu Đã từ lâu con người luôn mơ ước chế tạo được những máy móc thông minh, có một số chức năng thay thế con người, như khả năng nhìn và nhận dạng được các vật thể, nghe và thực hiện theo lời nói của con người. Nhưng cho mãi đến những năm gần đây, khi c ó những lý thuyết mới về xử lý thông tin và công nghệ phát triển, thì mơ ước đó mới dần trở thành hiện thực. Tuy thế, cho đến nay, giao tiếp giữa người với máy đã được cải thiện rất nhiều nhưng vẫn còn mức độ như thông qua bàn phím hay các thiết bị xuất nh ập khác. Giao tiếp giữa người với máy bằng giọng nói sẽ là phương thức giao tiếp hiện đại và có ý nghĩa quan trọng trong cuộc sống như xe lăn cho nguời tàn tật được điều khiển bằng giọng nói, hay con người sẽ không dùng bàn phím hoặc chuột để giao tiếp với máy tính, mà thay vào đó sẽ điều khiển máy tính theo mệnh lệnh bằng ngôn ngữ. Trên thế giới đã có nhiều hệ thống nhận dạng giọng nói (tiếng Anh) đã và đang được ứng dụng rất hiệu quả như: ViaVoice, Dragon Naturally Speaking, Spoken Toolket…nhưng do sự khác biệt về ngôn ngữ nên chúng ta không thể áp dụng chương trình trên để nhận dạng tiếng Việt. Do đó, một hệ thống nhận dạng giọng nói tiếng Việt cần phải được xây dựng. Đề tài này xin trình bày quá trình nghiên cứu thiết kế, chế tạo robot được điều khiển từ xa bằng giọng nói (tiếng Việt) với một bộ từ vựng nhỏ, thiết lập hệ thống điều khiển robot từ xa theo tập lệnh cố định. 38
  2. Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010 2. Nội dung 2.1. Tính toán thiết kế cơ khí Xác định momen và lực động xuất hiện trong quá trình chuyển động của robot sẽ quyết định đến chọn công suất động cơ, kiểm tra độ bền, độ cứng vững, đảm bảo độ tin cậy cho robot. Có nhiều phương pháp để xác định như phương pháp cơ học Lagrange, cơ học cổ điển…Báo cáo này trình bày phương pháp tính toán đơn giản là cơ học cổ điển, với phương pháp nà y sẽ bỏ qua quán tính, tương hổ, ly tâm…Các thông số đã được chọn trước để có thể tính Hình 1. Sơ đồ phân tích lực hai bậc của cánh tay robot toán: khối lượng của mỗi khâu, khối lượng tại mỗi khớp, khối lượng của đối tượng cần nâng, chiều dài mỗi khâu. W1, W2: là trọng lượng quy đổi của các khâu 2 và khâu 3 về vị trí tâm của mỗi khâu W4, W3: là trọng lượng của khớp 3 và khối lượng của vật cần nâng. L1, L2: là chiều dài của khâu thứ 2 và khâu thứ 3 L3: là khoảng cách từ tâm vật cần nâng đến khớp thứ 3 Ta sẽ dễ dàng xác định được mômen sơ bộ tại các khớp 2 và khớp 3 (hình 1) Mômen tại khớp 2: M1 = W1*L1/2 + L1*W4 + (L1+L2/2)*W2+ (L1+L3)*W3 Mômen tại khớp 3: M2 = L2/2*W2 + L3*W3 Từ đó có thể chọn được cơ cấu truyền động và các động cơ hợp lý. Hình 3. Động cơ khớp 2 sau khi gắn hộp giảm tốc Hình 2. Cơ cấu tay quay con trượt Chuyến động của khâu 3 được động cơ tác động thông qua cơ cấu tay quay con trượt (hình 2). Cơ cấu tay quay con truợt là cơ cấu bốn khâu bản lề có bốn khớp thấp. Để tránh ma sát lớn trong cơ cấu mà con trượt chủ động, tay quay bị dẫn thì cơ cấu cần thỏa mãn điều kiện:        max (1) Hàm vị trí của cơ cấu khi con trượt chủ động: 39
  3. Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010 r 2  e2   x0  s   l 2 2 e   arctg  arcsin (2) x0  s 2r  x0  s   e2 2 x0  e2  (r e)2 Trong đó: (3) Dấu dưới tương ứng với trường hợp độ lệch tâm e ở phía bên trái. Ta chọn e = 0, tức độ lệch tâm bằng không thì:   arcsin(2. l 2  r 2  s) / [2.r. l 2  r 2 -s] (4) Kích thước của các khâu đã chọn trước là L1 = L2 = 300 mm, l = 140 mm, r = 45 mm, và góc xoay cần đạt được là 120 độ, ta sẽ tính được hành trình của vít me là 150 mm. Vì vậy ta chọn vít me Ø10, chiều dài 180 mm. Động cơ dẫn động là động cơ Pitman DC 24v, 80 vòng/phút. Khớp thứ 2 được truyền động bằng động cơ DC 24V, 30W, 120 vòng/phút. Do tốc độ động cơ quá lớn nên khó điều khiển vị trí chính xác, đặc biệt là với tay máy đòi hỏi độ chính xác cao. Nên ta cần phải giảm tốc cho động cơ thông qua hộp giảm tốc Hospital có tỷ số truyền 1:60 từ động cơ Maxon, Nhật Bản. Động cơ khớp 2 sau khi gắn hộp giảm tốc Hospital như hình 2. 14 13 5 6 7 12 4 280 11 3 55 10 2 53 9 1 8 100 80 246 430 Hình 4. Kết cấu chung của robot 1 - đế robot; 2 - nhôm hộp 25x50; 3 – eru Ø6; 4 - khớp xoay 1; 5 - ổ bi Ø12; 6 - động cơ Pitman nhỏ; 7 - trục vít me Ø10; 8 - vít Ø6; 9 - bánh xe; 10 - động cơ lép; 11- động cơ khớp 2; 12 - hộp giảm tốc; 13 - bạc ổ bi Ø12; 14 - khâu 2. 2.2. Tính toán thiết kế mạch điều khiển Mạch điều khiển gồm hai phần: Phần mạch phát dùng nhận tín hiệu từ máy tính và truyền tín hiệu đi, phần mạch thu (hình 3) dùng để thu và xử lý tín hiệu, từ đó điều khiển robot. TANG CÁCH LY TANG DIEU KHIEN TRUNG TAM TANG CONG SUAT TANG KHUYECH DAI 5v 5v 12v J707 clock DC1 1 1 4 data R705 2 SW701 10k 3 OP21 D108 Vdd 4 5v 3 Vpp Vpp PWM1 5 2 3 J6301 Q48 RST R112 2 C2383 LS10 D42 J910 DC2 1 4007 1 4 2 C702 ENCODER7-8 2 8 OSC1 RLA1 22p OP20 D75 330_1W 7 11 D109 24V Q45 Q26 2 J8 1N4007 PWM2 2 2 CON2 U4 12v 4 D43 1 2 2 3 Y2 PIC18F4331 1 2 6 1 1 MT12 4M R120 R15 1 C47 2 C703 Vpp data DC3 1 1 104 1 40 R12 U3 ULN2803 R13 3 1 4 MCLR/VPP RB7/PGD OSC2 CB1 clock 22p 2 39 10k 10k 12v Q44 5 RA0/AN0 RB6/PGC CB2 ENCOR4 DC1 MT1 3 3 3 38 OP17 1 2 1 18 2 A1013 DC1 3 RA1/AN1 RB5/PWM4 IN1 OUT1 D110 CB3 PWM4 DC2 MT2 5V 4 37 3 2 17 3 RA2/AN2 RB4/PWM5 IN2 OUT2 CB4 PWM3 PWM3 DC3 MT3 5 36 4 3 16 4 2 3 RA3/AN3 RB3/PWM3 IN3 OUT3 CB5 OK2 DC4 MT4 6 35 5 4 15 5 R7001 J6005 RA4/AN4 RB2/PWM2 IN4 OUT4 CB6 PWM2 DC4 DC5 MT5 7 34 R119 6 5 14 6 RA5/AN5 RB1/PWM1 IN5 OUT5 CB1 AB RS DC6 MT6 1 2 D610 3 8 33 7 6 13 7 1 1 4 RE0/AN6 RB0/PWM0 IN6 OUT6 CB2 CLK74 3 D609 2 9 7 12 3 RE1/AN7 IN7 OUT7 CB3 E PWM1 4 D612 1 10 30 OP22 8 11 RE2/AN8 RD7/PWM7 IN8 OUT8 R121 D111 CB4 RELAY 6 5 D611 29 Q34 COM GND RD6/PWM6 CB5 OSC1 PWM4 6 D607 13 2 C2383 LS7 2 3 CON3 OSC1/CLK D47 CB6 OSC2 RELAY 5 7 D608 14 28 2 OSC2/CLKOUT RD5/(PWM4) RELAY 4 DC5 27 8 10 9 1 4 RD4 ENCOR2 15 RLA2 LED C8 D72 330 Q31 7 470 11 RC0/T1OSO/T1CLK 24V PWM6 2 16 OP18 Q33 2 J7 RC1/CCP2/FLTA 1N4007 R117 D106 PWM5 RX 2 17 26 4 D48 J6003 RC2/CCP1/FLTB RC7/RX/DT ENCOR1 TX PWM5 18 25 C5 1 2 6 1 2 3 1 RC3/SCK/SCL RC6/TX/CK MT22 ENCOR3 1 + 8 19 24 1 C46 2 5v RD0/PSP0 RC5/SDO RELAY 1 DC6 1 104 7 20 23 R8 3 1 4 RD1/SDO RC4/SDI/SDA CB6 RELAY 3 3 6 22 LED 220 Q32 5 RD3/SCK/SCL CB5 RELAY 2 3 5 21 OP19 A1013 DC2 3 RD2/SDI/SDA R118 D107 CB4 4 CB3 PWM6 3 12v GND GND VDD VDD 2 3 CB2 2 CB1 1 LED 11 32 12 31 C711 CON8 + 220_16v 5v 3 Q41 C731 12VC 2 C2383 LS8 12v 1 4 D53 Vdd 104 2 OP16 8 D1003 24V RLA3 D74 330 Q37 7 11 RELAY 1 RL1 2 5v Q25 D52 2 J11 2 3 1N4007 2 4 J924 R116 6 1 1 I2C MT32 1 1 C48 2 TANG NGUON 1 4 1 104 R9 3 12v 3 OP15 Q38 5 D1007 3 U5 ULN2803 A1013 DC3 1 2 3 3 RELAY 2 RL2 2 3 J202 RL1 RLA1 1 18 IN1 OUT1 RL2 RLA2 1 R115 2 17 1 4 IN2 OUT2 RL3 RLA3 2 3 16 IN3 OUT3 RL4 RLA4 3 + OP14 4 15 IN4 OUT4 D1008 RL5 RLA5 C201C209 R204 5 14 IN5 OUT5 RELAY 3 RL3 RL6 RLA6 2200 104 1k 6 13 2 3 3 IN6 OUT6 CON3 7 12 IN7 OUT7 24V D181 R114 8 11 Q30 IN8 OUT8 2 C2383 LS9 COM GND 1 4 D57 2 5v OP13 8 J203 D1009 24V RLA4 D192 D62 330 7 10 9 11 RELAY 4 RL4 2 C6 Q28 Q27 D58 2 J12 2 3 1N4007 2 2 1 Q201 4 DIODE R113 6 1 1 MT42 1 3 U201 R203 LED C7 1 C49 2 1 4 1 1 + 104 C211 C207 7805 220 R7 3 2200 + 104 R205 OP23 Q29 5 R122 D1010 3 3 10_1W 1 3 220 A1013 DC4 GND 3 VIN VOUT RELAY 5 RL5 2 2 3 C210 D193 + C208 104 12v 2 220 LED 1 4 R123 OP24 D1011 RELAY 6 RL6 2 3 Hình 3. Sơ đồ nguyên lý mạch thu. 40
  4. Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010 2.2.1. Tầng xử lý trung tâm Sử dụng chip PIC18F4331, do chip này có 4 chân hỗ trợ điều xung PWM, ngoài ra còn 2 chân CCP có thể hoạt động ở chế độ PWM. Vậy tổng cộng có 6 chân điều xung, phù hợp với robot thiết kế, có 6 động cơ DC cần phải điều khiển tốc độ. 2.2.2. Tầng cách ly Vì tầng xử lý trung tâm có tín hiệu ra là 5V, trong khi đó các động cơ dùng trong robot đều hoạt động ở12V- 24V do đó ta phải dùng opto coupler như một khoá chuyển từ 5V sang 12V. Mạch này sử dụng bộ cách quang PC817. VCC  VLED  VDIODE 5  1,7  1,2 R   210Ω I LED 10 Ta chọn điện trở R = 330Ω hoặc 470Ω 2.2.3. Tầng công suất Mạch công suất sử dụng transistor hiệu ứng trường MOSFET IRF540 có khả năng cung cấp dòng lớn lên đến 5A, điều khiển bằng áp trên ngõ vào G. Mạch kích được lựa chọn là đẩy kéo(PUSH PULL) cho đáp ứng xung tốt. ULN2803 gồm 8 BJT ghép darlington có sẵn các điện trở và diode bảo vệ, cung cấp dòng 500mA, điện áp làm việc lên đến 50V. Ở điều kiện làm việc bình thường của ULN2803: IC =100mA, IB=250μA, VCE=2V. Giá trị của điện trở công suất trên tải ra của mạch đẩy kéo. 12  VCESAT 12  0,2 R CS    236Ω I CESAT 50 Do thị trường không có loại điện trở 236 Ω nên ta chọn Rcs=330 Ω. Công suất tiêu thụ trên điện trở Pcs = ICESAT .R CS  502 .330  0,82W 2 Chọn điện trở R = 330 Ω , P =1 đến 2 W. 2.3. Xây dựng hệ thống nhận dạng giọng nói Sơ đồ tổng quát của một hệ thống nhận dạng tiếng nói được thể hiện trên hình 6. Kết quả Trích đặc trưng Đối sánh Tách từ mẫu MFCC Hình 6. Sơ đồ tổng quát của hệ thống nhận dạng tiếng nói. 2.3.1. Thực hiện ghi âm và tách từ Tiếng nói được thu âm qua một micro kết nối với máy tính. Tiếng nói sau khi được thu âm từ micro, dùng kỹ thuật xử lý đầu cuối để tách tín hiệu tiếng nói ra khỏi nền nhiễu. Tuy có nhiều phương pháp tách tiếng nói khác nhau, nhưng qua quá trình nghiên cứu tác giả thấy phương pháp kết hợp giữa hàm năng lượng thời gian ngắn và tỷ lệ qua điểm zero cho kết quả tốt hơn. Với một cửa sổ kết thức tại mẫu thứ m, hàm năng lượng thời gian ngắn E(m) được xác định: 41
  5. Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010   (S (n) *W (n  m)) E ( m)  (5) n  Tỷ lệ qua điểm zero (zero crossing rate) là số lần mà biên độ tín hiệu đi qua điểm zero trong một khoảng thời gian cho trước được xác đinh: sgn s (n)  sgn s (n  1) m 1  Zs (m)  w(m  n) (6) N 2 n  m  N 1 Hình 7. Sự tương quan của tín hiệu tiếng nói, tỉ lệ qua điểm zero và hàm năng lượng thời gian ngắn của từ “Ba” Phương pháp này tuy đơn giản nhưng sẽ không còn chính xác nếu môi trường có nhiễu quá lớn. Tuy nhiên trong môi trường không quá ồn, giải thuật này có thể chấp nhận được. 2.3.2. Trích đặc trưng tiếng nói Quá trình nhân dạng mẫu cả ở pha huấn luyện đều trải qua giai đoạn trích đặc trưng tiếng nói. Bước này thực hiện các phân tích nhằm xác định các thông tin quan trọng, đặc trưng, ổn định của tín hiệu tiếng nói, giảm khối lượng dữ liệu cần xứ lý. Có nhiều phương pháp trích đặc trưng đã và đang được sử dụng như FBA, MFCC, LPC, PLP...Mỗi phương pháp đều có những ưu nhược điểm riêng. Hiện nay MFCC (Mel- scale Frequency Cepstral Coefficient) được sử dụng phổ biến và hiệu quả nhất. Vì vậy sử dụng MFCC làm đặc trưng của hệ nhận dạng được trình bày trong báo cáo này. MFCC là phương pháp Hình 8. Sơ đồ trích đặc trưng tiếng nói MFCC trích đặc trưng dựa vào đặc điểm cảm thụ từ tần số âm của tai người : tuyến tính đối với tần số nhỏ hơn 1kHz và phi tuyến đối với tần số trên 1kHz (Theo thang tần số Mel). Ngoài ra trong hệ nhận dạng còn bổ xung them các hệ số delta MFCC. 2.3.3. Đối sánh mẫu Đối sánh mẫu là một trong những cách tiếp cận cơ bản để giải quyết bài toán nhận dạng. Trong lĩnh vực nhận dạng tiếng nói, cách tiếp cận này cũng được sử dụng và có hiệu 42
  6. Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 7 Đại học Đà Nẵng năm 2010 quả. Đối sánh mẫu tức là sự xác định tương đương giữa các mẫu, hay nói cách khác là đo lường khoảng cách giữa các mẫu. Tùy theo đặc tả của hệ thống mà ta sử dụn g các kỹ thuật so sánh mẫu khác nhau. Các kỹ thuật có thể dùng là DTW, HMM... Cuối cùng, luật quyết định là pha trợ giúp máy tính đưa ra kết quả nhận dạng mẫu tín hiệu nào gần giống nhất, hai luật được sử dụng rộng rãi là NN và KNN. Mô hình điều khiển này thực hiện theo kỹ thuật căn chỉnh thời gian động DTW (Dynamic Time Warping) và sử dụng luật K-NN (K- Nearest Neighbor Rule) Hình 9. Giao diện điều khiển và mô hình robot điều khiển từ xa 3. Kết luận Với kết quả thu được trong quá trình thử nghiệm trên mô hình thực tế, ta nhận thấy tuy hệ thống còn nhiều hạn chế như tốc độ xử lý còn chậm, môi trường hoạt động yêu cầu không quá ồn nhưng cũng đã đáp ứng được mục tiêu của đề tài. Mô hình hoạt động khá tốt với các lệnh: hệ một từ : “Tiến”, “Lùi”, “Trái”, “Phải” và hệ hai từ : “Một trái”, “Một phải”, “Hai lên”, ”Hai xuống”, ”Ba lên”, “ Ba xuống”. Trong thời gian đến tác giả sẽ tiếp tục nghiên cứu tối ưu hóa chương trình để đạt được kết quả tốt hơn. TÀI LIỆU THAM KHẢO [1] Lê Bá Dũng, Khoa Công nghệ Thông tin, Đại học Hàng Hải Việt Nam, Tài liệu tham khảo môn xử lý tiếng nói. [2] TS Nguyễn Văn Giáp, KS Trần Việt Hồng, Bộ môn Cơ điện tử, Khoa Cơ khí, Đại học Bách khoa Thành Phố Hồ Chí Minh, “Kỹ thuật nhận dạng tiếng nói và ứng dụng trong điều khiển”. [3] Quách Tuấn Ngọc (1997), Xử lí tín hiệu số, Nhà xuất bản giáo dục. [4] GS.TSKH. Nguyễn Thiện Phúc (2006), Robot công nghiệp, NXB khoa học kỹ thuật. [5] TS Nguyễn Đức Thành (2005), Matlab và ứng dụng trong điều khiển, Nhà xuất bản Đại học Quốc gia Thành phố Hồ Chí Minh [6] http://www.mathworks.com 43
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2