intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Ứng dụng mạng noron nhân tạo SOM cho bài toán nhận dạng kí tự

Chia sẻ: Hoang Son | Ngày: | Loại File: PDF | Số trang:6

58
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong bài báo này chúng tôi đề xuất một cấu trúc trọng số mới của mạng noron SOM để biểu diễn các đặc trưng hình dạng của đối tượng, đồng thời xây dựng một hàm khoảng cách để đo độ phi tương tự giữa các đặc trưng dữ liệu và áp dụng cho bài toán nhận dạng ký tự. Kết quả thử nghiệm chỉ ra rằng mạng noron SOM có khả năng nhận dạng tốt hơn khi áp dụng giải pháp cải tiến.

Chủ đề:
Lưu

Nội dung Text: Ứng dụng mạng noron nhân tạo SOM cho bài toán nhận dạng kí tự

Lê Anh Tú và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> 99(11): 55 - 60<br /> <br /> ỨNG DỤNG MẠNG NORON NHÂN TẠO SOM<br /> CHO BÀI TOÁN NHẬN DẠNG KÍ TỰ<br /> Lê Anh Tú1*, Nguyễn Quang Hoan2, Lê Sơn Thái1<br /> 1<br /> <br /> Trường Đại học Công nghệ thông tin và truyền thông – ĐH Thái Nguyên<br /> 2<br /> Học viện Công nghệ Bưu chính Viễn thông<br /> <br /> TÓM TẮT<br /> Khi áp dụng mạng noron SOM cho bài toán nhận dạng nói chung và nhận dạng ký tự nói riêng,<br /> chúng tôi nhận thấy mạng noron SOM có nhiều triển vọng trong vấn đề này. Tuy nhiên, với mỗi<br /> dạng dữ liệu vào thì vector trọng số và hàm khoảng cách đánh giá độ phi tương tự của dữ liệu cần<br /> được thiết kế phù hợp để mạng hoạt động hiệu quả hơn. Trong bài báo này chúng tôi đề xuất một<br /> cấu trúc trọng số mới của mạng noron SOM để biểu diễn các đặc trưng hình dạng của đối tượng,<br /> đồng thời xây dựng một hàm khoảng cách để đo độ phi tương tự giữa các đặc trưng dữ liệu và áp<br /> dụng cho bài toán nhận dạng ký tự. Kết quả thử nghiệm chỉ ra rằng mạng noron SOM có khả năng<br /> nhận dạng tốt hơn khi áp dụng giải pháp cải tiến.<br /> Từ khóa: nhận dạng kí tự, mạng noron nhân tạo, mạng tự tổ chức, phân cụm dữ liệu, học cạnh tranh.<br /> <br /> GIỚI THIỆU*<br /> Trong những năm gần đây, lĩnh vực nhận<br /> dạng đối tượng sử dụng mạng noron nhân tạo<br /> là một hướng nghiên cứu được nhiều người<br /> quan tâm [1,2,4,5]. Tùy từng kiểu đối tượng<br /> cần nhận dạng và mô hình mạng noron được<br /> áp dụng mà có các giải pháp khác nhau đã<br /> được đưa ra. Trong phạm vi nghiên cứu của<br /> bài báo này, chúng tôi tập trung vào vấn đề<br /> nhận dạng đối tượng dựa trên các đặc trưng<br /> hình dạng sử dụng mạng noron nhân tạo<br /> SOM[7]. Với mỗi ảnh đối tượng huấn luyện<br /> đầu vào (ví dụ ảnh ký tự, chữ kí,..), trích ra<br /> các điểm đặc trưng mô tả đối tượng và sử<br /> dụng các thông tin này để huấn luyện mạng<br /> noron SOM. Giải pháp này có thể áp dụng<br /> cho các bài toán nhận dạng kí tự, chữ ký, biển<br /> số xe… Hình 1 minh họa quy trình nhận dạng<br /> ký tự sử dụng mạng noron nhân tạo SOM.<br /> Trong cả hai giai đoạn của quy trình trên đều<br /> thực hiện tiền xử lý ảnh đầu vào để giảm<br /> nhiễu. Tuy nhiên, chỉ có giai đoạn 1 phải trích<br /> chọn đặc trưng của ký tự sau bước tiền xử lý.<br /> Còn giai đoạn 2, ảnh sau khi tiền xử lý sẽ<br /> được đưa trực tiếp vào mạng để đối sánh.<br /> Hiện tại có nhiều giải pháp trích chọn đặc<br /> trưng có thể áp dụng cho tập dữ liệu ký tự<br /> như[3]: phương pháp trọng số vùng (zoning),<br /> biểu đồ chiếu (projection histograms), trích<br /> chọn chu tuyến (contour profiles), wavelet<br /> *<br /> <br /> Tel: 0989 199088, Email: latu@ictu.edu.vn<br /> <br /> Haar[6]… mỗi phương pháp đều có những<br /> ưu, nhược điểm riêng.<br /> Thực tế, khi áp dụng mạng noron SOM cho<br /> bài toán nhận dạng kí tự, chúng tôi thấy độ<br /> chính xác của kết quả nhận dạng phụ thuộc<br /> nhiều vào phương pháp trích chọn đặc trưng<br /> và hàm đánh giá độ phi tương tự của SOM<br /> (hàm khoảng cách). Hàm khoảng cách này<br /> cần được xây dựng phù hợp với từng dạng dữ<br /> liệu và đặc trưng cụ thể. Chúng tôi đã chia<br /> ảnh thành nhiều vùng tương tự phương pháp<br /> trọng số vùng (chia ảnh thành lưới kích thước<br /> m x n, mỗi ô lưới là một đầu vào của mạng<br /> với giá trị là số điểm đen trong ô lưới đó)[3]<br /> và xác định đặc trưng hình dạng của đối<br /> tượng dựa vào vị trí các điểm đen đặc trưng<br /> và vị trí các điểm trắng đặc trưng. Trong đó,<br /> điểm đen (đặc trưng điểm đen) mô tả đường<br /> nét của đối tượng, chỉ ra những vị trí bắt buộc<br /> phải có nét vẽ; ngược lại, điểm trắng (đặc<br /> trưng điểm trắng) mô tả các vị trí không có<br /> đường nét (không được phép có nét vẽ).<br /> Những đặc trưng này là cơ sở để chúng tôi<br /> thiết kế cấu trúc trọng số cho mạng noron SOM,<br /> từ đó xây dựng một hàm khoảng cách mới phù<br /> hợp với cách lựa chọn các đặc trưng này.<br /> Các phần tiếp theo của bài báo sẽ trình bày<br /> chi tiết hơn, trong đó: phần 2 trình bày giải<br /> thuật SOM, phần 3 mô tả cấu trúc trọng số<br /> mới sử dụng đặc trưng điểm đen và đặc trưng<br /> điểm trắng, phần 4 đưa ra công thức xác định<br /> độ phi tương tự giữa trọng số của noron và<br /> ảnh đầu vào, phần 5 trình bày kết quả thực<br /> nghiệm và cuối cùng là kết luận.<br /> 55<br /> <br /> Lê Anh Tú và Đtg<br /> <br /> Tập ảnh kí tự<br /> huấn luyện<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> Tiền<br /> xử lý<br /> <br /> Trích<br /> chọn đặc<br /> trưng<br /> <br /> Giai đoạn 1<br /> Giai đoạn 2<br /> Tập ảnh kí tự<br /> cần nhận dạng<br /> <br /> Tiền<br /> xử lý<br /> <br /> 99(11): 55 - 60<br /> <br /> Huấn luyện<br /> mạng noron<br /> SOM<br /> <br /> Mạng noron<br /> SOM đã được<br /> huấn luyện<br /> <br /> Mạng noron<br /> SOM đã được<br /> huấn luyện<br /> <br /> Kết quả nhận<br /> dạng<br /> <br /> Hình 1. Quy trình nhận dạng ký tự sử dụng mạng noron nhận tạo<br /> <br /> MẠNG NORON NHÂN TẠO SOM<br /> Mạng noron SOM[7] gồm lớp tín hiệu vào và<br /> lớp ra Kohonen. Lớp Kohonen thường được<br /> tổ chức dưới dạng một ma trận 2 chiều các<br /> noron. Mỗi đơn vị i (noron) trong lớp<br /> Kohonen được gắn một vector trọng số wi=<br /> [wi1, wi2, …,win], với n là kích thước vector<br /> đầu vào (Hình 2); wij là trọng số của noron i<br /> ứng với đầu vào j).<br /> Quá trình huấn luyện mạng được lặp nhiều<br /> lần, tại lần lặp thứ t thực hiện 3 bước:<br /> Bước 1- tìm noron chiến thắng (BMU- Best<br /> Matching Unit): chọn ngẫu nhiên một đầu vào<br /> v từ tập dữ liệu, duyệt ma trận Kohonen tìm<br /> noron b có hàm khoảng cách dist nhỏ nhất<br /> (thường dùng hàm Euclidian, Manhattan hay<br /> Vector Dot Product). Noron b được gọi là<br /> BMU.<br /> dist =|| v − w b ||= min {|| v − mi ||}<br /> i<br /> <br /> với quá trình học, được tính theo công thức<br />  || r − r ||2 <br /> hbi (t ) = exp − b 2 i  trong đó rb và ri là vị<br /> 2σ (t ) <br /> <br /> <br /> trí của noron b và noron i trong ma trận<br /> Kohonen.<br /> CẤU TRÚC TRỌNG SỐ DỰA TRÊN ĐẶC<br /> TRƯNG ĐIỂM ĐEN VÀ ĐẶC TRƯNG<br /> ĐIỂM TRẮNG<br /> x1<br /> x2<br /> <br /> wi1<br /> wi2<br /> <br /> noron<br /> i<br /> xn<br /> <br /> y<br /> <br /> win<br /> Hình 2. Noron i trong lớp Kohonen<br /> <br /> (1)<br /> <br /> Bước 2- xác định bán kính lân cận của BMU:<br />  t<br /> σ (t ) = σ0 exp −  là hàm nội suy bán kính<br />  λ <br /> <br /> (giảm dần theo số lần lặp), với σ0 là bán kính<br /> khởi tạo; hằng số thời gian λ =<br /> <br /> K<br /> , với<br /> log (σ0 )<br /> <br /> K là tổng số lần lặp.<br /> Bước 3- cập nhật lại trọng số của các noron<br /> trong bán kính lân cận của BMU theo hướng<br /> gần hơn với vector đầu vào v:<br /> w i (t + 1) = w i (t ) + α (t ) hbi (t ) v − w i (t ) (2)<br />  t<br />  λ <br /> <br /> Trong đó: α (t ) = α0 exp −  là hàm nội suy<br /> tốc độ học, với α0 là giá trị khởi tạo của tốc<br /> độ học; hbi(t) là hàm nội suy theo thời gian<br /> học, thể hiện sự tác động của khoảng cách đối<br /> 56<br /> <br /> Hình 3. Minh họa chia lưới lấy mẫu<br /> trên ảnh ký tự nhị phân<br /> <br /> Ảnh ký tự gốc ban đầu được lọc xương, xén<br /> tỉa các mép thừa và biến đổi về dạng ảnh nhị<br /> phân có kích thước u x v pixels (điểm đen có<br /> giá trị 1, điểm trắng có giá trị 0), với u và v<br /> chia hết cho k (k là kích thước đơn vị của lưới<br /> lấy mẫu). Mỗi ô của lưới lấy mẫu có kích<br /> thước k x k.<br /> <br /> Lê Anh Tú và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> 99(11): 55 - 60<br /> <br /> Ký tự ban đầu<br /> Ký tự mới sau khi xóa đi một vài nét<br /> của ký tự ban đầu<br /> Hình 4. Ví dụ một số ký tự có hình dạng bao nhau<br /> <br /> Hình 3 minh họa ảnh nhị phân kích thước<br /> 20x16 và kích thước đơn vị của lưới lấy mẫu<br /> k=4, tức là kích thước lưới lấy mẫu là 5x4 ô,<br /> mỗi ô có kích thước 4x4 pixels. Mỗi ô của<br /> lưới lấy mẫu được trích trọn đặc trưng theo<br /> hai bước. Bước 1, lấy đặc trưng điểm đen (mb,<br /> xb, yb), trong đó mb là số pixels có giá trị 1<br /> (điểm màu đen) và xb, yb là tọa độ trung tâm<br /> của tất cả các điểm màu đen. Bước 2, lấy đặc<br /> trưng điểm trắng (mw, xw, yw), trong mw là số<br /> pixels có giá trị 0 và xw, yw là tọa độ trung tâm<br /> của tất cả các điểm màu trắng (trình tự các<br /> bước có thể thay đổi nhưng phải thống nhất<br /> trên tất cả các ô).<br /> Lý do chúng tôi sử dụng thêm đặc trưng điểm<br /> trắng là do các đặc trưng điểm đen không<br /> hoàn toàn phân biệt được các mẫu ký tự có<br /> hình dạng bao nhau (tập nét vẽ của ký tự này<br /> bao tập nét vẽ của ký tự khác). Tức là nếu xóa<br /> đi một vài nét của ký tự ban đầu thì ta sẽ có<br /> một ký tự mới (Hình 4).<br /> x1<br /> x2<br /> <br /> wi1<br /> wi2<br /> <br /> xs<br /> <br /> wis<br /> <br /> xs+1<br /> xs+2<br /> <br /> wi s+1<br /> wi s+2<br /> <br /> x2s<br /> <br /> wi 2s<br /> <br /> noron<br /> i<br /> <br /> một noron i. Như vậy, mỗi noron i trong lớp<br /> Kohonen được gắn một vector trọng số wi=<br /> [wi1, wi2, …,wis, wis+1, wis+2, …, wi2s], trong đó<br /> cấu trúc của đầu vào xj và trọng số wij (với<br /> j=1..2) gồm 3 thành phần đặc trưng m, x và y.<br /> Như vậy trong quá trình tính toán của mạng<br /> SOM, công thức (2) sẽ được áp dụng để điều<br /> chỉnh cho cả 3 tham số này.<br /> HÀM ĐÁNH GIÁ ĐỘ PHI TƯƠNG TỰ<br /> GIỮA TRỌNG SỐ CỦA NORON VÀ ẢNH<br /> ĐẦU VÀO<br /> Để đánh giá độ khác biệt giữa vector trọng số<br /> của noron và vector dữ liệu vào, thuật toán<br /> SOM sử dụng công thức (1). Đây chỉ đơn<br /> giản là công thức xác định khoảng cách giữa<br /> hai vector. Như vậy, với cách thiết lập trọng<br /> số đã trình bày ở đoạn 3, chúng tôi đề xuất<br /> một hàm đánh giá mới đo độ phi tương tự<br /> giữa trọng số của mỗi noron và ảnh kí tự vào,<br /> với dist = min{dblack+dwhite}. Trong đó, dblack là<br /> hàm đánh giá sự khác biệt dựa trên đặc trưng<br /> điểm đen, dwhite là hàm đánh giá sự khác biệt<br /> dựa trên đặc trưng điểm trắng.<br /> <br /> y<br /> <br /> Hình 5. Noron i với vector trọng số<br /> theo đặc trưng điểm đen và trắng<br /> <br /> Mỗi ký tự sẽ trích chọn được s=(u/k)x(v/k)<br /> đặc trưng điểm đen và s đặc trưng điểm trắng.<br /> Ví dụ, ô lưới được đánh dấu trong Hình 3 có<br /> đặc trưng điểm đen là (4, 2.5, 7) và đặc trưng<br /> điểm trắng là (12, 2.5, 6.3). Mạng noron SOM<br /> được thiết kế gồm 2s đầu vào, s đầu vào đầu<br /> tiên tương ứng với các đặc trưng điểm đen, s<br /> đầu vào tiếp theo tương ứng với các đặc trưng<br /> điểm trắng. Hình 5 minh họa kiến trúc của<br /> <br /> Hình 6. Minh họa lực kéo của các điểm<br /> khung với đối tượng<br /> <br /> Hàm dblack được tính dựa trên ý tưởng coi mỗi<br /> điểm đen đặc trưng như là các điểm khung<br /> của đối tượng. Do đó khi áp một đối tượng<br /> (ký tự) lên khung này để so sánh, thì mỗi<br /> điểm trên khung (điểm đen) sẽ cần một lực<br /> 57<br /> <br /> Lê Anh Tú và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> kéo nhất định để giữ được đối tượng (Hình 6).<br /> Lực kéo tại một điểm trên khung tỉ lệ thuận<br /> với khoảng cách từ điểm đó tới điểm đen gần<br /> nhất trên đối tượng và số lượng pixels tại<br /> điểm khung đó. Tổng lực kéo này càng nhỏ<br /> thì độ tương tự giữa khung và đối tượng càng<br /> lớn (đối tượng giống với khung), ngược lại<br /> lực kéo lớn thì độ phi tương tự lớn (đối tượng<br /> không giống khung). Công thức dblack được<br /> xác định như sau:<br /> s<br /> <br /> dblack = ∑ mbi * rbi , trong đó: mbi là số pixels<br /> i =1<br /> <br /> có giá trị 1 tại điểm khung thứ i; rbi là khoảng<br /> cách từ điểm khung thứ i đến điểm đen gần<br /> nhất trên đối tượng.<br /> <br /> Hình 7. Minh họa lực đẩy của các điểm trắng<br /> đặc trưng<br /> <br /> Ngược với các điểm đen đặc trưng (được coi<br /> là các điểm kéo), các điểm trắng đặc trưng<br /> được coi là các điểm đẩy (Hình 7). Các điểm<br /> này sẽ góp phần đẩy hình dạng của đối tượng<br /> đến gần các điểm khung hơn. Như vậy, nếu<br /> cần càng nhiều lực đẩy thì độ phi tương tự<br /> càng lớn, ngược lại lực đẩy nhỏ thì độ tương<br /> tự cao. Điều này có nghĩa là nếu đối tượng có<br /> càng nhiều nét vẽ vi phạm các vị trí “cấm vẽ”<br /> thì độ phi tương tự càng tăng. Về nguyên tắc,<br /> lực đẩy sẽ tỉ lệ nghịch với khoảng cách từ<br /> điểm trắng đặc trưng tới điểm đen gần nhất<br /> trên đối tượng. Công thức dwhite được xác định<br /> như sau:<br /> s<br /> <br /> d white = ∑<br /> i =1<br /> <br /> mwi<br /> , trong đó: mwi là số pixels có<br /> rwi<br /> <br /> giá trị 0 của đặc trưng điểm trắng thứ i; rwi là<br /> khoảng cách từ điểm trắng đặc trưng thứ i tới<br /> điểm đen gần nhất trên đối tượng.<br /> Như vậy, hàm đánh giá độ phi tương tự được<br /> viết lại như sau:<br /> 58<br /> <br /> s<br />  s<br /> m <br /> dist = min ∑ mbi * rbi + ∑ wi <br />  i=1<br /> <br /> i =1 rwi <br /> <br /> <br /> <br /> 99(11): 55 - 60<br /> <br /> (3)<br /> <br /> KẾT QUẢ THỬ NGHIỆM<br /> Chúng tôi đã cài đặt thử nghiệm đồng thời cả<br /> hai giải pháp: giải pháp trọng số vùng (trích<br /> chọn đặc trưng theo phương pháp trọng số<br /> vùng, với hàm khoảng cách Euclidian) và giải<br /> pháp trích trọn cải tiến (đoạn 3) với hàm đánh<br /> giá độ phi tương tự theo công thức (3).<br /> Kết quả thử nghiệm trình bày trong Hình 8<br /> được áp dụng đối với 26 mẫu kí tự quang in<br /> hoa và một số ký tự viết tay. Trong tất cả các<br /> trường hợp thử nghiệm, giải pháp cải tiến đều<br /> cho kết quả nhận dạng chính xác hơn, đặc biệt<br /> với các mẫu ký tự quang kết quả nhận dạng<br /> đều chính xác. Với các mẫu ký tự viết tay tuy<br /> không hoàn toàn chính xác, nhưng ít sai hơn<br /> so với giải pháp chuẩn.<br /> Ảnh mẫu đầu tiên, các mẫu kí tự quang in hoa<br /> tương đối mảnh (nét mảnh), cả hai giải pháp<br /> đều cho kết quả nhận dạng chính xác. Nhưng<br /> ở ảnh mẫu thứ hai và thứ ba các mẫu ký tự<br /> quang in hoa đậm hơn (nét dày hơn) thì giải<br /> pháp chuẩn có một số kí tự bị nhận dạng sai,<br /> trong khi giải pháp cải tiến vẫn có kết quả<br /> nhận dạng chính xác. Nguyên nhân là do ảnh<br /> đầu vào được lọc xương, nên khi các kí tự có<br /> nét càng dày thì xương của ký tự càng có xu<br /> thế bị biến dạng hơn. Điều này cho thấy giải<br /> pháp cải tiến đánh giá đặc trưng của ký tự<br /> chính xác hơn (ít nhạy hơn khi có các biến<br /> dạng). Tương tự với 3 ảnh mẫu cuối, ngoài<br /> mức độ dày, mảnh của kí tự thì đây là các<br /> mẫu kí tự viết tay nên có nhiều biến dạng so<br /> với kí tự gốc. Giải pháp cải tiến vẫn có kết<br /> quả nhận dạng khả thi hơn giải pháp chuẩn.<br /> KẾT LUẬN<br /> Tuy mạng noron SOM có nhiều triển vọng<br /> trong các bài toán phân cụm dữ liệu và nhận<br /> dạng, nhưng tính khả thi thực sự phụ thuộc rất<br /> nhiều vào đặc trưng của dữ liệu và hàm đánh<br /> giá độ phi tương tự của đặc trưng. Bài báo đã<br /> đề xuất một cấu trúc trọng số mới phù hợp<br /> với cách trích trọn đặc trưng của đối tượng và<br /> đưa ra một hàm đánh giá độ phi tương tự của<br /> các đặc trưng này, góp phần nâng cao khả<br /> năng nhận dạng của noron SOM. Giải pháp<br /> đề xuất có thể áp dụng cho các bài toán nhận<br /> dạng kí tự, chữ ký, biển số xe…<br /> <br /> Lê Anh Tú và Đtg<br /> <br /> Ảnh đầu vào<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> 99(11): 55 - 60<br /> <br /> Giải pháp trọng số vùng, sử dụng<br /> hàm khoảng cách Euclidian<br /> Tỉ lệ<br /> Kết quả<br /> đúng<br /> A B C D E F G H I<br /> 100%<br /> J K L M N O F Q R<br /> S T U V K X Z W<br /> A B C D E F G H I<br /> 92.3%<br /> J K L M N O F Q P<br /> S T U V Y X Z W<br /> A B C O E F B H I J 76.9%<br /> K L M N O P M R S<br /> T U V H X ZM<br /> <br /> A<br /> K<br /> T<br /> A<br /> K<br /> T<br /> A<br /> K<br /> T<br /> <br /> A B C O E P P K<br /> <br /> 50%<br /> <br /> A B C DE FGH<br /> <br /> 100%<br /> <br /> D C F K F D<br /> <br /> 33.3%<br /> <br /> B C F I P D<br /> <br /> 83.3%<br /> <br /> N H A N O A R P K<br /> C K U<br /> <br /> 50%<br /> <br /> N H A N D A N G K<br /> I T U<br /> <br /> 100%<br /> <br /> Giải pháp cải tiến<br /> Kết quả<br /> B<br /> L<br /> U<br /> B<br /> L<br /> U<br /> B<br /> L<br /> U<br /> <br /> C<br /> M<br /> V<br /> C<br /> M<br /> V<br /> C<br /> M<br /> V<br /> <br /> D<br /> N<br /> K<br /> D<br /> N<br /> Y<br /> D<br /> N<br /> Y<br /> <br /> E F G H I J<br /> O F Q R S<br /> X Z W<br /> E F G H I J<br /> O P Q R S<br /> X Z W<br /> E F G H I J<br /> O F Q R S<br /> X Z W<br /> <br /> Tỉ lệ<br /> đúng<br /> 100%<br /> <br /> 100%<br /> <br /> 100%<br /> <br /> Hình 8. Kết quả thử nghiệm nhận dạng kí tự<br /> <br /> Mặc dù kết quả thử nghiệm của giải pháp đề<br /> xuất với một số mẫu ký tự đơn giản có khả<br /> quan, nhưng để đánh giá tính khả thi thực sự<br /> của giải pháp cần tiếp tục thử nghiệm với các<br /> bộ test lớn hơn (ví dụ như MNIST). Trên các<br /> bộ test lớn thời gian tính toán cũng là một vấn<br /> đề cần xem xét, do cách thức tổ chức trọng số<br /> và việc đối sánh trọng số của noron với ảnh<br /> đầu vào tương đối phức tạp.<br /> Về mặt chất lượng nhận dạng, thì giải pháp đã<br /> đề xuất có thể tiếp tục cải tiến. Chẳng hạn, ở<br /> giai đoạn tiền xử lý có thể tăng cường đặc<br /> trưng điểm giao của các nét trong mỗi kí tự.<br /> Tức là giá trị pixel tại các điểm giao giữa các<br /> nét không phải là 1, mà có thể là tổng của tất<br /> cả các pixels có giá trị 1 quanh nó. Việc tăng<br /> cường này có thể làm tăng độ chính xác của<br /> hàm đánh giá độ phi tương tự căn cứ vào đặc<br /> trưng điểm giao.<br /> <br /> TÀI LIỆU THAM KHẢO<br /> [1]. Dong Xiao Ni, (May 4th, 2007), “Application of<br /> Neural Networks to Character Recognition”,<br /> Proceedings of Students/Faculty Research Day, CSIS,<br /> Pace University.<br /> [2]. Prof. M.S.Kumbhar, Y.Y.Chandrachud, (9-2012),<br /> “Handwritten marathi character recognition using<br /> neural network”, International Journal of Emerging<br /> Technology and Advanced Engineering, Vol 2, Issue 9.<br /> [3]. Phạm Anh Phương, (2009), “Một số phương pháp<br /> trích chọn đặc trưng hiệu quả cho bài toán nhận dạng<br /> chữ viết tay rời rạc”, Tạp chí khoa học – Đại học Huế,<br /> số 53.<br /> [4]. C .M. Bishop, (1995), “Neural networks for pattern<br /> recognition”, Oxford University Press , USA.<br /> [5]. Jelmer de Vries, “Object Recognition: A<br /> Shape-Based Approach using Artificial Neural<br /> Networks”, University of Utrecht.<br /> [6]. Viola, P., Jones, M., (2001), “Rapid object detection<br /> using a boosted cascade of simple features”, Proc. Intl.<br /> Conf. on Computer Vision and Pattern Recognition<br /> (CVPR), Vol 1, p511–518.<br /> [7]. Teuvo Kohonen, (2001), “Self-Organizing<br /> Maps”, Springer, 3rd Edition.<br /> <br /> 59<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2