Lê Anh Tú và Đtg<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
99(11): 55 - 60<br />
<br />
ỨNG DỤNG MẠNG NORON NHÂN TẠO SOM<br />
CHO BÀI TOÁN NHẬN DẠNG KÍ TỰ<br />
Lê Anh Tú1*, Nguyễn Quang Hoan2, Lê Sơn Thái1<br />
1<br />
<br />
Trường Đại học Công nghệ thông tin và truyền thông – ĐH Thái Nguyên<br />
2<br />
Học viện Công nghệ Bưu chính Viễn thông<br />
<br />
TÓM TẮT<br />
Khi áp dụng mạng noron SOM cho bài toán nhận dạng nói chung và nhận dạng ký tự nói riêng,<br />
chúng tôi nhận thấy mạng noron SOM có nhiều triển vọng trong vấn đề này. Tuy nhiên, với mỗi<br />
dạng dữ liệu vào thì vector trọng số và hàm khoảng cách đánh giá độ phi tương tự của dữ liệu cần<br />
được thiết kế phù hợp để mạng hoạt động hiệu quả hơn. Trong bài báo này chúng tôi đề xuất một<br />
cấu trúc trọng số mới của mạng noron SOM để biểu diễn các đặc trưng hình dạng của đối tượng,<br />
đồng thời xây dựng một hàm khoảng cách để đo độ phi tương tự giữa các đặc trưng dữ liệu và áp<br />
dụng cho bài toán nhận dạng ký tự. Kết quả thử nghiệm chỉ ra rằng mạng noron SOM có khả năng<br />
nhận dạng tốt hơn khi áp dụng giải pháp cải tiến.<br />
Từ khóa: nhận dạng kí tự, mạng noron nhân tạo, mạng tự tổ chức, phân cụm dữ liệu, học cạnh tranh.<br />
<br />
GIỚI THIỆU*<br />
Trong những năm gần đây, lĩnh vực nhận<br />
dạng đối tượng sử dụng mạng noron nhân tạo<br />
là một hướng nghiên cứu được nhiều người<br />
quan tâm [1,2,4,5]. Tùy từng kiểu đối tượng<br />
cần nhận dạng và mô hình mạng noron được<br />
áp dụng mà có các giải pháp khác nhau đã<br />
được đưa ra. Trong phạm vi nghiên cứu của<br />
bài báo này, chúng tôi tập trung vào vấn đề<br />
nhận dạng đối tượng dựa trên các đặc trưng<br />
hình dạng sử dụng mạng noron nhân tạo<br />
SOM[7]. Với mỗi ảnh đối tượng huấn luyện<br />
đầu vào (ví dụ ảnh ký tự, chữ kí,..), trích ra<br />
các điểm đặc trưng mô tả đối tượng và sử<br />
dụng các thông tin này để huấn luyện mạng<br />
noron SOM. Giải pháp này có thể áp dụng<br />
cho các bài toán nhận dạng kí tự, chữ ký, biển<br />
số xe… Hình 1 minh họa quy trình nhận dạng<br />
ký tự sử dụng mạng noron nhân tạo SOM.<br />
Trong cả hai giai đoạn của quy trình trên đều<br />
thực hiện tiền xử lý ảnh đầu vào để giảm<br />
nhiễu. Tuy nhiên, chỉ có giai đoạn 1 phải trích<br />
chọn đặc trưng của ký tự sau bước tiền xử lý.<br />
Còn giai đoạn 2, ảnh sau khi tiền xử lý sẽ<br />
được đưa trực tiếp vào mạng để đối sánh.<br />
Hiện tại có nhiều giải pháp trích chọn đặc<br />
trưng có thể áp dụng cho tập dữ liệu ký tự<br />
như[3]: phương pháp trọng số vùng (zoning),<br />
biểu đồ chiếu (projection histograms), trích<br />
chọn chu tuyến (contour profiles), wavelet<br />
*<br />
<br />
Tel: 0989 199088, Email: latu@ictu.edu.vn<br />
<br />
Haar[6]… mỗi phương pháp đều có những<br />
ưu, nhược điểm riêng.<br />
Thực tế, khi áp dụng mạng noron SOM cho<br />
bài toán nhận dạng kí tự, chúng tôi thấy độ<br />
chính xác của kết quả nhận dạng phụ thuộc<br />
nhiều vào phương pháp trích chọn đặc trưng<br />
và hàm đánh giá độ phi tương tự của SOM<br />
(hàm khoảng cách). Hàm khoảng cách này<br />
cần được xây dựng phù hợp với từng dạng dữ<br />
liệu và đặc trưng cụ thể. Chúng tôi đã chia<br />
ảnh thành nhiều vùng tương tự phương pháp<br />
trọng số vùng (chia ảnh thành lưới kích thước<br />
m x n, mỗi ô lưới là một đầu vào của mạng<br />
với giá trị là số điểm đen trong ô lưới đó)[3]<br />
và xác định đặc trưng hình dạng của đối<br />
tượng dựa vào vị trí các điểm đen đặc trưng<br />
và vị trí các điểm trắng đặc trưng. Trong đó,<br />
điểm đen (đặc trưng điểm đen) mô tả đường<br />
nét của đối tượng, chỉ ra những vị trí bắt buộc<br />
phải có nét vẽ; ngược lại, điểm trắng (đặc<br />
trưng điểm trắng) mô tả các vị trí không có<br />
đường nét (không được phép có nét vẽ).<br />
Những đặc trưng này là cơ sở để chúng tôi<br />
thiết kế cấu trúc trọng số cho mạng noron SOM,<br />
từ đó xây dựng một hàm khoảng cách mới phù<br />
hợp với cách lựa chọn các đặc trưng này.<br />
Các phần tiếp theo của bài báo sẽ trình bày<br />
chi tiết hơn, trong đó: phần 2 trình bày giải<br />
thuật SOM, phần 3 mô tả cấu trúc trọng số<br />
mới sử dụng đặc trưng điểm đen và đặc trưng<br />
điểm trắng, phần 4 đưa ra công thức xác định<br />
độ phi tương tự giữa trọng số của noron và<br />
ảnh đầu vào, phần 5 trình bày kết quả thực<br />
nghiệm và cuối cùng là kết luận.<br />
55<br />
<br />
Lê Anh Tú và Đtg<br />
<br />
Tập ảnh kí tự<br />
huấn luyện<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
Tiền<br />
xử lý<br />
<br />
Trích<br />
chọn đặc<br />
trưng<br />
<br />
Giai đoạn 1<br />
Giai đoạn 2<br />
Tập ảnh kí tự<br />
cần nhận dạng<br />
<br />
Tiền<br />
xử lý<br />
<br />
99(11): 55 - 60<br />
<br />
Huấn luyện<br />
mạng noron<br />
SOM<br />
<br />
Mạng noron<br />
SOM đã được<br />
huấn luyện<br />
<br />
Mạng noron<br />
SOM đã được<br />
huấn luyện<br />
<br />
Kết quả nhận<br />
dạng<br />
<br />
Hình 1. Quy trình nhận dạng ký tự sử dụng mạng noron nhận tạo<br />
<br />
MẠNG NORON NHÂN TẠO SOM<br />
Mạng noron SOM[7] gồm lớp tín hiệu vào và<br />
lớp ra Kohonen. Lớp Kohonen thường được<br />
tổ chức dưới dạng một ma trận 2 chiều các<br />
noron. Mỗi đơn vị i (noron) trong lớp<br />
Kohonen được gắn một vector trọng số wi=<br />
[wi1, wi2, …,win], với n là kích thước vector<br />
đầu vào (Hình 2); wij là trọng số của noron i<br />
ứng với đầu vào j).<br />
Quá trình huấn luyện mạng được lặp nhiều<br />
lần, tại lần lặp thứ t thực hiện 3 bước:<br />
Bước 1- tìm noron chiến thắng (BMU- Best<br />
Matching Unit): chọn ngẫu nhiên một đầu vào<br />
v từ tập dữ liệu, duyệt ma trận Kohonen tìm<br />
noron b có hàm khoảng cách dist nhỏ nhất<br />
(thường dùng hàm Euclidian, Manhattan hay<br />
Vector Dot Product). Noron b được gọi là<br />
BMU.<br />
dist =|| v − w b ||= min {|| v − mi ||}<br />
i<br />
<br />
với quá trình học, được tính theo công thức<br />
|| r − r ||2 <br />
hbi (t ) = exp − b 2 i trong đó rb và ri là vị<br />
2σ (t ) <br />
<br />
<br />
trí của noron b và noron i trong ma trận<br />
Kohonen.<br />
CẤU TRÚC TRỌNG SỐ DỰA TRÊN ĐẶC<br />
TRƯNG ĐIỂM ĐEN VÀ ĐẶC TRƯNG<br />
ĐIỂM TRẮNG<br />
x1<br />
x2<br />
<br />
wi1<br />
wi2<br />
<br />
noron<br />
i<br />
xn<br />
<br />
y<br />
<br />
win<br />
Hình 2. Noron i trong lớp Kohonen<br />
<br />
(1)<br />
<br />
Bước 2- xác định bán kính lân cận của BMU:<br />
t<br />
σ (t ) = σ0 exp − là hàm nội suy bán kính<br />
λ <br />
<br />
(giảm dần theo số lần lặp), với σ0 là bán kính<br />
khởi tạo; hằng số thời gian λ =<br />
<br />
K<br />
, với<br />
log (σ0 )<br />
<br />
K là tổng số lần lặp.<br />
Bước 3- cập nhật lại trọng số của các noron<br />
trong bán kính lân cận của BMU theo hướng<br />
gần hơn với vector đầu vào v:<br />
w i (t + 1) = w i (t ) + α (t ) hbi (t ) v − w i (t ) (2)<br />
t<br />
λ <br />
<br />
Trong đó: α (t ) = α0 exp − là hàm nội suy<br />
tốc độ học, với α0 là giá trị khởi tạo của tốc<br />
độ học; hbi(t) là hàm nội suy theo thời gian<br />
học, thể hiện sự tác động của khoảng cách đối<br />
56<br />
<br />
Hình 3. Minh họa chia lưới lấy mẫu<br />
trên ảnh ký tự nhị phân<br />
<br />
Ảnh ký tự gốc ban đầu được lọc xương, xén<br />
tỉa các mép thừa và biến đổi về dạng ảnh nhị<br />
phân có kích thước u x v pixels (điểm đen có<br />
giá trị 1, điểm trắng có giá trị 0), với u và v<br />
chia hết cho k (k là kích thước đơn vị của lưới<br />
lấy mẫu). Mỗi ô của lưới lấy mẫu có kích<br />
thước k x k.<br />
<br />
Lê Anh Tú và Đtg<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
99(11): 55 - 60<br />
<br />
Ký tự ban đầu<br />
Ký tự mới sau khi xóa đi một vài nét<br />
của ký tự ban đầu<br />
Hình 4. Ví dụ một số ký tự có hình dạng bao nhau<br />
<br />
Hình 3 minh họa ảnh nhị phân kích thước<br />
20x16 và kích thước đơn vị của lưới lấy mẫu<br />
k=4, tức là kích thước lưới lấy mẫu là 5x4 ô,<br />
mỗi ô có kích thước 4x4 pixels. Mỗi ô của<br />
lưới lấy mẫu được trích trọn đặc trưng theo<br />
hai bước. Bước 1, lấy đặc trưng điểm đen (mb,<br />
xb, yb), trong đó mb là số pixels có giá trị 1<br />
(điểm màu đen) và xb, yb là tọa độ trung tâm<br />
của tất cả các điểm màu đen. Bước 2, lấy đặc<br />
trưng điểm trắng (mw, xw, yw), trong mw là số<br />
pixels có giá trị 0 và xw, yw là tọa độ trung tâm<br />
của tất cả các điểm màu trắng (trình tự các<br />
bước có thể thay đổi nhưng phải thống nhất<br />
trên tất cả các ô).<br />
Lý do chúng tôi sử dụng thêm đặc trưng điểm<br />
trắng là do các đặc trưng điểm đen không<br />
hoàn toàn phân biệt được các mẫu ký tự có<br />
hình dạng bao nhau (tập nét vẽ của ký tự này<br />
bao tập nét vẽ của ký tự khác). Tức là nếu xóa<br />
đi một vài nét của ký tự ban đầu thì ta sẽ có<br />
một ký tự mới (Hình 4).<br />
x1<br />
x2<br />
<br />
wi1<br />
wi2<br />
<br />
xs<br />
<br />
wis<br />
<br />
xs+1<br />
xs+2<br />
<br />
wi s+1<br />
wi s+2<br />
<br />
x2s<br />
<br />
wi 2s<br />
<br />
noron<br />
i<br />
<br />
một noron i. Như vậy, mỗi noron i trong lớp<br />
Kohonen được gắn một vector trọng số wi=<br />
[wi1, wi2, …,wis, wis+1, wis+2, …, wi2s], trong đó<br />
cấu trúc của đầu vào xj và trọng số wij (với<br />
j=1..2) gồm 3 thành phần đặc trưng m, x và y.<br />
Như vậy trong quá trình tính toán của mạng<br />
SOM, công thức (2) sẽ được áp dụng để điều<br />
chỉnh cho cả 3 tham số này.<br />
HÀM ĐÁNH GIÁ ĐỘ PHI TƯƠNG TỰ<br />
GIỮA TRỌNG SỐ CỦA NORON VÀ ẢNH<br />
ĐẦU VÀO<br />
Để đánh giá độ khác biệt giữa vector trọng số<br />
của noron và vector dữ liệu vào, thuật toán<br />
SOM sử dụng công thức (1). Đây chỉ đơn<br />
giản là công thức xác định khoảng cách giữa<br />
hai vector. Như vậy, với cách thiết lập trọng<br />
số đã trình bày ở đoạn 3, chúng tôi đề xuất<br />
một hàm đánh giá mới đo độ phi tương tự<br />
giữa trọng số của mỗi noron và ảnh kí tự vào,<br />
với dist = min{dblack+dwhite}. Trong đó, dblack là<br />
hàm đánh giá sự khác biệt dựa trên đặc trưng<br />
điểm đen, dwhite là hàm đánh giá sự khác biệt<br />
dựa trên đặc trưng điểm trắng.<br />
<br />
y<br />
<br />
Hình 5. Noron i với vector trọng số<br />
theo đặc trưng điểm đen và trắng<br />
<br />
Mỗi ký tự sẽ trích chọn được s=(u/k)x(v/k)<br />
đặc trưng điểm đen và s đặc trưng điểm trắng.<br />
Ví dụ, ô lưới được đánh dấu trong Hình 3 có<br />
đặc trưng điểm đen là (4, 2.5, 7) và đặc trưng<br />
điểm trắng là (12, 2.5, 6.3). Mạng noron SOM<br />
được thiết kế gồm 2s đầu vào, s đầu vào đầu<br />
tiên tương ứng với các đặc trưng điểm đen, s<br />
đầu vào tiếp theo tương ứng với các đặc trưng<br />
điểm trắng. Hình 5 minh họa kiến trúc của<br />
<br />
Hình 6. Minh họa lực kéo của các điểm<br />
khung với đối tượng<br />
<br />
Hàm dblack được tính dựa trên ý tưởng coi mỗi<br />
điểm đen đặc trưng như là các điểm khung<br />
của đối tượng. Do đó khi áp một đối tượng<br />
(ký tự) lên khung này để so sánh, thì mỗi<br />
điểm trên khung (điểm đen) sẽ cần một lực<br />
57<br />
<br />
Lê Anh Tú và Đtg<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
kéo nhất định để giữ được đối tượng (Hình 6).<br />
Lực kéo tại một điểm trên khung tỉ lệ thuận<br />
với khoảng cách từ điểm đó tới điểm đen gần<br />
nhất trên đối tượng và số lượng pixels tại<br />
điểm khung đó. Tổng lực kéo này càng nhỏ<br />
thì độ tương tự giữa khung và đối tượng càng<br />
lớn (đối tượng giống với khung), ngược lại<br />
lực kéo lớn thì độ phi tương tự lớn (đối tượng<br />
không giống khung). Công thức dblack được<br />
xác định như sau:<br />
s<br />
<br />
dblack = ∑ mbi * rbi , trong đó: mbi là số pixels<br />
i =1<br />
<br />
có giá trị 1 tại điểm khung thứ i; rbi là khoảng<br />
cách từ điểm khung thứ i đến điểm đen gần<br />
nhất trên đối tượng.<br />
<br />
Hình 7. Minh họa lực đẩy của các điểm trắng<br />
đặc trưng<br />
<br />
Ngược với các điểm đen đặc trưng (được coi<br />
là các điểm kéo), các điểm trắng đặc trưng<br />
được coi là các điểm đẩy (Hình 7). Các điểm<br />
này sẽ góp phần đẩy hình dạng của đối tượng<br />
đến gần các điểm khung hơn. Như vậy, nếu<br />
cần càng nhiều lực đẩy thì độ phi tương tự<br />
càng lớn, ngược lại lực đẩy nhỏ thì độ tương<br />
tự cao. Điều này có nghĩa là nếu đối tượng có<br />
càng nhiều nét vẽ vi phạm các vị trí “cấm vẽ”<br />
thì độ phi tương tự càng tăng. Về nguyên tắc,<br />
lực đẩy sẽ tỉ lệ nghịch với khoảng cách từ<br />
điểm trắng đặc trưng tới điểm đen gần nhất<br />
trên đối tượng. Công thức dwhite được xác định<br />
như sau:<br />
s<br />
<br />
d white = ∑<br />
i =1<br />
<br />
mwi<br />
, trong đó: mwi là số pixels có<br />
rwi<br />
<br />
giá trị 0 của đặc trưng điểm trắng thứ i; rwi là<br />
khoảng cách từ điểm trắng đặc trưng thứ i tới<br />
điểm đen gần nhất trên đối tượng.<br />
Như vậy, hàm đánh giá độ phi tương tự được<br />
viết lại như sau:<br />
58<br />
<br />
s<br />
s<br />
m <br />
dist = min ∑ mbi * rbi + ∑ wi <br />
i=1<br />
<br />
i =1 rwi <br />
<br />
<br />
<br />
99(11): 55 - 60<br />
<br />
(3)<br />
<br />
KẾT QUẢ THỬ NGHIỆM<br />
Chúng tôi đã cài đặt thử nghiệm đồng thời cả<br />
hai giải pháp: giải pháp trọng số vùng (trích<br />
chọn đặc trưng theo phương pháp trọng số<br />
vùng, với hàm khoảng cách Euclidian) và giải<br />
pháp trích trọn cải tiến (đoạn 3) với hàm đánh<br />
giá độ phi tương tự theo công thức (3).<br />
Kết quả thử nghiệm trình bày trong Hình 8<br />
được áp dụng đối với 26 mẫu kí tự quang in<br />
hoa và một số ký tự viết tay. Trong tất cả các<br />
trường hợp thử nghiệm, giải pháp cải tiến đều<br />
cho kết quả nhận dạng chính xác hơn, đặc biệt<br />
với các mẫu ký tự quang kết quả nhận dạng<br />
đều chính xác. Với các mẫu ký tự viết tay tuy<br />
không hoàn toàn chính xác, nhưng ít sai hơn<br />
so với giải pháp chuẩn.<br />
Ảnh mẫu đầu tiên, các mẫu kí tự quang in hoa<br />
tương đối mảnh (nét mảnh), cả hai giải pháp<br />
đều cho kết quả nhận dạng chính xác. Nhưng<br />
ở ảnh mẫu thứ hai và thứ ba các mẫu ký tự<br />
quang in hoa đậm hơn (nét dày hơn) thì giải<br />
pháp chuẩn có một số kí tự bị nhận dạng sai,<br />
trong khi giải pháp cải tiến vẫn có kết quả<br />
nhận dạng chính xác. Nguyên nhân là do ảnh<br />
đầu vào được lọc xương, nên khi các kí tự có<br />
nét càng dày thì xương của ký tự càng có xu<br />
thế bị biến dạng hơn. Điều này cho thấy giải<br />
pháp cải tiến đánh giá đặc trưng của ký tự<br />
chính xác hơn (ít nhạy hơn khi có các biến<br />
dạng). Tương tự với 3 ảnh mẫu cuối, ngoài<br />
mức độ dày, mảnh của kí tự thì đây là các<br />
mẫu kí tự viết tay nên có nhiều biến dạng so<br />
với kí tự gốc. Giải pháp cải tiến vẫn có kết<br />
quả nhận dạng khả thi hơn giải pháp chuẩn.<br />
KẾT LUẬN<br />
Tuy mạng noron SOM có nhiều triển vọng<br />
trong các bài toán phân cụm dữ liệu và nhận<br />
dạng, nhưng tính khả thi thực sự phụ thuộc rất<br />
nhiều vào đặc trưng của dữ liệu và hàm đánh<br />
giá độ phi tương tự của đặc trưng. Bài báo đã<br />
đề xuất một cấu trúc trọng số mới phù hợp<br />
với cách trích trọn đặc trưng của đối tượng và<br />
đưa ra một hàm đánh giá độ phi tương tự của<br />
các đặc trưng này, góp phần nâng cao khả<br />
năng nhận dạng của noron SOM. Giải pháp<br />
đề xuất có thể áp dụng cho các bài toán nhận<br />
dạng kí tự, chữ ký, biển số xe…<br />
<br />
Lê Anh Tú và Đtg<br />
<br />
Ảnh đầu vào<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
99(11): 55 - 60<br />
<br />
Giải pháp trọng số vùng, sử dụng<br />
hàm khoảng cách Euclidian<br />
Tỉ lệ<br />
Kết quả<br />
đúng<br />
A B C D E F G H I<br />
100%<br />
J K L M N O F Q R<br />
S T U V K X Z W<br />
A B C D E F G H I<br />
92.3%<br />
J K L M N O F Q P<br />
S T U V Y X Z W<br />
A B C O E F B H I J 76.9%<br />
K L M N O P M R S<br />
T U V H X ZM<br />
<br />
A<br />
K<br />
T<br />
A<br />
K<br />
T<br />
A<br />
K<br />
T<br />
<br />
A B C O E P P K<br />
<br />
50%<br />
<br />
A B C DE FGH<br />
<br />
100%<br />
<br />
D C F K F D<br />
<br />
33.3%<br />
<br />
B C F I P D<br />
<br />
83.3%<br />
<br />
N H A N O A R P K<br />
C K U<br />
<br />
50%<br />
<br />
N H A N D A N G K<br />
I T U<br />
<br />
100%<br />
<br />
Giải pháp cải tiến<br />
Kết quả<br />
B<br />
L<br />
U<br />
B<br />
L<br />
U<br />
B<br />
L<br />
U<br />
<br />
C<br />
M<br />
V<br />
C<br />
M<br />
V<br />
C<br />
M<br />
V<br />
<br />
D<br />
N<br />
K<br />
D<br />
N<br />
Y<br />
D<br />
N<br />
Y<br />
<br />
E F G H I J<br />
O F Q R S<br />
X Z W<br />
E F G H I J<br />
O P Q R S<br />
X Z W<br />
E F G H I J<br />
O F Q R S<br />
X Z W<br />
<br />
Tỉ lệ<br />
đúng<br />
100%<br />
<br />
100%<br />
<br />
100%<br />
<br />
Hình 8. Kết quả thử nghiệm nhận dạng kí tự<br />
<br />
Mặc dù kết quả thử nghiệm của giải pháp đề<br />
xuất với một số mẫu ký tự đơn giản có khả<br />
quan, nhưng để đánh giá tính khả thi thực sự<br />
của giải pháp cần tiếp tục thử nghiệm với các<br />
bộ test lớn hơn (ví dụ như MNIST). Trên các<br />
bộ test lớn thời gian tính toán cũng là một vấn<br />
đề cần xem xét, do cách thức tổ chức trọng số<br />
và việc đối sánh trọng số của noron với ảnh<br />
đầu vào tương đối phức tạp.<br />
Về mặt chất lượng nhận dạng, thì giải pháp đã<br />
đề xuất có thể tiếp tục cải tiến. Chẳng hạn, ở<br />
giai đoạn tiền xử lý có thể tăng cường đặc<br />
trưng điểm giao của các nét trong mỗi kí tự.<br />
Tức là giá trị pixel tại các điểm giao giữa các<br />
nét không phải là 1, mà có thể là tổng của tất<br />
cả các pixels có giá trị 1 quanh nó. Việc tăng<br />
cường này có thể làm tăng độ chính xác của<br />
hàm đánh giá độ phi tương tự căn cứ vào đặc<br />
trưng điểm giao.<br />
<br />
TÀI LIỆU THAM KHẢO<br />
[1]. Dong Xiao Ni, (May 4th, 2007), “Application of<br />
Neural Networks to Character Recognition”,<br />
Proceedings of Students/Faculty Research Day, CSIS,<br />
Pace University.<br />
[2]. Prof. M.S.Kumbhar, Y.Y.Chandrachud, (9-2012),<br />
“Handwritten marathi character recognition using<br />
neural network”, International Journal of Emerging<br />
Technology and Advanced Engineering, Vol 2, Issue 9.<br />
[3]. Phạm Anh Phương, (2009), “Một số phương pháp<br />
trích chọn đặc trưng hiệu quả cho bài toán nhận dạng<br />
chữ viết tay rời rạc”, Tạp chí khoa học – Đại học Huế,<br />
số 53.<br />
[4]. C .M. Bishop, (1995), “Neural networks for pattern<br />
recognition”, Oxford University Press , USA.<br />
[5]. Jelmer de Vries, “Object Recognition: A<br />
Shape-Based Approach using Artificial Neural<br />
Networks”, University of Utrecht.<br />
[6]. Viola, P., Jones, M., (2001), “Rapid object detection<br />
using a boosted cascade of simple features”, Proc. Intl.<br />
Conf. on Computer Vision and Pattern Recognition<br />
(CVPR), Vol 1, p511–518.<br />
[7]. Teuvo Kohonen, (2001), “Self-Organizing<br />
Maps”, Springer, 3rd Edition.<br />
<br />
59<br />
<br />