TRƯỜNG ĐẠI HỌC ĐIỆN LỰC
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO CHUYÊN ĐỀ HỌC PHẦN
NHẬP MÔN NHẬP MÔN HỌC MÁY
ĐỀ TI:
NHẬN DIỆN CHỮ VIẾT TAY BẰNG NEUTRAL NETWORK
Sinh viên thực hiện : LÊ MINH PHÚC
LÊ HỒNG PHONG
NGUYỄN ĐỨC THỊNH
Giảng viên hướng dẫn : ĐO NAM ANH
Ngành : CÔNG NGHỆ THÔNG TIN
Chuyên ngành : QUẢN TRAN NINH MẠNG
Lớp : D13QTANM
Khóa : D13
Hà Nội, tháng 10 năm 2020
i
lOMoARcPSD|16911414
PHIẾU CHẤM ĐIỂM
ST
T
Họ tên
sinh viên
Nội dung thực hiện Điể
m
Chữ ký
1 Lê Minh
Phúc
(Nhóm
trưởng)
-Chỉnh sửa chung,phân công công việc .
-Làm phần:Giới thiệu bài toán nhận
dạng, Mô hình học sâu , Mạng nhiều
tầng MLP.
-Tìm hiểu code bài toán lớn.
2 Lê Hồng
Phong
-Làm phần: Các bước xử lý cho bài toán
nhận dạng hoàn chỉnh,Mô hình và huấn
luyện trong bài toán nhận dạng.
-Tìm hiểu code bài toán lớn
3 Nguyễn
Đức Thịnh
-Làm phần: Các bước xử cho bài toán
nhận dạng hoàn chỉnh, Giới thiệu tổng
quan về neuron.
-Tìm hiểu code bài toán lớn.
Họ và tên giảng viên Chữ ký Ghi chú
Giảng viên chấm 1:
Giảng viên chấm 2:
ii
lOMoARcPSD|16911414
MỤC LỤC
LỜI CẢM ƠN........................................................................................................5
LỜI MỞ ĐẦU........................................................................................................1
CHƯƠNG 1: GIỚI THIỆU ĐỀ TÀI......................................................................3
1.1.
Giới thiệu về bài toán nhận dạng....................................................................3
1.1.1.
Các giai đoạn phát triển..............................................................................3
1.2.
Các bước xử lý cho bài toán nhận dạng hoàn chỉnh......................................5
1.3.
Kết luận chương..............................................................................................8
CHƯƠNG 2: MÔ HÌNH MẠNG NEURON VÀ MÔ HÌNH HỌC SÂU...............11
2.1.
Tổng quan về mô hình mạng neuron.............................................................11
2.1.1.
Giới thiệu về mạng Neuron.........................................................................11
2.1.1.1.
Định nghĩa:.......................................................................................11
2.1.1.2.
Lịch sử phát triển mạng neuron.......................................................11
2.1.1.3.
So sánh mạng neuron với máy tính truyền thống.............................14
2.1.1.4.
Hoạt động của mạng neuron............................................................15
2.1.2.
Mô hình và huấn luyện trong bài toán nhận dạng.....................................26
2.1.2.1.
Mạng neuron và bài toán phân loại mẫu.........................................26
2.1.2.2.
Khả năng học và tổng quát hóa.......................................................27
2.1.2.3.
Các phương pháp huấn luyện mạng................................................27
2.2.
Mô hình học sâu............................................................................................29
2.2.1.
Mạng nhiều tầng truyền thẳng (MLP).......................................................29
2.3.
Kết luận chương............................................................................................34
CHƯƠNG 3: CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM...............................35
3.1.
Dữ liệu thực nghiệm......................................................................................35
3.2.
Huấn luyện mô hình và kết quả thực nghiệm với mô hình MLP..................35
3.2.1.
Mô hình huấn luyện....................................................................................35
3.2.2.
Các bước thực nghiệm...............................................................................36
KẾT LUẬN CHUNG...........................................................................................40
TÀI LIỆU THAM KHẢO.....................................................................................41
lOMoARcPSD|16911414
LỜI CẢM ƠN
LỜI CẢM ƠN
Lời đầu tiên, em xin chân thành gửi lời cảm ơn tới các thầy giáo trong
Trường Đại học Điện Lực nói chung các thầy giáo trong Khoa Công nghệ
thông tin nói riêng đã tận tình giảng dạy, truyền đạt cho chúng em những kiến
thức cũng như kinh nghiệm quý báu trong suốt quá trình học.
Đặc biệt, chúng em xin gửi lời cảm ơn đến Thầy Đào Nam Anh - giảng
viên Khoa Công nghệ thông tin - Trường Đại học Điện Lực. Thầy đã tận tình
theo sát giúp đỡ, trực tiếp chỉ bảo, hướng dẫn trong suốt quá trình nghiên cứu
học tập của chúng em. Trong thời gian học tập với thầy, nhóm chúng em không
những tiếp thu thêm nhiều kiến thức bổ ích còn học tập được tinh thần làm
việc, thái độ nghiên cứu khoa học nghiêm túc, hiệu quả. Đây những điều rất
cần thiết cho chúng em trong quá trình học tập và công tác sau này.
Do thời gian thực hiện hạn kiến thức còn nhiều hạn chế nên bài làm
của chúng em chắc chắn không tránh khỏi những thiếu sót nhất định. Em rất
mong nhận được ý kiến đóng góp của thầy giáo các bạn để em thêm
kinh nghiệm và tiếp tục hoàn thiện đồ án của mình.
Chúng em xin chân thành cảm ơn!
lOMoARcPSD|16911414
LỜI MỞ ĐẦU
Nhận dạng chữ viết tay bài toán khó trong lớp các bài toán nhận
dạng chữ, vẫn luôn thu hút được nhiều sự quan tâm nghiên cứu của
các nhà khoa học. Đặc biệt trong vài thập niên gần đây, do sự thúc đẩy
của quá trình tin học hóa trong mọi lĩnh vực, ứng dụng nhận dạng chữ
càng nhiều ý nghĩa khi được sử dụng cho các bài toán trong thực tế.
Cũng như nhiều bài toán nhận dạng tiếng nói, hình ảnh… khác, thì độ
chính xác của hệ thống vẫn tiếp tục cần phải cải thiện nhằm vươn tới khả
năng nhận dạng giống như con người.
Tuy nhiên, với bài toán nhận dạng chữ viết tay thì vấn đề trở nên
phức tạp hơn nhiều so với bài toán nhận dạng chữ in thông thường
những vấn đề sau đây:
Với chữ viết tay thì không thể các khái niệm font chữ, kích cỡ
chữ. Các tự trong một văn bản chữ viết tay thường kích thước khác
nhau. Thậm chí, cùng một tự trong một văn bản do một người viết
nhiều khi cũng có độ rộng, hẹp, cao, thấp khác nhau, ...
Với những người viết khác nhau chữ viết độ nghiêng khác nhau
(chữ nghiêng nhiều/ít, chữ nghiêng trái/phải...).
Các tự của một từ trên văn bản chữ viết tay đối với hầu hết
người viết thường bị dính nhau vậy rất khó xác định được phân cách
giữa chúng.
Các văn bản chữ viết tay còn có thể có trường hợp dính dòng (dòng
dưới bị dính hoặc chồng lên dòng trên).
Trong những năm gần đây, hình mạng Neuron theo hướng học
sâu đã cho thấy những kết quả tốt trong nhiều bài toán khác nhau, trong
đó có nhận dạng chữ.
1
lOMoARcPSD|16911414