
Báo Cáo Luận Văn Tốt Nghiệp Trang 1
SVTH : Lương Cao Hoài Tâm Lớp TH40
MỤC LỤC
LỜI MỞ ĐẦU 3
CHƯƠNG 1: TÌM HIỂU VỀ LẬP TRÌNH WINDOWS 4
I. Khái quát về lập trình trong Windows 5
II. Thông điệp và xử lý thông điệp 7
III. Giao diện thiết bị đồ họa GDI 11
IV. Cửa sổ trong Windows 15
V. Chương trình Windows tiếp nhận thông điệp chuột 22
CHƯƠNG 2: TÌM HIỂU VỀ HOOK 26
1 - Chuỗi hook 27
2 - Thủ tục hook 27
3 - Các loại hook 28
4 - Sử dụng hook 30
5 - Hook trong Windows 3.x 31
6 - Giới thiệu một số hàm liên quan đến hook 33
CHƯƠNG 3: KỸ THUẬT OVERRIDE HÀM API 36
I. Khái quát về kỹ thuật override 37
II. Lý do sử dụng kỹ thuật override trong lập trình Windows 37
III. Cơ chế hoạt động và quản lý bộ nhớ trên Windows 16bits 38
IV. Cơ chế hoạt động và quản lý bộ nhớ trên Windows 32bits 41
V. Hiện thực kỹ thuật override trên Windows 16bits 45
VI. Một số hàm được sử dụng trong kỹ thuật override 50
CHƯƠNG 4: KẾT XUẤT VĂN BẢN TRONG WINDOWS 54
I. Kết xuất văn bản trong Windows 55
II. Các hàm căn bản để kết xuất văn bản 55
CHƯƠNG 5: PHÂN TÍCH VÀ THIẾT KẾ CHƯƠNG TRÌNH 66
I. Phân tích vấn đề 67
II. Thiết kế chương trình 68
III. Giới thiệu một số hàm có liên quan 78
IV. Giới thiệu một số cấu trúc dữ liệu có liên quan 92
KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN 97

Báo Cáo Luận Văn Tốt Nghiệp Trang 2
SVTH : Lương Cao Hoài Tâm Lớp TH40
Đề tài : Nghiên cứu các phương pháp
nhận dạng từ dưới cursor mouse trên
Desktop Windows.
Viết chương trình nhận dạng từ này.

Báo Cáo Luận Văn Tốt Nghiệp Trang 3
SVTH : Lương Cao Hoài Tâm Lớp TH40
Lời Mở Đầu
gày nay, hầu như mọi công việc hàng ngày liên quan đến cuộc sống của
chúng ta đều diễn ra trên máy tính. Từ việc soạn thảo văn bản, gởi nhận
thông tin đến việc tra cứu, truy cập thông tin từ hệ thống mạng máy tính
tồn cầu Internet đối với người sử dụng là công việc thường ngày và rất phổ biến.
Từ đó, sẽ phát sinh vấn đề là người sử dụng sẽ cần tìm hiểu ý nghĩa của một
từ, một câu hoặc cần phải dịch một đoạn văn bản, một file dữ liệu nào đó ra tiếng
Việt và ngược lại. Đây là một nhu cầu cần thiết và hầu như xảy ra thường xuyên đối
với nhiều người, do đó nhận dạng từ đặc biệt là nhận dạng từ trên màn hình trong
môi trường Windows là việc làm cần thiết và có ý nghĩa thực tế.
Kết quả của việc nhận dạng từ sẽ được dùng để xây dựng nên các ứng dụng
khác chẳng hạn như các từ điển được tra cứu theo kiểu tương tác trực tiếp sẽ rất
thuận tiện cho người sử dụng bởi vì theo cách này thì cho dù đang ở trong bất kỳ
ứng dụng nào khi cần tra cứu thì thao tác trực tiếp ngay trên ứng dụng đang dùng
tức là chỉ cần click chuột vào đó chứ không cần phải mở từ điển rồi tra cứu từ đó
theo kiểu cổ điển.
Vì thế, trong thời gian làm Luận Án Tốt nghiệp được sự hướng dẫn của thầy
Lê Tấn Hùng nhóm sinh viên chúng tôi thực hiện đề tài: “ Nhận dạng từ dưới cursor
mouse trên deskop Windows. Viết chương trình nhận dạng từ này ”. Trong giai
đoạn đầu của Luận Án Tốt Nghiệp chúng tôi đã nghiên cứu được một số vấn đề
quan trọng và căn bản có ý nghĩa trong việc thực hiện yêu cầu đã đặt ra của đề tài.
Đề tài này chỉ tập trung nhận dạng từ ở dạng text trên desktop của môi trường
Windows rồi xuất kết quả ra.
Trong thời gian làm Luận Án Tốt Nghiệp nhóm sinh viên chúng tôi đã tiến
hành nghiên cứu cơ chế hoạt động và quản lý của hệ điều hành Windows. Nghiên
cứu về phương thức lập trình trong môi trường Windows và các phương tiện mà
Windows hỗ trợ khi lập trình. Tham khảo và nghiên cứu kỹ thuật override các hàm
giao tiếp của Windows ở chế độ 16 bit và 32 bit. Nghiên cứu cách xử lý các thông
điệp trong Windows và tìm hiểu về cách kết xuất văn bản, về chế độ ánh xạ, vấn đề
tọa độ . . . và cách xử lý văn bản. Trên cơ sở đó bước đầu chúng tôi đã xây dựng
xong một ứng dụng có khả năng nhận dạng được từ trên nền Windows 16 bit được
viết bằng ngôn ngữ Visual C++ version 1.5 và hướng phát triển trong thời gian tới
là hiện thực nó trên nền Win32.
Báo cáo của chúng tôi sẽ lần lượt điểm qua những nội dung mà chúng tôi đã
nghiên cứu và tìm hiểu được trong thời gian qua. Sau đó là phần giới thiệu chi tiết
về chương trình từ khâu phân tích-thiết kế cho đến phần chương trình nguồn và cuối
cùng sẽ là nêu những vấn đề còn tồn tại và hướng phát triển trong tương lai.

Báo Cáo Luận Văn Tốt Nghiệp Trang 4
SVTH : Lương Cao Hoài Tâm Lớp TH40
Chương 1:
T
TÌ
ÌM
M
H
HI
IỂ
ỂU
U
V
VỀ
Ề
L
LẬ
ẬP
P
T
TR
RÌ
ÌN
NH
H
W
WI
IN
ND
DO
OW
WS
S

Báo Cáo Luận Văn Tốt Nghiệp Trang 5
SVTH : Lương Cao Hoài Tâm Lớp TH40
I - KHÁI QUÁT VỀ LẬP TRÌNH TRONG WINDOWS:
1 - Khái quát về lập trình trong Windows:
Môi trường lập trình Windows về cơ bản là dựa trên bộ hàm API (Application
Programmer Interface), nó có chức năng như các ngắt trong bảng vector ngắt của
DOS, nhưng nó thân thiện hơn ở chỗ cách gọi hàm API giống hệt cách gọi hàm của
ngôn ngữ cấp cao, mỗi hàm có một tên gọi hẳn hoi, và tên gọi thường được đặt rất
phù hợp với công dụng của hàm (mặc dù có hơi dài dòng) từ đó tạo khả năng gợi
nhớ cao. Với Windows, người lập trình không còn phải lập trình theo kiểu assembly
nữa mà lập trình theo kiểu ngôn ngữ cấp cao, mọi hoạt động trong máy ở mức thấp
từ hàm API trở xuống thuộc phạm vi của Windows, và Windows không khuyến
khích việc các ứng dụng can thiệp vào lĩnh vực này. Bù lại, bằng các hàm API, nó
hỗ trợ rất hiệu quả cho người lập trình, giúp khai thác khả năng của thiết bị triệt để,
dễ dàng và tiện lợi hơn bao giờ hết. Có thể nói Windows đã mở ra cho người lập
trình không gian rộng lớn để phát triển ứng dụng, và hạn chế không gian phát triển
hệ thống. Điều này dẫn đến hệ quả là các ứng dụng được tạo ra hết sức dễ dàng, và
quan trọng là hệ thống chạy ổn định hơn, không bị treo do lỗi của ứng dụng,
không thể xâm nhập, nhưng sẽ rất khó khăn nếu người lập trình muốn trực tiếp điều
khiển hoạt động trong máy và phát triển về lập trình hệ thống.
- Tìm hiểu hàm Windows API: Windows là một hệ điều hành đa nhiệm
(multitasking) mà qua đó các ứng dụng ở trong môi trường Windows sẽ giao tiếp
với user thông qua một hay nhiều giao diện. Để truy cập các giao diện này thì các
ứng dụng được xây dựng trên môi trường Windows sẽ sử dụng tập các hàm được
gọi là giao diện chương trình ứng dụng API (Application Program Interface).
Chương trình của người sử dụng có thể gọi tới các hàm API để truy cập tới mọi tài
nguyên của Windows. GDI là một bộ phận của API, giao diện thiết bị đồ họa GDI
(Graphic Device Interface) có nhiệm vụ duy trì sự độc lập của Windows đối với các
thiết bị đồ họa hay còn gọi là khả năng độc lập thiết bị (device independent) tức là
cho phép Windows làm việc với nhiều kiểu thiết bị đồ họa khác nhau.
2 - Thư viện liên kết động DLL (Dynamic Link Library):
Thư viện liên kết động là các tập tin được Windows lưu dưới dạng nhị phân
chứa các hàm mà mọi ứng dụng trên Windows đều có thể sử dụng. Nét đặc trưng
của DLL là nó có thể được sử dụng bởi nhiều ứng dụng tại cùng một thời điểm hay
nói cách khác thư viện liên kết động có thể cùng một lúc được gọi bởi nhiều chương
trình. DLL là một dữ liệu chia sẻ được (shared data).
Có 3 loại DLL khác nhau:

