intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn thạc sĩ: Ứng dụng xử lý văn bản tiếng Việt xây dựng hệ thống kiểm tra đề tài tốt nghiệp

Chia sẻ: Sdfas Vfdtg | Ngày: | Loại File: PDF | Số trang:13

153
lượt xem
23
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Ứng dụng xử lý văn bản tiếng Việt xây dựng hệ thống kiểm tra đề tài tốt nghiệp nhằm giảm bớt gánh nặng công việc kiểm tra trùng lặp đề tài cho cán bộ hướng dẫn.

Chủ đề:
Lưu

Nội dung Text: Luận văn thạc sĩ: Ứng dụng xử lý văn bản tiếng Việt xây dựng hệ thống kiểm tra đề tài tốt nghiệp

  1. B GIÁO D C VÀ ĐÀO T O Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Đ I H C ĐÀ N NG ------------------ TR N TH DI U UYÊN Ngư i hư ng d n khoa h c : PGS.TS. Phan Huy Khánh NG D NG X LÝ VĂN B N TI NG VI T XÂY D NG H TH NG KI M TRA Ph n bi n 1 : ...................................................................................... Đ TÀI T T NGHI P Ph n bi n 2 : ...................................................................................... Chuyên ngành : Khoa h c máy tính Mã s : 60.48.01 Lu n văn s ñư c b o v trư c h i ñ ng ch m Lu n văn t t nghi p Th c sĩ K thu t h p t i Đ i h c Đà N ng vào ngày 10,11 tháng 9 TÓM T T LU N VĂN TH C SĨ K THU T năm 2011 Có th tìm hi u lu n văn t i : - Trung tâm Thông tin – H c li u, Đ i h c Đà N ng Đà N ng – Năm 2011 - Trung tâm H c li u, Đ i h c Đà N ng
  2. 1 2 M Đ U tài m t cách nhanh chóng, hi u qu , khoa h c và ñ chính xác cao, ñ ng th i giúp răn ñe ngư i có thói quen l i hay sao chép, giúp 1. Lý do ch n ñ tài tăng tính tích c c trong vi c h c t p, t o thói quen h c t p nghiêm CNTT can thi p sâu r ng vào ñ i s ng con ngư i, ñem l i túc, ñ m b o ch t lư ng ñ u ra cho sinh viên. nhi u l i ích mà tác h i cũng không kém. Nh CNTT, vi c sao chép 2. M c ñích c a ñ tài ñơn gi n nhi u. Nhưng ñ i v i sinh viên là tương lai c a ñ t nư c, Xây d ng m t h th ng qu n lý ñ tài t t nghi p bài b n nh m vi c sao chép thư ng mang tính tiêu c c, l m d ng ch t xám c a gi m b t gánh n ng công vi c ki m tra trùng l p ñ tài cho cán b ngư i khác d dàng và tràn lan, d n ñ n thói quen l i, chây lư i, hư ng d n cũng như thư ký c a h i ñ ng ph n bi n. S ki m tra này h c ñ i phó, nh hư ng t i ch t lư ng ñ u ra c a r t nhi u trư ng s làm tăng hi u qu ch m t t nghi p, nhanh chóng và chính xác. cao ñ ng và ñ i h c trên c nư c. Khi sinh viên làm khóa lu n t t 3. Ý nghĩa khoa h c nghi p, cán b hư ng d n cũng như thư ký h i ñ ng ph n bi n v i Làm ñ tài này giúp tôi n m ñư c quy trình x lý ngôn ng t cách th c ki m tra th công trên m t lư ng ñ tài khá l n ph i t n nhiên và n m ñư c cách th c ki m tra ñ tài t t nghi p. m t th i gian r t dài, m t r t nhi u công s c nhưng ñ chính xác c a 4. Ý nghĩa th c ti n k t qu ki m tra l i không cao, s không tránh kh i s thi u sót, gây T o ñư c ng d ng h tr t t nghi p, có th áp d ng chung b t công cho nh ng ngư i h c hành, nghiên c u m t cách nghiêm cho h th ng cao ñ ng, ñ i h c trên c nư c. Tăng tính tích c c trong túc. d y và h c. Sau này, khi sinh viên t t nghi p ra trư ng, các nơi tuy n d ng 5. M c tiêu, nhi m v nhân s cũng d a vào chính k t qu trên t m b ng ñ i h c, cao - Tìm hi u cách th c, quy ñ nh làm khóa lu n t i trư ng c th . ñ ng… ñ làm căn c . Quá trình h c m t khóa ñ i h c, cao ñ ng - Tìm hi u quy trình x lý ngôn ng t nhiên. chưa k liên thông m t 4-5 năm, m t quãng th i gian không ph i là - Tìm hi u thu t toán so sánh 2 văn b n. ng n ñ trau d i ki n th c, m t khi ngư i h c có thói quen l i thì - Xây d ng h th ng ki m tra s trùng l p ñ tài t kho d li u không riêng bài khóa lu n t t nghi p mà ngay c bài th o lu n nhóm, có s n trong trư ng, có th tìm thêm m t s ngu n d li u trên bài t p l n, báo cáo nh cũng có th là k t qu c a vi c sao chép. Internet… Li u ch t lư ng ñ u ra có ph n ánh ñúng th c t ñi m s trên b ng - Tri n khai xây d ng ng d ng. ñi m, trên t m b ng? - Đánh giá k t qu th c hi n ñư c theo tiêu chí ñã cho. Chính vì nh ng lý do trên, tôi quy t ñ nh ch n ñ tài : “ ng 6. Đ i tư ng và ph m vi nghiên c u d ng x lý văn b n ti ng Vi t xây d ng h th ng ki m tra ñ tài t t Tìm hi u quy trình làm và ki m tra khóa lu n t t nghi p t i nghi p” nh m t o ra m t chương trình giúp ki m tra s trùng l p ñ trư ng Cao ñ ng Đ c Trí Đà N ng. D ki n ki m tra th nghi m trên
  3. 3 4 nh ng t p tin khóa lu n có ñ nh d ng .doc, ho c .docx do Microsoft Word t o ra, nh ng t p tin ñ nh d ng .pdf s dùng ph n m m chuy n CHƯƠNG 1 : PHÂN TÍCH HI N TR NG sang Microsoft Word r i ti n hành ki m tra. 7. K t qu 1.1 Ho t ñ ng ñào t o t i trư ng Cao ñ ng Đ c Trí Đà N ng Tìm hi u ñư c c u trúc m u văn b n, so sánh hai văn b n, quy 1.1.1. Gi i thi u trư ng Cao ñ ng Đ c Trí Đà N ng trình x lý ngôn ng t nhiên, xây d ng ñư c h th ng ki m tra ñ Trư ng Cao ñ ng Đ c Trí Đà N ng ñư c thành l p ngày tài t t nghi p hi u qu , ñ chính xác cao ñ h tr t t nghi p t i 08/03/2005 theo quy t ñ nh s 962/QĐ-BGD&ĐT/ĐH&SĐH c a B trư ng Cao ñ ng Đ c Trí. Giáo d c và Đào t o. 8. C u trúc c a lu n văn: trư ng có 2 lo i hình ñào t o : Ngoài ph n m ñ u, k t lu n, tài li u tham kh o và ph l c - H Cao ñ ng : Th i gian ñào t o 3 năm. trong lu n văn g m có các chương như sau : - H Trung c p : Th i gian ñào t o 2 năm. Chương 1 : Phân tích hi n tr ng T t nghi p xong h Trung c p ho c Cao ñ ng, h c sinh sinh Chương 2 : Phân tích và thi t k ng d ng. viên có th liên thông t i trư ng ho c các trư ng khác trong c nư c Chương 3 : Tri n khai cài ñ t ng d ng. có chương trình liên thông ñ h c c p cao hơn. 1.1.2. Th c tr ng t t nghi p S ñ tài t t nghi p ñư c công nh n qua các năm 1600 1400 1200 1000 S ñ tài ñư c 800 công nh n 600 400 200 0 Năm Năm Năm Năm 2008 2009 2010 2011 Bi u ñ trên th hi n s lư ng ñ tài ñư c công nh n qua các năm
  4. 5 6 Bi u ñ so sánh th c tr ng làm ñ tài trong sinh viên s n l c r t nhi u v phía GVHD và nhà trư ng. Vi c nghiên c u (T i trư ng Cao ñ ng Đ c Trí Đà N ng năm 2010) thành công h th ng ki m tra ñ tài t t nghi p s giúp ích ph n nào thay ñ i ý th c vi c h c trong sinh viên. S khóa lu n 1.2. Quá trình làm khóa lu n t t nghi p 250 1.2.1. Giao ñ tài 200 1.2.2. Th c hi n ñ tài 150 T ng s bài làm Làm ñ cương sơ b 100 S bài không trùng S bài trùng Th c t p, nghiên c u 50 Hoàn thành khóa lu n 0 Khoa Qu n Khoa K Khoa CNTT N p bài tr KD-DL toán-TCNH 1.2.3. Đánh giá ñ tài (Ngu n : T ng h p t s li u khoa Qu n tr KD-DL, K toán-TCNH, 1.3. Quy trình ki m tra th công ñ tài t t nghi p Thông thư ng có hai cách ki m tra : CNTT) Cách th nh t : 1.1.3. Phân tích hi n tr ng ñào t o Bư c 1 : X p khóa lu n m i riêng theo t ng ngành H u h t sinh viên các khoa trong trư ng Cao ñ ng Đ c Trí Bư c 2 : Chu n b ngu n khóa lu n cũ ñ u ph i làm khóa lu n ñ t t nghi p trư c khi ra trư ng. Theo quy Bư c 3 : Dò tên m t ñ tài m i v i l n lư t các tên ñ tài cũ. ñ nh c a nhà trư ng, ñ tài không ñư c trùng nhau trong m t năm, Bư c 4 : L p l i cho ñ n h t khóa lu n. n u trùng v i các năm trư c thì s li u ph i khác. Chính vì v y s Trong khi so sánh tên ñ tài, ngư i ki m tra ph i t nh n lư ng ñ tài ph i làm tương ñương s sinh viên làm KLTN. Đây là xét và k t lu n có trùng hay không ñ ti n hành ki m tra ti p m t con s tương ñ i l n, ñòi h i các GVHD ph i tích c c t ng h p t c ph n n i dung bên trong. m t kho d li u ñ tài t các năm trư c ñ ñ i chi u và g i ý ñ tài Nh n xét : T n nhi u th i gian, chi phí, nhân l c, hi u qu cho các em sinh viên ñang làm không rơi vào tình tr ng trùng l p ñ không cao. tài ngoài ý mu n. Tuy nhiên, s c tình trùng l p ñ tài c a các em Cách th hai : sinh viên cũng th t s r t khó ki m soát n u ch ti n hành ki m tra Bư c 1 : X p khóa lu n m i riêng theo t ng ngành theo phương pháp th công như m i năm trư c. Làm sao ñ tăng Bư c 2 : Nh p tên ñ tài khóa lu n cũ vào b ng tính Excel cư ng tính sáng t o, nâng cao kh năng tư duy, khơi d y s ham h c, tìm tòi, nghiên c u th c s trong sinh viên…? qu là m t v n ñ c n
  5. 7 8 Bư c 3 : Nh p tên ñ tài khóa lu n m i vào b ng tính Excel - Cơ ch c t t d a vào kho ng tr ng, t ñư c c t có th là s , (không ñánh s th t ho c tô ch khác màu v i các ký hi u, công th c… dòng ch khóa lu n cũ) - N u g p l i t ñã c t l n th hai, th ba… thì không ñưa t Bư c 4 : Dùng l nh Data/Sort trong Excel ñ s p x p toàn b vào m ng t mà tăng bi n ñ m lên 1 ñơn v m i l n. d li u, khi ñó các khóa lu n cũ và m i s ñan - Sau khi k t thúc vi c tách t , s có hai m ng : m t m ng t xen nhau. ñư c tách và m t m ng lưu t n su t xu t hi n t trong văn K t thúc vi c s p x p, ngư i ki m tra s t ñánh giá và k t b n. lu n r i ti n hành ki m tra n i dung. - M i t không trùng nhau ch xu t hi n trong m ng m t l n. Nh n xét : Hao phí ñi n năng, nhân l c, công s c, th i gian, 1.4.2. Nghiên c u phương pháp so sánh văn b n hi u qu không cao. L y t l % t trùng 1.4. Phát bi u bài toán - Đ u vào là văn b n m i c n so sánh và m t kho văn b n C n ki m tra m t t p khóa lu n c a m t sinh viên b t kỳ c a cũ. m t khoa b t kỳ có trùng v i kho d li u s n có c a trư ng hay - Duy t t ñ u ñ n cu i m ng t c a văn b n m i, l y t không. Kho d li u trong trư ng bao g m các t p tin Word ñư c lưu ñ u tiên. l i t các khóa trư c ñã ra trư ng, có sưu t m thêm m t s các khóa - L y văn b n cũ th nh t trong kho. lu n t Internet ho c t các ngu n khác. - Duy t t ñ u ñ n cu i m ng t c a văn b n cũ th nh t. V i s sao chép khá ña d ng, m t s bài sao chép m t ho c - L y t ñ u tiên c a văn b n m i so v i toàn b các t hai chương, có nh ng bài sao chép toàn b ch s a m t s ph n hình trong văn b n cũ, n u tìm th y s tăng bi n ñ m lên m t th c, các thao tác ñ nh d ng văn b n, m t s bài hoàn toàn không ñơn v . ch nh s a… Yêu c u ñ t ra là làm sao có th ki m tra h t toàn b - Th c hi n ti p t c cho t th hai trong m ng văn b n nh ng s ña d ng ñó, trong khi m t bài g c khi ñư c sao chép l i có m i so v i toàn b t trong m ng văn b n cũ cho ñ n khi th b b t m t vài ño n, m t vài dòng. H th ng ki m tra ph i phát h t t trong m ng văn b n m i. hi n ra ñư c nh ng trư ng h p ñó. - Quy v t l ph n trăm s t gi ng v i toàn b t trong 1.4.1. Nghiên c u thu t toán tách t kh i văn b n m ng. - Cho con tr ch y t ñ u văn b n, g p kí t tr ng thì d ng. - C t t cho vào m ng t - T ñư c c t là t ñơn, không ph thu c nghĩa Ti ng Vi t
  6. 9 10 L y t l % t n su t xu t hi n t CHƯƠNG 2 : PHÂN TÍCH VÀ THI T K NG D NG - L y s l n xu t hi n t c a t th nh t trong văn b n m i. 2.1 Phân tích nhu c u - L y s l n xu t hi n t c a t gi ng nó tìm th y trong Ch c n so sánh gi ng và khác gi a hai văn b n c m trên tay ñã văn b n cũ th nh t. là khó, hu ng chi ph i so sánh m t văn b n v i r t nhi u văn b n - L p t l ph n trăm khác là m t vi c quá khó khăn. M t khóa lu n theo yêu c u t 50 ñ n - L p l i ñ n khi h t t và h t văn b n cũ trong kho. 60 trang, trùng ph n m t ch c gì ñã trùng ph n hai, li u ñã k t lu n s m r ng ch sao chép ph n m t mà không sao chép ph n hai, hay K t lu n : d a vào ph n m t ch c ch n ñoán bi t ph n hai s hoàn toàn gi ng. D a vào t l % t trùng và t l % t n su t xu t V i trách nhi m c a ngư i hư ng d n, h ph i ñ c h t quy n khóa hi n t ñ ñ i chi u v i t l % ñ t ra ñ k t lu n k t qu lu n r i so sánh th t t m m i ñưa ra k t lu n có ph i là sao chép hay so sánh. không. M t công vi c hoàn toàn không d chút nào. V i vi c ki m tra th công thì : - T n kém th i gian :R tl n -Đ t m : R t cao - Đ chính xác : Không cao - T n kém nhân l c : R t nhi u M i m t năm ñi qua, lư ng khóa lu n l i tăng thêm. Không ai có th ñ m b o các khóa lu n sao chép không ñ n t các trư ng khác cùng chuyên ngành, t t nh thành khác trên c nư c, t các trang web mua bán ñ tài chuyên nghi p, hay khó hơn là các ñ tài ti ng nư c ngoài ñư c d ch ra ti ng Vi t. C n thi t có m t chương trình ki m tra th t nhanh chóng, khoa h c và ñ chính xác cao. 2.2 Đ xu t các bư c tri n khai 2.2.1 Mô hình gi i pháp t ng quát
  7. 11 12 BEGIN 2.2.3 Cơ s d li u quan h Đưa vào m t tài li u Word (.doc ho c .docx) DOC WORD Khai báo ngu n d li u (gi i h n Khoa) FACULTY 1 1 DO Idx Idx Idx - Ki m tra v i t p 1 n Faculty_Idx n Doc_Idx Faculty_Name - Ki m tra v i t p 2 Doc_name Word Delete_Flg - ….. Doc_ path Cnt - Ki m tra v i t p cu i Delete_Flg WHILE IF THEN - Trong m t khoa có th ch a nhi u t p tài li u (t p khóa lu n) Thông báo - Trong m t t p tài li u có th ch a nhi u t , nhưng t c a t p nào ELSE x p riêng t p ñó dù cho có nhi u t trùng nhau gi a các t p v i - Thông báo nhau. - Lưu vào kho 2.3 Đ xu t gi i pháp END IF 2.3.1 Mô hình END Bư c 1 : Đưa vào 1 file c n ki m tra trùng l p. Bư c 2 : C t t ng t cho vào m ng t , g p t trùng ñ m tăng 2.2.2 Xây d ng kho d li u lên 1 Đ t o ñư c kho d li u theo yêu c u bài toán ban ñ u ñ t ra, Bư c 3 : C t xong 1 file s có m ng t kèm s l n xu t hi n t thư ký m i khoa s ph i l y file t t ng ñĩa CD m t copy vào trong Bư c 4 : L y 1 file trong kho d li u theo khoa ra so sánh t ng máy tính ñ có ñư c ngu n d li u. Ngoài ra, trong quá trình nghiên t v i các t trong m ng v a t o. c u tìm tòi thêm, tr lý ho c các giáo viên trong khoa có th c p nh t Bư c 5 : T trong m ng file nh p v i t trong m ng file l y thêm các file có ñư c t t t c các ngu n trên Internet. trong kho trùng nhau, s có bi n ñ m c ng d n tăng d n. S l n xu t hi n t trong t p ñưa vào ñư c so v i s l n xu t hi n t trong t p kho ñang xét theo t l ch n.
  8. 13 14 Bư c 6 : L y k t qu cu i cùng c a bi n ñ m so v i t ng s t ng n, m t file ki m tra v i hàng lo t file m t l n và cho ra k t qu khác nhau trong file quy ra % và ñem so sánh v i t chính xác cao. l ch n ban ñ u. 2.6 Tìm hi u thu t toán tìm ki m Bư c 7 : Quay tr l i bư c 4, ñ n khi h t file thì d ng. Thu t toán so kh p chu i KMP (Knuth-Morris-Pratt) Đ ph c t p c a thu t toán tìm ki m 2.3.2 Thu t toán ñ c văn b n 2.7 Tìm hi u môi trư ng, công c xây d ng ng d ng Bư c 1 : C t t ng t trong file (tính ñ n ký t tr ng) 2.7.1 Ngôn ng l p trình VB.NET Bư c 2 : Ki m tra t v a c t ra có trong m ng t hay chưa 2.7.2 Microsoft SQL server 2005 - N u có c ng d n t ñó lên 2.7.3 Microsoft Excel - N u chưa có thì thêm t ñó và s l n xu t hi n c a nó vào m ng t . Bư c 3 : Quay l i bư c 1, h t file thì d ng. 2.3.3 X lý lưu tr và khai thác 2.4 Tìm hi u m t s m u văn b n Microsoft Word PDF (Portable Document Format) 2.5 Tìm hi u m t s ph n m m so sánh hai văn b n Ph n m m Beyond Compare 3 Ph n m m ExamDiff Pro C n thi t ra ñ i h th ng ki m tra khoa h c hơn Yêu c u ñ t ra cho vi c ki m tra khóa lu n thư ng r t cao. V i s lư ng khóa lu n quá l n c a m i năm, c ng thêm khóa lu n c a các năm trư c vào và các file sưu t m ñư c t các ngu n khác như Internet, vi c ki m tra không th làm theo cách ki m tra t ng c p, r t m t công và t n nhi u th i gian, ñ chính xác không cao. Làm sao ñ ñưa vào m t file và ki m tra trong kho d li u kh ng l r t nhi u file cũ thì h th ng s ki m tra trong th i gian tương ñ i
  9. 15 16 Mô hình giao di n chính c a chương trình : CHƯƠNG 3 : TRI N KHAI CÀI Đ T NG D NG 3.1 Các ch c năng chính c a chương trình - Lưu vào kho d li u cùng lúc nhi u t p tin. - Cho phép ch n t ng khoa ñ gi i h n ph m vi ki m tra. - So sánh m t t p tin (ñ u vào) v i t t c các t p tin khác theo khoa trong kho d li u (t p tin d ng .doc ho c .docx) và cho k t qu trùng hay không trùng. 3.2 Thi t k giao di n chính c a chương trình Cho phép ch n t ng khoa ñ chia nh ph m vi tìm ki m. 3.2.1 Form ñ nh p danh m c Khoa Cho phép c p nh t khóa lu n t nhi u nơi vào kho d li u. Đ nh p tên khoa, ta ch n m c Options/ ListFaculty Cho phép ch ñư ng d n ñ n tên t p khóa lu n ñ u vào c n ki m tra (thay vì t nh p) vì ñư ng d n ñ n t p khóa lu n có th dài. Cho phép ch n t l ki m tra. Ki m tra xong c n ph i thông báo k t qu . Trong trư ng h p không trùng t p nào trong kho thì cho phép ngư i dùng lưu luôn t p ñó vào kho. N u trùng, ch rõ tên t p trùng trong kho. Tên t p lưu l i trong kho ñính kèm thêm ngày gi ki m tra. Ki m tra t p có ph n m r ng .doc ho c .docx Trong các m c ch n, quan tr ng nh t là m c khai báo t l % c n so sánh. Ngư i dùng có th linh ho t hơn trong vi c ki m tra, 3.2.2 Khai báo kho d li u nh m m c ñích ki m soát ñư c các m c ñ ña d ng trong sao chép, cho k t qu cu i cùng chính xác, trung th c.
  10. 17 18 * Thông báo vi c k t n i ñ n cơ s d li u thành công/không thành 3.2.4 Giao di n lúc ki m tra tài li u công : : 3.2.3 Form ñưa nhi u t p vào kho d li u * Sau khi ki m tra xong, n u tài li u chưa có trong Kho : Mô ph ng kho d li u : * Lúc có thông báo tài li u chưa có trong kho, ta ti n hành lưu t p vào kho d li u b ng cách click nút Save Document :
  11. 19 20 * Sau khi ki m tra xong, n u tài li u ñã có trong Kho : 3.3 K ch b n s d ng h th ng a. Ngư i dùng : - Thư ký khoa : T ng h p khóa lu n các năm trư c, tìm ki m và c p nh t thêm khóa lu n t Internet, các ngu n khác… ñ ñ y vào kho d li u chung c a trư ng. - Cán b hư ng d n : Ki m tra t p tin khóa lu n c a sinh viên mình hư ng d n có trùng b t kỳ t p tin nào trong kho d li u chung hay không. 3.2.5 Cơ s d li u sau khi ch y chương trình - Thư ký h i ñ ng ph n bi n : Ki m tra bài khóa lu n c a ngư i * Trong Table DOC hi n th thông tin các t p tài li u ñang b o v có trùng v i bài khóa lu n b t kỳ nào trong kho d li u. b. Th i ñi m s d ng : - Thư ký khoa : M i th i ñi m. - Cán b hư ng d n : Th i ñi m nh n bài khóa lu n hoàn ch nh c a sinh viên n p. - Thư ký h i ñ ng ph n bi n : Th i ñi m b o v khóa lu n. c. Cách dùng : C p nh t ngu n khóa lu n (cũ/ không c n ki m tra/ t Internet…) vào kho * Trong Table WORD hi n th thông tin các t ñư c ñ m. - Vào Form chính, ch n menu Options/AddFile, xu t hi n h p tho i AddWordForm. - Ch n tên khoa. - Khai báo ñư ng d n ñ n ngu n khóa lu n c n n p thêm vào kho. - Nh n nút List File, danh sách khóa lu n s hi n th . - Duy t qua h t khóa lu n, khóa lu n nào không ñưa vào kho thì nh n Delete ngay cu i dòng tên khóa lu n ñó. - Nh n nút Add Document
  12. 21 22 - Ch h th ng báo k t qu . B ng th ng kê k t qu th nghi m : - K t thúc chương trình. Kho d li u : 100 t p Word Ki m tra trùng l p n i dung khóa lu n : S t p m i ñưa vào ki m tra : 20 (m i l n 1 t p) - Ch n tên khoa. Khoa ki m tra : K toán – TCNH - Khai báo ñư ng d n ñ n khóa lu n c n ki m tra. - Ch n t l c n ki m tra (t 10% ñ n 100%) T l ki m S bài Chi m t Ki m tra l i b ng - Nh p ch n nút Check Document. tra trùng l th công - Ch thông báo k t qu . 100% 0 0% Đúng - N u không trùng, nh n nút Save Document lưu khóa lu n 90% 1 5% Đúng v a ki m tra ñư c vào kho d li u. 80% 1 5% Đúng d. Hi u qu : 70% 2 10% Đúng - Đưa ñư c nhi u khóa lu n vào kho làm ngu n cùng lúc. 60% 2 10% Đúng - Ki m tra theo t l v i ñ chính xác tương ñ i cao, r t 50% 2 10% Đúng nhanh. Dư i 50% 12 60% G n ñúng 3.4 Đánh giá k t qu th nghi m T c ñ x lý nhanh T l lúc ch n ñ ki m tra n u t 40% tr xu ng thì xác su t Tính khoa h c cao báo trùng r t l n, vì các khóa lu n cùng chuyên ngành thư ng có Trong quá trình ki m tra t p tài li u, ph n m m cho phép nhi u t gi ng nhau, t n su t xu t hi n các t ñó cũng g n gi ng ngư i dùng ch n 10 t l khác nhau, ñ chính xác này ngư i dùng có nhau, cho nên vi c k t lu n trùng c a máy là h p lý. Trong nh ng th t ư c lư ng trư c, m c ñích tăng tính chính xác c a k t qu . trư ng h p máy báo trùng v i t l 40% tr xu ng, ta nên ki m tra l i Nh thu t toán c t t ñ so sánh khóa lu n, nh ng t p khóa lu n sao b ng phương pháp th công (d a trên tên t p trùng mà máy ch ra). chép tinh vi có th d dàng ñư c nh n d ng. Vi c ki m tra không ph thu c ñ dài khóa lu n, các thao tác ñ nh d ng ch nh s a hình th c c a khóa lu n, hay k c vi c xáo tr n m t s ph n trong n i dung khóa lu n. Giao di n ñơn gi n, d dùng Thi t k ñơn gi n, thân thi n v i ngư i dùng. Ch c n tìm hi u 5 phút là ai cũng có th dùng ñư c.
  13. 23 24 K T LU N 2. Nh ng h n ch 1. K t qu ñ t ñư c Tuy v y, bên c nh nh ng thành công nh t ñ nh, ph n m m Trong quá trình kh o sát th c t , tìm hi u, nghiên c u và ñưa này cũng còn nh ng h n ch c n ph i kh c ph c b ng nh ng nghiên ra mô hình t ng quát cho h th ng ki m tra ñ tài t t nghi p v i ñ c u sâu và k hơn trong tương lai ñ hoàn thi n, vì s chính xác tuy t tài “ ng d ng x lý văn b n ti ng Vi t xây d ng h th ng ki m tra ñ i trong vi c ki m tra trùng l p còn chưa cao, có th x y ra trư ng ñ tài t t nghi p”, tôi t ñánh giá k t qu ñ t ñư c như sau : h p thi u sót ñ i v i m t s ñ tài trùng. Trong trư ng h p ñó, ngư i Trư c h t, qua quá trình kh o sát th c t , tôi ñã tìm hi u ki m tra ph i áp d ng song song vi c ki m tra theo phương pháp th ñư c quy trình ñ hoàn thành m t bài khóa lu n t t nghi p c a sinh công khi c m th y nghi ng . viên, bao g m t các khâu ñi th c t p và vi t nh t ký th c t p, cũng như l y s li u hay k t qu công vi c th c t p nghiên c u ñ làm bài 3. Đ nh hư ng phát tri n khóa lu n t t nghi p c a mình. Nhìn chung, quy trình hoàn thành bài Trong khuôn kh c a ñ tài, n i dung ch n m trong gi i h n khóa lu n t t nghi p ñ t t nghi p c a sinh viên g n gi ng v i th ki m tra ñư c t p do Microsoft Word t o ra (.doc ho c .docx), còn t c hoàn thành nh ng bài báo cáo nhóm, ñ án t t nghi p, hay th m t p PDF chưa ki m tra ñư c, trong trư ng h p này ñã dùng ph n chí là lu n văn th c s c a h c viên cao h c như chúng tôi. T t c m m chuy n t PDF sang Word r i m i ti n hành ki m tra. D a trên ph i theo m t quy trình nghiêm ng t t bư c tìm hi u, kh o sát tình vi c thành công v t p Word, ñ tài này có th m r ng tri n khai hình th c t , l y s li u, vi t ñ cương ñ n tri n khai ñ tài và hoàn sang t p PDF và m t s t p khác. thành nó. Đ tài th c hi n d a trên kh o sát th c t t i trư ng Cao Ti p theo ñó, vi c nghiên c u ki m tra trùng l p ñ tài giúp ñ ng Đ c Trí Đà N ng, tuy mang tính c th nhưng ph n l n các tôi hi u rõ hơn v quy trình x lý văn b n ti ng Vi t hay x lý ngôn trư ng cao ñ ng ñ i h c khác trong ñ a bàn thành ph Đà N ng nói ng t nhiên. Vi c ki m tra n i dung ñ tài giúp cho tôi tìm hi u, riêng hay trên c nư c nói chung v cách làm khóa lu n t t nghi p nghiên c u và n m rõ hơn v m t s ngôn ng l p trình hư ng ñ i cũng tương t , các ñ tài có th gi ng nhau ít nhi u, nên có th áp tư ng như VB.NET, hi u thêm ñư c thu t toán tìm ki m, so sánh. d ng cho nh ng trư ng khác. Đ tài này s m hư ng phát tri n sang Cu i cùng, vi c cho ra ñ i ñư c mô hình t ng quát h th ng bài t p báo cáo nhóm, lu n văn th c sĩ, lu n án ti n sĩ… ki m tra ñ tài t t nghi p v a h tr ñư c các khoa trong vi c ki m tra s trùng l p ñ tài m t cách nhanh chóng, chính xác, m t khác v a có tính ch t răn ñe nh ng sinh viên có thói quen l i, lư i nghiên c u, h c theo ki u ñ i phó.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
8=>2