intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Máy tính: Nghiên cứu một số tính chất nội suy ảnh số sử dụng phép toán hình thái để nâng cao chất lượng ảnh

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:72

29
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn Thạc sĩ Máy tính "Nghiên cứu một số tính chất nội suy ảnh số sử dụng phép toán hình thái để nâng cao chất lượng ảnh" trình bày các nội dung chính sau: Các khái niệm cơ bản về xử lý ảnh và phép toán hình thái; Phép toán hình thái học trong xử lý ảnh; Chương trình thử nghiệm phép lọc hình thái.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Máy tính: Nghiên cứu một số tính chất nội suy ảnh số sử dụng phép toán hình thái để nâng cao chất lượng ảnh

  1. LỜI CAM ĐOAN Tôi là Tô Hồng Quân, học viên khóa 2019B, ngành Máy tính, chuyên ngành Hệ Thống Thông Tin. Tôi xin cam đoan luận văn “Nghiên cứu một số tính chất nội suy ảnh số sử dụng phép toán hình thái để nâng cao chất lượng ảnh” là do tôi nghiên cứu, tìm hiểu và phát triển dưới sự hướng dẫn của PGS.TS. Ngô Quốc Tạo và TS. Nguyễn Hoàng Hà, không phải sự sao chép từ các tài liệu, công trình nghiên cứu của người khác mà không ghi rõ trong tài liệu tham khảo. Tôi xin chịu trách nhiệm về lời cam đoan này. Hà Nội, ngày tháng năm 2021 Tác giả Tô Hồng Quân
  2. LỜI CẢM ƠN Lời cảm ơn trân trọng đầu tiên em muốn dành tới các thầy cô Học viện khoa học và công nghệ Việt Nam, Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam nói chung và các thầy cô trong bộ môn Hệ thống thông tin cũng như khoa Công nghệ thông tin nói riêng đã tận tình giảng dạy và truyền đạt những kiến thức quý báu trong suốt khoá cao học vừa qua, giúp em có những kiến thức chuyên môn nền tảng để làm cơ sở lý luận khoa học cho luận văn này. Đặc biệt em xin chân thành cảm ơn thầy PGS.TS. Ngô Quốc Tạo và thầy TS. Nguyễn Hoàng Hà đã dìu dắt và hướng dẫn em trong suốt quá trình làm luận văn, sự chỉ bảo và định hướng của các thầy đã giúp em nghiên cứu và hoàn thành luận văn này. Em xin trân trọng cảm ơn Ban giám hiệu Học viện khoa học công nghệ Việt Nam - Viện Hàn lâm khoa học và công nghệ Việt Nam đã tạo các điều kiện cho em được học tập và làm luận văn một cách thuận lợi. Qua đây, em cũng xin gửi lời cảm ơn đến người thân trong gia đình, bạn bè và đồng nghiệp đã luôn động viên, hỗ trợ và tạo mọi điều kiện tốt nhất giúp em hoàn thành việc học tập và thực hiện luận văn này. Mặc dù đã cố gắng nỗ lực, nhưng chắc chắn trong quá trình học tập cũng như thực hiện luận văn, em không tránh khỏi những thiếu xót. Em rất mong nhận được sự thông cảm và chỉ bảo tận tình của các thầy cô và các bạn. Nội dung nghiên cứu của luận văn này nằm trong đề tài khoa học mã số VAST01.01/19-20 tiêu đề “Nghiên cứu phát triển phương pháp phát hiện tự động các điểm mốc hình thái trên ảnh cánh côn trùng”. Bản luận văn này của em được sự hỗ trợ bởi đề tài CS21.04 của Viện Công nghệ thông tin(IOIT), Viện hàn lâm Khoa học và Công nghệ Việt Nam (VAST). Hà Nội, ngày tháng năm 2021 . Tác giả Tô Hồng Quân
  3. MỤC LỤC DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT ...................................................... i DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ ............................................................................ ii MỞ ĐẦU .........................................................................................................................1 1. Động lực nghiên cứu................................................................................................1 2. Mục tiêu luận văn ....................................................................................................1 3. Cấu trúc luận văn .....................................................................................................2 CHƯƠNG 1. CÁC KHÁI NIỆM CƠ BẢN VỀ XỬ LÝ ẢNH VÀ PHÉP TOÁN HÌNH THÁI ................................................................................................................................3 1.1. Giới thiệu về xử lý ảnh ....................................................................................3 1.1.1 Xử lý ảnh .....................................................................................................3 1.1.2 Giới thiệu về hệ thống xử lý ảnh .................................................................4 1.1.3 Các vấn đề cơ bản trong xử lý ảnh ..............................................................5 1.1.3.1 Một số khái niệm cơ bản .........................................................................5 1.1.3.2 Biểu diễn ảnh ...........................................................................................7 1.1.3.3 Tăng cường ảnh – khôi phục ảnh ............................................................8 1.1.3.4 Biến đổi ảnh .............................................................................................8 1.1.3.5 Phân tích ảnh ...........................................................................................8 1.1.3.6 Nhận dạng ảnh .........................................................................................9 1.1.3.7 Nén ảnh ..................................................................................................10 1.1.4 Một số phương pháp nâng cao chất lượng ảnh..........................................11 1.2. Các khái niệm về phép toán hình thái Morphology ......................................13 1.2.1. Một số khái niệm cơ bản về tập hợp..........................................................14 1.2.1.1. Một số phép toán trên ảnh nhị phân ..................................................14 1.2.1.2. Các phép toán logic trên ảnh nhị phân ..............................................15 1.2.2. Các khái niệm hình thái cơ bản .................................................................16 1.2.3. Bốn nguyên tắc hình thái ...........................................................................19 1.3. Kết luận..........................................................................................................20 CHƯƠNG 2. PHÉP TOÁN HÌNH THÁI HỌC TRONG XỬ LÝ ẢNH ......................21 2.1. Các phép toán hình thái học ..........................................................................21
  4. 2.1.1. Phần tử cấu trúc .........................................................................................21 2.1.2. Các phép toán hình thái học trên ảnh nhị phân .........................................22 2.1.2.1. Phép giãn nở trên ảnh nhị phân .........................................................22 2.1.2.2. Phép co trên ảnh nhị phân .................................................................25 2.1.2.3. Phép mở ảnh (Opening) và phép đóng ảnh (Closing) .......................28 2.1.2.4. Phép biến đổi trúng hay trượt (Hit-or- miss transformation) ............32 2.1.2.5. Phép toán dãn nở có điều kiện ...........................................................34 2.1.3. Các phép toán hình thái học trên ảnh xám ................................................35 2.1.3.1. Phép giãn ...........................................................................................35 2.1.3.2. Phép co ..............................................................................................36 2.1.3.3. Phép toán đóng mở ảnh .....................................................................37 2.2. Các tính chất nội suy của phép toán hình thái học ........................................37 2.3. Ứng dụng của phép toán hình thái .................................................................38 2.3.1. Ứng dụng làm trơn ảnh ..............................................................................38 2.3.2. Trích biên (Boundary Extraction) .............................................................39 2.3.3. Tô đầy vùng (Region Filling) ....................................................................41 2.3.4. Trích chọn các thành phần liên thông (Extraction of Connected Components) ..........................................................................................................42 2.3.5. Làm mảnh ảnh (Thinning) .........................................................................43 2.3.6. Làm dày đối tượng trong ảnh (Thickening) ..............................................46 2.3.7. Tìm khung xương (Skeletonization) .........................................................46 2.3.8. Phép toán hình thái Gradient (Morphology Gradient Operator) ...............47 2.4. Các phép lọc hình thái học ứng dụng cho ảnh OCR .....................................48 2.4.1. Mô hình ảnh tài liệu kém chất lượng .........................................................48 2.4.2. Lọc hình thái học .......................................................................................49 2.4.2.1. Toán tử hình thái trên không gian đồ thị ...........................................49 2.4.2.2. Toán tử hình thái trên các phức hợp đơn giản ...................................50 2.4.2.3. Bộ lọc đóng và mở khu vực hình thái ...............................................53 2.5. Phương pháp đánh giá chất lượng ảnh ..........................................................53 2.5.1. Sai số bình phương trung bình (MSE) ......................................................53 2.5.2. Tỷ số tín hiệu cực đại/ nhiễu (PSNR) ........................................................54 2.5.3. Chỉ số tương đồng về cấu trúc SSIM ........................................................54 2.6. Kết luận..........................................................................................................55 CHƯƠNG 3. THỬ NGHIỆM PHÉP LỌC HÌNH THÁI HỌC .....................................57
  5. 3.1. Thiết kế mô hình thử nghiệm ........................................................................57 3.1.1. Công cụ ......................................................................................................57 3.1.2. Tập dữ liệu thử nghiệm .............................................................................57 3.2. Phép toán hình thái cơ bản ............................................................................57 3.3. Làm rõ đối tượng ảnh. ...................................................................................58 3.4. Kết hợp các phép toán hình thái để khử nhiễu ảnh. ......................................60 3.5. Kết luận..........................................................................................................61 TÀI LIỆU THAM KHẢO .............................................................................................63
  6. DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT Từ viết tắt Từ chuẩn Diễn giải OCR Optical Character Nhận dạng ký tự quang học Recognition MSE Mean Squared Error Sai số toàn phương trung bình PSNR Peak Signal-to-Noise Ration Tỉ số tín hiệu cực đại trên nhiễu SSIM Structural Similarity Index Đo lường chỉ số tương đồng về cấu trúc Measure
  7. DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ Hình 1.1. Quá trình xử lý ảnh ..........................................................................................3 Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh...............................................4 Hình 1.3. Biểu đồ Histogram của ảnh ...........................................................................12 Hình 1.4. Cân bằng biểu đồ Histogram .........................................................................12 Hình 1.5. Phép đảo ảnh ..................................................................................................14 Hình 1.6. Ví dụ về tập điểm ...........................................................................................18 Hình 1.7. Các phần tử cấu trúc cơ bản...........................................................................18 Hình 1.8. Tịnh tiến với một véc tơ ................................................................................19 Hình 2.1. Một số hình dáng của phần tử cấu trúc phẳng ...............................................21 Hình 2.2. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ. .........................22 Hình 2.3. Dãn A bởi B ...................................................................................................23 Hình 2.4. Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân. .........................24 Hình 2.5. Phép co nhị phân trên hai đối tượng ..............................................................26 Hình 2.6. Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân ...27 Hình 2.7. Ứng dụng của phép co ảnh dưới dạng số nhị phân .......................................28 Hình 2.8. Quá trình thực hiện phép mở ảnh. .................................................................29 Hình 2.9. Sử dụng phép toán mở ...................................................................................30 Hình 2.10. Quá trình thực hiện phép đóng ảnh. ............................................................31 Hình 2.11. Sử dụng phép toán đóng ..............................................................................31 Hình 2.12. Phép đóng với độ sâu lớn ............................................................................32 Hình 2.13. Minh hoạ thao tác đánh trúng và trượt ........................................................33 Hình 2.14. Dãn theo điều kiện .......................................................................................35 Hình 2.15. Phép toán dãn ảnh trên ảnh xám với phần tử cấu trúc không phẳng. ..........36 Hình 2.16. Phép toán co ảnh trên ảnh xám với phần tử cấu trúc không phẳng. ............37 Hình 2.17. Làm trơn ảnh đa cấp xám ............................................................................39 Hình 2.18. Quá trình tìm biên của đối tượng trên ảnh nhị phân. ...................................40 Hình 2.19. Trích lọc biên của đối tượng ........................................................................40 Hình 2.20. Quá trình lấp đầy vùng đối tượng trong ảnh................................................42 Hình 2.21. Quá trình trích chọn các thành phần liên thông trong ảnh bằng phép toán hình thái .................................................................................................................................43 Hình 2.22. Quá trình làm mảnh đối tượng trong hình ảnh ............................................45 Hình 2.23. Ví dụ về làm mảnh đối tượng ......................................................................46 Hình 2.24. Kết quả làm dày đối tượng ..........................................................................46 Hình 2.25. Quá trình thực hiện thuật toán tìm xương ...................................................47
  8. Hình 2.26. Ví dụ tìm xương của các đối tượng .............................................................47 Hình 2.27. Đường dốc hình thái ....................................................................................48 Hình 2.28. Minh họa về sự giãn nở và ăn mòn hình thái trên các phức hợp .................53 Hình 3.1. Các phép toán hình thái cơ bản......................................................................58 Hình 3.2. Làm rõ đối tượng tiền cảnh ...........................................................................59 Hình 3.3. Khử nhiễu ảnh................................................................................................60 Hình 3.4. Khử nhiễu ảnh OCR ......................................................................................61
  9. MỞ ĐẦU 1. Động lực nghiên cứu Hình ảnh trong cuộc sống hiện tại là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử lý và lưu giữ thông tin. Hiện nay, nhu cầu lưu trữ và xử lý các tài liệu, văn bản, bản vẽ kỹ thuật, … dưới dạng hình ảnh scan hoặc dưới dạng ảnh là nhu cầu cần thiết. Tuy nhiên, các hình ảnh scan hoặc chụp thu được bởi nhiều lý do có thể bị nhiễu, mờ nhòe, đứt nét và không được rõ ràng… dẫn đến việc thu nhận thông tin và xử lý gặp nhiều khó khăn. Vì vậy việc khắc phục những nhược điểm của hình ảnh thu nhận được là việc làm rất cấp thiết và quan trọng. Trên thế giới cũng như tại Việt Nam đã có rất nhiều các kỹ thuật được đưa ra, trong đó có xử lý hình thái học trên ảnh. Các phép toán hình thái trên ảnh cung cấp cho chúng ta những mô tả định lượng về cấu trúc và hình dạng hình học của các đối tượng trong ảnh và nó đang được ứng dụng rộng rãi trong việc nâng cao chất lượng ảnh, phân đoạn ảnh, kiểm tra khuyết điểm trên ảnh, … Trong luận văn này tác giả sẽ nghiên cứu : “Một số tính chất nội suy ảnh số sử dụng phép toán hình thái để nâng cao chất lượng ảnh ” 2. Mục tiêu luận văn Với đề tài “ Nghiên cứu một số tính chất nội suy ảnh số sử dụng phép toán hình thái để nâng cao chất lượng ảnh”, luận văn tập trung các vấn đề sau : • Tổng quan về xử lý ảnh và phép toán hình thái : Lý thuyết cơ bản về xử lý ảnh, quá trình xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh, các khái niệm về phép toán hình thái Morphology. • Trình bày một số tính chất nội suy của phép toán hình thái : trình bày các phép toán hình thái học trên ảnh nhị phân, ảnh xám và các tính chất nội suy của phép toán hình thái học. Tiếp theo đó sẽ trình bày các phép lọc hình thái học cho ảnh OCR. Thực hiện cài đặt và đánh giá kết quả đạt được với phép lọc hình thái học ứng dụng cho một số loại ảnh tài liệu đang bị các vết mờ theo thời gian, ảnh có những chi tiết thừa, 1
  10. nhiễu như vết lem mực, nhòe, ố… Từ đó đưa ra đánh giá và hướng phát triển trong tương lai. 3. Cấu trúc luận văn Cấu trúc của luận văn bao gồm: MỞ ĐẦU: Giới thiệu và đưa ra hướng nghiên cứu. CHƯƠNG 1: Các khái niệm cơ bản về xử lý ảnh và phép toán hình thái: Tại chương này tác giả nghiên cứu về khái niệm xử lý ảnh, quá trình xử lý ảnh và các khái niệm về phép toán hình thái Morphology. CHƯƠNG 2: Phép toán hình thái học trong xử lý ảnh: Chương này tác giả sẽ trình bày các phép toán hình thái học trên ảnh nhị phân, ảnh xám và các tính chất nội suy của phép toán hình thái học. Tiếp theo đó sẽ trình bày các phép lọc hình thái học cho ảnh OCR. CHƯƠNG 3: Chương trình thử nghiệm phép lọc hình thái: Chương này trình bày sơ đồ chương trình, thử nghiệm phép lọc hình thái và đánh giá MSE cũng như đánh giá PSNR, đánh giá SSIM. TÀI LIỆU THAM KHẢO: Liệt kê các tài liệu mà luận văn tham khảo trên nhiều nguồn khác nhau. 2
  11. CHƯƠNG 1. CÁC KHÁI NIỆM CƠ BẢN VỀ XỬ LÝ ẢNH VÀ PHÉP TOÁN HÌNH THÁI Chương này trình bày về khái niệm xử lý ảnh, quá trình xử lý ảnh và các khái niệm về phép toán hình thái Morphology. 1.1. Giới thiệu về xử lý ảnh 1.1.1 Xử lý ảnh Thông tin được con người thu nhận qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy. Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận nào đó. Hình 1.1. Quá trình xử lý ảnh Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử lý ảnh số bao gồm các phương pháp và kĩ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm: - Thứ nhất, biến đổi ảnh và làm đẹp ảnh. - Thứ hai, tự động nhận dạng ảnh hay đoán ảnh và đánh giá các nội dung của ảnh. Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng: 3
  12. - Mô tả tham số (nhận dạng theo tham số) - Mô tả theo cấu trúc (nhận dạng theo cấu trúc) Nhận biết và đánh giá các nội dung của ảnh (nhận dạng) là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu.[1] Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh, v.v... Kĩ thuật này được dùng nhiều trong y học (xử lý tế bào, nhiễm sắc thể) và nhận dạng chữ viết trong văn bản. 1.1.2 Giới thiệu về hệ thống xử lý ảnh Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2,..., cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều. Các quá trình của xử lý ảnh được tiến hành theo sơ đồ sau[2]: Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh Sơ đồ này bao gồm các thành phần sau: a) Phần thu nhận ảnh (Image Acquisition) Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh được quét qua scanner. Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại. b) Tiền xử lý (Image Processing) 4
  13. Do những nguyên nhân khác nhau có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể có độ tương phản thấp, có thể bị suy biến. Do vậy, chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản, tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng. c) Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh trên từng vùng. d) Biểu diễn và mô tả Tìm các vùng đặc trưng điểm ảnh như biên ảnh (Boundary), vùng ảnh (Region), và biểu diễn lại thông qua các điểm ảnh đặc trưng. e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản: - Nhận dạng theo tham số. - Nhận dạng theo cấu trúc. Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người… f) Cơ sở tri thức (Knowledge Base) Tiếp nhận và xử lý theo phương pháp trí tuệ con người. 1.1.3 Các vấn đề cơ bản trong xử lý ảnh 1.1.3.1 Một số khái niệm cơ bản ❖ Pixel (Picture Element): Điểm ảnh 5
  14. Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình số hoá, người ta biến đổi tín hiêụ liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên tắc, mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này, người ta sử dụng khái niệm Picture Element mà ta quen gọi hay viết là pixel (điểm ảnh). Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y). Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh. Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hóa, nó thường được biểu diễn bởi mảng 2 chiều (ví dụ ảnh I(mxn): m dòng và n cột và có m*n điểm ảnh). Một điểm ảnh có thể được biểu diễn bằng 1, 4, 8, 24 bits. ❖ Ảnh nhị phân: Khi trên một ảnh chỉ tồn tại các giá trị 0 hoặc 1 thì ta nói đó là ảnh nhị phân (hoặc ảnh đen trắng) và các điểm ảnh của nó gọi là điểm ảnh nhị phân mỗi điểm chỉ có giá trị đen hoặc trắng không có các mức xám khác nhau. ❖ Ảnh xám: Nếu dùng 8-bit (1 byte) để biểu diễn mức xám, thì số các mức xám có thể biểu diễn được là 28 hay 256. Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ tối nhất và 255 biểu diễn cho mức cường độ sáng nhất. ❖ Ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24-bit, 24-bit này được chia thành ba khoảng 8 bit. Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính, tổ hợp của các màu ta được nhiều mức biểu diễn, như vậy mỗi điểm ảnh có thể được mô tả rõ giá trị màu tự nhiên của nó (true color). ❖ Ảnh đa cấp xám: Ảnh được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh mức xám cũng ứng dụng được trên ảnh màu. Ta có thể biến đổi ảnh màu về ảnh xám. Mỗi điểm 6
  15. của ảnh màu có 3 giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có màu xám (Grey), khi đó với mỗi điểm ảnh ta chỉ cần lưu một giá trị. Việc xử lý ảnh nhị phân là một bước tiền xử lý các ảnh, để phân đoạn và tách ra các đặc tính. Nhờ vậy ta có thể biết được mối quan hệ tôpô giữa các điểm ảnh cũng như thực hiện các phép biến đổi ảnh không tuyến tính đạt hiệu quả; trong quá trình xử lý ảnh các phép biến đổi này dẫn đến sự đơn giản hoá việc đánh giá ảnh. Việc đếm các điểm ảnh trên ảnh nhị phân đã qua biến đổi tạo điều kiện thuận lợi cho việc tách ra các đặc tính. Bằng cách sử dụng các ảnh nhị phân đã qua xử lý như là những mặt nạ đối với các ảnh xám, ta có thể tách ra các vùng đáng quan tâm của một ảnh xám từ tập hợp các ảnh. Để tạo ra một ảnh nhị phân, một ảnh xám cần phải được biến đổi thành một ảnh nhị phân nhờ một quá trình phân đoạn thích hợp. Muốn thế, phương pháp đơn giản nhất là phương pháp tách ngưỡng. Các giá trị nằm ở bên trên ngưỡng được gán giá trị 1 còn ở bên dưới ngưỡng thì được gán giá trị 0. Việc tìm giá trị ngưỡng có thể thực hiện tự động nhờ kĩ thuật tách ngưỡng tự động. 1.1.3.2 Biểu diễn ảnh Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng trong các thiết bị kỹ thuật khác nhau. Quá trình lưu trữ ảnh nhằm 2 mục đích: • Tiết kiệm bộ nhớ • Giảm thời gian xử lý Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng kích thước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo mô hình toán học, mô hình thống kê. Trong mô hình toán học, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở. Với mô hình thống kê, một ảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: hàm phân bố mật độ xác suất, kỳ vọng, hàm tương quan, ma trận tương quan, ma trận hiệp phương sai. 7
  16. 1.1.3.3 Tăng cường ảnh – khôi phục ảnh Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một loạt các kỹ thuật như: tăng cường độ tương phản, khử nhiễu, nỗi màu, vv. Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh. Với một hệ thống tuyến tính, ảnh của một đối tượng có thể biểu diễn bởi: +∞ +∞ 𝑔(𝑥, 𝑦) = ∫ ∫ ℎ(𝑥, 𝑦; ∝, 𝛽) 𝑓 (𝛼 , 𝛽)𝑑𝛼𝑑 (𝛽 + η(𝑥, 𝑦)) (1.1) −∞ −∞ Trong đó (x, y): là hàm biểu diễn nhiễu cộng f (, ): hàm biểu diễn đối tượng g (x, y): là ảnh thu nhận ℎ(𝑥, 𝑦; 𝛼, 𝛽): là hàm ánh xạ điểm 1.1.3.4 Biến đổi ảnh Thuật ngữ biến đổi ảnh dùng để nói tới một lớp các ma trận đơn vị và các kỹ thuật dùng để biến đổi ảnh. Cũng như các tín hiệu một chiều được biểu diễn bởi một chuỗi các hàm cơ sở, ảnh cũng có thể được biểu diễn bởi một chuỗi rời rạc các ma trận cơ sở gọi là ảnh cơ sở. Phương trình ảnh cơ sở có dạng: 𝐴∗𝑘,𝑙 = 𝑎𝑘 𝑎𝑙∗𝑇 , với ak là cột thứ k của ma trận A. A là ma trận đơn vị. Có nghĩa là ∗ A*T=I. Các 𝐴𝑘,𝑙 được định nghĩa ở trên với k, l = 0,1, …, N-1 là ảnh cơ sở. Có nhiều loại biến đổi được dùng như: - Biến đổi Fourier, Sin, Cosin, Hadamard, … - Tích Kronecker - Biến đổi KL (Karhumen Loeve): biến đổi này có nguồn gốc từ khai triển của các quá trình ngẫu nhiên gọi là phương pháp trích chọn các thành phần chính. 1.1.3.5 Phân tích ảnh Đây là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh. Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây: 8
  17. Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v... Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..). Đặc điểm biên và đường biên: Là đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v... Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống. 1.1.3.6 Nhận dạng ảnh Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách mơ hồ (vaguely defined) và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể: Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định. Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh. Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây: o Thu nhận dữ liệu và tiền xử lý. o Biểu diễn dữ liệu. 9
  18. o Nhận dạng, ra quyết định. Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là: o Đối sánh mẫu dựa trên các đặc trưng được trích chọn. o Phân loại thống kê. o Đối sánh cấu trúc. o Phân loại dựa trên mạng nơ-ron nhân tạo. Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp. Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu. 1.1.3.7 Nén ảnh Nhằm giảm thiểu không gian lưu trữ và thường được tiến hành theo cả hai cách là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh: - Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF - Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX - Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là tiếp cận 10
  19. theo kỹ thuật nén này. - Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal. 1.1.4 Một số phương pháp nâng cao chất lượng ảnh Nâng cao chất lượng ảnh bao gồm một loạt các phương pháp nhằm hoàn thiện trạng thái quan sát của ảnh. Nhiệm vụ của thao tác này không phải là làm tăng lượng thông tin vốn có trong ảnh mà làm nổi bật các đặc trưng mong muốn sao cho có thể phát hiện tốt hơn, tạo thành quá trình tiền xử lý cho phân tích ảnh [5] Có nhiều phương pháp khác nhau trong nâng cao chất lượng ảnh như: - Các phương pháp trên điểm: Biến đổi tuyến tính từng đoạn, biến đổi logarithm, biến đổi âm bản. Phương pháp này thích hợp cho việc tăng cường các chi tiết của ảnh. - Cân bằng, biến đổi biểu đồ Histogram: biểu đồ Histogram của một ảnh là biểu đồ mô tả sự phân bố của các giá trị mức xám của các điểm ảnh (Pixel) trong một bức ảnh hoặc một vùng ảnh (Region). Biểu đồ Histogram được biểu diễn trong hệ tọa độ vuông góc Oxy. Trong hệ tọa độ này, trục hoành biểu diễn cho số mức xám từ 0-> N (N là số mức xám). Trục tung biểu diễn số điểm ảnh cho một cho một mức xám (số điểm ảnh có cùng mức xám hay tỉ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh). Dựa vào biểu đồ Histogram có thể biết được hình ảnh sáng tối như thế nào. Nếu ảnh sáng thì biểu đồ Histogram nằm bên phải (mức xám cao) Nếu ảnh đậm thì biểu đồ Histogram nằm bên trái (mức xám thấp) 11
  20. Hình 1.3. Biểu đồ Histogram của ảnh Cân bằng Histogram (Histogram equalization) là phương pháp làm cho biểu đồ Histogram của ảnh được phân bố một cách đồng đều. Đây là một cách giúp nâng cao chất lượng hình ảnh. Hình 1.4. Cân bằng biểu đồ Histogram (a) Ảnh gốc (b) Histogram của ảnh gốc (c) Ảnh với cân bằng Histogram 12
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2