Chapter 8 – Strings, Chars

L p đ i t

ươ

ng th c ToString

ớ ố ượ ạ ạ

Slide  1

©

ng string ỗ ộ •  T o m t chu i ỗ •  T o chu i dùng ph •  Thao tác trên chu iỗ •  Tìm m t chu i con •  Chia chu iỗ ỗ •  Thao tác trên chu i dùng StringBuilder ắ Các bi u th c quy t c ắ ứ •  S  d ng bi u th c quy t c qua l p Regex ậ ợ ể •  S  d ng Regex đ  tìm t p h p ể •  S  d ng Regex đ  gom nhóm •  S  d ng l p CaptureCollection ậ ể ử ụ ử ụ ử ụ ử ụ ỏ Câu h i & bài t p

Lớp đối tượng string

 Mỗi đối tượng chuỗi là một dãy cố định các ký tự Unicode.  Các phương thức được dùng để làm thay đổi một chuỗi thực sự trả về một bản sao đã thay đổi, chuỗi nguyên thủy không thay đổi.

 Là một trong những kiểu dữ liệu được xây dựng sẵn được cung cấp bởi thư viện lớp .NET (.NET Framework Class Library)

 Khai báo của lớp System.String như sau:

:

IComparable,

ICloneble,

public sealed class String Iconvertible

thực

 Lớp này cũng

thi ba giao diện hệ

thống

là IComparable, ICloneable, và IConvertible – giao diện này cho phép lớp System.String chuyển đổi với những lớp khác trong hệ thống .NET.

Slide  2

©

Lớp đối tượng string

 IComparable được thực thi bởi các kiểu dữ liệu đã được sắp xếp. Các lớp IComparable thực thi phương thức CompareTo().

 ICloneable có thể tạo ra những thể hiện khác với cùng giá trị như là thể hiện nguyên thuỷ. Các lớp Icloneable thực thi phương thức Clone() – phương thức sao chép.

Slide  3

©

 IConvertible cung cấp phương thức để dễ dàng chuyển đổi qua các kiểu dữ liệu cơ bản khác như là ToInt32(), ToDouble(), ToDecimal(),...

Tạo một chuỗi

 Khai báo và khởi tạo chuỗi hằng

string newString = “Day la chuoi hang”;

 Chuỗi cũng có thể được tạo bằng cách sử dụng chuỗi cố định hay nguyên văn (verbatim) không thay đổi. Được bắt đầu với biểu tượng @. (cid:0)

 string literal1 =

“\\\\MyDocs\\CSharp\\ProgrammingC#.cs”;

 string verbatim1 =

Slide  4

©

@”\\MyDocs\CSharp\ProgrammingC#.cs”;

Tạo chuỗi dùng phương thức ToString của đối tượng

 Gọi phương thức ToString() của một đối tượng và gán

kết quả đến một biến chuỗi.

 int myInt = “9”;  string intString = myInt.ToString();

 Truyền một mảng chuỗi như là tham số đến bộ khởi dựng của String là tạo ra một thể hiện CLRcompliant (một thể hiện đúng theo yêu cầu của CLR).

 Còn việc truyền một con trỏ chuỗi như một tham số của bộ khởi dựng String là việc tạo một thể hiện không an toàn (unsafe).

Slide  5

©

 Lớp String của .NET cung cấp rất nhiều bộ khởi dựng hỗ trợ rất nhiều kỹ thuật khác nhau để gán những giá trị chuỗi đến kiểu dữ liệu chuỗi.

Thao tác trên chuỗi

Slide  6

©

Thao tác trên chuỗi

Slide  7

©

Thao tác trên chuỗi

Slide  8

©

Thao tác trên chuỗi dùng StringBuilder

ượ ử ụ ể ạ ổ • L p StringBuilder đ c s  d ng đ  t o ra và b  sung các

ớ chu i. ỗ

ở ự ộ ộ ủ ầ • L p này chính là ph n đóng gói c a m t b  kh i d ng cho

Slide  9

©

ớ ộ m t String.

Thao tác trên chuỗi dùng StringBuilder

Slide  10

©

ươ ứ ủ ớ Ph ng th c c a l p StringBuilder

Các biểu thức quy tắc (Regular Expression)

 Một biểu thức qui tắc bao gồm hai kiểu ký tự:  Ký tự bình thường (literal): những ký tự này mà chúng

ta sử dụng để so khớp với chuỗi ký tự đích.

 Metacharacter: là các biểu tượng đặc biệt, có hành động như là các lệnh trong bộ phân tích (parser) của biểu thức.

 Ví dụ:

 Biểu thức này sẽ so khớp với bất cứ chuỗi con nào với những từ như “From”, “To”, “Subject”, và “Date” miễn là những từ này bắt đầu bằng ký tự dòng mới (^) và kết thúc với dấu hai chấm (:).

Slide  11

©

^(From|To|Subject|Date):

Sử dụng biểu thức quy tắc qua lớp Regex

 MS.NET cung cấp một hướng tiếp cận hướng đối tượng (object- oriented approad) cho biểu thức quy tắc để so khớp, tìm kiếm và thay thế chuỗi.

 Biểu thức quy tắc của ngôn ngữ C# là được xây dựng

từ lớp regexp của ngôn ngữ Perl5.

 Namspace System.Text.RegularExpressions của thư

Demo

Slide  12

©

viện BCL (Base Class Library) chứa đựng tất cả các đối tượng liên quan đến biểu thức quy tắc trong môi trường .NET. Và lớp quan trọng nhất mà biểu thức quy tắc hỗ trợ là Regex.

Regular Expressions and Class Regex

Cha ra c ter  \d

Cha ra c ter  \D

Ma tc hes  any digit

Ma tc hes  any non­digit

\w

\W

any word character

any non­word character

\s

\S

any whitespace

any non­whitespace

Fig. 15.19  Cha ra c ter c la sses.

Slide  13

©

Regular Expressions and Class Regex

Qua ntifier  *

Ma tc hes  Matches zero or more occurrences of the pattern.

+

Matches one or more occurrences of the pattern.

?

Matches zero or one occurrences of the pattern.

{n}

Matches exactly n occurrences.

{n,}

Matches at least n occurrences.

{n,m}

Matches between n and m (inclusive) occurrences.

Fig. 15.21  Qua ntifiers used  reg ula r exp ressions.

Slide  14

©

Sử dụng Regex để tìm kiếm tập hợp

 Hai lớp được thêm vào trong namespace .NET cho

phép chúng ta thực hiện việc tìm kiếm một chuỗi một cách lặp đi lặp lại cho đến hết chuỗi, và kết quả trả về là một tập hợp.

 Tập hợp được trả về có kiểu là MatchCollection, bao

gồm không có hay nhiều đối tượng Match.

 Hai thuộc tính quan trọng của những đối tượng Match

Demo

Slide  15

©

là chiều dài và giá trị của nó

Sử dụng Regex để gom nhóm

 Lớp Group cho phép chúng ta tạo những nhóm và tìm kiếm dựa trên biểu thức quy tắc, và thể hiện kết quả từ một nhóm biểu thức đơn.

 Một biểu thức nhóm định rõ một nhóm và cung cấp một biểu thức quy tắc, bất cứ chuỗi con nào được so khớp bởi biểu thức quy tắc thì sẽ được thêm vào trong nhóm.

 Ví dụ, để tạo một nhóm chúng ta có thể viết như sau:

@”(?(\d|\ .)+)\s”

Demo

Slide  16

©

 Lớp Match dẫn xuất từ nhóm Group, và có một tập hợp gọi là Groups chứa tất cả các nhóm mà Match tìm thấy.

Sử dụng lớp CaptureCollection

 Mỗi khi một đối tượng Regex tìm thấy một chuỗi con, thì môt thể hiện Capture được tạo ra và được thêm vào trong một tập hợp CaptureCollection.

 Một đối tượng Capture thể hiện một chuỗi con riêng.  Mỗi nhóm có một tập hợp các Capture được tìm thấy trong

chuỗi con có liên hệ với nhóm.

 Thuộc tính Length là chiều dài của chuỗi con được nắm giữ.  Capture.Length do Match được dẫn xuất từ Group và đến

lượt Group lại được dẫn xuất từ Capture.

Demo

Slide  17

©

 Một Group là một Capture (Group is-a Capture), là một đối tượng Capture đóng gói các ý tưởng về các nhóm biểu thức.  Match cũng là một Group (Match is-a Group), nó đóng gói tất cả các nhóm biểu thức con được so khớp trong biểu thức quy tắc.