Chapter 8 – Strings, Chars
L p đ i t
ứ
ươ
ng th c ToString
ớ ố ượ ạ ạ
ỗ
ộ
ứ
ớ
ể
ớ
Slide 1
©
ng string ỗ ộ • T o m t chu i ỗ • T o chu i dùng ph • Thao tác trên chu iỗ • Tìm m t chu i con • Chia chu iỗ ỗ • Thao tác trên chu i dùng StringBuilder ắ Các bi u th c quy t c ắ ứ • S d ng bi u th c quy t c qua l p Regex ậ ợ ể • S d ng Regex đ tìm t p h p ể • S d ng Regex đ gom nhóm • S d ng l p CaptureCollection ậ ể ử ụ ử ụ ử ụ ử ụ ỏ Câu h i & bài t p
Lớp đối tượng string
Mỗi đối tượng chuỗi là một dãy cố định các ký tự Unicode. Các phương thức được dùng để làm thay đổi một chuỗi thực sự trả về một bản sao đã thay đổi, chuỗi nguyên thủy không thay đổi.
Là một trong những kiểu dữ liệu được xây dựng sẵn được cung cấp bởi thư viện lớp .NET (.NET Framework Class Library)
Khai báo của lớp System.String như sau:
:
IComparable,
ICloneble,
public sealed class String Iconvertible
thực
Lớp này cũng
thi ba giao diện hệ
thống
là IComparable, ICloneable, và IConvertible – giao diện này cho phép lớp System.String chuyển đổi với những lớp khác trong hệ thống .NET.
Slide 2
©
Lớp đối tượng string
IComparable được thực thi bởi các kiểu dữ liệu đã được sắp xếp. Các lớp IComparable thực thi phương thức CompareTo().
ICloneable có thể tạo ra những thể hiện khác với cùng giá trị như là thể hiện nguyên thuỷ. Các lớp Icloneable thực thi phương thức Clone() – phương thức sao chép.
Slide 3
©
IConvertible cung cấp phương thức để dễ dàng chuyển đổi qua các kiểu dữ liệu cơ bản khác như là ToInt32(), ToDouble(), ToDecimal(),...
Tạo một chuỗi
Khai báo và khởi tạo chuỗi hằng
string newString = “Day la chuoi hang”;
Chuỗi cũng có thể được tạo bằng cách sử dụng chuỗi cố định hay nguyên văn (verbatim) không thay đổi. Được bắt đầu với biểu tượng @. (cid:0)
string literal1 =
“\\\\MyDocs\\CSharp\\ProgrammingC#.cs”;
string verbatim1 =
Slide 4
©
@”\\MyDocs\CSharp\ProgrammingC#.cs”;
Tạo chuỗi dùng phương thức ToString của đối tượng
Gọi phương thức ToString() của một đối tượng và gán
kết quả đến một biến chuỗi.
int myInt = “9”; string intString = myInt.ToString();
Truyền một mảng chuỗi như là tham số đến bộ khởi dựng của String là tạo ra một thể hiện CLRcompliant (một thể hiện đúng theo yêu cầu của CLR).
Còn việc truyền một con trỏ chuỗi như một tham số của bộ khởi dựng String là việc tạo một thể hiện không an toàn (unsafe).
Slide 5
©
Lớp String của .NET cung cấp rất nhiều bộ khởi dựng hỗ trợ rất nhiều kỹ thuật khác nhau để gán những giá trị chuỗi đến kiểu dữ liệu chuỗi.
Thao tác trên chuỗi
Slide 6
©
Thao tác trên chuỗi
Slide 7
©
Thao tác trên chuỗi
Slide 8
©
Thao tác trên chuỗi dùng StringBuilder
ượ ử ụ ể ạ ổ • L p StringBuilder đ c s d ng đ t o ra và b sung các
ớ chu i. ỗ
ở ự ộ ộ ủ ầ • L p này chính là ph n đóng gói c a m t b kh i d ng cho
Slide 9
©
ớ ộ m t String.
Thao tác trên chuỗi dùng StringBuilder
Slide 10
©
ươ ứ ủ ớ Ph ng th c c a l p StringBuilder
Các biểu thức quy tắc (Regular Expression)
Một biểu thức qui tắc bao gồm hai kiểu ký tự: Ký tự bình thường (literal): những ký tự này mà chúng
ta sử dụng để so khớp với chuỗi ký tự đích.
Metacharacter: là các biểu tượng đặc biệt, có hành động như là các lệnh trong bộ phân tích (parser) của biểu thức.
Ví dụ:
Biểu thức này sẽ so khớp với bất cứ chuỗi con nào với những từ như “From”, “To”, “Subject”, và “Date” miễn là những từ này bắt đầu bằng ký tự dòng mới (^) và kết thúc với dấu hai chấm (:).
Slide 11
©
^(From|To|Subject|Date):
Sử dụng biểu thức quy tắc qua lớp Regex
MS.NET cung cấp một hướng tiếp cận hướng đối tượng (object- oriented approad) cho biểu thức quy tắc để so khớp, tìm kiếm và thay thế chuỗi.
Biểu thức quy tắc của ngôn ngữ C# là được xây dựng
từ lớp regexp của ngôn ngữ Perl5.
Namspace System.Text.RegularExpressions của thư
Demo
Slide 12
©
viện BCL (Base Class Library) chứa đựng tất cả các đối tượng liên quan đến biểu thức quy tắc trong môi trường .NET. Và lớp quan trọng nhất mà biểu thức quy tắc hỗ trợ là Regex.
Regular Expressions and Class Regex
Cha ra c ter \d
Cha ra c ter \D
Ma tc hes any digit
Ma tc hes any nondigit
\w
\W
any word character
any nonword character
\s
\S
any whitespace
any nonwhitespace
Fig. 15.19 Cha ra c ter c la sses.
Slide 13
©
Regular Expressions and Class Regex
Qua ntifier *
Ma tc hes Matches zero or more occurrences of the pattern.
+
Matches one or more occurrences of the pattern.
?
Matches zero or one occurrences of the pattern.
{n}
Matches exactly n occurrences.
{n,}
Matches at least n occurrences.
{n,m}
Matches between n and m (inclusive) occurrences.
Fig. 15.21 Qua ntifiers used reg ula r exp ressions.
Slide 14
©
Sử dụng Regex để tìm kiếm tập hợp
Hai lớp được thêm vào trong namespace .NET cho
phép chúng ta thực hiện việc tìm kiếm một chuỗi một cách lặp đi lặp lại cho đến hết chuỗi, và kết quả trả về là một tập hợp.
Tập hợp được trả về có kiểu là MatchCollection, bao
gồm không có hay nhiều đối tượng Match.
Hai thuộc tính quan trọng của những đối tượng Match
Demo
Slide 15
©
là chiều dài và giá trị của nó
Sử dụng Regex để gom nhóm
Lớp Group cho phép chúng ta tạo những nhóm và tìm kiếm dựa trên biểu thức quy tắc, và thể hiện kết quả từ một nhóm biểu thức đơn.
Một biểu thức nhóm định rõ một nhóm và cung cấp một biểu thức quy tắc, bất cứ chuỗi con nào được so khớp bởi biểu thức quy tắc thì sẽ được thêm vào trong nhóm.
Ví dụ, để tạo một nhóm chúng ta có thể viết như sau:
@”(?
Demo
Slide 16
©
Lớp Match dẫn xuất từ nhóm Group, và có một tập hợp gọi là Groups chứa tất cả các nhóm mà Match tìm thấy.
Sử dụng lớp CaptureCollection
Mỗi khi một đối tượng Regex tìm thấy một chuỗi con, thì môt thể hiện Capture được tạo ra và được thêm vào trong một tập hợp CaptureCollection.
Một đối tượng Capture thể hiện một chuỗi con riêng. Mỗi nhóm có một tập hợp các Capture được tìm thấy trong
chuỗi con có liên hệ với nhóm.
Thuộc tính Length là chiều dài của chuỗi con được nắm giữ. Capture.Length do Match được dẫn xuất từ Group và đến
lượt Group lại được dẫn xuất từ Capture.
Demo
Slide 17
©
Một Group là một Capture (Group is-a Capture), là một đối tượng Capture đóng gói các ý tưởng về các nhóm biểu thức. Match cũng là một Group (Match is-a Group), nó đóng gói tất cả các nhóm biểu thức con được so khớp trong biểu thức quy tắc.