Độ phức tạp của thuật toán
lượt xem 36
download
Một chương trình máy tính thường được cài đặt dựa trên một thuật toán đúng để giải quyết bài toán hay vấn đề. Tuy nhiên, ngay cả khi thuật toán đúng, chương trình vẫn có thể không sử dụng được đối với một dữ liệu đầu vào nào đó vì thời gian để cho ra kết quả là quá lâu hoặc sử dụng quá nhiều bộ nhớ (vượt quá khả năng đáp ứng của máy tính).
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Độ phức tạp của thuật toán
- ĐỘ PHỨC TẠP CỦA THUẬT TOÁN Một chương trình máy tính thường được cài đặt dựa trên một thu ật toán đúng để giải quyết bài toán hay vấn đề. Tuy nhiên, ngay cả khi thu ật toán đúng, chương trình vẫn có thể không sử dụng được đối với một d ữ li ệu đ ầu vào nào đó vì thời gian để cho ra kết quả là quá lâu hoặc sử dụng quá nhiều bộ nhớ (vượt quá khả năng đáp ứng của máy tính). Khi tiến hành phân tích thuật toán nghĩa là chúng ta tìm ra một đánh giá về thời gian và "không gian" cần thiết để thực hiện thu ật toán. Không gian ở đây được hiểu là các yêu cầu về bộ nhớ, thiết bị lưu trữ, ... của máy tính đ ể thuật toán có thể làm việc. Việc xem xét về không gian của thuật toán ph ụ thuộc phần lớn vào cách tổ chức dữ liệu của thuật toán. Trong ph ần này, khi nói đến độ phức tạp của thuật toán, chúng ta chỉ đề cập đến nh ững đánh giá về mặt thời gian mà thôi. Phân tích thuật toán là một công việc rất khó khăn, đòi hỏi phải có những hiểu biết sâu sắc về thuật toán và nhiều kiến thức toán học khác. Ðây là công việc mà không phải bất cứ người nào cũng làm được. Rất may mắn là các nhà toán học đã phân tích cho chúng ta độ phức tạp của hầu hết các thuật toán cơ sở (sắp xếp, tìm kiếm, các thuật toán số h ọc, ...). Chính vì v ậy, nhi ệm v ụ còn lại của chúng ta là hiểu được các khái niệm liên quan đến độ ph ức t ạp của thuật toán. Ðánh giá về thời gian của thuật toán không phải là xác định thời gian tuyệt đối (chạy thuật toán mất bao nhiêu giây, bao nhiêu phút,...) để thực hiện thuật toán mà là xác định mối liên quan giữa dữ liệu đầu vào (input) của thuật toán và chi phí (số thao tác, số phép tính cộng,trừ, nhân, chia, rút căn,...) đ ể thực hiện thuật toán. Sở dĩ người ta không quan tâm đến th ời gian tuyệt đối của thuật toán vì yếu tố này phụ thuộc vào tốc độ của máy tính, mà các máy tính khác nhau thì có tốc độ rất khác nhau. Một cách tổng quát, chi phí thực hiện thuật toán là một hàm số phụ thuộc vào dữ liệu đầu vào : T = f(input) Tuy vậy, khi phân tích thuật toán, người ta thường chỉ chú ý đến mối liên quan giữa độ lớn của dữ liệu đầu vào và chi phí. Trong các thuật toán, độ lớn của dữ liệu đầu vào thường được thể hiện bằng một con số nguyên n. Chẳng hạn : sắp xếp n con số nguyên, tìm con số lớn nhất trong n số, tính đi ểm trung bình của n học sinh, ... Lúc này, người ta thể hiện chi phí thực hiện thuật toán bằng một hàm số phụ thuộc vào n :
- T = f(n) Việc xây dựng một hàm T tổng quát như trên trong mọi trường h ợp c ủa thuật toán là một việc rất khó khăn, nhiều lúc không thể thực hiện được. Chính vì vậy mà người ta chỉ xây dựng hàm T cho một số trường hợp đáng chú ý nhất của thuật toán, thường là trường hợp tốt nhất và xấu nhất. Chúng ta trở lại ví dụ về thuật toán tìm hộp nặng nhất trong n hộp cho trước, nhưng lần này ta làm việc trên một thể hiện khác của vấn đề. Ðây là một thuật toán tương đối đơn giản nên chúng ta có thể ti ến hành phân tích được độ phức tạp. Trước khi phân tích độ phức tạp, ta nhắc lại đôi điều về thuật toán này. Tìm số lớn nhất trong một dãy số Bài toán : Cho một dãy số a có n phần tử a 1, a2, ...an. Hãy xây dựng thuật toán để tìm con số lớn nhất trong dãy a. Nhận xét 1. Nếu dãy chỉ có 1 phần tử thì phần tử đó là số lớn nhất. 2. Giả sử dãy có n phần tử và ta đã xác định được phần tử lớn nhất là amax . Nếu bổ sung thêm phần tử thứ an+1 vào dãy mà an+1 > amax thì an+1 chính là phần tử lớn nhất của dãy có n+1 phần tử. Trường h ợp ngược lại, nghĩa là an+1 ? amax thì amax vẫn là phần tử lớn nhất của dãy có n+1 phần tử. Thuật toán 1. Ghi nhớ amax = a1. 2. i = 2. 3. Nếu (i ? n) thì thực hiện các bước sau, ngược lại sang bước 5. 3.1. Nếu (ai > amax ) thì 3.1.1. Ghi nhớ amax = ai . 3.2. Tăng i lên 1. 4. Trở lại bước 3. 5. Phần tử lớn nhất dãy a chính là amax .Kết thúc. Trong thuật toán trên, để đơn giản, ta chỉ xem chi phí là số lần so sánh ở bước 3.1 và số lần "ghi nhớ" trong bước 3.1.1. Trường hợp tốt nhất của thuật toán này xảy ra khi con số lớn nhất nằm đầu dãy (a max= a1); trường hợp xấu nhất xảy ra khi con số lớn nhất nằm ở cuối dãy (a max=an) và dãy được sắp xếp theo thứ tự tăng dần.
- Dựa theo sơ đồ khối của thuật toán, ta nhận thấy rằng, trong mọi trường hợp của bài toán, phép "ghi nhớ" ở bước 3.1 luôn được thực hiện và số lần thực hiện là n-1 (ứng với việc xét từ phần tử a 2 đến an). Ta gọi đây là chi phí cố định hoặc bất biến của thuật toán. Trường hợp tốt nhất : do amax = a1 suy ra, với mọi i > 2, a i< amax. Do đó, điều kiện ai>amax ở bước 3.1 luôn không thỏa nên bước 3.1.1 không bao giờ được thực hiện. Như vậy, chi phí chung cho trường hợp này chính là chi phí cố định của bài toán. T = f(n) = n-1 Trường hợp xấu nhất : Ta có : với mọi i>1, ai-1< ai (do định nghĩa dãy được sắp xếp tăng dần) nên điều kiện ai>amax ở bước 3.1 luôn thỏa, bước 3.1.1 luôn được thực hiện. Như vậy, ngoài chi phí chung là n-1 phép so sánh, ta cần ph ải dùng thêm n-1 phép "ghi nhớ" ở bước 3.1.1. Như vậy, tổng chi phí của trường hợp này là T = f(n) = 2(n-1)=2n-2
- Ðịnh nghĩa Cho hai hàm f và g có miền xác định trong tập số tự nhiên . Ta viết f(n) = O(g(n)) và nói f(n) có cấp cao nhất là g(n) khi tồn tại hằng số C và k sao cho | f(n) | ? C.g(n) với mọi n > k Tuy chi phí của thuật toán trong trường hợp tốt nh ất và x ấu nh ất có th ể nói lên nhiều điều nhưng vẫn chưa đưa ra được một hình dung tốt nhất về độ phức tạp của thuật toán. Ðể có thể hình dung chính xác về độ phức tạp của thuật toán, ta xét đến một yếu tố khác là độ tăng của chi phí khi độ lớn n của dữ liệu đầu vào tăng. Theo định nghĩa ở trên, ta nhận thấy chi phí thấp nhất và lớn nhất của thuật toán tìm số lớn nhất đều bị chặn bởi O(n) (tồn tại hằng s ố C=10, k=1 để 2n-2 < 10n với mọi n>1). Một cách tổng quát, nếu hàm chi phí của thuật toán (xét trong một trường hợp nào đó) bị chặn bởi O(f(n)) thì ta nói rằng thuật toán có độ ph ức tạp là O(f(n)) trong trường hợp đó. Như vậy, thuật toán tìm số lớn nhất có độ phức tạp trong trường hợp tốt nhất và xấu nhất đều là O(n). Người ta gọi các thuật toán có đ ộ ph ức t ạp O(n) là các thuật toán có độ phức tạp tuyến tính. Sau đây là một số "thước đo" độ phức tạp của thuật toán đ ược s ử d ụng rộng rãi. Các độ phức tạp được sắp xếp theo thứ tự tăng dần. Nghĩa là một bài toán có độ phức tạp O(nk) sẽ phức tạp hơn bài toán có độ ph ức tạp O(n) hoặc O(logan).
CÓ THỂ BẠN MUỐN DOWNLOAD
-
BÀI TẬP PHÂN TÍCH VÀ THIẾT KẾ THUẬT TOÁN
5 p | 1614 | 269
-
Giáo trình Một số vấn đề về thuật toán - Nguyễn Hữu Điển
233 p | 251 | 86
-
Giáo trình phân tích giải thuật
83 p | 223 | 81
-
Giáo trình Lý thuyết thuật toán
92 p | 238 | 65
-
Giáo trình - Một số vấn đề về thuật toán - chương 3
21 p | 179 | 42
-
THUẬT TOÁN – ĐỘ PHỨC TẠP CỦA THUẬT TOÁN
29 p | 154 | 31
-
Bài giảng Nhập môn Số học thuật toán: Chương 1, 2 - Nguyễn Đạt Thông
54 p | 177 | 13
-
THUẬT TOÁN – PHẦN 2
10 p | 92 | 11
-
Chươn 1 "Giáo trình toán rời rạc"
18 p | 75 | 7
-
Đề cương: Tính toán song song
20 p | 73 | 6
-
Giáo trình Toán rời rạc: Phần 2 - TS. Võ Văn Tuấn Dũng
80 p | 17 | 5
-
Thuận toán nhanh tính toán lập thuộc tính lõi của bảng quyết định đưa vào vùng dương
6 p | 39 | 3
-
Bài giảng Toán rời rạc: Chương 2 - Nguyễn Quỳnh Diệp
44 p | 39 | 3
-
Bài giảng Toán rời rạc: Bài 2 - Vũ Thương Huyền
42 p | 40 | 3
-
Triển khai hiệu quả bài toán hiệu chỉnh các hệ số điều hoà cầu của mô hình trọng trường trái đất theo thuật toán Colombo O.L.
8 p | 24 | 3
-
Bài giảng Toán rời rạc: Độ phức tạp của thuật toán - ThS. Hoàng Thị Thanh Hà
9 p | 17 | 3
-
Phương pháp xây dựng tập Slist các logarit có trọng số thấp
8 p | 34 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn