Bài giảng Cơ sở dữ liệu: Chương 5 - Nguyễn Hồng Phương
lượt xem 4
download
Bài giảng "Cơ sở dữ liệu - Chương 5: Tối ưu hóa câu truy vấn" cung cấp cho người học các kiến thức: Tổng quan về xử lý truy vấn, tối ưu hóa các biểu thức đại số quan hệ. Mời các bạn cùng tham khảo nội dung chi tiết.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Cơ sở dữ liệu: Chương 5 - Nguyễn Hồng Phương
- 1/30/2012 Nội dung • Tổng quan về xử lý truy vấn Tối ưu hóa câu truy vấn • Tối ưu hóa các biểu thức đại số quan hệ Ng ễn Hồng Phương Nguyễn phuongnh@soict.hut.edu.vn http://is.hut.edu.vn/~phuongnh Bộ môn Hệ thống thông tin Viện Công nghệ thông tin và Truyền thông Đại học Bách Khoa Hà Nội 1 2 NHP Tổng quan về xử lý truy vấn Tổng quan về xử lý truy vấn (tiếp) • Xử lý một truy vấn bao gồm 3 – Tối ưu hóa câu truy vấn: Mục tiêu của bước tối ưu hóa là chọn ra một kế hoạch thực hiện bước chính: câu truy vấn có chi phí thấp nhất. –Phân tích và Biên dịch câu truy vấn: • Để thực hiện được điều này, trước tiên ta cần biến đổi 1 biểu thức ĐSQH đầu vào thành một biểu thức Trong bước này, hệ thống phải dịch câu ĐSQH tương đương nhưng có thể xử lý được 1 cách t truy vấn ấ từ dạng d ngôn ô ngữ ữ bậc bậ cao hiệu quả và ít tốn kém hơn. Bước con đầu tiên này được gọi là tối ưu hóa đại số. thành một ngôn ngữ biểu diễn dữ llệu • Tiếp theo đó, ta cần phải đặc tả các thuật toán đặc bên trong để máy tính có thể thao tác biệt tiến hành thực thi các phép toán , chọn 1 chỉ dẫn trên đó. Một biểu diễn bên trong thích cụ thể nào đó để sử dụng. hợp và hỗ trợ cho bước tối ưu hóa tiếp • Các dữ liệu thống kê về CSDL sẽ giúp ta trong quá trình xem xét và lựa chọn. Ví dụ như: theo là biểu diễn bằng ngôn ngữ đại số quan hệ 3 4 NHP NHP Tổng quan về xử lý truy vấn (tiếp) Tổng quan về xử lý truy vấn (tiếp) – Số bộ trong quan hệ – Thực hiện đánh giá truy vấn: Từ một kế – Kích thước của một bộ hoạch thực hiện có được do Trình tối ưu hóa – Số khối (block) chứa các bộ của quan hệ cung cấp, hệ thống sẽ tiến hành thực hiện các – Số bộ của quan hệ mà một khối có thể chứa thao tác trên dữ liệu trong CSDL và đưa ra câu – Các thông tin về cơ chế truy nhập, chỉ dẫn trên quan hệ trả lời cho truy vấn đó. • Chi phí cho việc iệc thực hiện một truy t vấn ấn được Truy vaá n ñaàu vaø o Bieân dòch truy vaán Bieå u thöù c ÑSQH đo bởi chi phí sử dụng tài nguyên như việc truy cập đĩa, thời gian CPU dùng để thực Toá i öu hoù a hiện một truy vấn. truy vaá n Thoán g keâ veà dl • Trong chương này, chúng ta sẽ tập trung vào việc đánh giá các biểu thức đại số quan hệ Thöïc hieä n Caâ u traû lô øi truy vaá n Keá hoaï ch thöï c hieä n tìm kieá m dl chứ không đi vào chi tiết việc tính toán chi phí cho việc thực hiện đánh giá một truy vấn. 5 CSDL 6 NHP NHP 1 CuuDuongThanCong.com https://fb.com/tailieudientucntt
- 1/30/2012 Đánh giá biểu thức ĐSQH Đánh giá biểu thức ĐSQH (tiếp) • Sau bước phân tích và biên dịch, ta có • Vật chất hóa: Trong cách tiếp cận này thì ta lần lượt đánh giá các phép toán theo một truy vấn được biểu diễn bằng một một thứ tự thích hợp. Kết quả của việc biểu thức đại số quan hệ bao gồm đánh giá mỗi phép toán sẽ được lưu trong nhiều phép toán và tác động lên nhiều một quan hệ trung gian tạm thời để sử dụng làm đầu vào cho các phép toán tiếp quan hệ khác nhau. nhau Ta sẽ phải tiến theo theo. hành đánh giá biểu thức này. Có 2 • Điểm bất lợi của cách tiếp cận này là việc hướng tiếp cận để thực thi quá trình cần thiết phải xây dựng các quan hệ trung gian tạm thời nhất là khi các quan hệ này đánh giá biểu thức ĐSQH: thường phải được ghi ra đĩa (trừ khi chúng – Vật chất hóa (Materialize) có kích thước rất nhỏ). Mà việc đọc và ghi ra đĩa có chi phí khá lớn. – Đường ống (Pipeline) 7 8 NHP NHP Đánh giá biểu thức ĐSQH (tiếp) Đánh giá biểu thức ĐSQH (tiếp) • Đường ống: Chúng ta có thể cải thiện hiệu quả • Ví dụ: Chúng ta có một biểu thức đại số quan hệ đánh giá truy vấn bằng cách làm giảm bớt số gồm 2 phép toán: kết nối và chiếu. lượng các quan hệ trung gian tạm thời được tạo • Trong cách tiếp cận vật chất hóa, xuất phát từ ra. Điều này có thể đạt được nhờ việc kết hợp một phép toán ở mức thấp nhất là phép kết nối tự vài phép toán quan hệ vào một đường ống của nhiên, kết quả của phép kết nối này sẽ được lưu các phép toán. Trong đường ống thì kết quả của trong một quan hệ trung gian. Sau đó , đọc từ một phép toán được chuyển trực tiếp cho phép q an hệ trung quan t ng gian này nà để tiến hành chiếu chiế lấy lấ kết toán tiếp theo mà không cần phải lưu lại trong quả mong muốn. quan hệ trung gian. • Trong cách tiếp cận đường ống, khi một bộ được • Rõ ràng, cách tiếp cận thứ hai sẽ hạn chế được sinh ra trong phép kết nối 2 quan hệ, bộ này sẽ nhược điểm của cách tiếp cận đầu tiên, nhưng có được chuyển trực tiếp đến phép chiếu để xử lý và những trường hợp, ta bắt buộc phải vật chất hóa kết quả được ghi vào quan hệ đầu ra. Quan hệ chứ không dùng đường ống được. kết quả sẽ được tạo lập một cách trực tiếp. 9 10 NHP NHP Tối ưu hóa các biểu thức ĐSQH Các chiến lược tối ưu tổng quát • Mục tiêu là tổ chức lại trình tự thực hiện các 1. Đẩy phép chọn và phép chiếu xuống thực hiện phép toán trong biểu thức để giảm chi phí sớm nhất có thể: vì hai phép toán này giúp làm thực hiện đánh giá biểu thức đó. giảm kích thước của quan hệ trước khi thực hiện • Trong quá trình tối ưu hóa, ta biểu diễn một các phép toán 2 ngôi biểu thức ĐSQH dưới dạng một cây toán tử. 2. Nhóm dãy các phép chọn và chiếu: Sử dụng chiến Trong cây thì các nút lá là các quan hệ có lược này nếu như có một dãy các phép chọn hoặc mặt trong biểu thức, thức các nút trong là các dãy các phép chiến trên cùng một quan hệ phép toán trong biểu thức 3. Kết hợp phép chọn và tích Đề các thành phép kết • Ví dụ : Đưa ra tên hãng cung ứng mặt hàng nối: Nếu kết quả của một phép tích Đề các là đối có mã là 'P1': số của 1 phép chọn có điều kiện chọn là phép so sánh giữa các thuộc tính trên 2 quan hệ tham gia Select sname From S, SP Where S.sid = tích Đề các thì ta nên kết hợp 2 phép toán thành SP.sid And pid = 'P1' phép kết nối. • Biểu thức ĐSQH tương ứng là? 4. Tìm các biểu thức con chung trong biểu thức đại • Cây toán tử tương ứng là? 11 số quan hệ để đánh giá chỉ một lần 12 NHP NHP 2 CuuDuongThanCong.com https://fb.com/tailieudientucntt
- 1/30/2012 Các phép biến đổi tương đương Các chiến lược tối ưu tổng quát (tiếp) biểu thức ĐSQH 5. Xác định các phép toán có thể được đưa vào đường ống và thực hiện đánh giá • Hai biểu thức ĐSQH E1 và E2 là tương đương chúng theo đường ống nếu chúng cho cùng một kết quả khi áp 6. Xử lý các tệp dữ liệu trước khi tiến hành dụng trên cùng một tập các quan hệ tính toán: Tạo lập chỉ dẫn hay sắp xếp tệp dữ liệu có thể góp phần làm giảm chi phí • Trong phần này, ta có các ký hiệu dạng sau: của các phép tính trung gian – E1, E2, E3, … là à các á biểu ể thứcứ đại sốố quan hệệ 7. Ước lượng chi phí và lựa chọn thứ tự thực – F1, F2, F3, … là các điều kiện chọn hoặc là các hiện: Do với mỗi câu truy vấn có thể có điều kiện kết nối nhiều cách khác nhau để thực hiện, với việc ướng lượng chi phí (số phép tính, tài – X1, X2, … Y, Z, U1, U2, … là các tập thuộc tính nguyên sử dụng, dung tích bộ nhớ, thời gian thực hiện ..) ta có thể chọn cách đánh giá biểu thức ĐSQH có chi phí nhỏ nhất. 13 14 NHP NHP Các phép biến đổi tương đương Các phép biến đổi tương đương biểu thức ĐSQH (tiếp) biểu thức ĐSQH (tiếp) 1. Quy tắc kết hợp của phép tích Đề các và kết nối • VD: S* SP * P có thể được thực hiện theo ( E1 E 2 ) E3 E1 ( E 2 E3 ) 3 thứ tự như sau 1)(S*SP)*P ( E1 * E 2 ) * E3 E1 * ( E 2 * E3 ) 2)(S*P)*SP ( E1 E 2 ) E3 E1 ( E 2 E3 ) 3)S*(SP*P) F1 F2 F1 F2 Xét theo th ngữ ữ nghĩa hĩ S, S P không khô kết nối ối • Qui tắc này sử dụng cho chiến lược số 7. Thứ tự được nên (1) và (3) là tốt hơn (2). Xét thực hiện các phép kết nối hay tích Đề các là rất về kích thước thì (3) tốt hơn (1) vì S có quan trọng vì kích thước của quan hệ trung gian 4 thuộc tính còn P có 3 thuộc tính, tuy có thể rất lớn nếu không cân nhắc kỹ. Lựa chọn thứ tự thực hiện các phép toán này thì tùy thuộc nhiên, cũng còn tùy thuộc vào lực vào kích thước của các quan hệ tham gia phép lượng của 2 quan hệ S và P nữa toán và cả ngữ nghĩa của quan hệ (mối liên hệ) 15 16 NHP NHP Các phép biến đổi tương đương Các phép biến đổi tương đương biểu thức ĐSQH (tiếp) biểu thức ĐSQH (tiếp) 2. Quy tắc giao hoán trong phép tích Đề 5. Quy tắc giao hoán phép chọn các và kết nối E1 E 2 E 2 E 1 và phép chiếu E1 * E 2 E 2 * E1 E 1 E 2 E 2 E 1 X ( F ( E )) F ( X ( E )) F F 3. Quy tắc đối với dãy các phép chiếu Quy tắc nà Q này áp dụng d ng khi F là điề điều kiện xác định được trên tập thuộc X 1 ( X 2 ... X n ( E )...) X 1 ( E ) tính X. Tổng quát hơn ta có: X 1 X 2 ... X n X ( F ( E )) X ( F ( XY ( E ))) 4. Quy tắc đối với dãy các phép chọn F 1 ( F 2 .... Fn ( E )...) F 1 F 2... Fn ( E ) 17 18 NHP NHP 3 CuuDuongThanCong.com https://fb.com/tailieudientucntt
- 1/30/2012 Các phép biến đổi tương đương Các phép biến đổi tương đương biểu thức ĐSQH (tiếp) biểu thức ĐSQH (tiếp) 6. Quy tắc đối với phép chọn và phép 7. Quy tắc đối với phép chọn và tích Đề các • Ta ký hiệu: phép hợp: – E1(U1) có nghĩa là biểu thức E1 xác định trên tập thuộc tính U1 F ( E1 E 2 ) F ( E1 ) F ( E 2 ) – F1(U1) có nghĩa là điều kiện chọn F1 xác định trên tập thuộc tính U1 8 Quy tắc đối với phép chọn và 8. – Quy tắc biến đổi liên quan đến phép chọn và tích Đề các được phát biểu như sau: phép trừ: • F ( E 1 (U 1 ) E 2 (U 2 )) tương đương với: F ( E1 E 2 ) F ( E1 ) F ( E 2 ) – F 1 ( E1 ) E 2 trong trường hợp F = F1(U1) – F 1 ( E1 ) F 2 ( E 2 ) trong trường hợp F = F1(U1) F2(U2) – F 2 ( F 1 ( E1 ) E 2 ) trong trường hợp F = F1(U1) F2(U1U2) 19 20 NHP NHP Các phép biến đổi tương đương biểu thức ĐSQH (tiếp) Ví dụ 9. Quy tắc đối với phép chiếu và tích Đề • Tìm tên hãng cung ứng ít nhất 1 mặt các: hàng màu đỏ hoặc màu xanh X ( E 1 (U 1 ) E 2 (U 2 )) Y ( E 1 ) Z ( E 2 ) SELECT sname FROM S, P, SP WHERE S.sid = SP.sid AND P.pid = SP.pid X YZ , Y U 1 , Z U 2 AND (colour = ‘Red’ Red OR colour = ‘Green’); Green ); 10.Quy tắc đối với phép chiếu và phép • Biểu thức đại số quan hệ tương đương với hợp: câu truy vấn trên là: X ( E1 E 2 ) X ( E1 ) X ( E 2 ) sname ( S .sid SP.sid P. pid SP. pid ( colour 'Re d ' colour 'Green ') ( S SP P)) 21 22 NHP NHP Lời hay ý đẹp "Phẩm cách chân chính của con người là ở trong cách họ sống chứ không phải ở cái họ có" có Blackie 23 24 NHP NHP 4 CuuDuongThanCong.com https://fb.com/tailieudientucntt
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Cơ sở dữ liệu đất đai
49 p | 638 | 80
-
Bài giảng Cơ sở dữ liệu - Nguyễn Quỳnh Chi
189 p | 267 | 51
-
Bài giảng Cơ sở dữ liệu: Chương 1 - Tổng quan về cơ sở dữ liệu
21 p | 182 | 31
-
Bài giảng Cơ sở dữ liệu: Bài 1 - ĐH CNTT
15 p | 608 | 30
-
Bài giảng Cơ sở dữ liệu - Bài 2: Mô hình cơ sở dữ liệu quan hệ
43 p | 221 | 18
-
Bài giảng Cơ sở dữ liệu: Chương 2 - ThS. Hoàng Mạnh Hà
68 p | 151 | 12
-
Bài giảng Cơ sở dữ liệu (Database): Chương 4 - TS. Đặng Thị Thu Hiền
82 p | 40 | 8
-
Bài giảng Cơ sở dữ liệu - Chương 4: Chuẩn hóa cơ sở dữ liệu
30 p | 134 | 8
-
Bài giảng Cơ sở dữ liệu nâng cao - Chương 2: Toàn vẹn và cơ sở dữ liệu active
50 p | 82 | 8
-
Bài giảng Cơ sở dữ liệu (Database): Chương 1 - TS. Đặng Thị Thu Hiền
53 p | 49 | 7
-
Bài giảng Cơ sở dữ liệu: Phần 1 – Nguyễn Hải Châu
54 p | 122 | 6
-
Bài giảng Cơ sở dữ liệu: Mở đầu - ThS. Lương Thị Ngọc Khánh
11 p | 171 | 6
-
Bài giảng Cơ sở dữ liệu nâng cao: Bài 1.1 - PGS.TS. Đỗ Phúc
25 p | 90 | 6
-
Bài giảng Cơ sở dữ liệu: Chương 1 - Th.S Thiều Quang Trung
40 p | 93 | 5
-
Bài giảng Cơ sở dữ liệu - Bài 1: Thiết kế Cơ sở dữ liệu với Management Studio
10 p | 63 | 5
-
Bài giảng Cơ sở dữ liệu nâng cao: Bài 2 - PGS.TS. Đỗ Phúc
55 p | 66 | 4
-
Bài giảng Cơ sở dữ liệu: Chương 1 - GV. Đỗ Thị Kim Thành
21 p | 104 | 4
-
Bài giảng Cơ sở dữ liệu: Chương 2 - Trần Thị Dung
39 p | 7 | 4
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn