Bài giảng Cơ sở dữ liệu đa phương tiện: Chương 2 - Nguyễn Thị Oanh
lượt xem 4
download
Bài giảng "Cơ sở dữ liệu đa phương tiện - Chương 2: Truy nhập dữ liệu đa phương tiện" cung cấp cho người học các kiến thức: Truy nhập dữ liệu đa phương tiện từ đĩa từ, truy nhập dữ liệu từ CD-ROM,... Mời các bạn cùng tham khảo nội dung chi tiết.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Cơ sở dữ liệu đa phương tiện: Chương 2 - Nguyễn Thị Oanh
- Chương 2: Truy nhập dữ liệu đa phương tiện Nguyễn Thị Oanh Bộ môn HTTT – Viện CNTT & TT oanhnt@soict.hut.edu.vn 1
- Đặt vấn đề Youtube: – 2009: over 1 billion videos per day – Bandwidth accounts for about 51% of expenses -- with a run rate of $1 million per day -- with content licensing accounting for 36% http://www.wired.com/epicenter/2009/10/youtube-over-one-billion-videos-served-per-day/ http://www.multichannel.com/article/191223- 2 YouTube_May_Lose_470_Million_In_2009_Analysts.php
- Đặt vấn đề YouTube Video Server (2010): – May 2010, 2 Billion videos served per day – More than 24 hours of video uploaded every minute (and +) (2011: 48h /minute) – Videos usually less than 10 minutes long – Top videos ("Evolution of Dance", "Charlie Bit My Finger", and Lady Gaga's "Bad Romance“) are approaching 200 million views http://tech.fortune.cnn.com/2010/05/17/youtube-at-5-years-old-2- billion-served-per-day/ 3
- Đặt vấn đề Dailymotion: – Dailymotion is the second largest video site in the world after YouTube – 29th most visited website in the world – 114 millions unique visitors and more than 1,2 billions video views every month (Comscore, 5/2011) 4
- Đặt vấn đề Dành cho dữ liệu động, DL có thông số thời gian – Audio – Video DL đòi hỏi tính liên tục (continuous) được đảm bảo DL tĩnh: – Các phương pháp biểu diễn DL đa chiều: B-tree, R-tree, … 5
- 1. Truy nhập dữ liệu đa phương tiện từ đĩa từ 6
- Nhắc lại: cấu trúc đĩa từ Nhiều đĩa phẳng (platters), xếp đồng trục trên 1 trục chính (spindle) Các cần di chuyển đầu đọc/ghi được gắn chung trên 1 trục quay Mỗi mặt đĩa có 1 đầu đọc/ghi 7
- Cấu trúc đĩa từ Track (A): – Nơi chứa DL – Vòng tròn đồng tâm trên các mặt đĩa Region (B): – Mỗi mặt đĩa được chia thành k vùng đều nhau Sector (C): – Là phần giao của mỗi track và region Cluster (D): tập các sector Cylinder: 8 – Tập các tracks có cùng bán kính trên tất cả các mặt đĩa
- Truy nhập đĩa từ 2 bước: – phép dịch (seek operations): tìm đến track có chứa địa chỉ cần tìm kiếm seek time tăng tốc (acceleration phase) chạy ổn định (coast phase) giảm tốc độ (deceleration phase) ổn định vị trí (settle phase) – phép quay (rotational operations) rotational latency (spin time) Thời gian = tgian dịch + tgian quay + tgian đọc DL 9
- Truy nhập đĩa từ Transfer rate (bandwidth) (TR): – MB/s – Tốc độ ghi và đọc thường khác nhau – Thường TR được ngầm hiểu là tốc độ đọc, còn tốc độ ghi thì thường được chỉ rõ Vận tốc góc: – hầu hết các đĩa có vận tốc góc quay không đổi (constant angular veolocity - CAV) – Thời gian chuyển từ sector x -> sector y là giống nhau trên tất cả các track 10
- Truy nhập đĩa từ Ký hiệu Ý nghĩa tj , j Vị trí đầu đọc hiện tại: sector j, track tj ti, i Vị trí DL sẽ được đọc: sector i, track ti rd mật độ dữ liệu (MB/sector) dtr tốc độ đọc DL (MB/giây) rv vận tốc dịch trung bình của cần di chuyển đầu đọc/ghi rnum số vùng trên mỗi mặt đĩa ss tốc độ quay (độ / phút) 11
- Thời gian đọc DL rd readtime(i, j ) Sk (ti , t j ) spin _ time(i, j ) dtr abs(ti t j ) Sk (ti , t j ) rv spin _ time(i, j ) abs(i j ) mod rnum 360 1 rnum ss 12
- Phương pháp lưu trữ phổ biến RAID: Redundant Array of Inexpensive Disks – RAID-0 – RAID-1 – RAID-5 – RAID-2, RAID-3, RAID-4, RAID0+1, RAID1+0, … Nguyên tắc: ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng – gia tăng tốc độ đọc/ghi dữ liệu – hoặc/và nhằm tăng thêm sự an toàn của dữ liệu Khái niệm: 13 – block: khối DL nhỏ nhất được quan tâm khi đọc, ghi
- RAID-0 – 1 đĩa điều khiển + n đĩa dữ liệu (0, 1,…, n-1), n >= 2 – Sử dụng kỹ thuật phân chia (striping): chia dữ liệu thành các phần bằng nhau đặt trên nhiều đĩa và không có sự lặp lại DL – k-stripe: (k
- RAID-0 – Movie 1: blocks: b0, b1, b2, b3, b4 với k = 3 bắt đầu từ đĩa 0 – Movie 2: blocks: c0, c1, c2, c3, c4, c5 với k = 4 bắt đầu từ đĩa 1 – Tổng quát: các block liên tiếp b0, b1, b2, ..., br-1 lưu trữ trong RAID 0 với nhóm k đĩa bắt đầu ở đĩa j 15 block bi sẽ được lưu vào đĩa (i+j) mod k
- RAID-0 Ưu điểm: – Tốc độ đọc dữ liệu ra tăng lên do có thể đọc đồng thời từ k đĩa, tuy nhiên có giới hạn, phụ thuộc vào: Kích thước bộ đệm Độ rộng băng thông của đường bus cho thiết bị ra Nhược điểm – Không đảm bảo tính tin cậy: nếu 1 đĩa hỏng mất dữ liệu và ảnh hưởng toàn bộ hệ thống 16
- RAID-1 Sử dụng khái niệm đối xứng (mirroring): – Mỗi đĩa có 1 đĩa đối xứng – Nếu có N đĩa có thể sử dụng chỉ có n = N/2 đĩa được sử dụng đồng thời. – Striping có thể được sử dụng cho n đĩa này Ghi: ghi đồng thời lên đĩa chính + đĩa đối xứng Đọc: từ đĩa chính hoặc từ đĩa đối xứng nếu đĩa chính hỏng Ưu: tăng độ an toàn, tin cậy về DL Nhược: tốn không gian lưu trữ (hiệu suất sử dụng:50%) 17
- RAID-1 RAID-1 + striping 18
- RAID-5 RAID-5: striping + parity checking – Cân đối được không gian lưu trữ và sự an toàn của DL Mỗi nhóm k đĩa (cluster) sẽ có 1 đĩa parity giúp kiểm tra và phục hồi DL nếu 1 đĩa trong nhóm bị hỏng Ví dụ n=k = 4 19
- RAID-5 Giả sử – k = n đĩa (1 cluster), các đĩa được gán nhãn: 0, 1, 2, ..., n-1 – khối DL được lưu trong (n-1) đĩa, đĩa parity sẽ được xác định từ DL trong (n-1) đĩa giả sử đĩa parity là đĩa thứ n-1 Di.j: dữ liệu bít thứ j của đĩa i : phép hoặc loại trừ (exclusive-or) Dn1. j D0 . j D1. j ... Dn2 . j 20
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Cơ sở dữ liệu đất đai
49 p | 637 | 79
-
Bài giảng Cơ sở dữ liệu - Nguyễn Quỳnh Chi
189 p | 267 | 51
-
Bài giảng Cơ sở dữ liệu: Chương 1 - Tổng quan về cơ sở dữ liệu
21 p | 181 | 31
-
Bài giảng Cơ sở dữ liệu: Bài 1 - ĐH CNTT
15 p | 607 | 30
-
Bài giảng Cơ sở dữ liệu - Bài 2: Mô hình cơ sở dữ liệu quan hệ
43 p | 221 | 18
-
Bài giảng Cơ sở dữ liệu: Chương 2 - ThS. Hoàng Mạnh Hà
68 p | 151 | 12
-
Bài giảng Cơ sở dữ liệu (Database): Chương 4 - TS. Đặng Thị Thu Hiền
82 p | 40 | 8
-
Bài giảng Cơ sở dữ liệu - Chương 4: Chuẩn hóa cơ sở dữ liệu
30 p | 134 | 8
-
Bài giảng Cơ sở dữ liệu nâng cao - Chương 2: Toàn vẹn và cơ sở dữ liệu active
50 p | 82 | 8
-
Bài giảng Cơ sở dữ liệu (Database): Chương 1 - TS. Đặng Thị Thu Hiền
53 p | 49 | 7
-
Bài giảng Cơ sở dữ liệu: Phần 1 – Nguyễn Hải Châu
54 p | 122 | 6
-
Bài giảng Cơ sở dữ liệu: Mở đầu - ThS. Lương Thị Ngọc Khánh
11 p | 169 | 6
-
Bài giảng Cơ sở dữ liệu nâng cao: Bài 1.1 - PGS.TS. Đỗ Phúc
25 p | 90 | 6
-
Bài giảng Cơ sở dữ liệu: Chương 1 - Th.S Thiều Quang Trung
40 p | 93 | 5
-
Bài giảng Cơ sở dữ liệu - Bài 1: Thiết kế Cơ sở dữ liệu với Management Studio
10 p | 62 | 5
-
Bài giảng Cơ sở dữ liệu nâng cao: Bài 2 - PGS.TS. Đỗ Phúc
55 p | 66 | 4
-
Bài giảng Cơ sở dữ liệu: Chương 1 - GV. Đỗ Thị Kim Thành
21 p | 103 | 4
-
Bài giảng Cơ sở dữ liệu (Database) - Chương 1: Các khái niệm cơ bản về hệ cơ sở dữ liệu
34 p | 69 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn