intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Chương 2: Truy nhập dữ liệu trên đa phương tiện - Nguyễn Thị Oanh

Chia sẻ: Sinh Nhân | Ngày: | Loại File: PDF | Số trang:71

71
lượt xem
12
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Chương 2: Truy nhập dữ liệu trên đa phương tiện" cung cấp cho người học các kiến thức: Truy nhập dữ liệu đa phương tiện từ đĩa từ, truy nhập dữ liệu từ CD-ROM. Cuối bài giảng còn có phần bài tập giúp sinh viên có thể ôn tập và củng cố lại toàn bộ kiến thức đã học. Mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Chương 2: Truy nhập dữ liệu trên đa phương tiện - Nguyễn Thị Oanh

  1. Chương 2: Truy nhập dữ liệu đa phương tiện Nguyễn Thị Oanh Bộ môn HTTT – Viện CNTT & TT oanhnt@soict.hut.edu.vn 1
  2. Đặt vấn đề  Youtube: – 2009: over 1 billion videos per day – Bandwidth accounts for about 51% of expenses -- with a run rate of $1 million per day -- with content licensing accounting for 36% http://www.wired.com/epicenter/2009/10/youtube-over-one-billion-videos-served-per-day/ http://www.multichannel.com/article/191223- 2 YouTube_May_Lose_470_Million_In_2009_Analysts.php
  3. Đặt vấn đề  YouTube Video Server (2010): – May 2010, 2 Billion videos served per day – More than 24 hours of video uploaded every minute (and +) (2011: 48h /minute) – Videos usually less than 10 minutes long – Top videos ("Evolution of Dance", "Charlie Bit My Finger", and Lady Gaga's "Bad Romance“) are approaching 200 million views  http://tech.fortune.cnn.com/2010/05/17/youtube-at-5-years-old-2- billion-served-per-day/ 3
  4. Đặt vấn đề  Dailymotion: – Dailymotion is the second largest video site in the world after YouTube – 29th most visited website in the world – 114 millions unique visitors and more than 1,2 billions video views every month (Comscore, 5/2011) 4
  5. Đặt vấn đề  Dành cho dữ liệu động, DL có thông số thời gian – Audio – Video  DL đòi hỏi tính liên tục (continuous) được đảm bảo  DL tĩnh: – Các phương pháp biểu diễn DL đa chiều: B-tree, R-tree, … 5
  6. 1. Truy nhập dữ liệu đa phương tiện từ đĩa từ 6
  7. Nhắc lại: cấu trúc đĩa từ  Nhiều đĩa phẳng (platters), xếp đồng trục trên 1 trục chính (spindle)  Các cần di chuyển đầu đọc/ghi được gắn chung trên 1 trục quay  Mỗi mặt đĩa có 1 đầu đọc/ghi 7
  8. Cấu trúc đĩa từ  Track (A): – Nơi chứa DL – Vòng tròn đồng tâm trên các mặt đĩa  Region (B): – Mỗi mặt đĩa được chia thành k vùng đều nhau  Sector (C): – Là phần giao của mỗi track và region  Cluster (D): tập các sector  Cylinder: 8 – Tập các tracks có cùng bán kính trên tất cả các mặt đĩa
  9. Truy nhập đĩa từ  2 bước: – phép dịch (seek operations): tìm đến track có chứa địa chỉ cần tìm kiếm  seek time  tăng tốc (acceleration phase)  chạy ổn định (coast phase)  giảm tốc độ (deceleration phase)  ổn định vị trí (settle phase) – phép quay (rotational operations) rotational latency (spin time) Thời gian = tgian dịch + tgian quay + tgian đọc DL 9
  10. Truy nhập đĩa từ  Transfer rate (bandwidth) (TR): – MB/s – Tốc độ ghi và đọc thường khác nhau – Thường TR được ngầm hiểu là tốc độ đọc, còn tốc độ ghi thì thường được chỉ rõ  Vận tốc góc: – hầu hết các đĩa có vận tốc góc quay không đổi (constant angular veolocity - CAV) – Thời gian chuyển từ sector x -> sector y là giống nhau trên tất cả các track 10
  11. Truy nhập đĩa từ Ký hiệu Ý nghĩa tj , j Vị trí đầu đọc hiện tại: sector j, track tj ti, i Vị trí DL sẽ được đọc: sector i, track ti rd mật độ dữ liệu (MB/sector) dtr tốc độ đọc DL (MB/giây) rv vận tốc dịch trung bình của cần di chuyển đầu đọc/ghi rnum số vùng trên mỗi mặt đĩa ss tốc độ quay (độ / phút) 11
  12. Thời gian đọc DL rd readtime(i, j )  Sk (ti , t j )  spin _ time(i, j )  dtr abs(ti  t j ) Sk (ti , t j )  rv spin _ time(i, j )  abs(i  j ) mod rnum  360 1  rnum ss 12
  13. Phương pháp lưu trữ phổ biến  RAID: Redundant Array of Inexpensive Disks – RAID-0 – RAID-1 – RAID-5 – RAID-2, RAID-3, RAID-4, RAID0+1, RAID1+0, …  Nguyên tắc: ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng – gia tăng tốc độ đọc/ghi dữ liệu – hoặc/và nhằm tăng thêm sự an toàn của dữ liệu  Khái niệm: 13 – block: khối DL nhỏ nhất được quan tâm khi đọc, ghi
  14. RAID-0 – 1 đĩa điều khiển + n đĩa dữ liệu (0, 1,…, n-1), n >= 2 – Sử dụng kỹ thuật phân chia (striping): chia dữ liệu thành các phần bằng nhau đặt trên nhiều đĩa và không có sự lặp lại DL – k-stripe: (k
  15. RAID-0 – Movie 1: blocks: b0, b1, b2, b3, b4 với k = 3 bắt đầu từ đĩa 0 – Movie 2: blocks: c0, c1, c2, c3, c4, c5 với k = 4 bắt đầu từ đĩa 1 – Tổng quát: các block liên tiếp b0, b1, b2, ..., br-1 lưu trữ trong RAID 0 với nhóm k đĩa bắt đầu ở đĩa j 15  block bi sẽ được lưu vào đĩa (i+j) mod k
  16. RAID-0  Ưu điểm: – Tốc độ đọc dữ liệu ra tăng lên do có thể đọc đồng thời từ k đĩa, tuy nhiên có giới hạn, phụ thuộc vào:  Kích thước bộ đệm  Độ rộng băng thông của đường bus cho thiết bị ra  Nhược điểm – Không đảm bảo tính tin cậy: nếu 1 đĩa hỏng  mất dữ liệu và ảnh hưởng toàn bộ hệ thống 16
  17. RAID-1  Sử dụng khái niệm đối xứng (mirroring): – Mỗi đĩa có 1 đĩa đối xứng – Nếu có N đĩa có thể sử dụng  chỉ có n = N/2 đĩa được sử dụng đồng thời. – Striping có thể được sử dụng cho n đĩa này  Ghi: ghi đồng thời lên đĩa chính + đĩa đối xứng  Đọc: từ đĩa chính hoặc từ đĩa đối xứng nếu đĩa chính hỏng  Ưu: tăng độ an toàn, tin cậy về DL  Nhược: tốn không gian lưu trữ (hiệu suất sử dụng:50%) 17
  18. RAID-1 RAID-1 + striping 18
  19. RAID-5  RAID-5: striping + parity checking – Cân đối được không gian lưu trữ và sự an toàn của DL  Mỗi nhóm k đĩa (cluster) sẽ có 1 đĩa parity giúp kiểm tra và phục hồi DL nếu 1 đĩa trong nhóm bị hỏng Ví dụ n=k = 4 19
  20. RAID-5  Giả sử – k = n đĩa (1 cluster), các đĩa được gán nhãn: 0, 1, 2, ..., n-1 – khối DL được lưu trong (n-1) đĩa, đĩa parity sẽ được xác định từ DL trong (n-1) đĩa  giả sử đĩa parity là đĩa thứ n-1  Di.j: dữ liệu bít thứ j của đĩa i  : phép hoặc loại trừ (exclusive-or)  Dn1. j  D0 . j  D1. j  ...  Dn2 . j 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2