15/11/2017
Bài 5 Tổ chức bộ nhớ
Phần BỘ NHỚ ĐỆM NHANH (CACHE MEMORY)
(tham khảo trang 66 – KTMT Cần Thơ)
Ý tưởng thiết kế cache
(cid:1) Xác suất truy cập dữ liệu trong bộ nhớ trong Một chương trình mất 90% thời gian thi hành lệnh của nó để thi hành 10% số lệnh của chương trình.
(cid:1) Cache thiết kế dựa trên 2 nguyên tắc:
(cid:1) Nguyên tắc về thời gian: cho biết các ô nhớ được hệ thống xử lý thâm nhập có khả năng sẽ được thâm nhập trong tương lai gần.
thâm nhập vào một ô nhớ thì có nhiều khả năng thâm nhập vào ô nhớ có địa chỉ kế
1
(cid:1) Nguyên tắc về không gian: cho biết, bộ xử lý
15/11/2017
Nguyên tắc chung
(cid:1) Cache có tốc độ nhanh
CPU
Cache
Bộ nhớ
Chuyển từng khối
Chuyển từng từ
hơn bộ nhớ chính, chứa dữ liệu và lệnh thường dùng đến. (cid:1) Cache được đặt giữa CPU và bộ nhớ chính nhằm tăng tốc độ truy nhập bộ nhớ của CPU (cid:1) Cache có thể được đặt
trên chip của CPU (vận hành bằng bộ điều khiển cache)
Ví dụ về thao tác của cache (cid:1) CPU yêu cầu nội dung của ngăn nhớ (cid:1) CPU kiểm tra trên cache với dữ liệu này (cid:1) Nếu có, CPU nhận dữ liệu từ cache (nhanh)
(cache hit)
(cid:1) Nếu không có (cache miss),
đọc block nhớ chứa dữ liệu từ bộ nhớ chính vào cache (lâu) (cache penalty).
(cid:1) Tiếp đó chuyển dữ liệu từ cache vào CPU
2
15/11/2017
Cấu trúc chung của cache / bộ nhớ chính
(cid:1) Bộ nhớ chia thành các Block cache chia làm các Line có kích thước bằng nhau
Vận hành
Line của cache.
(cid:1) Một số Block của bộ nhớ chính được nạp vào các
nhớ chính hiện đang được chứa ở line đó.
(cid:1) Nội dung Tag (thẻ nhớ) cho biết block nào của bộ
năng xảy ra: (cid:1) Từ nhớ đó có trong cache (cache hit) (cid:1) Từ nhớ đó không có trong cache (cache miss)
3
(cid:1) Khi CPU truy nhập (đọc/ghi) một từ nhớ, có 2 khả
15/11/2017
Các vấn đề khi vận hành
Vì số line của cache ít hơn số block của bộ nhớ chính, cần có một thuật giải ánh xạ thông tin trong bộ nhớ chính vào cache. (cid:1) Câu hỏi 1: Phải để một khối bộ nhớ vào chỗ
nào của cache (sắp xếp khối)?
(cid:1) Câu hỏi 2: Làm sao để tìm một khối khi nó hiện diện trong cache (nhận diện khối)?
(cid:1) Câu hỏi 3: Khối nào phải được thay thế trong trường hợp thất bại cache (thay thế khối)? (cid:1) Câu hỏi 4: Việc gì xảy ra khi ghi vào bộ nhớ
(chiến thuật ghi)?
Các PP ánh xạ địa chỉ
a) Ánh xạ trực tiếp (Direct mapping) (cid:1) Mỗi block của bộ nhớ chính chỉ có thể được nạp
vào 1 line duy nhất của cache.
B0 → L0 B1 → L1 ...... Bm-1 → Lm-1 Bm → L0 Bm+1 → L1
(cid:1) Quy ước nạp: (với m là số line, đánh số: 0 đến m-1
L0 : B0, Bm, B2m ... L1 : B1, Bm+1, B2m+1 ..
Kết luận: Bj chỉ có thể được nạp vào Li với i = j mod m
4
(cid:1) Vì thế:
15/11/2017
Ví dụ 1(a)
khối gồm 32 byte, khối thứ 12 của bộ nhớ trong được đưa vào cache. Bộ nhớ có kích thước 1 KB
(cid:1) Bộ nhớ trong có 32 khối, cache có 8 khối, mỗi
0 1 1 0 0 1 0 0
Phép tính mod cho 2n: (8 = 23) (cid:1) Tối đa 32 khối: 5 bit (cid:1) 12 giá trị nhị phân: (cid:1) 12 mod 8 = 4, 3 bit cuối (cid:1) 12 / 8 = 1, 2 bit đầu 0 1
giá trị (01) được lưu trong Tag để phân biệt Block nào đang nằm trong Line Ví dụ: để phân biệt 4, 12, 20, 28 (00) 4 / 8 = 0 (01) 12 / 8 = 1 (10) 20 / 8 = 2 (11) 28 / 8 = 3
5
(cid:1) Thao tách trên bit của
15/11/2017
(cơ chế)
Địa chỉ CPU phát ra có N bit, được chia thành 3
trường:
Line (Block) 2n1 = kích thước 1 Line
(cid:1) Trường Byte (có n1 bit) để xác định byte nhớ trong
Cache 2n2 = số Line trong Cache Dung lượng Cache = 2n1 x 2n2 = 2n1+n2
(cid:1) Trường Line (có n2 bit) để xác định Line trong
6
(cid:1) Trường Tag (có n3 bit): số bit còn lại n3 = N - (n1 + n2) > 0 vì 2N >> 2n1+n2
15/11/2017
Ví dụ 1(b)
(cid:1) Trường Byte:
Địa chỉ từ (byte) nhớ: 5 bit
(cid:1) Trường Line: 3 bit (cid:1) Trường Tag: 2 bit Ví dụ: truy cập từ nhớ có địa chỉ (10 bit) 195h 0 1/1 0 0/1 0 1 0 1
b) Ánh xạ liên kết toàn phần (Fully Associative Mapping) (cid:1) Mỗi Block có thể được nạp vào bất kỳ Line nào của
cache.
phần: Tag và Byte.
(cid:1) Địa chỉ bộ nhớ do CPU phát ra được chia thành 2
(cid:1) Để kiểm tra xem một Block có trong cache hay không, phải đồng thời kiểm tra tất cả Tag của các Line trong cache.
7
(cid:1) Cần các mạch phức tạp để kiểm tra.
15/11/2017
c) Ánh xạ liên kết tập hợp (Set Associative Mapping) (cid:1) Là phương pháp dung hòa của 2 phương pháp trên (cid:1) Chia cache thành các tập: S0, S1, S2 ... (cid:1) Mỗi Set có một số Line (2, 4, 8, 16 Line)
Vd mỗi Set có 2 line
định:
(cid:1) Mỗi block được nạp vào 1 line nào đó trong Set nhất
...... Bk-1 → Sk-1
Bk → S0
(cid:1) B0 → S0 B1 → S1
(cid:1) Địa chỉ do CPU phát ra có 3 trường: Tag, Set, Byte
Ví dụ 2
(cid:1) Hệ thống có:
(cid:1) Xác định số bit của các trường địa chỉ khi
(cid:1) bộ nhớ chính = 256 MB (cid:1) Cache = 128 KB (cid:1) Line = 16 Byte
8
(cid:1) Ánh xạ trực tiếp (cid:1) Ánh xạ liên kết tập hợp 4 Line/Set
15/11/2017
1) 2N = 256 x 220 = 228 ⇒ N = 28 bit (cid:1) Tính cho trường Byte:
Kích thước line = 16 = 24 Byte
⇒ n1 = 4 bit
(cid:1) Tính cho trường Line:
Số line trong Cache: 128 x 210 / 16 = 213 ⇒ n2 = 13 bit
(cid:1) Tính cho trường Tag:
n3 = N - (n1 + n2) = 28 - (4 + 13) = 11 bit
2) (cid:1) Trường Byte: n1 = 4 bit (cid:1) Trường Set:
Số Set = Số line / 4 = 213 / 4 = 211 ⇒ n2 = 11 bit
(cid:1) Trường Tag:
n3 = N - (n1 + n2) = 28 - (4 + 11) = 13 bit
3. Các thuật giải thay thế block trong cache
(cid:1) Khi CPU truy nhập một thông tin mà không có trong cache (cache miss) thì nạp block chứa thông tin đó vào trong cache để thay thế block cũ trong cache.
thuật giải để nạp.
(cid:1) Ánh xạ trực tiếp chỉ có 1 cách nạp không cần
để lựa chọn thay thế.
9
(cid:1) Hai phương pháp ánh xạ liên kết cần có thuật giải
15/11/2017
truy nhập ít nhất.
4. LRU (Least Recently Used): thay block có khoảng
thời gian dài nhất không được truy nhập được đánh giá là hiệu quả nhất.
4. Phương pháp ghi dữ liệu khi cache hit (để đồng bộ dữ liệu giữa cache và bộ nhớ) (cid:1) Ghi xuyên qua (Write through) (cid:1) ghi cả cache và bộ nhớ chính (cid:1) tốc độ chậm
(cid:1) Ghi trả sau (Write back)
(cid:1) Các thuật giải thay thế block trong cache 1. Random: thay block một cách ngẫu nhiên. 2. FIFO (First In, First Out): thay thế block đã tồn tại lâu nhất trong toàn cache đối với ánh xạ liên kết toàn phần, trong set đối với ánh xạ liên kết tập hợp. 3. LFU (Least Frequently Used): thay block có số lần
cả block về bộ nhớ chính
10
(cid:1) chỉ ghi ra cache (cid:1) tốc độ nhanh (cid:1) khi block trong cache bị thay thế cần phải ghi trả
15/11/2017
Các mức cache
biệt giữa kích thước và thời gian thâm nhập giữa cache trong và bộ nhớ trong càng lớn.
(cid:1) Người ta đưa vào nhiều mức cache:
(cid:1) Việc dùng cache trong có thể làm cho sự cách
(cid:1) Cache mức một (L1 cache): thường là cache trong (on-chip cache; nằm bên trong CPU)
(cid:1) Cache mức hai (L2 cache) thường là cache ngoài (off-chip cache; cache này nằm bên ngoài CPU).
11
(cid:1) Ngoài ra, trong một số hệ thống còn có tổ chức cache mức ba (L3 cache), đây là mức cache trung gian giữa cache L2 và một thẻ bộ nhớ.