intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận án Tiến sĩ Kỹ thuật viễn thông: Tối ưu hóa và đánh giá hiệu năng của tổ chức Cache trong hệ thống vi xử lý thế hệ sau

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:153

14
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

MỤc tiêu của đề tài là nghiên cứu phân tích ảnh hưởng của tổ chức cache đa cấp và các chính sách thay thế cache đến hiệu năng của chip đa xử lý, đa luồng; xây dựng các mô hình kiến trúc chip đa xử lý, đa luồng, đa cấp cache. Tiến hành phân tích và đánh giá hiệu năng của các kiến trúc để lựa chọn tổ chức cache tối ưu nhằm nâng cao hiệu năng của chip đa xử lý, đa luồng,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Luận án Tiến sĩ Kỹ thuật viễn thông: Tối ưu hóa và đánh giá hiệu năng của tổ chức Cache trong hệ thống vi xử lý thế hệ sau

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI HỒ VĂN PHI TỐI ƯU HÓA VÀ ĐÁNH GIÁ HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG HỆ THỐNG VI XỬ LÝ THẾ HỆ SAU LUẬN ÁN TIẾN SĨ KỸ THUẬT VIỄN THÔNG Hà Nội - 2014
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI HỒ VĂN PHI TỐI ƯU HÓA VÀ ĐÁNH GIÁ HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG HỆ THỐNG VI XỬ LÝ THẾ HỆ SAU Chuyên ngành: Kỹ thuật Viễn thông Mã số: 62520208 LUẬN ÁN TIẾN SĨ KỸ THUẬT VIỄN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. TS. HỒ KHÁNH LÂM 2. TS. NGUYỄN VIẾT NGUYÊN Hà Nội - 2014
  3. LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình của riêng tôi. Tất cả các ấn phẩm được công bố chung với các cán bộ hướng dẫn khoa học và các đồng nghiệp đã được sự đồng ý của các tác giả trước khi đưa vào Luận án. Các kết quả trong Luận án là trung thực, chưa từng được công bố trong bất kỳ công trình nào. Tác giả Luận án Hồ Văn Phi
  4. LỜI CẢM ƠN Đầu tiên, tôi xin bày tỏ lời cảm ơn chân thành và sự kính trọng đến các Thầy giáo TS. Hồ Khánh Lâm và TS. Nguyễn Viết Nguyên, các Thầy đã nhận tôi làm nghiên cứu sinh và hướng dẫn tôi rất nhiệt tình trong suốt thời gian học tập, nghiên cứu và thực hiện bản Luận án này. Các Thầy đã tận tình chỉ bảo và giúp đỡ tôi cả về lĩnh vực khoa học cũng như trong cuộc sống. Tôi vô cùng biết ơn sự kiên trì của các Thầy, các Thầy đã dành nhiều thời gian để đọc cẩn thận và góp nhiều ý kiến quý báu cho bản thảo của Luận án. Những kiến thức mà tôi nhận được từ các Thầy không chỉ là bản Luận án mà trên hết là cách nhìn nhận, đánh giá cũng như phương thức giải quyết vấn đề một cách toàn diện và khoa học. Tôi xin trân trọng cảm ơn Lãnh đạo Trường Đại Học Bách khoa Hà Nội, Viện Sau Đại học, Viện Điện tử - Viễn thông và Bộ môn Điện tử & Kỹ thuật máy tính đã tạo điều kiện thuận lợi cho tôi được học tập và làm nghiên cứu sinh, luôn quan tâm động viên tôi trong suốt quá trình học tập và nghiên cứu. Tôi xin chân thành cảm ơn sự giúp đỡ tận tình của các GS, PGS, TS, các Thầy, Cô giáo trong Bộ môn Điện Tử & Kỹ thuật máy tính, Viện Điện tử - Viễn thông, các Nhà khoa học trong và ngoài Trường Đại học Bách khoa Hà Nội. Tôi xin trân trọng cảm ơn Lãnh đạo Trường Đại học Quy Nhơn và Khoa Kỹ thuật & Công nghệ - Trường Đại học Quy Nhơn, cũng như bạn bè đồng nghiệp đã ủng hộ và tạo mọi điều kiện thuận lợi giúp đỡ tôi trong suốt thời gian học tập, nghiên cứu và hoàn thành Luận án. Cuối cùng, tôi muốn dành lời cảm ơn đến những người thân yêu nhất của tôi. Bản Luận án này là món quà quý giá tôi xin được kính tặng cho cha mẹ, vợ và các con thân yêu của tôi. Hà Nội, tháng 06 năm 2014 Tác giả Luận án Hồ Văn Phi
  5. MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH, ẢNH VÀ ĐỒ THỊ MỞ ĐẦU...... ................................................................................................. 1 1. Tính cấp thiết của luận án ..................................................................... 1 2. Mục đích nghiên cứu của luận án .......................................................... 4 3. Đối tượng và phạm vi nghiên cứu của luận án ..................................... 4 4. Phương pháp nghiên cứu của luận án ................................................... 4 5. Ý nghĩa khoa học và thực tiễn của luận án ........................................... 5 6. Cấu trúc của luận án .............................................................................. 5 Chương 1. TỔNG QUAN VỀ KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG ....................................................................................... 6 1.1. Giới thiệu ............................................................................................. 6 1.2. Kiến trúc của chip đa xử lý, đa luồng ................................................ 6 1.2.1. Kiến trúc chung của chip đa xử lý, đa luồng ....................................6 1.2.2. Kiến trúc chip đa xử lý, đa luồng đồng thời ...................................11 1.2.3. Mạng liên kết trên chip ......................................................................12 1.2.4. Phân cấp hệ thống nhớ.......................................................................16 1.3. Kết luận chương 1 ............................................................................. 18 Chương 2. NGHIÊN CỨU TỔ CHỨC CACHE, CHÍNH SÁCH THAY THẾ CACHE TRONG KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG ....................................................................... 19 2.1. Tổ chức cache trong kiến trúc chip đa xử lý, đa luồng ................... 19 2.1.1. Cache và các nguyên tắc làm việc của cache ..................................19 2.1.1.1. Vị trí tạm thời ................................................................................... 20 2.1.1.2. Vị trí không gian ............................................................................... 20
  6. 2.1.1.3. Vị trí tuần tự ..................................................................................... 20 2.1.2. Các thành phần của cache .................................................................20 2.1.3. Các tổ chức cache................................................................................ 21 2.1.3.1. Cache liên kết đầy đủ ........................................................................ 22 2.1.3.2. Cache sắp xếp trực tiếp.....................................................................24 2.1.3.3. Cache liên kết tập hợp ......................................................................26 2.2. Các đặc tính hiệu năng của cache .................................................... 28 2.2.1. Các tỷ số trúng cache và trượt cache ............................................... 29 2.2.1.1. Trúng cache ...................................................................................... 29 2.2.1.2. Trượt cache ...................................................................................... 29 2.2.1.3. Tỷ số trúng cache, trượt cache và trượt penalty ................................ 29 2.2.1.4. Bus bộ nhớ, kích thước từ nhớ, kích thước khối và trượt penalty.......31 2.2.1.5. Trượt cache cục bộ và toàn cục ........................................................ 31 2.2.1.7. Ảnh hưởng của tổ chức cache đến trượt penalty ............................... 33 2.2.1.8. Kích thước khối cache và tỷ số trượt ................................................. 34 2.2.1.9. Các loại trượt cache ......................................................................... 35 2.2.1.10. Tổ chức cache ảnh hưởng đến tốc độ của CPU ............................... 36 2.2.2. Các giải pháp tăng hiệu năng của cache .........................................38 2.3. Các chính sách thay thế dòng cache ..................................................... 38 2.3.1. Chính sách thay thế cache LRU ....................................................... 39 2.3.2. Chính sách thay thế cache LFU ........................................................ 39 2.3.3. Chính sách thay thế cache FIFO ...................................................... 39 2.3.4. Chính sách thay thế cache Random ................................................. 39 2.3.5. Chính sách thay thế cache NRU ....................................................... 40 2.3.6. Chính sách thay thế cache SRRIP .................................................... 40 2.3.7. Chính sách thay thế cache DRRIP ................................................... 42 2.4. Ghi và đọc cache................................................................................ 42
  7. 2.4.1. Ghi cache .............................................................................................. 42 2.4.1.1. Ghi thông qua ................................................................................... 43 2.4.1.2. Ghi trở lại ......................................................................................... 44 2.4.2. Đọc cache.............................................................................................. 46 2.4.2.1. Đọc bên cạnh .................................................................................... 46 2.5.2.2. Đọc thông suốt.................................................................................. 47 2.5. Cache chia sẻ thông minh ................................................................. 48 2.5.1. Tổ chức phân cấp cache trong các chip đa xử lý ........................... 48 2.5.2. Cache chia sẻ thông minh ..................................................................49 2.6. Tính nhất quán cache trong các chip đa xử lý, đa luồng ................ 50 2.6.1. Thế nào là nhất quán cache............................................................... 50 2.6.2. Các giao thức nhất quán cache ......................................................... 52 2.7. Kết luận chương 2 ............................................................................. 52 Chương 3. PHÂN TÍCH ĐÁNH GIÁ HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG ..................................................................................... 53 3.1. Cơ sở lý thuyết để phân tích đánh giá hiệu năng của tổ chức cache .................................................................................................. 53 3.1.1. Kiến trúc chip đa xử lý, đa luồng là mạng xếp hàng đóng đa lớp có dạng tích các xác suất (MCPFQN) .......................................53 3.1.1.1. Khái quát mạng xếp hàng đóng......................................................... 53 3.1.1.2. Khái quát mạng xếp hàng đóng có dạng tích các xác suất ................ 56 3.1.1.3. Kiến trúc chip đa xử lý, đa luồng là mạng xếp hàng đóng đa lớp có dạng tích các xác suất (MCPFQN)............................................... 58 3.1.2. Thuật toán phân tích giá trị trung bình (MVA) đánh giá hiệu năng cho các mạng xếp hàng đóng có dạng tích các xác suất......59 3.1.2.1. Mạng xếp hàng đóng đơn lớp có dạng tích các xác suất ................... 59 3.1.2.2. Mạng xếp hàng đóng đa lớp có dạng tích các xác suất ..................... 61 3.2. Mô hình tổ chức cache trong kiến trúc chip đa xử lý, đa luồng...... 62
  8. 3.2.1. Khái quát.............................................................................................. 62 3.2.2. Mô hình tổ chức cache trong kiến trúc chip đa xử lý, đa luồng......................................................................................................63 3.3. Phân tích đánh giá hiệu năng của tổ chức cache trong kiến trúc chip đa xử lý, đa luồng ..................................................................... 64 3.3.1. Mô hình thực hiện phân tích hiệu năng của kiến trúc chip đa xử lý, đa luồng ..................................................................................... 64 3.3.1.1. Mô hình tổng quát............................................................................. 64 3.3.1.2. Mô hình rút gọn ................................................................................ 66 3.3.2. Kết quả mô phỏng và đánh giá hiệu năng cho kiến trúc CMP đa luồng ................................................................................................ 72 3.3.2.1. Kết quả mô phỏng cho các kiến trúc CMP đa luồng.......................... 72 3.3.2.2. Đánh giá hiệu năng các chip đa xử lý, đa luồng ............................... 83 3.4. Kết luận chương 3 ............................................................................. 84 Chương 4. GIẢI PHÁP TỐI ƯU HÓA HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG ..................................................................................... 85 4.1. Kiến trúc cụm lõi cho chip đa xử lý, đa luồng ................................. 85 4.1.1. Khái quát.............................................................................................. 85 4.1.2. Mô hình MCPFQN cho kiến trúc cụm lõi.......................................86 4.1.2.1. Mô hình MCPFQN tổng quát của kiến trúc cụm lõi .......................... 86 4.1.2.2. Mô hình MCPFQN rút gọn của kiến trúc cụm lõi ............................. 88 4.1.3. Kết quả mô phỏng và đánh giá hiệu năng cho kiến trúc cụm lõi ...........................................................................................................90 4.1.3.1. Kết quả mô phỏng cho kiến trúc cụm lõi ........................................... 90 4.1.3.2. Đánh giá hiệu năng cho kiến trúc cụm lõi ......................................... 93 4.2. Lựa chọn cấu hình mạng liên kết trên chip ..................................... 94 4.2.1. Khái quát.............................................................................................. 94
  9. 4.2.2. Đề xuất công thức tính trễ truyền thông trung bình cho mạng liên kết trên chip ................................................................................. 94 4.2.3. Lựa chọn cấu hình mạng liên kết trên chip................................. 99 4.2.3.1. Kết quả mô phỏng ............................................................................. 99 4.2.3.2. Đánh giá kết quả ............................................................................ 104 4.3. Kết luận chương 4 ........................................................................... 104 KẾT LUẬN ............................................................................................... 106 TÀI LIỆU THAM KHẢO ........................................................................ 107 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN .... 115 PHỤ LỤC.................................................................................................. 116 Phụ lục 1. Kịch bản mô phỏng đánh giá hiệu năng của tổ chức cache trong kiến trúc CMP đa luồng có 2 cấp cache và 3 cấp cache ...................................................................................... 116 Phụ lục 2. Kịch bản mô phỏng đánh giá hiệu năng của tổ chức cache trong kiến trúc cụm lõi 3 cấp cache ..................................... 130
  10. DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu Tên tiếng Anh Tên tiếng Việt A ACM Association for Computing Hiệp hội kỹ thuật tính toán Hoa Machinery Kỳ ALU Arithmetic Logic Unit Đơn vị số học và logic AMAT Average Memory Access Time Thời gian trung bình truy nhập bộ nhớ AMC Asymmetric Multi-core Chip Chip đa lõi bất đối xứng ANSI American National Standards Viện tiêu chuẩn quốc gia Hoa Institute Kỳ ASCII American Standards Code for Chuẩn mã trao đổi thông tin Information Interchange Hoa Kỳ ASIC Application-Specific Integrate Mạch tích hợp ứng dụng Circuit chuyên biệt B BCE Base Core Equivalents Tương đương lõi cơ sở BIP Bimodal Insertion Policy Chính sách chèn hai phương thức BRRIP Bimodal Re-Reference Interval Hai phương thức dự báo Prediction (Bimodal RRIP) khoảng tham chiếu lại C CAD Computer Aided Design Thiết kế bằng máy tính ccNUMA cache-coherent Non-Uniform Truy cập bộ nhớ không đồng Memory Access nhất tương quan cache CD Compact Disk Đĩa compact CISC Complex Instruction Set Computer Máy tính có tập lệnh phức
  11. CMP Chip Multi-Processors Chip đa xử lý CPI Cycles per Instruction Chu kỳ cho một lệnh CPU Central Processing Unit Đơn vị xử lý trung tâm CSM Centralised Shared Memory Bộ nhớ chia sẻ tập trung CTMC Continuous-Time Markov Chain Chuỗi Markov có thời gian liên tục D DIMM Dual In-line Memory Modules Module bộ nhớ hai hàng chân DMA Direct Memory Access Truy cập bộ nhớ trực tiếp DMC Dynamic Multi-core Chip Chip đa lõi linh hoạt DRAM Dynamic Random-Access Memory RAM động DRRIP Dynamic Re-Reference Interval Dự đoán khoảng tham chiếu lại Prediction (Dynamic RRIP) động DSM Distributed Shared Memory Bộ nhớ chia sẻ phân tán DSR Dynamic Spill Receive Nhận dữ liệu tràn tự động DTMC Discrete-Time Markov Chain Chuỗi Markov có thời gian rời rạc DVD Digital Versatile Disk Đĩa kỹ thuật số đa năng F FCFS First Come, First Served Đến trước được phục vụ trước FIFO First In First Out Vào trước ra trước FPGA Field Programmable Gate Array Mảng cổng lập trình được dạng trường G GALS Globally Asynchronous, Locally Dị bộ toàn cục, đồng bộ cục bộ Synchronous H
  12. HLL High-Level Language Ngôn ngữ cấp cao HPC High Performance Computing Tính toán hiệu năng cao I IAR Instruction Address Register Thanh ghi địa chỉ lệnh IC Integrated Circuit Mạch tích hợp IEEE Institute of Electrical and Electronics Viện kỹ sư điện và điện tử Engineers ILP Instruction Level Parallelism Song song mức lệnh IMC Integrated Memory Controller Bộ điều khiển bộ nhớ tích hợp I/O Input/Output Vào/ra IP Internet Protocol Giao thức Internet IR Instruction Register Thanh ghi lệnh J JMT Java Modelling Tools Công cụ mô phỏng Java L LAN Local Area Network Mạng cục bộ LFU Least Frequently Used Tần suất sử dụng ít nhất LLC Last Level Cache Cache cấp cuối LRU Least Recently Used Sử dụng gần đây ít nhất LSI Large-Scale Integration Tích hợp cỡ lớn M MAPI Memory Accesses clock cycles Per Số chu kỳ đồng hồ truy cập bộ Instruction nhớ/lệnh MAR Memory Address Register Thanh ghi địa chỉ bộ nhớ MAT Memory Access Time Thời gian truy nhập bộ nhớ MCPFQN Multiclass Closed Product-Form Mạng xếp hàng đóng đa lớp có Queuing Network dạng tích các xác suất
  13. MESI Modified, Exclusive, Shared or Sửa đổi, loại trừ, chia sẻ hoặc Invalid (Cache-Protocol) vô hiệu (giao thức cache) MESIF Modified, Exclusive, Shared, Sửa đổi, loại trừ, chia sẻ hoặc Invalid, Forward vô hiệu; chuyển tiếp MIMD Multiple Instruction Multiple Data Nhiều lệnh nhiều dữ liệu MISD Multiple Instruction Single Data Nhiều lệnh một dữ liệu MMU Memory Management Unit Đơn vị quản lý bộ nhớ MRU Most Recently Used Sử dụng gần đây nhiều nhất MSI Medium-Scale Integration Tích hợp cỡ trung bình MSPI Memory Stalls clock cycles Per Số chu kỳ đồng hồ trì hoãn bộ Instruction nhớ/lệnh MSPMA Memory Stalls clock cycles Per Số chu kỳ đồng hồ trì hoãn bộ Memory Access nhớ/truy cập bộ nhớ MVA Mean Value Analysis Phân tích giá trị trung bình N NoC Network on Chip Mạng trên chip NRU Not Recently Used Không sử dụng gần đây NUCA Non-Uniform Cache Architecture Kiến trúc cache không đồng nhất NUMA Non-Uniform Memory Access Truy nhập bộ nhớ không đều O OCIN On-Chip Interconnection Network Mạng liên kết trên chip OS Operating System Hệ điều hành P PC Program Counter Bộ đếm chương trình PCB Process Control Block Khối điều khiển quá trình PLD Programmable Logic Device Thiết bị logic lập trình được
  14. PMF Probability mass function Hàm khối lượng xác suất PS Processor Sharing Chia sẻ xử lý PSELC Policy Selection Counter Bộ đếm lựa chọn chính sách PSW Processor Status Word Từ trạng thái của bộ xử lý Q QPI Quick Path Interconnect Liên kết đường dẫn nhanh R RAID Redundant Array of Independent Hệ thống đĩa dự phòng Disks RAM Random Access Memory Bộ nhớ truy cập ngẫu nhiên RISC Reduced Instruction Set Computer Máy tính với tập lệnh đơn giản hóa ROM Read-Only Memory Bộ nhớ chỉ đọc RRIP Re-Reference Interval Prediction Dự đoán khoảng tham chiếu lại RRPV Re-reference Prediction Values Giá trị dự đoán tham chiếu lại S SD Set Dueling Tranh chấp tay đôi tập hợp SDM Set Dueling Monitor Bộ giám sát tranh chấp tay đôi tập hợp SDRAM Synchronous Dynamic RAM DRAM đồng bộ SIMD Single Instruction Multiple Data Một lệnh nhiều dữ liệu SMC Symmetric Multi-core Chip Chip đa lõi đối xứng SMP Symmetric Multiprocessors Đa xử lý đối xứng SMT Simultaneous Multi-Threading Đa luồng đồng thời SoC System on a Chip Hệ thống trên một chip SP Speed Up Mức tăng tốc
  15. SRAM Static Random-Access Memory RAM tĩnh SRRIP Static Re-reference Interval Dự đoán khoảng tham chiếu lại Prediction (Static RRIP) tĩnh SRRIP- SRRIP-Frequency Priority SRRIP ưu tiên tần xuất FP SRRIP- SRRIP-Hit Priority SRRIP ưu tiên trúng cache HP SSI Small-Scale Integration Tích hợp cỡ nhỏ T TLB Translation Look-aside Buffer Bộ đệm chuyển đổi TLP Thread Level Parallelism Song song mức luồng TP Thread Processors Luồng xử lý TRAM Tag RAM Thẻ RAM TSC Time Stamp Counter Bộ đếm dấu thời gian U ULSI Ultra Large-Scale Integration Tích hợp cỡ siêu lớn V VHDL Very-High speed integrated circuit Ngôn ngữ mô tả phần cứng hardware Description Language VHSIC VHSIC Very High Speed Integrated Circuit Mạch tích hợp tốc độ rất cao VLIW Very Long Instruction Word Từ lệnh rất dài VLSI Very Large-Scale Integration Tích hợp có quy mô rất lớn
  16. DANH MỤC CÁC BẢNG Bảng 2.1: Tần suất thực hiện các loại lệnh và CPI trong chip kiến trúc RISC. .......36 Bảng 3.1: Giá trị trung bình của các thông số hiệu năng khi chip có 2-lõi với 8- luồng/lõi. ............................................................................................... 73 Bảng 3.2: Giá trị trung bình của các thông số hiệu năng khi chip có 4-lõi với 8- luồng/lõi. ............................................................................................... 77 Bảng 3.3: Giá trị trung bình của các thông số hiệu năng khi chip có 8-lõi với 8- luồng/lõi. ............................................................................................... 80 Bảng 4.1: Giá trị trung bình của các thông số hiệu năng khi hệ thống có 2 cụm, mỗi cụm 4-lõi với L3 cache riêng cho mỗi cụm, và L3 cache chung, mỗi lõi xử lý 8-luồng. ............................................................................. 91 Bảng 4.2: Các thông số của các cấu hình mạng liên kết trên CMP đa luồng .......... 97
  17. DANH MỤC CÁC HÌNH, ẢNH VÀ ĐỒ THỊ Hình 1: Biểu diễn sự gia tăng transistor trên chip theo định luật Moore ..................1 Hình 1.1: Kiến trúc chung của CMP đa luồng. ........................................................6 Hình 1.2: Kiến trúc phân mảnh của CMP. ...............................................................7 Hình 1.3: a) SMC gồm n =16 lõi BCE; b) SMC gồm n/r = 4/4 lõi (4 lõi, mỗi lõi có 4 BCE). ...............................................................................................8 Hình 1.4: AMC gồm một lõi 4-BCE và n-4 lõi 1-BCE. .............................................9 Hình 1.5: Chip đa lõi linh hoạt (DMC) gồm 16 lõi 1-BCE. ....................................10 Hình 1.6: CMP với kiến trúc SISD. ........................................................................ 11 Hình 1.7: CMP với kiến trúc SIMD. .......................................................................11 Hình 1.8: CMP với kiến trúc MIMD.......................................................................11 Hình 1.9: Một số cấu trúc mạng liên kết đa xử lý. .................................................. 14 Hình 1.10: Phân lớp của hệ thống nhớ...................................................................16 Hình 2.1: Trao đổi dữ liệu giữa CPU, cache và bộ nhớ chính ................................ 19 Hình 2.2: Cache và bộ nhớ chính. .......................................................................... 21 Hình 2.3: Trang cache và dòng cache trên bộ nhớ chính. ......................................22 Hình 2.4: Tìm kiếm trong cache liên kết đầy đủ ..................................................... 23 Hình 2.5: Tìm kiếm trong cache sắp xếp trực tiếp. ................................................. 25 Hình 2.6: Tìm kiếm trong cache liên kết tập hợp. ................................................... 27 Hình 2.7: So sánh tỷ số trượt cục bộ và toàn cục với 2 cấp cache. ......................... 33 Hình 2.8: Sự phụ thuộc của tỷ số trượt vào kích thước cache .................................34 Hình 2.9: Sự phụ thuộc của tỷ số trượt cache theo kích thước và tổ chức của cache. ....................................................................................................35 Hình 2.10: Ghi thông qua. ..................................................................................... 43 Hình 2.11: Ghi trở lại. ........................................................................................... 44 Hình 2.12: Kỹ thuật bộ đệm ghi. ............................................................................ 45 Hình 2.13: Đọc bên cạnh. ...................................................................................... 46 Hình 2.14: Đọc thông suốt. .................................................................................... 47
  18. Hình 2.15: CMP đa luồng hai cấp cache; a) với L2 cache riêng và b) với L2 cache chung cho tất cả các lõi. .............................................................. 48 Hình 2.16: Tổ chức cache trong các bộ xử lý 8-lõi của Intel Xeon họ 5500 ............ 48 Hình 2.17: Tiled CMP 16-lõi với kiến trúc L2 cache chia sẻ. .................................49 Hình 2.18: P2 thực hiện lệnh ld r2, x về thanh ghi r2 của P2. ................................ 51 Hình 2.19: P1 thực hiện lệnh ld r2, x. ....................................................................51 Hình 2.20: P1 thực hiện các lệnh: add r1, r2, r4; st x, r1 .......................................51 Hình 3.1: Mô hình mạng xếp hàng đóng. ............................................................... 53 Hình 3.2: Các kiến trúc CMP đa luồng. .................................................................64 Hình 3.3: Mô hình MCPFQN tổng quát cho CMP đa luồng của hình 3.2............... 65 Hình 3.4: Mô hình MCPFQN rút gọn cho CMP đa luồng, 2 cấp cache với L2 cache chung. .......................................................................................... 67 Hình 3.5: Mô hình MCPFQN rút gọn cho CMP đa luồng, 3 cấp cache với L3 cache chung. .......................................................................................... 69 Hình 3.6: Mô hình MCPFQN 2-lõi, đa luồng; a) với L2 cache chung và b) với L3 cache chung. ..................................................................................... 73 Hình 3.7: Biểu diễn giá trị trung bình của Thời gian chờ đợi ở các nút khi chip có 2-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................74 Hình 3.8: Biểu diễn giá trị trung bình của Thời gian đáp ứng ở các nút khi chip có 2-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................74 Hình 3.9: Biểu diễn giá trị trung bình của Mức độ sử dụng ở các nút khi chip có 2-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ......75 Hình 3.10: Biểu diễn giá trị trung bình của Thông lượng ở các nút khi chip có 2-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ......75 Hình 3.11: Mô hình MCPFQN 4-lõi, đa luồng; a) với L2 cache chung và b) với L3 cache chung. ..................................................................................... 76 Hình 3.12: Biểu diễn giá trị trung bình của Thời gian chờ đợi ở các nút khi chip có 4-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................77
  19. Hình 3.13: Biểu diễn giá trị trung bình của Thời gian đáp ứng ở các nút khi chip có 4-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................78 Hình 3.14: Biểu diễn giá trị trung bình của Mức độ sử dụng ở các nút khi chip có 4-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................78 Hình 3.15: Biểu diễn giá trị trung bình của Thông lượng ở các nút khi chip có 4-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ......79 Hình 3.16: Mô hình MCPFQN 8-lõi, đa luồng; a) với L2 cache chung và b) với L3 cache chung. ..................................................................................... 80 Hình 3.17: Biểu diễn giá trị trung bình của Thời gian chờ đợi ở các nút khi chip có 8-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................81 Hình 3.18: Biểu diễn giá trị trung bình của Thời gian đáp ứng ở các nút khi chip có 8-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................81 Hình 3.19: Biểu diễn giá trị trung bình của Mức độ sử dụng ở các nút khi chip có 8-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ....................................................................................................82 Hình 3.20: Biểu diễn giá trị trung bình của Thông lượng ở các nút khi chip có 8-lõi, mỗi lõi xử lý 8-luồng với L2 cache chung và L3 cache chung. ......82 Hình 4.1: Kiến trúc CMP đa luồng gồm n cụm lõi và L3 cache riêng cho mỗi cụm. .......................................................................................................86 Hình 4.2: Mô hình MCPFQN tổng quát của kiến trúc cụm lõi cho ở hình 4.1. .......87 Hình 4.3: Mô hình MCPFQN rút gọn của kiến trúc cụm lõi. ..................................88 Hình 4.4: Mô hình MCFPQN 2-cụm lõi, mỗi cụm 4-lõi, đa luồng. ......................... 90 Hình 4.5: Biểu diễn giá trị trung bình của Thời gian chờ đợi ở các nút khi hệ thống có 2-cụm, L3 cache riêng cho mỗi cụm và L3 cache chung cho 8-lõi, mỗi lõi xử lý 8-luồng.....................................................................91 Hình 4.6: Biểu diễn giá trị trung bình của Thời gian đáp ứng ở các nút khi hệ thống có 2-cụm, L3 cache riêng cho mỗi cụm và L3 cache chung cho 8-lõi, mỗi lõi xử lý 8-luồng.....................................................................92
  20. Hình 4.7: Biểu diễn giá trị trung bình của Mức độ sử dụng ở các nút khi hệ thống có 2-cụm, L3 cache riêng cho mỗi cụm và L3 cache chung cho 8-lõi, mỗi lõi xử lý 8-luồng.....................................................................92 Hình 4.8: Biểu diễn giá trị trung bình của Thông lượng ở các nút khi hệ thống có 2-cụm, L3 cache riêng cho mỗi cụm và L3 cache chung cho 8-lõi, mỗi lõi xử lý 8-luồng. ............................................................................. 93 Hình 4.9: Chip đa lõi với tổ chức cache 3 cấp: L1I, L1D, L2 riêng lẻ cho mỗi lõi và L3 cache chia sẻ cho tất cả các lõi. .............................................. 96 Hình 4.10: Trễ truyền thông trung bình của các mạng liên kết Ring, 2DMesh, 2DTorus, 3DMesh, 3DTorus, cho các trường hợp số lõi trên chip n = 8, 16, 32, 64, 128. ................................................................................ 101 Hình 4.11: Mức tăng tốc xử lý của các mạng liên kết Ring, 2DMesh, 2DTorus, 3DMesh, 3DTorus, cho các trường hợp số lõi trên chip n = 8, 16, 32, 64, 128. .......................................................................................... 104
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
10=>1