Intel Core vi kiến trúc hai nhân chung đệm
Tại diễn đàn IDF đầu năm 2006, Intel tập trung giới thiệu một vi kiến
trúc hai nhân mới cho nền kiến trúc IA-32 32bit (cùng tồn tại với kiến
trúc EPIC, IXA) với những khẳng định lạc quan về sự cải thiện hiệu
năng, hiệu suất xử lý nhìn trên quan điểm tương quan năng lượng. Vi
kiến trúc mới mang tên giản dị là Intel Core.
Điểm lại các vi kiến trúc hai nhân đang dùng, chúng ta nhận thấy điểm
chung trong cách hiện thực là tích hợp hai nhân vi xử lý đơn nhân trước đây
vào một chip với sự độc lập khá rõ về bộ đệm xử lý và tách biệt quá trình
thực thi vi lệnh. Vi kiến trúc Core đã cải tiến điều này bằng cách thiết kế
một bộ đệm cấp 2 (L2 cache) chung cho cả hai nhân, đồng thời vận dụng có
cải tiến những điểm mạnh của hai vi kiến trúc NetBurst và Mobile để đạt
đồng thời hai yếu tố quan trọng là tăng hiệu năng xử lý và giảm mức tiêu thụ
điện năng. Vi kiến trúc Core chiến lược này sẽ đồng thời được Intel triển
khai trên cả ba dòng điện toán di động, để bàn và máy chủ; nhưng trong lộ
trình giới thiệu sản phẩm, bộ vi xử lý tên mã Merom dành cho máy tính xách
tay sẽ được ưu tiên giới thiệu trước.
So với vi kiến trúc Intel hai nhân hiện tại, năm cải tiến quan trọng trong vi
kiến trúc Core là Mở Rộng Thực Thi Động (Wide Dynamic Execution),
Quản Lý Điện Năng Thông Minh (Intelligent Power Capability), Đệm
Thông Minh Tiên Tiến (Advanced Smart Cache), Truy Xuất Bộ Nhớ Thông
Minh (Smart Memory Access) và Tăng Tốc Phương Tiện Số Tiên Tiến
(Advanced Digital Media Boost).
Wide Dynamic Execution
Thực thi động là sự kết hợp của nhiều kỹ thuật (phân tích luồng dữ liệu, thực
thi suy đoán, thực thi phi thứ tự,...) đã được Intel hiện thực trong vi kiến trúc
P6 gồm bộ xử lý Pentium Pro, Pentium II, Pentium III. Trong vi kiến trúc
NetBurst sau đó, Intel đưa ra cơ chế Thực Thi Động Tiên Tiến (Advanced
Dynamic Execution) thiết kế sâu hơn, tiên đoán xa hơn và cải tiến giải thuật
tiên đoán nhánh lệnh để giảm bớt trường hợp tiên đoán sai. Trong kiến trúc
Core, hàng lệnh thực thi được thiết kế dài hơn (14 khâu) giúp tiên đoán
nhánh lệnh chính xác hơn và có đến 4 hàng lệnh thực thi cùng lúc (Intel
Mobile và NetBurst trước đây chỉ thực thi được cùng lúc ba hàng lệnh).
Một tính năng khác cũng góp phần rút ngắn thời gian thực thi lệnh là
macrofusion. Trong quá trình giải mã lệnh, một số cặp vi lệnh thông dụng
(như lệnh compare (so sánh) đi kèm lệnh jump (nhảy) có điều kiện) sẽ được
macrofusion ghép thành một vi lệnh mới. Bộ Luận Lý Tóan Học (Arithmetic
Logic Unit-ALU) trong vi kiến trúc Core được thiết kế để thực thi các lệnh
kết hợp theo cơ chế macrofusion trong một xung nhịp, giúp rút ngắn đáng kể
thời gian thực thi (so với khi chưa kết hợp) và cũng đồng nghĩa giảm năng
lượng.
Trong Intel Core, bạn cũng bắt gặp lại kỹ thuật tiết kiệm năng lượng thời
gian micro-op fusion từng được dùng trong bộ xử lý Pentium M. Thông
thường, một lệnh thực thi (macro-op) thường được chẻ nhỏ thành nhiều vi
lệnh (micro-op) trước khi chuyển vào hàng lệnh thực thi của bộ vi xử lý. Kỹ
thuật micro-op giúp tối giản một số vi lệnh trong hàng chờ. Trong vi kiến
trúc Core, số trường hợp tinh giản vi lệnh được mở rộng hơn nhờ hàng lệnh
được thiết kế 14 khâu (dài hơn trước).
Mỗi nhân có thể xử lý đồng thời 4 hàng lệnh.
Intelligent Power Capability
Một trong những yếu tố đánh giá hiệu quả hệ thống điện toán hiện tại là chỉ
số hiệu năng/điện năng tiêu thụ. Điều này có nghĩa chúng ta chỉ cần giảm
lượng điện năng tiêu thụ là đã tăng độ hiệu quả hệ thống. Bên cạnh các cải
tiến nâng cao hiệu năng xử lý, Intel Core đồng thời thiết kế Intel Intelligent
Power Capability để tiết kiệm điện năng.
Công nghệ hiện tại đã cho phép Intel thiết kế cơ chế tắt mở cổng luận lý theo
yêu cầu. Nhờ vậy, vi kiến trúc Core có khả năng tắt một hệ thống con trong
bộ vi xử lý khi không cần dùng đến để tiết kiệm điện năng; nhưng vẫn đảm
bảo kích hoạt ngay khi cần để không ảnh hưởng đến tốc độ chung của bộ vi
xử lý. Bên cạnh đó, nhiều tuyến bus và vùng dữ liệu cũng đã được thiết kế
tách biệt để có thể vẫn đảm bảo truyền tải dữ liệu ở mức điện áp thấp trong
một số trạng thái.
Advanced Smart Cache
Khác với cách hiện thực thông thường, Intel thiết kế trong vi kiến trúc Core
một bộ đệm L2 dùng chung cho cả hai nhân vi xử lý để nâng cao hiệu năng,
tăng phần hiệu quả truy xuất dữ liệu. Đơn giản một điều, khi hai nhân thực
thi cần sử dụng một dữ liệu giống nhau thì có thể lưu tại một nơi trong vùng
đệm L2 dùng chung chứ không cần phải lưu thành hai bản tại hai vùng đệm
L2 riêng như trước đây. Điều này giúp tiết kiệm tài nguyên, rút ngắn thời
gian chuyển dữ liệu qua lại hai bộ đệm.
Công nghệ này còn cho phép phân chia động dung lượng vùng đệm theo nhu
cầu từng nhân. Khi nhân thứ nhất không cần dùng đến bộ đệm thì toàn bộ
vùng đệm L2 dùng chung có thể được chia hết cho nhân thứ hai; và ngược
lại. Điều này giúp tăng hiệu quả sử dụng bộ đệm, tránh được trường hợp
thiếu bộ đệm, đồng thời tận dụng hiệu quả tốc độ đáp ứng cao của đệm L2.
Smart Memory Access
Công nghệ Intel Smart Memory Access có hai kỹ thuật quan trọng là nạp
trước dữ liệu (memory disambiguation) và bộ nạp lệnh tiên tiến (advanced
prefetcher). Kỹ thuật nạp trước dữ liệu có giải thuật đặc biệt để định giá
được những lệnh load (nạp dữ liệu) không lệ thuộc và có thể thực thi vượt
trước lệnh store (lưu dữ liệu). Điều này thực thi đúng tinh thần xử lý song
song và đạt đến mức độ lệnh thực thi vi lệnh nên hỗ trợ rất đắc lực cho môi
trường đa nhiệm, xử lý song song. Trong một số trường hợp phép nạp "vượt
đèn" không đúng, Intel cũng đã tích hợp cơ chế cho phép phát hiện điểm
tranh chấp, nhanh chóng nạp lại dữ liệu đúng và thực thi lại lệnh.
Bên cạnh, Intel Smart Memory Access cũng có bộ nạp lệnh (prefetcher) tiên
tiến không chỉ làm nhiệm vụ nạp dữ liệu vào bộ nhớ mà còn chuyển dữ liệu
sẵn sàng tại vùng đệm để tận dụng được tốc độ truy xuất cao của vùng đệm.
Vi kiến trúc Core tích hợp hai cấp L1 và hai cấp L2 với nhiệm vụ đặt dữ liệu
của những lệnh thực thi chưa tức thời lên vùng đệm L1 và chuẩn bị sẵn sàng
dữ liệu thực thi tức thời trên vùng đệm L2.
Vi kiến trúc Intel Core xử lý lệnh SIMD 128bit trong một xung nhịp
Advanced Digital Media Boost
Tăng tốc thực thi lệnh Streaming SIMD Extension (SSE), vi kiến trúc Core
trang bị công nghệ Intel Advanced Digital Media Boost hỗ trợ xử lý các
phép toán SIMD 128bit. Trước đây, bộ vi xử lý chỉ hỗ trợ các phép toán độ
dài 64bit nên một lệnh SIMD 128bit buộc phải chia đôi và xử lý trong hai
xung. Công nghệ Intel Advanced Digital Media Boost trong vi kiến trúc
Core chỉ xử lý trong một xung nên rút ngắn gấp đôi thời gian xử lý dữ liệu
của các ứng dụng video, âm thanh, đồ họa, và dạng dữ liệu dùng tập lệnh
SSE, SSE2. SSE3. Khả năng tính toán dấu chấm động và số nguyên 128 bit
cũng giúp nâng độ chính xác trong các ứng dụng đặc thù như xử lý hình ảnh,
video, giọng nói, mã hóa, tài chính, kỹ thuật và khoa học.
Lộ trình sản phẩm
Dựa trên vi kiến trúc Core, Intel đã vạch ra lộ
trình sản phẩm sắp tới cho cả ba dòng điện toán di
động, để bàn và máy chủ với sự kết hợp chặt chẽ
giữa bộ vi xử lý và nền tảng hệ thống. Tiếp tục xu
hướng bộ xử lý đa nhân, Intel dự kiến sẽ tung ra
mẫu 4 nhân vào đầu năm 2007.
Cụ thể, bộ vi xử lý di động mã Merom cho máy
tính xách tay được tung ra thế giới trong quí 2
chạy được trên nền tảng Napa hiện tại và cả nền
tảng Santa Rosa (sẽ tung ra trong quí 1/2007). Bộ Đệm L2 dùng chung
vi xử lý máy tính để bàn cho văn phòng mã giúp tăng tốc độ truy Conroe sẽ chính thức có mặt tại thị trường thế xuất, giảm thời gian dịch
giới vào quí 3 cùng nền tảng Averill (giới thiệu chuyển dữ liệu.
giữa năm nay). Nền tảng máy tính để bàn gia đình
Bridge Creek (giữa năm nay) có thể thay đổi bộ xử lý mã Conroe sang
Kentsfield vào quí 1/2007. Hai bộ xử lý mã Conroe và Kentsfield của máy
tính cá nhân cũng sẽ được dùng chung cho nền tảng máy trạm/máy chủ một
bộ xử lý Kaylo và Wyloway (quí 3). Trong lúc, bộ xử lý mã Woodcrest (quí
3) và Clovertown (quí 1/2007) sẽ được tung ra trên nền tảng Bensley và
Glidewell (cùng quí 2) dành cho máy chủ hai bộ xử lý. Đến năm 2007, vi
kiến trúc Core sẽ xuất hiện trong bộ xử lý Tigerton chạy trên nền tảng máy
chủ đa bộ xử lý Caneland.
Intel Việt Nam cho biết dòng bộ vi xử lý hai nhân trên vi kiến trúc Core sẽ
có mặt tại Việt Nam vào khoảng quí 3 năm nay với phiên bản tiên phong
dành cho máy tính xách tay (tên mã Merom), kế tiếp có thể là phiên bản cho
PC (mã Conroe).Theo Intel, bộ xử lý trên vi kiến trúc Intel Core đã cải thiện
rõ rệt hiệu năng và giảm đáng kể điện năng tiêu thụ so với bộ xử lý Intel trên
vi kiến trúc thế hệ trước. Cụ thể, Conroe tăng hơn 40% hiệu năng, giảm hơn
40% điện năng tiêu thụ; Woodcrest tăng hơn 80% hiệu năng, giảm hơn 35%
điện năng. Thế hệ máy tính xách tay Intel Core Duo mới dùng bộ xử lý
Merom sẽ tăng hơn 20% hiệu năng.
hfghfghfghfghfghfgg