Một startup có trụ sở tại Sunnyvale, California (Mỹ) mang tên Bolt Graphics vừa giới thiệu nền tảng GPU Zeus với mục tiêu phục vụ gaming, rendering và các mô phỏng siêu máy tính. Theo thông tin do ServeTheHome công bố, công ty tuyên bố rằng Zeus có thể mạnh hơn GeForce RTX 5090 của Nvidia tới 10 lần trong các tác vụ path tracing. Tuy nhiên, có một điểm cần lưu ý: Zeus chỉ vượt trội khi xử lý path tracing và tính toán FP64, nhưng lại không hỗ trợ các phương pháp render truyền thống, đồng nghĩa với việc nó khó có thể trở thành một đối thủ thực sự trong lĩnh vực GPU gaming.
GPU đa chiplet dựa trên kiến trúc RISC-V
Không giống như GPU từ Nvidia, AMD hay Intel vốn dựa trên kiến trúc lệnh độc quyền, Zeus sử dụng RISC-V – một nền tảng mã nguồn mở. Cấu trúc lõi của Zeus kết hợp nhân scalar RVA23, đơn vị tính toán FP64 ALU và RISC-V Vector Extension Version 1.0 (RVV 1.0) hỗ trợ nhiều kiểu dữ liệu từ 8-bit đến 64-bit. Bên cạnh đó, Bolt còn bổ sung các phần mở rộng độc quyền nhằm tăng tốc các tác vụ khoa học.
Điểm đáng chú ý là Zeus vẫn trang bị TMU (Texture Mapping Unit) và ROP (Raster Operations Pipeline), nhưng Bolt chưa tiết lộ thông số cụ thể. Mỗi GPU sẽ đi kèm một cổng DisplayPort 2.1a và một cổng HDMI 2.1b.
Zeus áp dụng thiết kế đa chiplet. Phiên bản cơ bản Zeus 1c26-032 chỉ có một đơn vị xử lý, tích hợp 32GB LPDDR5X với băng thông 273GB/s và hỗ trợ thêm 128GB DDR5 qua hai khe SO-DIMM (băng thông 80GB/s). Ngoài ra, nó còn có một chiplet I/O hỗ trợ QSFP-DD 400GbE/800GbE, hai khe PCIe Gen5 x16 với CXL 3.0, cùng một cổng GbE dành cho BMC. Các chiplet xử lý và I/O kết nối với nhau qua băng thông 256GB/s.
Zeus 2c26-064/128 mạnh hơn nhờ hai đơn vị xử lý, bộ nhớ LPDDR5X từ 64GB đến 128GB. Trong khi đó, phiên bản mạnh nhất Zeus 4c26-256 sử dụng bốn chip xử lý, bốn chiplet I/O, bộ nhớ LPDDR5X 256GB và hỗ trợ tối đa 2TB DDR5, nhưng đây không phải một GPU thông thường mà là một giải pháp dành cho máy chủ.
Đối đầu RTX 5090 trong những tác vụ nào?
Khác với các GPU cao cấp tập trung vào băng thông, Zeus ưu tiên dung lượng bộ nhớ lớn để xử lý dataset khổng lồ. Ngoài ra, các cổng mạng 400GbE/800GbE tích hợp cũng cho thấy định hướng phục vụ trung tâm dữ liệu.
Dù có hiệu suất vượt trội trong path tracing và FP64 compute, Zeus lại không thể cạnh tranh với RTX 5090 trong AI và gaming truyền thống. RTX 5090 sở hữu 105 TFLOPS FP16 và 1.637 TFLOPS INT8, trong khi Zeus chỉ đạt 10 TFLOPS FP16 và 614 TFLOPS INT8 ở phiên bản single-chiplet. Điều này đồng nghĩa với việc nếu Zeus hỗ trợ render truyền thống, phiên bản 1c26-32 với 10 TFLOPS FP32 không có cửa trước RTX 5090 với 105 TFLOPS.
Phiên bản mạnh nhất Zeus 4c26-256 có thể đánh bại RTX 5090 ở nhiều khía cạnh, nhưng chỉ khi xét đến các workload như mô phỏng điện từ, nghiên cứu quang tử và tính toán FFT. Zeus nhắm đến các mô phỏng quy mô lớn, nơi cần bộ nhớ lớn và khả năng xử lý dữ liệu nhanh mà không phụ thuộc vào bộ nhớ ngoài.
Điểm quan trọng quyết định thành bại của Zeus không chỉ nằm ở phần cứng mà còn là hệ sinh thái phần mềm. Trong khi Nvidia có CUDA và AMD có ROCm, Bolt Graphics chưa có nền tảng phần mềm phổ biến. Dù RISC-V có thể tận dụng các công cụ mã nguồn mở hiện có, nhưng nếu thiếu sự hỗ trợ mạnh mẽ từ giới lập trình viên, Zeus sẽ gặp khó khăn trong việc cạnh tranh.
Bolt đã phát triển Glowstick – một engine path tracing nội bộ giúp cải thiện tốc độ render theo thời gian thực. Công ty tuyên bố rằng phiên bản single-chip của Zeus có thể đạt hiệu suất cao hơn 2,5 lần so với các giải pháp hiện tại, và có thể mở rộng hiệu suất với nhiều GPU.
Tuy nhiên, vẫn chưa rõ liệu Zeus có hỗ trợ các framework chuẩn công nghiệp như OpenCL, Vulkan hay các lớp chuyển đổi CUDA hay không. Nếu Bolt Graphics có thể cung cấp bộ công cụ lập trình mạnh mẽ, trình biên dịch tối ưu và khả năng tương thích với hệ thống HPC chạy Linux, Zeus có thể có chỗ đứng trong lĩnh vực tính toán khoa học và render chuyên nghiệp. Nhưng việc thách thức Nvidia sẽ là một chặng đường gian nan.