Pada hari Selasa di konferensi GTC 2025 NVIDIA di San Jose, California, CEO Jensen Huang mengungkapkan beberapa GPU AI-mempercepat AI-Accelerating perusahaan berencana untuk merilis selama beberapa bulan dan bertahun-tahun. Dia juga mengungkapkan lebih banyak spesifikasi tentang chip yang diumumkan sebelumnya.
Pengumuman tengah adalah Vera Rubin, pertama kali diejek di Computex 2024 dan sekarang dijadwalkan untuk rilis pada paruh kedua tahun 2026. GPU ini, dinamai setelah seorang astronom terkenal, akan menampilkan 288 gigabyte memori dan dilengkapi dengan CPU yang dirancang khusus Nvidia bernama VERA.
Menurut NVIDIA, Vera Rubin akan memberikan peningkatan kinerja yang signifikan atas pendahulunya, Grace Blackwell, terutama untuk pelatihan dan inferensi AI.
Spesifikasi untuk Vera Rubin, disajikan oleh Jensen Huang selama keynote GTC 2025.
Vera Rubin memiliki dua GPU bersama pada satu die yang menghasilkan 50 petaflops kinerja inferensi FP4 per chip. Ketika dikonfigurasi dalam rak NVL144 lengkap, sistem ini memberikan 3.6 exaflops dari komputasi inferensi FP4 – 3,3 kali lebih banyak dari 1.1 Exaflops Blackwell Ultra dalam konfigurasi rak yang sama.
Vera CPU memiliki 88 inti lengan khusus dengan 176 utas yang terhubung ke Rubin GPU melalui antarmuka NVLink 1,8 TB/S berkecepatan tinggi.
Huang juga mengumumkan Rubin Ultra, yang akan mengikuti pada paruh kedua tahun 2027. Rubin Ultra akan menggunakan konfigurasi rak NVL576 dan menampilkan GPU individual dengan empat die berukuran reticle, memberikan 100 petaflops dari presisi FP4 (format poin floating 4-bit yang digunakan untuk mewakili angka dan pemrosesan dalam model AI) di dalam AI Model.
Pada level rak, Rubin Ultra akan memberikan 15 exaflops komputasi inferensi FP4 dan 5 eksaflop kinerja pelatihan FP8 – sekitar empat kali lebih kuat daripada konfigurasi Rubin NVL144. Setiap GPU Rubin Ultra akan mencakup memori HBM4E 1TB, dengan rak lengkap berisi memori cepat 365TB.