Alla GTC 2026, la conferenza annuale dedicata agli sviluppatori, NVIDIA ha presentato Vera Rubin, la nuova generazione di piattaforma per l’intelligenza artificiale destinata a succedere all’architettura Blackwell e ad aprire quella che l’azienda definisce la “frontiera dell’AI Agent”.
Il nome rende omaggio a Vera Rubin, l’astronoma la cui ricerca contribuì a dimostrare l’esistenza della materia oscura. Una scelta simbolica che riflette l’obiettivo della nuova architettura: rendere possibile una nuova fase dell’intelligenza artificiale, più autonoma, proattiva e orientata al ragionamento continuo.
La piattaforma integra la CPU Vera e la GPU Rubin in un’architettura unificata collegata tramite NVLink 6 ad alta velocità. Il chip Rubin conta 336 miliardi di transistor, utilizza memoria HBM4 da 288 GB e raggiunge fino a 50 petaFLOPS di potenza di calcolo. Numeri che posizionano Vera Rubin come una delle piattaforme più potenti mai progettate per carichi di lavoro AI.
L’intero rack Vera Rubin NVL72, che integra 72 GPU Rubin e 36 CPU Vera, è stimato tra i 3,5 e i 4 milioni di dollari, circa il 25% in più rispetto alla generazione Blackwell. Nonostante il costo, la domanda attesa è elevata, spinta dalla crescente necessità di infrastrutture per modelli sempre più complessi.
Durante la presentazione, il CEO Jensen Huang ha inquadrato Vera Rubin non come una semplice evoluzione hardware, ma come la base computazionale per un nuovo paradigma: le “token factory”. Sistemi progettati per generare, gestire e orchestrare enormi flussi di ragionamento AI in modo autonomo e continuo.
Questo approccio si allinea con la transizione verso sistemi di intelligenza artificiale agenti, capaci non solo di rispondere, ma di pianificare, eseguire e adattarsi nel tempo.
Tra i primi ad anticipare l’adozione delle GPU Rubin c’è CoreWeave, che ha annunciato l’integrazione nell’ambito dell’accordo espanso con Meta. Un segnale chiaro della direzione del mercato.
Il messaggio di NVIDIA è esplicito: chi vorrà guidare l’intelligenza artificiale nel 2026 e oltre dovrà costruire su Vera Rubin. Non solo un nuovo chip, ma l’infrastruttura pensata per l’era dell’AI agente.