Nvidia se pregătește de GTC 2025, conferința anuală a companiei care reunește cele mai noi inovații în materie de inteligență artificială și hardware de înaltă performanță. Într-o analiză recentă, Ming-Chi Kuo – binecunoscut pentru predicțiile sale legate de industria tech – oferă câteva indicii despre ce am putea vedea la acest eveniment. Potrivit informațiilor dezvăluite de analist, ediția de anul acesta ar putea aduce noutăți majore în zona serverelor AI, a cipurilor de ultimă generație și a rețelelor pentru centrele de date.
1. Principalele direcții de investiții și posibile subiecte fierbinți
a) Eficiența legilor de scalare
Kuo atrage atenția asupra modului în care legile de scalare (scaling laws) pot continua să susțină evoluția performanțelor în AI. Există un interes tot mai mare pentru segmentul entry-level și Edge AI, care vine cu propriile provocări de spațiu, consum și costuri. Dacă Nvidia va oferi exemple clare despre cum noile servere își pot menține randamentul crescut, investitorii ar putea deveni mai optimiști privind potențialul de creștere al companiei.
b) Avansul producției pentru cipurile B300
Un punct central al așteptărilor pieței este trecerea de la cipul B200 la B300 și modul în care Nvidia va rezolva eventualele blocaje de producție. Kuo menționează că, până acum, GB200 NVL72 s-a confruntat cu unele provocări de disponibilitate, așa că anunțul unei linii de producție clare pentru B300 ar putea reda încrederea investitorilor.
c) Riscuri geopolitice
Deși Nvidia nu obișnuiește să abordeze explicit astfel de subiecte la conferințe, Kuo semnalează că tensiunile la nivel global pot afecta lanțurile de aprovizionare. Totuși, cel puțin oficial, se pare că Nvidia va pune accentul mai degrabă pe inovația hardware și pe datele de producție, decât pe aceste factori externi.
2. B300, noul cip-vedetă
Conform articolului lui Ming-Chi Kuo, B300 va fi în centrul atenției:
- Se va lansa în două variante – dual-die (CoWoS-L) și single-die (CoWoS-S) – ambele venind cu o creștere semnificativă a memoriei HBM (de la 192GB, câte avea B200, la 288GB).
- În plus, testele interne (FP4) indică un salt de performanță de aproximativ 50% față de generația precedentă.
- Trial production (producția de test) ar începe în trimestrul al doilea din 2025, iar producția de masă este programată pentru trimestrul al treilea.
Dacă aceste termene sunt respectate, Nvidia ar putea începe implementarea pe scară largă a B300 chiar din a doua jumătate a anului viitor, ceea ce ar face ca GTC 2025 să fie momentul propice pentru a prezenta potențialii clienți și performanțele reale ale noului cip.
3. Servere anunțate și stații de lucru
Kuo precizează că vom vedea o serie de produse noi la GTC 2025, grupate în jurul generației B300:
- GB300 NVL72
- Următorul pas după GB200 NVL72, cu aceleași cerințe de spațiu și putere, pentru upgrade facil în centrele de date.
- Primele mostre, denumite “Pre-build samples”, sunt așteptate în iunie 2025.
- HGX B300 NVL16 (răcire pe aer sau pe lichid)
- Păstrează același număr de GPU-uri ca HGX B200 NVL8, însă cipul folosit este B300 într-o singură matriță.
- Versiunile de test vor fi gata, cel mai probabil, în iunie (varianta cu aer) și septembrie (varianta cu lichid).
- B300 NVL cu specificații mai accesibile
- Pentru companiile care nu necesită puterea maximă a modelului NVL72, Nvidia pregătește o versiune cu performanțe reduse, dar mai prietenoasă cu bugetul.
- Stații de lucru (workstations)
- Echipate cu RTX PRO 6000 Blackwell Server Edition, având 96GB GDDR7 și o lățime de bandă de până la 1.6 TB/s.
- Consum de energie estimat între 400 și 600W, cu producția de masă prevăzută pentru 2Q-3Q 2025.
- Arhitectura viitoare Vera Rubin (NVL144/288)
- GTC 2025 ar putea fi locul unde Nvidia va anunța, în premieră, noua arhitectură Vera Rubin, însă producția de volum mare nu va începe înainte de 2026 (2Q-3Q).
- În prima fază, rack-urile pentru aceste servere vor folosi încă cipuri din seria GB, din cauza disponibilității limitate a noilor cipuri.
4. Noutăți în rețelistica pentru centre de date
Pe partea de infrastructură de rețea, Kuo evidențiază următoarele:
- Quantum-3, Quantum-X800, Spectrum-5 și ConnectX-8 (CX8) vor fi prezentate la GTC 2025.
- ConnectX-8 (CX8) vine cu o viteză dublă față de CX7, consum energetic redus cu aproximativ 30% și suport pentru PCIe Gen6, datorită integrării unui switch PCIe și a tehnologiei SuperNIC.
- CX8 va fi optimizat în special pentru platformele de tip GB300 NVL72 și noua serie Quantum, urmărind să eficientizeze și mai mult fluxul de date dintre GPU-uri.
5. Perspective pentru investitori și evoluția pieței
În opinia lui Ming-Chi Kuo, GTC 2025 ar putea genera o creștere a interesului pe bursă pentru Nvidia, mai ales dacă firma va prezenta rezultate clare despre eficiența noilor servere și va confirma calendarul de producție. Investitorii așteaptă, de asemenea, să vadă cum va gestiona Nvidia eventualele tensiuni geopolitice și dacă va reuși să mențină costurile sub control, într-o perioadă în care cererea de servere AI este pe un trend ascendent.
Analiza lui Ming-Chi Kuo sugerează că Nvidia își propune să-și consolideze poziția de lider în domeniul AI și al sistemelor de calcul de înaltă performanță. Cu toate că subiecte precum Edge AI și PC AI (N1X, N1) vor fi tratate, probabil, la evenimente diferite (precum Computex), GTC 2025 se așteaptă să fie axată pe serverele mari pentru centre de date, pe cipurile B300 și pe o infrastructură de rețea mai rapidă și mai eficientă energetic.
Rămâne de urmărit cât de mult se va adeveri prognoza lui Ming-Chi Kuo și în ce măsură Nvidia va livra la timp componentele anunțate. Cert este că GTC 2025 are potențialul să fie unul dintre cele mai importante momente ale anului pentru industria AI, ridicând ștacheta în materie de performanță și implicând, totodată, pariuri financiare majore pe viitorul acestui sector.