Zi6PDau

Nel mondo della tecnologia, è sempre più evidente l’importanza dei modelli di linguaggio e dell’intelligenza artificiale generativa. Tuttavia, questi modelli richiedono una enorme potenza di calcolo per il loro addestramento ed esecuzione. Consapevole di questa necessità, Google Cloud ha annunciato all’evento Google I/O l’arrivo delle nuove macchine virtuali A3 supercomputer, progettate specificamente per soddisfare le esigenze di questi casi d’uso che richiedono molte risorse.

Potenza e prestazioni per carichi di lavoro intensivi

Le VM A3 sono state costruite con l’obiettivo di offrire le migliori prestazioni nell’addestramento dei carichi di lavoro di apprendimento automatico attuali. Google Cloud ha equipaggiato queste macchine con potenti schede grafiche Nvidia H100, oltre a utilizzare processori Intel Xeon Scalable di quarta generazione, memoria host da 2 TB e una sorprendente capacità di larghezza di banda di 3,6 TB. Queste caratteristiche consentono di raggiungere fino a 26 exaFlops di potenza, migliorando significativamente i tempi e i costi relativi all’addestramento dei modelli di apprendimento automatico più grandi.

Innovazione nell’infrastruttura e nella rete

hOasZ31

Ma non è solo una questione di hardware. Queste VM vengono eseguite nel data center Jupiter di Google, che dispone di una rete di oltre 26.

000 GPU altamente interconnesse. Questa infrastruttura di rete unica consente collegamenti ottici riconfigurabili a larghezza di banda completa, in grado di adattare la topologia della rete in base alla domanda. Questo approccio innovativo non solo contribuisce a migliorare le prestazioni, ma aiuta anche a ridurre i costi di esecuzione di questi carichi di lavoro.

Flessibilità per i clienti

Google Cloud offre ai clienti due opzioni per sfruttare le capacità delle VM A3. Da un lato, gli utenti possono scegliere di eseguire queste VM da soli utilizzando Google Kubernetes Engine (GKE) e Google Compute Engine (GCE). Questa opzione offre loro maggiore controllo e personalizzazione dell’infrastruttura. D’altra parte, c’è l’opzione di utilizzare il servizio gestito di Google, dove l’azienda si occupa della maggior parte dei compiti pesanti. Questa opzione consente ai clienti di utilizzare le VM A3 in Vertex AI, la piattaforma di apprendimento automatico gestita di Google.

Gli interessati possono registrarsi a questo link.

Come vedete, sebbene le nuove VM A3 siano state annunciate in Google I/O, attualmente sono disponibili solo attraverso una lista d’attesa per ottenere l’accesso anticipato.