Meta rivela il suo secondo processore personalizzato
CasaCasa > Notizia > Meta rivela il suo secondo processore personalizzato

Meta rivela il suo secondo processore personalizzato

Jun 13, 2023

Fustellato Meta "MTIA" V1 (Meta Training and Inference Accelerator).

Quando la maggior parte delle persone pensa a Meta, pensa alle sue app, tra cui Facebook, Instagram, WhatsApp o al prossimo metaverso. Molti non sanno che l'azienda ha progettato e costruito alcuni dei data center più grandi e sofisticati del mondo per gestire tali servizi.

A differenza dei fornitori di servizi cloud come AWS, GCP o Azure, Meta non deve rivelare dettagli sulle scelte del silicio, sull'infrastruttura o sulla progettazione del data center oltre ai progetti OCP per impressionare gli acquirenti. Gli utenti Meta desiderano esperienze migliori e più coerenti, senza preoccuparsi di come ciò avvenga.

Divulgazioni senza precedenti

La mancanza di dettagli è cambiata oggi con quella che considero una divulgazione senza precedenti dell'ultimo acceleratore di inferenza AI dell'azienda, un transcodificatore video in produzione, l'architettura del data center di prossima generazione progettata per l'intelligenza artificiale e i dettagli sulla seconda fase della sua ricerca sull'intelligenza artificiale su 16.000 GPU. supercomputer, la prima fase che ha alimentato il modello di intelligenza artificiale generativa LLaMA.

Questa divulgazione dovrebbe interessare le parti interessate di Meta, compresi gli investitori, poiché ciò influisce sul tempo di commercializzazione, sulla differenziazione e sui costi.

All'inizio di questa settimana, ho incontrato Alexis Björlin, vicepresidente delle infrastrutture di Meta, per parlare dell'approccio full-stack dell'azienda al suo silicio e per ottenere maggiori dettagli sulla sua nuova inferenza AI e acceleratore video.

Sono impressionato dai progressi compiuti finora da Meta, ma questo è solo l'inizio.

L'approccio full-stack di Meta

Prima di passare a "MTIA" o "Meta Training and Inference Accelerator", volevo rivedere l'approccio di Meta al silicio. Sono lieto di poter affermare che la strategia relativa al silicio non è cambiata da quando ho parlato con l'azienda un anno e mezzo fa. Puoi leggere l'articolo qui. Meta continuerà ad acquistare tonnellate di silicio commerciale da AMD, Broadcom, Intel, Marvell e NVIDIA. Tuttavia, ne progetterà uno proprio per carichi di lavoro specifici in cui il silicio commerciale non è ottimale per fornire le migliori prestazioni per watt e TCO.

Questo approccio ha perfettamente senso strategico per me poiché Meta ha un approccio infrastrutturale "full-stack", possedendo quasi ogni livello dello stack, dall'infrastruttura all'app e tutto il resto. Quando gli standard di settore vengono ottimizzati per l'intero stack, li utilizza e, in caso contrario, aiuta a creare standard di settore come OCP e PyTorch.

Le app e i servizi di Meta sono unici e operano su una scala incredibile, il che, a mio avviso, amplifica la necessità e i vantaggi del silicio personalizzato. Gli utenti di Facebook e Instagram guardano enormi quantità di video e ricevono costantemente consigli di persone con cui connettersi, post con cui interagire e, ovviamente, annunci su cui fare clic. Potete immaginare come il metaverso infuso di intelligenza artificiale e l’intelligenza artificiale generativa spingeranno la necessità di soluzioni a basso consumo e più altamente ottimizzate.

MSVP: processore video meta scalabile

MTIA non è il primo silicio personalizzato di Meta. L'MSVP, o "Meta Scalable Video Processor", è in produzione. Alcuni dettagli sul transcodificatore video sono emersi l'anno scorso, ma oggi l'azienda ha deciso di rivelarne ancora di più.

Secondo Meta, gli utenti di Facebook trascorrono il 50% del loro tempo guardando video 4B al giorno. Ogni video viene compresso dopo essere stato caricato, archiviato e quindi decompresso in un formato adatto quando l'utente desidera visualizzarlo. Questi video vengono transcodificati (compressi/decompressi) utilizzando formati standard come H.264 e VP9. Il trucco sta nel rimpicciolire rapidamente il file, archiviarlo rapidamente e riprodurlo in streaming con la massima qualità per il dispositivo appropriato (ad esempio telefono, tablet, PC) con la massima qualità possibile.

Chip confezionato MSVP V1 (Meta Training and Inference Accelerator) di Meta.

Questo tipo di caratteristica del carico di lavoro è perfetta per un ASIC (circuito integrato specifico per l'applicazione), un carico di lavoro che richiede la massima efficienza attraverso uno standard fisso. Gli ASIC sono i più efficienti ma non programmabili come una CPU o una GPU. Quando lo standard video cambierà da H.264 e VP9 ad AV1, cosa che probabilmente accadrà in futuro, Meta dovrà creare un nuovo ASIC, una nuova versione di MSVP.