英偉達(dá)CEO黃仁勛在GTC大會(huì)的主題演講中,清晰地勾勒出一幅宏偉藍(lán)圖:將傳統(tǒng)的數(shù)據(jù)中心轉(zhuǎn)變?yōu)楦咝А⒁?guī)模化生產(chǎn)的“人工智能工廠”。這一戰(zhàn)略的核心驅(qū)動(dòng)力,便是其全新發(fā)布的基于Hopper架構(gòu)的H100 GPU、配套的超級(jí)計(jì)算機(jī)系統(tǒng)以及一整套軟件棧。這不僅是一次硬件與軟件的升級(jí),更是對(duì)整個(gè)計(jì)算范式的一次重塑。
核心引擎:Hopper架構(gòu)與H100 GPU
Hopper架構(gòu)的命名源自計(jì)算機(jī)科學(xué)先驅(qū)格蕾絲·霍珀,它代表著英偉達(dá)在加速計(jì)算領(lǐng)域的新高度。H100 GPU作為該架構(gòu)的首款產(chǎn)品,集成了多項(xiàng)突破性技術(shù):
- 革命性的Transformer引擎:專門為當(dāng)前主導(dǎo)AI發(fā)展的Transformer模型(如GPT-3、DALL-E等)優(yōu)化。它通過(guò)創(chuàng)新的FP8精度格式,結(jié)合專用的硬件加速,能夠動(dòng)態(tài)處理不同層級(jí)的計(jì)算精度,在處理大規(guī)模語(yǔ)言模型時(shí),可將訓(xùn)練速度提升高達(dá)9倍,推理速度提升30倍。
- 第二代多實(shí)例GPU(MIG)技術(shù):可將單個(gè)H100 GPU物理分割為多達(dá)7個(gè)獨(dú)立、安全的實(shí)例,每個(gè)實(shí)例都具備完整的內(nèi)存、緩存和計(jì)算核心。這極大地提升了GPU在云和數(shù)據(jù)中心環(huán)境中的利用率,讓多個(gè)用戶或工作負(fù)載能夠安全、高效地共享強(qiáng)大的算力。
- 突破性的互連帶寬:H100是全球首款支持PCIe 5.0和全新NVLink互連技術(shù)的GPU。特別是第四代NVLink,其互聯(lián)帶寬高達(dá)900GB/s,是上一代的1.5倍,為構(gòu)建巨型GPU集群、處理萬(wàn)億參數(shù)模型掃清了通信瓶頸。
超級(jí)計(jì)算機(jī):AI工廠的“廠房”與“裝配線”
僅有強(qiáng)大的“引擎”(GPU)還不夠,英偉達(dá)提供了完整的“廠房”解決方案——全新的超級(jí)計(jì)算機(jī)系統(tǒng)。
- DGX H100系統(tǒng):作為AI基礎(chǔ)設(shè)施的旗艦產(chǎn)品,單個(gè)DGX H100集成了8塊H100 GPU,通過(guò)第四代NVLink全互聯(lián),提供高達(dá)32 petaflops的AI性能。它是構(gòu)建企業(yè)內(nèi)部AI工廠的基石。
- Eos超級(jí)計(jì)算機(jī):英偉達(dá)宣布將打造一臺(tái)名為Eos的AI超級(jí)計(jì)算機(jī)。它預(yù)計(jì)將配備4608塊H100 GPU,AI計(jì)算性能可達(dá)驚人的18.4 exaflops,有望成為全球最快的AI超算之一。Eos不僅是英偉達(dá)自身研發(fā)的工具,更是其AI工廠理念的終極實(shí)體展示。
軟件棧:AI工廠的“操作系統(tǒng)”與“生產(chǎn)工具”
黃仁勛反復(fù)強(qiáng)調(diào):“我們是一家軟件公司。”硬件是基礎(chǔ),軟件才是釋放其潛力的關(guān)鍵。英偉達(dá)推出了覆蓋AI開(kāi)發(fā)生命周期全棧的軟件:
- NVIDIA AI Enterprise:這是一個(gè)端到端的云原生AI軟件平臺(tái),包含100多個(gè)框架、預(yù)訓(xùn)練模型和開(kāi)發(fā)工具,經(jīng)過(guò)優(yōu)化認(rèn)證,可在從云到數(shù)據(jù)中心的任何地方運(yùn)行。它簡(jiǎn)化了AI的部署與管理,是AI工廠的“操作系統(tǒng)”。
- 新一代CUDA與庫(kù):更新了CUDA計(jì)算平臺(tái),并推出了針對(duì)量子計(jì)算、基因組學(xué)等領(lǐng)域的專用庫(kù),持續(xù)擴(kuò)大加速計(jì)算的應(yīng)用生態(tài)。
- Omniverse與AI的結(jié)合:將Omniverse數(shù)字孿生平臺(tái)與AI工具深度集成,使企業(yè)能夠在虛擬世界中模擬、優(yōu)化和運(yùn)營(yíng)其物理世界的工廠、城市乃至整個(gè)供應(yīng)鏈,實(shí)現(xiàn)真正的智能決策。
深遠(yuǎn)影響:從“計(jì)算中心”到“智慧生產(chǎn)中心”
“AI工廠”這一概念的提出,標(biāo)志著數(shù)據(jù)中心角色的根本性轉(zhuǎn)變:
- 從成本中心到價(jià)值創(chuàng)造中心:傳統(tǒng)數(shù)據(jù)中心主要承載存儲(chǔ)與通用計(jì)算,是運(yùn)營(yíng)成本的一部分。而AI工廠則利用海量數(shù)據(jù),通過(guò)AI模型持續(xù)“生產(chǎn)”出洞察、預(yù)測(cè)、內(nèi)容(如圖像、文本、蛋白質(zhì)結(jié)構(gòu))等具有直接商業(yè)價(jià)值或科研價(jià)值的“產(chǎn)品”。
- 規(guī)模化與工業(yè)化AI:通過(guò)H100的極致性能、MIG的靈活切分以及企業(yè)級(jí)軟件的標(biāo)準(zhǔn)化,企業(yè)能夠像運(yùn)營(yíng)生產(chǎn)線一樣,規(guī)模化地開(kāi)發(fā)、部署和管理AI應(yīng)用,降低AI應(yīng)用門檻,提升投資回報(bào)率。
- 驅(qū)動(dòng)新一輪科技創(chuàng)新:H100提供的算力飛躍,使得訓(xùn)練更大、更復(fù)雜的模型成為可能,將直接推動(dòng)自然科學(xué)(如氣候科學(xué)、藥物研發(fā))、數(shù)字孿生、自動(dòng)駕駛等前沿領(lǐng)域的突破。
###
英偉達(dá)此次發(fā)布,并非簡(jiǎn)單的產(chǎn)品迭代,而是一次系統(tǒng)的生態(tài)升級(jí)。通過(guò)從芯片(H100)、系統(tǒng)(DGX/Eos)到軟件(AI Enterprise)的垂直整合,英偉達(dá)正在為全球企業(yè)構(gòu)建通往“AI工廠”時(shí)代的完整基礎(chǔ)設(shè)施。這預(yù)示著,未來(lái)企業(yè)的核心競(jìng)爭(zhēng)力,將很大程度上取決于其“AI工廠”的規(guī)模與效率。算力,正以一種前所未有的集中化和工業(yè)化形態(tài),成為驅(qū)動(dòng)數(shù)字文明進(jìn)步的新電力。