英伟达颁发史上最大的GPU芯片清点GTC202完美电竞4上的重磅硬件产物

 行业动态     |      2024-03-29 14:21:38    |      小编

  人为智能进入天生式AI阶段,大模子正在给企业带来更高处事出力的同时,也对算力提出了更高的哀求。为了然决算力带来的寻事,正在本年的GTC2024上,英伟达重磅发表了全新的

  与此同时,基于NVIDIA GB200 Grace Blackwell 超等芯片和诸多更始本领与产物完美电竞,NVIDIA还发表了更健旺的新一代AI超等揣测机——NVIDIA DGX SuperPOD,不妨用于管理万亿参数模子,并拥有络续的平常运转功夫硬件产品,以告竣超大范畴天生式AI练习和推理处事负载。

  那么,被英伟达黄仁勋称之为更大GPU的NVIDIA GB200 Grace Blackwell 超等芯片,以及基于此打造的超等揣测机,都有哪些亮眼的本领?让咱们一道来看一下。

  家喻户晓,大模子之是以“大”,是由于它有着宏大的参数。以谷歌LaMDA模子为例,其参数高达1370亿。别的,GPT-3模子参数高达1750亿,GPT-4更是被曝包蕴了1.8万亿参数,而范畴越大,对算力的需求便越多,如练习GPT3.5需求用到约3万颗英伟达A100芯片。

  GTC 2024上,黄仁勋以OpenAI最进步的1.8万亿参数大模子为例,先容了其需求的算力情形。据先容,该模子需求几万亿的Token实行练习,万亿参数与数万亿的Token相乘,即是练习OpenAI最进步大模子所需的揣测范畴硬件产品。黄仁勋现场估算其揣测范畴为3×1025,假设使用一颗petaflop(每秒钟实行1000万亿次运算)量级的GPU实行运算,需求1000年的功夫才智实行。

  为了然决算力题目,NVIDIA正式推出了GB200 Grace Blackwell大芯片。之是以称之为“大”,不但再现正在其具有目今GPU中最大的晶体管数目,供应了目前最高的揣测职能完美电竞,并且其具有目前最大的GPU物理面积。

  跟往年相似,正在GTC2024上黄仁勋同样对GB200 Grace Blackwell芯片实行了显现。他从口袋里掏出一块Blackwell芯片,将它与Hopper芯片并排举起。可能看到,后者显著要幼极少。黄仁勋表现完美电竞,咱们需求更大的GPU,Blackwell平台即是为了应对这一寻事而修筑的。

  除了具有健旺的揣测职能除表,NVIDIA GB200 Grace Blackwell超等芯片还采用了以下五大中央本领:

  1)第二代Transformer引擎:得益于全新微张量缩放声援,以及集成于NVIDIA TensorRT™-LLM和NeMo Megatron框架中的NVIDIA进步动态规模治理算法,Blackwell将正在新型4位浮点AI推理本事下告竣算力和模子巨细翻倍。

  2)第五代NVLink:为了提拔万亿级参数模子和搀杂专家AI模子的职能,最新一代NVIDIA NVLink®为每块GPU供应打破性的1.8TB/s双向模糊量,确保多达576块GPU之间的无缝高速通讯,满意了当今最繁复LLM的需求。

  3)RAS引擎:采用Blackwell架构的GPU包蕴一个用于保证牢靠性、可用性和可保卫性的专用引擎。其它,Blackwell架构还增进了多项芯片级功效,不妨使用AI提防性保卫来运转诊断并预测牢靠性闭联的题目。这将最大水准地耽误体例平常运转功夫,降低大范畴AI陈设的弹性,使其不妨陆续不间断运转数周甚至数月,同时低落运营本钱。

  4)安好AI:进步的秘密揣测功效可能正在不影响职能的情形下回护AI模子和客户数据,而且声援全新当地接口加密合同,这看待医疗、金融任事等高度珍重隐私题主意行业至闭要紧。

  5)解压缩引擎:专用的解压缩引擎声援最新体例,通过加快数据库盘问供应极其健旺的数据领悟和数据科学职能。

  数据显示,Blackwell不妨正在具有高达10万亿参数的模子上告竣AI练习和及时LLM推理。

  除了高职能的揣测芯片除表,跟着数据量的爆炸式增加,搜集相连正在天生式AI期间也变得至闭要紧。

  正在GTC 2024上,NVIDIA发表了Quantum-X800 InfiniBand搜集和NVIDIA Spectrum™-X800 以太搜集,以及配套的开荒软件。据了然,这是环球首批高达 800Gb/s 端到端模糊量的搜集平台,进一步加快了各式数据核心中的AI、云、数据管理和高职能揣测(HPC)使用。

  Spectrum-X800平台包蕴Spectrum SN5600换取机和NVIDIA BlueField-3 SuperNIC,专为多租户情况打造硬件产品,不妨为多租户天生式AI云和大型企业级用户供应各式至闭要紧的进步功效,进而缩短AI办理计划的开荒、陈设和上市功夫。

  正在软件方面,NVIDIA供应面向万亿参数级AI模子职能优化的搜集加快通讯库、软件开荒套件和治理软件等全套软件计划。个中的NVIDIA纠合通讯库(NCCL)可将GPU的并行揣测义务扩展到Quantum-X800搜集,使用其基于SHARPv4的健旺搜集揣测本事和对FP8的声援,为大模子练习和天生式AI供应超强的职能完美电竞。

  数据显示,正在FP4精度下可供应11.5 exaflops的AI超等揣测职能和240 TB的急速显存,且可通过增进机架来扩展职能。与NVIDIA H100 Tensor Core GPU比拟,GB200超等芯片正在大措辞模子推理处事负载方面的职能提拔了高达30倍。

  研商到功耗和散热题目,全新的DGX SuperPOD采用新型高效液冷机架级扩展架构,不妨更好地降低散热出力,确保运转宁静性的同时完美电竞,低落整个具有本钱。

  说到超等揣测机,黄仁勋表现,NVIDIA DGX AI超等揣测机是推动AI资产改革的工场。新一 DGX SuperPOD集NVIDIA加快揣测、搜集和软件方面的最新开展于一体,不妨帮帮区其余行业和企业美满并天生本身的AI。

  写正在结果:无论是史上最大的GPU芯片,如故不妨管理万亿参数的最强揣测机,以及具有800Gb/s端到端模糊量的搜集平台,每一款产物都有着分表亮眼的参数。可能说,本届GTC上发表的每一款硬件产物,都吸引了多人的眼球。当然,这些产物正在天生式AI使用场景下的再现何如,让咱们拭目以待吧!英伟达颁发史上最大的GPU芯片清点GTC202完美电竞4上的重磅硬件产物