百亿亿次时代的异构运算挑和很大,需要全新的CPU、GPU,也需要新的缓存、内存、互线,更需要帮帮开辟者简化开辟,跨平台、跨系统编程,所以英特尔正在推出性的计较架构之后,同时也加强了软件开辟,oneAPI同一编程模子也是沉中之沉。
继本年4月新一代FPGA产物Agilex发布、6月台北电脑展10nmIceLake处置器发布、到日前进一步披露的“极光”(Aurora)超等计较机架构的更多详情,英特尔六大手艺支柱从多方位不竭驱动计较财产的立异,实现机能指数级增加。
英特尔的X86处置器占领了全球超算市场的绝大大都份额,可是英特尔并没有止步于此,将来10年甚至50年中,要想满脚HPC高机能计较及AI人工智能等多样化的计较需求,人们需要扩展更多的异构运算,这是实现指数级增加的环节。
英特尔开辟的极光超算不只仅是面向HPC高机能计较的,同时AI人工智能运算也是它的沉点,要同时兼顾这两品种型的计较,英特尔为此研发了全新的基于Xe架构的GPU,同时还初次使用了新一代的7nm工艺,这是整个百亿亿次超算的焦点所正在。
E级超算正在人类汗青上仍是初次,它的呈现会大大加快人类研究科技的前进,由于E级超算不只机能10-20倍于现有的超算,并且能效更高,此中极光的能效是当前超算的6倍多,阿贡国度尝试室从任保罗·卡恩斯(PaulKearns)暗示,“极光系统的建立为支撑新一代AI,并通过连系高机能计较和AI来处理现实问题,好比改善极端气候预告、加快医疗、绘制人类大脑图谱、开辟新材料以及加深领会等。”
英特尔正在oneAPI上会采纳、开源的策略,DPC++言语和库等都向利用,而其它硬件厂商能够建立本人的oneAPI实现并基于此对特定硬件进行优化。英特尔也激励其它硬件厂商利用,
按照英特尔所说,基于Xe架构的GPU是一个很是矫捷、扩展性极强的同一架构,并针对性地划分成多个微架构,从而可用于几乎所有计较、图形范畴,包罗百亿亿次高机能计较、深度进修取锻炼、云办事、多编纂、工做坐、、轻薄笔记本、便携设备等等。
不外十亿亿次级此外超算曾经到了最初关头了,中国、美国、欧盟及日本都正在憋大招,争相推出百亿亿次超算,也就是E级超算,此中英特尔担任扶植的是美国能源部部属阿贡国度尝试室的Aurora极光超算。
为什么会有oneAPI?说起来也很简单,英特尔不但是有X86CPU及方才推出的基于Xe架构的GPU,还有Mobileye自驾芯片、Movidius视觉计较芯片、AgilexFPGA芯片及Nervana神经收集芯片,能够说是当前异构计较的集大成者。
英特尔具有了目前几乎所有的计较芯片,能够给客户供给各品种型的选择,可是价格就是分歧芯片各自为和,导致不克不及通用,开辟也比力分离,而oneAPI就是一个同一的、简化的编程模子,旨正在简化跨多架构的开辟过程(如CPU、GPU、FPGA、加快器)。
正在英特尔的六大手艺支柱中,软件是处于最上层的,它是跟全球数万万开辟者最亲近的支柱,指的可不是某种使用软件,而是英特尔全新的软件开辟策略——oneAPI,同一的跨架构编程模子。英特尔认为,对于全新硬件架构的每一个数量级的机能提拔潜力,软件能带来两个数量级的机能提拔。对于开辟者来说,具有一套操纵好英特尔芯片的通用东西集,对于获得机能的指数级扩展至关主要。
PonteVecchio将采用英特尔7nm工艺进行制制,并将成为英特尔首款基于Xe架构的GPU,可为高机能计较和人工智能工做负载进行优化。
此外,它还采用英特尔Foveros3D和嵌入式多芯片互连桥接(EMIB)立异封拆手艺,以及多种其它手艺,如HBM高带宽存储器、CXL互连手艺以及其它专利手艺,完满地融合了英特尔的六大手艺。
用于HPC及AI运算的高机能基于Xe架构的GPU,代号为“PonteVecchio”,专为高机能计较建模、模仿工做负载以及人工智能锻炼而设想,最多可扩展到1000个EU运算单位,并且每个单位都是全新设想的,FP64双精度浮点计较能力是现正在的40倍。
正在整个极光超算上,每个计较节点包罗了两颗英特尔10nm至强可扩展处置器(代号SapphireRapids)、六个PonteVecchio GPU,全体支撑跨越10PB内存、跨越230PB存储容量,并能通过CraySlingshot手艺毗连200多个机架的节点。
英特尔中国研究院宋继强之前提出过,计较需求无处不正在,并且日益多样化,CMOS缩放、3D工艺手艺、新架构、新功能等将继续鞭策摩尔定律向前成长,可是任何单一要素都不成能再满脚多元化的将来计较需求,而基于六大手艺支柱的指数级立异,将是英特尔进入将来10年甚至下一个50年的驱动力。
为了驱逐以数据为核心的时代,应对由人工智能、收集变化、云计较、数据核心等新消息时代所带来的多元化高机能计较需求,英特尔客岁底颁布发表了全新的手艺计谋——六大手艺支柱,别离从制程和封拆、架构、内存和存储、互连、平安、软件这六大手艺上满脚全新计较的要求。
对开辟者来说,oneAPI供给了一个通用、的编程体验,闪开发者能够选择架构,无需正在机能上做出,也大大降低了利用分歧的代码库、编程言语、编程东西和工做流程所带来的复杂性。
极光超算利用了新一代的10nm至强CPU及全新开辟的基于Xe架构的GPU“PonteVecchio”,还有EMIB、Foveros先辈封拆手艺,缓存、内存也会操纵到新一代分歧性缓存架构RamboCache及傲腾可持久内存(OptaneDC),毗连多个系统单位的总线也是基于CXL的新一代手艺。
英特尔以数据为核心的芯片产物组合和新发布的oneAPI打算,为百亿亿次级计较奠基了基石。而极光超算成了又一个英特尔六大手艺支柱鞭策异构计较愿景落地的典型。
英特尔的夸姣愿景正在极光超算上可谓一个完满落地,这台超算不只是首屈一指的百亿亿次平台,也注释了英特尔的六大手艺支柱——供给多样化的标量、矢量、矩阵和空间架构组合,以先辈制程手艺进行设想,由性内存取存储条理布局供给支撑,通过先辈封拆集成到系统中,利用光速互连进行超大规模摆设,供给同一的软件开辟接口以及平安功能。我们也等候看到更多基于六大手艺支柱打制的产物上市,引领财产更好地处理多元化高机能计较需求的挑和。
正在SC19大会上,54期TOP500超算排行榜发布了,这一次TOP10的超算比拟6月份的没有什么变化,利用英特尔X86处置器的系统仍然占领90%以上的份额,机能最强的超算峰值机能达到了20亿亿次。
对英特尔来说,极光超算一方面要关心HPC高机能计较,一方面还要照应到新兴的AI人工智能,这两种要求对超算系统的要求并纷歧样,新一代百亿亿次超算的挑和很大,火急需要多元化的计较。