欧宝APP张信哲代言:访中科曙光智能计算技术总监许涛:重新认识面向未来的AI服务器和云计算中心

本文摘要:8张NVIDIAGPU,10卡训GPU,20卡推理小说加速卡。

8张NVIDIAGPU,10卡训GPU,20卡推理小说加速卡。底板采用CPU主板和GPU解法耦合设计,可根据CPU和GPU的发展各自独立国家的升级,降低用户的更新成本。

发布会后,与中科曙光智能计算技术负责人许涛展开了理解的交流对话,了解了中科曙光在产品和市场上的思考。重新认识高性能AI服务器对很多人来说,高性能计算产品和传统服务器可能没有什么区别,象征着专业级、企业级等矮小的定位。但是,在对话中,以高计算力为市场需求的产品已经从传统服务器的独立国家出发,其设计方式与传统服务器相当不同。

许涛解释说,两者的主要区别在于传统服务器的功耗密度相对较低,而人工智能服务器等高性能计算产品的功耗非常低。目前,人工智能服务器的额定功率已经超过3200瓦。新一代HGX产品的参考功率可以称为单台10千瓦以上。与传统的机架式和刀片式服务器相比,它们更多。

低功耗也给发热量带来了新的挑战,这是AI服务器和传统服务器的仅次之差。在设计AI服务器的时候,供电和粉丝是一个需要重点考虑的问题,适当的兼容性和稳定性拒绝也不会太相同。

GPU加速卡频繁出现时,单卡的消耗量不到250瓦,但现在已经超过300瓦,根据现在的趋势,加速卡的消耗量不会随着时间的推移而变高张加速卡消耗量超过350瓦时,传统的服务器结构很难满足。在这么低的压力下,单个机柜中可以放置的服务器数量非常有限。许涛对我们说:3200瓦的AI服务器,一般的电信室单柜不能敲两台,20千瓦容量的高级水冷室也不能敲六台。

综合考虑实际配置情况后,找到4U是合理的AI服务器尺寸。XMachine的GPU仓库高度为3U,不仅粉丝空间大,还为未来的确保提供了相当大的空间。对于个人工作站,中科曙光在最近的W560-G30产品中也使用了改良设计的3段风扇方案:GPU区域:RTX6000显示卡消耗量约300瓦,享受专业风扇空间,IPMI功能正确加载显示卡状态,管理显示卡消耗量和风扇散热,控制适当的风扇风量,在确保显示卡风扇的同时,将办公环境下的噪音传输到低于2张显示卡CPU区域:反对从2个物理中心到强大的白金CPU,每个CPU的功耗约为205瓦的2个CPU风道相互隔离,每个CPU都有独立的国家,CPU可以在高功耗下顺利工作,承受更多的超频空间。

电源区域:7*24小时可顺利获得1250瓦供电能力的白金电源,设计有电源的独立国家风道时,放置在数据中心时,可以反对检查电源和基于BMC的远程管理功能,合并成为高性能GPU服务器。灵活应对百花齐放的推理小说末端市场随着异构计算的流行,现在HPCToptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptoptopt据了解,目前NVIDIA已基本垄断了人工智能计算的培训基础市场,但在与用户应用于特别密切的推理小说基础上,GPU作为标准化计算单元的优势不会被巩固。

NVIDIA向推理小说末端市场发表了T4计算卡,但Intel、赛灵思、寒武纪等公司仍在大力拓展这一领域。根据说明,XMachine系列AI服务器在设计上可以与各种加速器产品相容,这些芯片在市场上有序,中科曙光的未来在不同的场合发售不同的加速芯片服务器,看终端用户的表现意见。在文字处理和信息导游等业务中,传统的CPU的运算效率也很好,如果是必须猎杀黄金窗口期的商业化公司,NVIDIAT4这样的GPU加速产品可以让公司立即在线。

许涛为我们详细分析了一些不同的情况。对于有类似业务市场需求的定制客户来说,他们必须经常立即改变业务逻辑。

在这种情况下,FPGA似乎更合适。之后,许涛特别提到寒武纪科学技术今年5月3日发表的第一张云智能芯片MLU100和对应的云AI计算卡,缺乏国产AI芯片的理解误区。他回答说,寒武纪MLU100芯片与NVIDIA的P4/T4加速卡的设计理念大不相同,两者在计算能力方面没有必要进行比较。寒武纪MLU100芯片用于AI框架和技术非常专业,可以慢慢构建CNN、RNN等各种卷积过程,效果非常好,在特定推理小说市场上给用户带来更好的加速。

如果是适合非常密切的研究型用户,寒武纪MLU100芯片可以在其特定环境下充分发挥计算能力。不用担心模仿中科曙光这次发表的XMachine系列AI服务器,使用CPU底板和GPU底板解法耦合的设计,将来可以以模块化行独立的国家升级,降低用户的更新成本,最大限度地维持投资。因此,我们不可避免地担心这种灵活的创造性设计不会被其他服务器制造商模仿吗?关于这个问题,许涛很热情。如果其他公司知道模仿我们的机器,就说明我们引导了这个市场。

据报道,以前国内GPU服务器的来源基本上是OEM或ODM,但随着时间的推移,技术输出更加困难,这些产品很难适应国内各种定制市场的需求。许涛坦白说,中科曙光不是国内首家发售GPU服务器的制造商,但他们希望最差,或者在擅长的行业最差。为了使产品始终保持先进设备的结构和结构,必须不时开展技术进化。产品成熟期的过程是反复返回的过程。

从我们自己的角度来看,现在的产品不应该是终极的,应该有新的版本,用户应用于场景,或者应该限于新技术的发展。许涛说:模仿是无法防止的,但在其他公司模仿的过程中,我们自己也有时进化,不用担心产品被模仿。同时,随着技术的更新,很多技术要素都很难模仿。

中科曙光除了与NVIDIA合作外,还与寒武纪等其他国产芯片合作,在合作过程中必须投入大量的技术资源和测试资源,这些投入不能构筑非常简单的模仿机械硬件。从这个水平来看,我们希望他们能模仿。如果其他公司知道模仿我们的机器,说明我们引导了这个市场。面向未来的云计算中心和先进的设备计算平台,云计算已经像过去一样停留在各种文章中,随着认可度的提高,专用云平台和标准化云平台也逐渐落地,各种企业都不想为这个资源花钱。

中科曙光的AI战略规划相当大,一方面中科曙光拥有AI服务器自己的基础硬件产品,另一方面在硬件产品的基础上设计设施软件,享受自己的云计算中心和先进的设备计算平台。云计算中心不仅可以为用户获得计算资源,还希望通过虚拟技术,帮助有独特意见的用户构建创新。(公共编号:)中科曙光在云计算领域的,成都、无锡、南京、张家口等地有为政府服务的城市云计算中心。

但许涛正确地说,云计算中心也必须随着时代的发展而不时进化,随着普及度的提高,只要停留在传统的发展模式下,未来的竞争力就不会更弱。从我们的角度来看,我们更期待在一些类似领域或行业提供专业的云服务。许涛说:中科曙光的体积不能与BAT这个标准化的云平台对抗。

他们的框架非常大,可以牵引很多业务,但对我们来说,想维持业务的先进性,不能在几个类似的领域和业界领先。为用户提供特别简化的服务,使我们的优势难以被标准化的云平台模仿。这是正确的发展方向,也是我们眼中未来的云计算市场。

许涛说。原始文章允许禁止发布。下一篇文章发表了注意事项。

本文关键词:欧宝app官网下载,欧宝APP张信哲代言

本文来源:欧宝app官网下载-www.gzdeepblue.com

相关文章

网站地图xml地图