车讯网 - 专业汽车新闻资讯门户
当前位置: 车讯网 -> 热点

燧原科技发布云燧智算机,定义人工智能算力中心建设实践

时间:2022-09-03 17:36  |  责任编辑:沐瑶  |  来源: TechWeb  |  关键词:  |  阅读量:14152  |  

凝聚了随缘科技两代芯片的研发和多个大型人工智能计算中心的工程实践,面向大规模,集约化,绿色低碳的数据中心建设,云柜智能计算机正式发布。

日前,中国上海——在2022世界人工智能大会物尽其用,定义ai计算中心新实践云计算行业应用论坛上,随缘科技正式发布云韵智能计算机云智能计算机是针对大规模,密集型人工智能计算应用场景推出的高性能人工智能加速集群产品通过一站式预集成人工智能加速硬件,集成开发管理平台以及配套的人工智能应用软件和服务,可广泛应用于数字政府,科研院所,科技平台等企事业单位

基于随园科技过去几个大型AI计算中心的工程实践

作为在国内落地过千卡规模液冷AI集群的人工智能计算企业,随园科技第一,二代佳思芯片已实际应用于大规模AI集群项目,支持媒体生成,城市智能感知等多元化场景根据以往的实践,随缘科技发现,人工智能数据中心由于软件运维复杂,普遍存在方案选择困难,各厂商产品兼容性未知等痛点,数据中心部署交付周期长,沟通成本高,项目管理周期长

开箱即用,实现智能计算中心的卓越总拥有成本。

云智能计算机采用一体化设计,是专门为人工智能场景下的计算,存储,网络,软硬件协同设计的标准化产品它提供了高可用的整体安全设计,确保集群架构的扩展性能符合预期,并提供了包括采购,安装,运行和维护的交钥匙方案提供数据中心环境和IT计算资源的全面监控和管理,提升集群部署和测试的质量和效率,协助用户提升运营效率和降低运营成本,帮助用户提升运维价值,为用户实现AI计算中心从交付部署到后期上线和运维管理的卓越总拥有成本

全局优化,提供卓越的AI性能保障

云智能计算机代表了众多大规模工程实践形成的计算,网络和存储的整体设计:以全局优化为目标,基于计算,存储和管理网络分离,全互联,无阻塞的网络架构,结合高效的多级存储模式,以强大的佳思芯片和CPU的异构计算能力为支撑,云智能计算机可以提供

云智能计算机的总体设计

PUE = lt,1.1,满足新数据中心的要求。

基于两碳目标和绿色环保的大趋势,无论是新数据中心的规划建设,还是由东向西计算的政策要求,都对数据中心的整体能效有明确的优化指标要求云智能计算机采用集成冷板液冷技术,实现单个节点8个高性能人工智能芯片的液冷被冷却物体的热量通过液冷板等高效导热元件传递给自然制冷剂采用先进的流量控制系统,大大增加流量变化范围,降低能耗具有结构简单,系统可靠,智能监控的特点,PUE可降至1.1以下

搭载经过商业验证的AI芯片,软硬件一起使用。

突破E级计算能力,最高可支持超级千卡集群。

依托佳思芯片的核心能力,云智能计算机在典型配置下,可实现TF32浮点运算能力8PFLOPS台,支持按需横向扩展,可支持千卡集群,突破E级计算能力,打造业界领先的超级计算集群。

软件协作,充分释放集群的生产力价值

目前计算能力构成复杂,多CPU架构,多异构计算单元考虑到集群本身普遍服务于多用户,多场景,如何将下层计算能力异构性屏蔽于上层用户,赋能用户高效开发和部署在线AI应用,真正释放集群作为生产力工具的价值软件是关键因素

贵池智能计算平台是全栈人工智能开发服务平台,也是通用大规模计算管理平台结合强大的云端AI计算集群和先进的大规模计算资源调度,为用户提供人工智能模型制作和应用发布的全流程服务,可一站式满足复杂人工智能业务场景对人工智能服务的需求

贵池智suan平台

支持数千亿参数的庞大模型的高效并行训练。

大规模训练大参数的庞大模型是人工智能的发展方向预训练大模型+微调下游任务的模型开发模式,将大大提高企业AI应用开发的效率开发者只需要少量的行业数据,就可以快速开发出准确率更高,泛化能力更强的AI模型

训练一个大模型,除了算法和数据,还需要超大规模的计算支持基于云智能计算机的大规模集群解决方案采用高带宽,全互联的拓扑架构,计算,存储,管理网络完全分离基于GCU—拉雷2.0多核互连技术的计算节点内互连带宽接近1TB/s,跨节点互连能力高达600Gb/s,可实现千卡大规模集群的高速互连,并具有出色的线性加速比,以支持数千亿参数的庞大模型的效率和效能

随缘科技创始人,首席运营官张亚林表示,云贵智能计算机是一款全新的系统集成产品,融合了云贵训练推理产品在行业内的实践经验,旨在全面降低AI计算中心的部署和应用成本面向大规模,集约化,绿色低碳的数据中心建设我们始终专注于客户的价值和体验,致力于为客户提供完整易用的人工智能系统软硬件产品,同时积极响应绿色低碳高质量发展的国家战略目标