更开放,更懂AI,新华三发布多元异构算力平台
2024/05/20
紫光股份旗下新华三集团发布全新多元异构算力平台H3C UniServer R5330 G7和H3C UniServer R5500 G7服务器,以多元异构、开放包容、灵活等多重优势,提供高性能、高可靠的多元算力,为不同AI负载提供强劲算力支撑,为数字经济高质量发展提供坚实后盾。
智能算力 H3C UniServer R5500 G7服务器
为AI而生 模块化设计打造及至算力
“百模大战”热潮下,大模型的训练及推理过程均需要强大的算力作为支撑。H3C UniServer R5500 G7服务器是专为AI大模型训练而设计的智能算力旗舰新品,支持千亿级参数规模的大模型训练。产品采用系统解耦的模块化设计,兼容新OCP OAI开放硬件标准,实现算力开放和可进化;通过搭载2颗新处理器以及新一代OAM 8-GPU模组,为AI大模型训练提供算力与互联带宽,加速AGI时代到来。算力旗 舰,助力AI大模型训练:
-
支持超过15种、千亿级参数主流大模型训练,覆盖AIGC、计算机视觉、自然语言处理和大数据分析等多种AI应用场景。
-
采用模块化设计,用户可灵活选择GPU计算模块,提高系统的可扩展性和可维护性,节省成本。
-
GPU模组算力可提升200%,Llama2-70B增量预训练仅需15天。
生态兼容,AI业务平滑迁移:
-
主流开源大模型一键迁移,客户模型零代码改动。
-
CUDA底层原生兼容,算子库兼容可达95%以上。
-
适配国内外主流深度学习框架,原生适配国产飞桨深度学习框架。
可靠,算力管理智能灵活:
-
CPU、GPU模组、BMC芯片等核心部件支持国产化,供应可靠。
-
结合傲飞算力平台,可实现万卡集群算力统一调度,算力高 效率使用。
-
算力资源统一管理、监控、告警,智能灵活。

自主算力引擎H3C UniServer R5330 G7服务器
直面异构算力 性能助力AGI时代
随着多元异构算力的广泛应用,伴随而来的诸多挑战也逐渐浮现。由于不同厂商硬件存在计算架构、缓存资源、互联方式等差异,限制了算力资源的充分使用和灵活调度。新华三集团发布的自主算力引擎产品——H3C UniServer R5330 G7服务器,搭载2颗新处理器+GPU异构算力,可解决异构算力部署的技术难题;CUDA算子库支持95%以上,让底层适配更加便捷,实现生态无缝迁移;开放包容,异构赋能,为不同AI负载提供强劲算力支撑。训推一体,AI开发新范式:
-
对比上一代GPU,大模型训练场景下的AI算力提升超过30%,显存容量提升100。
-
大模型推理场景仅需单台8-GPU便可支持在100用户同时访问情况下达到15 token/s,提供更快的服务响应速度。
-
支持多元GPU异构算力大模型混合部署,更具灵活性,为用户提供更多选择。
生态开放,AI业务快速部署:
-
CUDA算子库支持95%以上,用户代码零改动。
-
支持200种以上主流AI模型,软件栈兼容国内外主流生态,支持原生社区分布式训练方案。
-
覆盖通用计算、FFT(快速傅里叶变换)等多种计算模式。
异构赋能,实现智能算力调度:
-
结合傲飞算力平台,可实现万卡集群算力统一调度。
-
提供模型训练、微调、评估、推理全流程服务。
-
支持AI算力资源统一管理、监控、告警,让运维更智能、更灵活。
