更开放，更懂AI，新华三发布多元异构算力平台

2024/05/20

紫光股份旗下新华三集团发布全新多元异构算力平台H3C UniServer R5330 G7和H3C UniServer R5500 G7服务器，以多元异构、开放包容、灵活等多重优势，提供高性能、高可靠的多元算力，为不同AI负载提供强劲算力支撑，为数字经济高质量发展提供坚实后盾。

智能算力 H3C UniServer R5500 G7服务器
为AI而生模块化设计打造及至算力

“百模大战”热潮下,大模型的训练及推理过程均需要强大的算力作为支撑。H3C UniServer R5500 G7服务器是专为AI大模型训练而设计的智能算力旗舰新品，支持千亿级参数规模的大模型训练。产品采用系统解耦的模块化设计，兼容新OCP OAI开放硬件标准，实现算力开放和可进化；通过搭载2颗新处理器以及新一代OAM 8-GPU模组，为AI大模型训练提供算力与互联带宽，加速AGI时代到来。算力旗舰，助力AI大模型训练：

支持超过15种、千亿级参数主流大模型训练，覆盖AIGC、计算机视觉、自然语言处理和大数据分析等多种AI应用场景。
采用模块化设计，用户可灵活选择GPU计算模块，提高系统的可扩展性和可维护性，节省成本。
GPU模组算力可提升200%，Llama2-70B增量预训练仅需15天。

生态兼容，AI业务平滑迁移：

主流开源大模型一键迁移，客户模型零代码改动。
CUDA底层原生兼容，算子库兼容可达95%以上。
适配国内外主流深度学习框架，原生适配国产飞桨深度学习框架。

可靠，算力管理智能灵活：

CPU、GPU模组、BMC芯片等核心部件支持国产化，供应可靠。
结合傲飞算力平台，可实现万卡集群算力统一调度，算力高效率使用。
算力资源统一管理、监控、告警，智能灵活。

自主算力引擎H3C UniServer R5330 G7服务器
直面异构算力性能助力AGI时代

随着多元异构算力的广泛应用，伴随而来的诸多挑战也逐渐浮现。由于不同厂商硬件存在计算架构、缓存资源、互联方式等差异，限制了算力资源的充分使用和灵活调度。新华三集团发布的自主算力引擎产品——H3C UniServer R5330 G7服务器，搭载2颗新处理器+GPU异构算力，可解决异构算力部署的技术难题；CUDA算子库支持95%以上，让底层适配更加便捷，实现生态无缝迁移；开放包容，异构赋能，为不同AI负载提供强劲算力支撑。训推一体，AI开发新范式：

对比上一代GPU，大模型训练场景下的AI算力提升超过30%，显存容量提升100。
大模型推理场景仅需单台8-GPU便可支持在100用户同时访问情况下达到15 token/s，提供更快的服务响应速度。
支持多元GPU异构算力大模型混合部署，更具灵活性，为用户提供更多选择。

生态开放，AI业务快速部署：

CUDA算子库支持95%以上，用户代码零改动。
支持200种以上主流AI模型，软件栈兼容国内外主流生态，支持原生社区分布式训练方案。
覆盖通用计算、FFT（快速傅里叶变换）等多种计算模式。

异构赋能，实现智能算力调度：

结合傲飞算力平台，可实现万卡集群算力统一调度。
提供模型训练、微调、评估、推理全流程服务。
支持AI算力资源统一管理、监控、告警，让运维更智能、更灵活。