产品

PRODUCT

AI服务器

推理型服务器SH822

- 生态开放 灵活应用

- 面向AIGC极致性能

- 稳定可靠 持续服务

- 全新架构 全面增强

推理型服务器SH822

产品参数

  • CPU

    搭载2颗Intel Xeon 6430‌处理器,每颗拥有‌32物理核心‌,基础频率2.1GHz

  • GPU

    配置8块燧原三代S60推理卡,基于PCIe 4.0×16接口

  • 内存

    配置‌32根三星64GB DDR5 RECC内存条,运行频率 ‌4800MHz‌,总容量 ‌2TB‌,支持纠错编码(ECC)与寄存式模块(RDIMM)

  • 系统盘

    配置2×480GB SATA SSD‌,采用RAID 1模式(默认)

  • 数据盘

    配置4×3.84TB U.2 NVMe SSD‌,基于PCIe Gen4接口,最高读写速度可达7GB/s

  • 带外管理网络

    提供‌IPMI 2.0标准,基于‌ASPEED AST2600 BMC芯片‌,通过‌1个1G RJ45电口,实现硬件级远程监控、固件更新与故障诊断

  • 电源

    配置4个2700W功率白金交流电源,支持‌N+N冗余架构‌,总峰值功率‌10.8kW‌

  • 存储控制器

    支持选配RAID卡,支持 ‌RAID 0/1/10/5/6/50/60‌,提供数据冗余与I/O加速

  • 网络

    支持Mellanox MCX512A-ACAT双端口25Gb以太网网卡,配备2个SFP28光纤接口,通过PCI Express 3.0×8总线接口连接服务器主板

  • 接口

    包含‌6×USB 3.0‌端口‌(外设连接)、‌2×VGA接口‌(多屏输出)、‌1×串口(RS-232)‌(设备调试)、‌1×HDMI管理网口‌(BMC视频输出)、‌1×Type-C Debug口‌(系统诊断)

产品优势

卓越算力

基于燧原GCU320芯片,支持FP32、FP16、BF16、INT8多种精度计算,Llama-13B等大模型推理时,精度、首字延迟及tokens吞吐率达国际同等领先水平

超低延迟

高并发场景下保持毫秒级低延时响应,满足“AI换装”等实时交互应用需求

框架兼容性强

广泛适配TensorFlow、PyTorch等主流框架,已部署DeepSeek-V3/R1等大模型,适用于文本生成、搜索推荐、多模态识别等场景

产品应用场景

国产化

国产化AI基础设施
(如教育、能源领域)

智能终端

边缘智能终端
(如无人零售、智能工厂)