推理型服务器SH822

产品

PRODUCT

AI服务器算力Pod 算力集装箱

首页产品 AI服务器推理型服务器SH822

AI服务器

推理型服务器SH822

- 生态开放灵活应用

- 面向AIGC极致性能

- 稳定可靠持续服务

- 全新架构全面增强

推理型服务器SH822

产品参数

CPU

搭载2颗Intel Xeon 6430‌处理器，每颗拥有‌32物理核心‌，基础频率2.1GHz
GPU

配置8块燧原三代S60推理卡，基于PCIe 4.0×16接口
内存

配置‌32根三星64GB DDR5 RECC内存条，运行频率 ‌4800MHz‌，总容量 ‌2TB‌，支持纠错编码（ECC）与寄存式模块（RDIMM）
系统盘

配置2×480GB SATA SSD‌，采用RAID 1模式（默认）
数据盘

配置4×3.84TB U.2 NVMe SSD‌，基于PCIe Gen4接口，最高读写速度可达7GB/s
带外管理网络

提供‌IPMI 2.0标准，基于‌ASPEED AST2600 BMC芯片‌，通过‌1个1G RJ45电口，实现硬件级远程监控、固件更新与故障诊断
电源

配置4个2700W功率白金交流电源，支持‌N+N冗余架构‌，总峰值功率‌10.8kW‌
存储控制器

支持选配RAID卡，支持 ‌RAID 0/1/10/5/6/50/60‌，提供数据冗余与I/O加速
网络

支持Mellanox MCX512A-ACAT双端口25Gb以太网网卡，配备2个SFP28光纤接口，通过PCI Express 3.0×8总线接口连接服务器主板
接口

包含‌6×USB 3.0‌端口‌（外设连接）、‌2×VGA接口‌（多屏输出）、‌1×串口（RS-232）‌（设备调试）、‌1×HDMI管理网口‌（BMC视频输出）、‌1×Type-C Debug口‌（系统诊断）

产品优势

卓越算力

基于燧原GCU320芯片，支持FP32、FP16、BF16、INT8多种精度计算，Llama-13B等大模型推理时，精度、首字延迟及tokens吞吐率达国际同等领先水平

超低延迟

高并发场景下保持毫秒级低延时响应，满足“AI换装”等实时交互应用需求

框架兼容性强

广泛适配TensorFlow、PyTorch等主流框架，已部署DeepSeek-V3/R1等大模型，适用于文本生成、搜索推荐、多模态识别等场景

产品应用场景

国产化

国产化AI基础设施
（如教育、能源领域）

智能终端

边缘智能终端
（如无人零售、智能工厂）