产品
PRODUCT
AI服务器
推理型服务器SH822
- 生态开放 灵活应用
- 面向AIGC极致性能
- 稳定可靠 持续服务
- 全新架构 全面增强
产品参数
-
CPU
搭载2颗Intel Xeon 6430处理器,每颗拥有32物理核心,基础频率2.1GHz
-
GPU
配置8块燧原三代S60推理卡,基于PCIe 4.0×16接口
-
内存
配置32根三星64GB DDR5 RECC内存条,运行频率 4800MHz,总容量 2TB,支持纠错编码(ECC)与寄存式模块(RDIMM)
-
系统盘
配置2×480GB SATA SSD,采用RAID 1模式(默认)
-
数据盘
配置4×3.84TB U.2 NVMe SSD,基于PCIe Gen4接口,最高读写速度可达7GB/s
-
带外管理网络
提供IPMI 2.0标准,基于ASPEED AST2600 BMC芯片,通过1个1G RJ45电口,实现硬件级远程监控、固件更新与故障诊断
-
电源
配置4个2700W功率白金交流电源,支持N+N冗余架构,总峰值功率10.8kW
-
存储控制器
支持选配RAID卡,支持 RAID 0/1/10/5/6/50/60,提供数据冗余与I/O加速
-
网络
支持Mellanox MCX512A-ACAT双端口25Gb以太网网卡,配备2个SFP28光纤接口,通过PCI Express 3.0×8总线接口连接服务器主板
-
接口
包含6×USB 3.0端口(外设连接)、2×VGA接口(多屏输出)、1×串口(RS-232)(设备调试)、1×HDMI管理网口(BMC视频输出)、1×Type-C Debug口(系统诊断)
产品优势
卓越算力
基于燧原GCU320芯片,支持FP32、FP16、BF16、INT8多种精度计算,Llama-13B等大模型推理时,精度、首字延迟及tokens吞吐率达国际同等领先水平
超低延迟
高并发场景下保持毫秒级低延时响应,满足“AI换装”等实时交互应用需求
框架兼容性强
广泛适配TensorFlow、PyTorch等主流框架,已部署DeepSeek-V3/R1等大模型,适用于文本生成、搜索推荐、多模态识别等场景
产品应用场景
国产化AI基础设施
(如教育、能源领域)