薪火科技GPU服务器,是具备卓越多元算力性能、极致弹性架构扩展的全新一代人工智能服务器。可定制英特尔+英伟达GPU服务器,高算力、高显存,极高的性价比。也可支持华为鲲鹏+昇腾加速卡方案,全国产,符合国企安全合规要求。另外还有deepseek一体机,附带RAG知识库管理系统。可应用于AI计算、人工智能大模型、算法训练推理、科学计算、3D图形、渲染和视频应用等场景。
可选择仅购买服务器硬件,也可支持常见的数十种AI识别算法,DS大模型以及RAG知识库管理系统,支持定制开发。薪火科技作为人工智能资深行业专家,对深度学习、AI算法训练、AI大模型应用,提供免费技术支持。服务器配件、GPU显卡、机箱外壳、算法、大模型,都可按需定制。
英特尔CPU+英伟达GPU服务器
|
|
CPU/处理器 |
至强CPU 12核24线程-36核72线程 |
内存 | 64G-128G |
系统盘 | 1T固态硬盘 |
数据盘 | 6T机械硬盘 |
GPU显卡 |
可支持1-8张显卡 单张卡显存16-22G 总显存数可高达176G |
操作系统 | centos / ubuntu |
电源 | 双电源 |
机箱 | 4U |
网卡 | 千兆 双口网卡 |
华为鲲鹏CPU+昇腾算力卡服务器
|
|
CPU/处理器 | 2 × 鲲鹏 920 |
内存 | 4 × 32GB/DDR4/ECC/REG |
系统盘 | 1T固态硬盘 |
数据盘 | 6T机械硬盘 |
网卡 | 2个RJ45千兆以太网口 |
操作系统 | 银河麒麟 |
AI加速卡 |
4× Atlas 300I Pro ; 单卡显存24 GB; 单卡算力140 TOPS INT8; |
电源 | 2 × 1500W电源 |
阵列卡 | RAID 0 / 1 / 10 / 5 / 50 / 6 / 60 等 |
满血版DS大模型一体机
|
||||
部件规格 1 | 部件数量 | 支持DS模型性能 | 使用体验 | |
薪火AI服务器XH-10L20-48 | 1 | 本地部署DeepSeek版本 | DeepSeek-R1 671B | 企业级应用部署,满血DeepSeek 671B-R1模型 |
Intel 8480+ Xeon 2.0GHz 56C 105M 350W | 2 | |||
64G DDR5-6400MHZ RECC RDIMIM | 16 | 支持并发数 | 30-300 | |
M.2固态硬盘2T | 1 | |||
机械硬盘 16T | 1 | 推荐使用人数 | 50-120 | |
2GB缓存RAID卡,支持RAID 0、1、5、6、10、50、60 | 1 | |||
25G双口网卡 | 1 | 并发为20时性能 | 25-30Tokens/s | 已可满足对外提供服务,每秒输出25个字,使用非常流畅 |
英伟达L20 | 10 | |||
2700W满配热插拔冗余GPU电源 | 6 | |||
3200W满配热插拔冗余主板电源 | 2 | 并发为50时性能 | 10Tokens/s | 企业内部使用理论上不低于10Tokens/s 体验不会太差 |
满配冗余风扇组,支持N+1冗余,支持热插拔 | 12 | |||
标准机柜安装,含机架安装套件并带安装导轨,带相关配置软件 | 1 | 并发为200时性能 | 5Tokens/s | 系统性能趋于饱和 |
一体化交付,分钟级部署,提供用户UI界面,支持模型微调和数据投喂 | 1 |
|
|
一体化交付,提供产品指导和培训,研发侧与用户侧分离,提供网页使用界面 |
内置基于大语言模型和 RAG 的知识库问答系统,广泛应用于智能客服、企业内部知识库、学术研究与教育等场景,为企业智能化注入新动力,助力企业提质增效。 核心优势:支持直接上传文档;自动爬取在线文档;自动拆分文档、向量化;零编码嵌入第三方 Web 系统;快速接入企业微信、钉钉、飞书、公众号等应用;让已有系统快速拥有智能问答能力,提高用户满意度;内置强大的工作流引擎;支持编排 AI 工作流程;满足复杂业务场景需求。 |
||||
大模型在线演示地址 api.xinhuokj.com:56655