Deepseek-R1-671B(满血版)大模型一体机，开箱即用，仅需28万元

薪火Deepseek满血版671B大模型软硬件一体机（DS一体机）

在内网部署deepseek-R1-671B满血版私有化AI大模型，提供服务器+GPU显卡+大模型部署一体机产品，开箱即用，快速上线属于您自己的大模型。一站式为企业客户提供开箱即用的大模型AI软硬一体机，为行业客户提供大模型智能应用落地的一体化解决方案，参数规模671B，与deepseek官网R1模型效果一致，成本低，性价比极高。

演示网址 http://api.xinhuokj.com:56655 请您亲自验证效果

满血版DS大模型一体机内置RAG的知识库问答系统 售价仅需28万元

图片上传

对大模型部署方式进行调整，使得显存占用降低，大大节省成本

通过优化，将非共享的稀疏矩阵转移至CPU内存进行处理，有效降低对GPU显存的需求，原本需要500GB显存的模型，在优化下，仅需24GB即可运行，而推理速度和精度保持不变。在具体的计算任务分配上，将计算复杂、参数较少的MLA注意力模块留在GPU上处理，而对于参数较大、计算较轻的FNN（MOE）模块，则将其交由CPU执行。在GPU/CPU协同方面，将MLA层保留在GPU，而把路由专家层卸载至CPU，并充分利用AMD指令集进行加速。通过这种动态任务分配方式，根据计算强度分级调度，使每个计算资源都能得到充分利用，大幅提升了整体计算效率。除此之外，还引入了Marlin GPU算子，对模型的计算过程进行深度优化，使推理效率大幅提升，推理速度提高了5倍。

如果使用人数较多，需要高并发的deepseek一体机，推荐使用如下产品方案

部件规格	部件数量	支持DS模型性能		使用体验	价格

薪火AI服务器XH-10L20-48	1	本地部署DeepSeek版本	DeepSeek-R1 671B	企业级应用部署，满血DeepSeek 671B-R1模型	80W
Intel 8480+ Xeon 2.0GHz 56C 105M 350W	2
64G DDR5-6400MHZ RECC RDIMIM	16	支持并发数	30-300
M.2固态硬盘2T	1
机械硬盘 16T	1	推荐使用人数	50-120
2GB缓存RAID卡，支持RAID 0、1、5、6、10、50、60	1
25G双口网卡	1	并发为20时性能	25-30Tokens/s	已可满足对外提供服务，每秒输出25个字，使用非常流畅
英伟达L20	10
2700W满配热插拔冗余GPU电源	6
3200W满配热插拔冗余主板电源	2	并发为50时性能	10Tokens/s	企业内部使用理论上不低于10Tokens/s 体验不会太差
满配冗余风扇组，支持N+1冗余，支持热插拔	12
标准机柜安装，含机架安装套件并带安装导轨，带相关配置软件	1	并发为200时性能	5Tokens/s	系统性能趋于饱和
一体化交付，分钟级部署，提供用户UI界面，支持模型微调和数据投喂	1			一体化交付，提供产品指导和培训，研发侧与用户侧分离，提供网页使用界面
内置基于大语言模型和 RAG 的知识库问答系统，广泛应用于智能客服、企业内部知识库、学术研究与教育等场景，为企业智能化注入新动力，助力企业提质增效。核心优势：支持直接上传文档；自动爬取在线文档；自动拆分文档、向量化；零编码嵌入第三方 Web 系统；快速接入企业微信、钉钉、飞书、公众号等应用；让已有系统快速拥有智能问答能力，提高用户满意度；内置强大的工作流引擎；支持编排 AI 工作流程；满足复杂业务场景需求。核心优势：可自定义可视化工作流，通过基础组件以及函数库满足用户问题分类、敏感词检索等各类复杂场景需求；零编码嵌入第三方 Web 系统，快速接入企业微信、钉钉、飞书以及微信公众号等应用，提供即时智能问答和信息检索功能；支持直接上传文档；自动爬取在线文档；自动拆分文档、向量化；零编码嵌入第三方 Web 系统；快速接入企业微信、钉钉、飞书、公众号等应用；让已有系统快速拥有智能问答能力，提高用户满意度；内置强大的工作流引擎；支持编排 AI 工作流程；满足复杂业务场景需求。

产品概述

薪火DeepSeek AI一体机（型号XH-10L20-48）是一款专为企业级智能化场景打造的高性能AI服务器，搭载DeepSeek 671B-R1大模型，支持本地化部署，提供开箱即用的企业级AI能力。通过一体化交付设计，分钟级快速部署，助力企业轻松实现智能客服、知识库管理、学术研究等场景的数字化转型。

核心配置与性能

1. 强劲硬件，稳定可靠

- 处理器：Intel Xeon 8480+（2.0GHz，56核心），支持高并发数据处理。

- 内存与存储：64G DDR5-6400MHz RECC内存，2TB M.2固态硬盘 + 16TB机械硬盘，满足海量数据存储需求。

- GPU算力：10块英伟达L20 GPU，配合2700W冗余电源，保障AI模型高效运算。

- 网络与冗余：25G双口网卡、热插拔冗余电源（N+1）、智能散热系统，确保7×24小时不间断运行。

2. 卓越性能，灵活适配

- 高并发支持： 支持30-300用户并发，性能随负载动态优化。

- 并发20时：25-30 Tokens/s（每秒输出25字，流畅响应对外服务）。

- 并发50时：10 Tokens/s（企业内部使用体验稳定）。

- 并发200时：5 Tokens/s（系统性能趋于饱和，仍可保障基础服务）。

核心功能与优势

1. 内置知识库问答系统

- 文档智能处理：支持直接上传文档、自动爬取在线内容、智能拆分与向量化，快速构建企业专属知识库。

- 零代码集成：无缝嵌入企业微信、钉钉、飞书等第三方平台，无需开发即可为现有系统赋予智能问答能力。

- 工作流引擎：支持AI流程自定义编排，灵活应对复杂业务场景（如多轮对话、审批流转等）。

2. 企业级部署便捷性

- 一体化交付：预装DeepSeek-R1模型及管理界面，分钟级部署，即插即用。

- 研发与使用分离：提供用户友好的网页操作界面，支持模型微调、数据投喂，技术门槛低。

- 标准化机柜安装：含导轨与配置软件，兼容企业机房环境。

3. 场景全覆盖

- 智能客服：7×24小时自动应答，提升客户满意度。

- 内部知识库：快速检索企业文档、制度、技术资料，提高员工效率。

- 学术研究：支持文献分析、数据挖掘，加速科研进程。

为何选择薪火DeepSeek一体机？

- 成本可控：本地化部署，无持续云端费用，长期使用更经济。

- 安全合规：数据完全私有，保障企业敏感信息不外泄。

- 高效运维：冗余电源、散热系统与热插拔设计，降低维护成本。

- 专业支持：提供产品培训、技术指导，确保快速上手与持续优化。

赋能企业智能化，一步到位！

薪火DeepSeek一体机以企业级性能、开箱即用的便捷性、灵活的场景适配能力，为企业提供从“AI能力构建”到“业务落地”的全链路支持。无论是提升服务效率，还是优化内部管理，这款产品都是您迈向智能化的最佳伙伴。

在线演示地址

http://api.xinhuokj.com:56655

您可以打开上面的网址，亲自体验效果。