Deepseek-R1-671B(满血版)大模型一体机,开箱即用,仅需28万元

发布日期: 2025-02-26 16:48 


薪火Deepseek满血版671B大模型软硬件一体机(DS一体机)

在内网部署deepseek-R1-671B满血版私有化AI大模型,提供服务器+GPU显卡+大模型部署一体机产品,开箱即用,快速上线属于您自己的大模型。一站式为企业客户提供开箱即用的大模型AI软硬一体机,为行业客户提供大模型智能应用落地的一体化解决方案,参数规模671B,与deepseek官网R1模型效果一致,成本低,性价比极高。 

演示网址 http://api.xinhuokj.com:56655  请您亲自验证效果

满血版DS大模型一体机 内置RAG的知识库问答系统 售价仅需28万元

图片上传

对大模型部署方式进行调整,使得显存占用降低,大大节省成本

通过优化,将非共享的稀疏矩阵转移至CPU内存进行处理,有效降低对GPU显存的需求,原本需要500GB显存的模型,在优化下,仅需24GB即可运行,而推理速度和精度保持不变。在具体的计算任务分配上,将计算复杂、参数较少的MLA注意力模块留在GPU上处理,而对于参数较大、计算较轻的FNN(MOE)模块,则将其交由CPU执行。在GPU/CPU协同方面,将MLA层保留在GPU,而把路由专家层卸载至CPU,并充分利用AMD指令集进行加速。通过这种动态任务分配方式,根据计算强度分级调度,使每个计算资源都能得到充分利用,大幅提升了整体计算效率。除此之外,还引入了Marlin GPU算子,对模型的计算过程进行深度优化,使推理效率大幅提升,推理速度提高了5倍。


如果使用人数较多,需要高并发的deepseek一体机,推荐使用如下产品方案

部件规格

部件数量

支持DS模型性能

使用体验

价格

薪火AI服务器XH-10L20-48

1

本地部署DeepSeek版本

DeepSeek-R1 671B

企业级应用部署,满血DeepSeek 671B-R1模型

80W

Intel 8480+ Xeon 2.0GHz 56C 105M 350W

2

64G DDR5-6400MHZ RECC RDIMIM

16

支持并发数

30-300

M.2固态硬盘2T

1

机械硬盘 16T

1

推荐使用人数

50-120

2GB缓存RAID卡,支持RAID 0、1、5、6、10、50、60

1

25G双口网卡

1

并发为20时性能

25-30Tokens/s

已可满足对外提供服务,每秒输出25个字,使用非常流畅

英伟达L20

10

2700W满配热插拔冗余GPU电源

6

3200W满配热插拔冗余主板电源

2

并发为50时性能

10Tokens/s

企业内部使用理论上不低于10Tokens/s 体验不会太差

满配冗余风扇组,支持N+1冗余,支持热插拔

12

标准机柜安装,含机架安装套件并带安装导轨,带相关配置软件

1

并发为200时性能

5Tokens/s

系统性能趋于饱和

一体化交付,分钟级部署,提供用户UI界面,支持模型微调和数据投喂

1

 

 

一体化交付,提供产品指导和培训,研发侧与用户侧分离,提供网页使用界面

内置基于大语言模型和 RAG 的知识库问答系统,广泛应用于智能客服、企业内部知识库、学术研究与教育等场景,为企业智能化注入新动力,助力企业提质增效。
核心优势:支持直接上传文档;自动爬取在线文档;自动拆分文档、向量化;零编码嵌入第三方 Web 系统;快速接入企业微信、钉钉、飞书、公众号等应用;让已有系统快速拥有智能问答能力,提高用户满意度;内置强大的工作流引擎;支持编排 AI 工作流程;满足复杂业务场景需求。核心优势:可自定义可视化工作流,通过基础组件以及函数库满足用户问题分类、敏感词检索等各类复杂场景需求;零编码嵌入第三方 Web 系统,快速接入企业微信、钉钉、飞书以及微信公众号等应用,提供即时智能问答和信息检索功能;支持直接上传文档;自动爬取在线文档;自动拆分文档、向量化;零编码嵌入第三方 Web 系统;快速接入企业微信、钉钉、飞书、公众号等应用;让已有系统快速拥有智能问答能力,提高用户满意度;内置强大的工作流引擎;支持编排 AI 工作流程;满足复杂业务场景需求。


产品概述  

薪火DeepSeek AI一体机(型号XH-10L20-48)是一款专为企业级智能化场景打造的高性能AI服务器,搭载DeepSeek 671B-R1大模型,支持本地化部署,提供开箱即用的企业级AI能力。通过一体化交付设计,分钟级快速部署,助力企业轻松实现智能客服、知识库管理、学术研究等场景的数字化转型。  

核心配置与性能  

1. 强劲硬件,稳定可靠  

   - 处理器Intel Xeon 8480+2.0GHz56核心),支持高并发数据处理。  

   - 内存与存储64G DDR5-6400MHz RECC内存,2TB M.2固态硬盘 + 16TB机械硬盘,满    足海量数据存储需求。  

   - GPU算力:10块英伟达L20 GPU,配合2700W冗余电源,保障AI模型高效运算。  

   - 网络与冗余:25G双口网卡、热插拔冗余电源(N+1)、智能散热系统,确保7×24    时不间断运行。  

2. 卓越性能,灵活适配  

   - 高并发支持: 支持30-300用户并发,性能随负载动态优化。  

   - 并发20时:25-30 Tokens/s(每秒输出25字,流畅响应对外服务)。  

   - 并发50时:10 Tokens/s(企业内部使用体验稳定)。  

   - 并发200时:5 Tokens/s(系统性能趋于饱和,仍可保障基础服务)。  

核心功能与优势  

1. 内置知识库问答系统  

   - 文档智能处理:支持直接上传文档、自动爬取在线内容、智能拆分与向量化,快速构     建企业专属知识库。  

   - 零代码集成:无缝嵌入企业微信、钉钉、飞书等第三方平台,无需开发即可为现有系    统赋予智能问答能力。  

   - 工作流引擎:支持AI流程自定义编排,灵活应对复杂业务场景(如多轮对话、审批流    转等)。  

2. 企业级部署便捷性  

   - 一体化交付:预装DeepSeek-R1模型及管理界面,分钟级部署,即插即用。  

   - 研发与使用分离:提供用户友好的网页操作界面,支持模型微调、数据投喂,技术门槛低。  

   - 标准化机柜安装:含导轨与配置软件,兼容企业机房环境。  

3. 场景全覆盖  

   - 智能客服7×24小时自动应答,提升客户满意度。  

   - 内部知识库:快速检索企业文档、制度、技术资料,提高员工效率。  

   - 学术研究:支持文献分析、数据挖掘,加速科研进程。  

为何选择薪火DeepSeek一体机?  

- 成本可控:本地化部署,无持续云端费用,长期使用更经济。  

- 安全合规:数据完全私有,保障企业敏感信息不外泄。  

- 高效运维:冗余电源、散热系统与热插拔设计,降低维护成本。  

- 专业支持:提供产品培训、技术指导,确保快速上手与持续优化。  

赋能企业智能化,一步到位!  

薪火DeepSeek一体机以企业级性能、开箱即用的便捷性、灵活的场景适配能力,为企业提供从“AI能力构建”到“业务落地”的全链路支持。无论是提升服务效率,还是优化内部管理,这款产品都是您迈向智能化的最佳伙伴。 


在线演示地址

http://api.xinhuokj.com:56655  

您可以打开上面的网址,亲自体验效果。


查看更多新闻

在线OCR识别小工具,一键提取图片中的文字,转成word、excel、pdf等文档
地址:安徽省合肥市高新区品恩科技园1203
皖ICP备14001900号-2
皖公网安备 34010402701701号