消息称DeepSeek R2下月发：成本较GPT降97%、华为芯片性能不输英伟达具体怎么回事

2025-09-07 13:09 发布时间: 2个月前 130

核心提示：快科技4月29日消息，据国内媒体报道称，深度求索可能会在下个月有所行动，推出下一代AI大模型DeepSeekR2。报道称，DeepSeekR2大模型将会采用一种更先进的混合专家模型（MoE），其结合了更加智能的门控网络层（Gating Network）以优化高负载推理任务的性能。有分析师预计，DeepSeekR2的定价可能显著低于OpenAI同类产品，预示着其可能颠覆现有AI服务的定价模式。此外，还有

快科技4月29日消息，据国内媒体报道称，深度求索可能会在下个月有所行动，推出下一代AI大模型DeepSeekR2。

报道称，DeepSeekR2大模型将会采用一种更先进的混合专家模型（MoE），其结合了更加智能的门控网络层（Gating Network）以优化高负载推理任务的性能。

有分析师预计，DeepSeekR2的定价可能显著低于OpenAI同类产品，预示着其可能颠覆现有AI服务的定价模式。

此外，还有相关消息显示，DeepSeekR2预计比GPT4成本下降97%；并且是在昇腾卡上做的训练，主打一个全方位全产业链的自主可控。

据相关人士透露的情况，DeepSeekR2的总参数量可能会达到1.2万亿，比DeepSeekR1的6710亿参数增加大约一倍。

DeepSeekR2是一款基于华为昇腾910B（Ascend 910B）芯片集群训练的模型，在FP16精度下达到512PetaFLOPS的计算能力，芯片使用效率为82%。

据华为实验室统计，这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的，还有待观察，但看起来确实更强大、更自主了。

消息称DeepSeek R2下月发：成本较GPT降97%、华为芯片性能不输英伟达

举报收藏

更多>同类生活资讯

推荐图文

推荐生活资讯

点击排行

• 黄仁勋官宣：NVIDIA新总部落地中国台湾！到底是	• 【20250519午评】混沌期热点散乱心烦意乱今+日
• 搜狐创始人张朝阳： AI 发展进入“快车道”，科	• 今日豆粕期货价格行情查询（2025年5月19日）网
• 迷宫探索游戏推荐哪个好玩的迷宫探索游戏排行	• 合资卷王再发力！大众ID.4 X聪明款上市：一口价
• Windows 游戏模拟器 Winlator 将恢复开发，曾被	• 挺进中东，丽天智能与印度L&T达成合作，首
• AI 短剧：看起来很美，拍起来很难网友怎么看	• 微生物环境适应密码破解，西农大构建生态预测新