推广 热搜:长虹美菱  惠而浦  汽油价格最新调整  汽油价格最新调  7怎么样 

消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达具体怎么回事

   2025-09-07 13:09  发布时间: 2个月前   130
核心提示:快科技4月29日消息,据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeekR2。报道称,DeepSeekR2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。有分析师预计,DeepSeekR2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。此外,还有

快科技4月29日消息,据国内媒体报道称,深度求索可能会在下个月有所行动,推出下一代AI大模型DeepSeekR2。

报道称,DeepSeekR2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

有分析师预计,DeepSeekR2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

此外,还有相关消息显示,DeepSeekR2预计比GPT4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

据相关人士透露的情况,DeepSeekR2的总参数量可能会达到1.2万亿,比DeepSeekR1的6710亿参数增加大约一倍。

DeepSeekR2是一款基于华为昇腾910B(Ascend 910B)芯片集群训练的模型,在FP16精度下达到512PetaFLOPS的计算能力,芯片使用效率为82%。

据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。

消息称DeepSeek R2下月发:成本较GPT降97%、华为芯片性能不输英伟达



 
举报 收藏
 
更多>同类生活资讯