推广 热搜:长虹美菱  惠而浦  汽油价格最新调整  汽油价格最新调  7怎么样 

MiniMax开源首个推理模型M1具体真相是什么

   2025-06-18 02:06  发布时间: 3小时前   222
核心提示:6月17日,正式开源推理模型M1,采用 机制的混合注意力架构。M1支持目前业内最高100万token上下文输入,同时支持最多8万token输出。成本表现方面,M1在用8万Token深度推理的时候,需要使用 R1约30%的算力。团队表示,M1整个强化学习阶段只用到512块H800三周时间,租赁成本为53.74万美金。

6月17日,正式开源推理模型M1,采用 机制的混合注意力架构。M1支持目前业内最高100万token上下文输入,同时支持最多8万token输出。成本表现方面,M1在用8万Token深度推理的时候,需要使用 R1约30%的算力。

团队表示,M1整个强化学习阶段只用到512块H800三周时间,租赁成本为53.74万美金。

 
举报 收藏
 
更多>同类生活资讯
推荐图文
推荐生活资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  赣ICP备2024040164号-4