据“”官微消息,美团今日正式发布并开源大模型-Flash-Chat。-Flash采用创新性混合专家模型(-of- MoE)架构,总参数560B,激活参数18.6B-31.3B(平均 27B),实现计算效率与性能的双重优化。据多项基准测试综合评估,-Flash-Chat在仅激活少量参数的前提下,在智能体任务中具备突出优势,同时推理速度超过。
据“”官微消息,美团今日正式发布并开源大模型-Flash-Chat。-Flash采用创新性混合专家模型(-of- MoE)架构,总参数560B,激活参数18.6B-31.3B(平均 27B),实现计算效率与性能的双重优化。据多项基准测试综合评估,-Flash-Chat在仅激活少量参数的前提下,在智能体任务中具备突出优势,同时推理速度超过。