MiniMax发布开源混合架构推理模型M1发表时间:2025-06-18 07:07来源:澎湃新闻 6月17日,上海AI独角兽MiniMax正式开源推理模型MiniMax-M1(M1),称其为全球首个开放权重的大规模混合注意力推理模型。M1结合混合门控专家架构(MoE)与Lightning Attention,在性能和推理效率上实现显著突破。实测显示,M1在长上下文理解、代码生成等场景中超越多数闭源模型,仅微弱落后于顶尖闭源系统。
M1支持最高100万token上下文输入和最多8万token输出。成本方面,进行8万Token深度推理时,M1算力需求仅为DeepSeek R1的约30%;生成10万token时,推理算力仅需DeepSeek R1的25%。 天使投资人郭涛分析认为,MiniMax此次更新填补了开源领域长上下文技术空白,以“开源+场景化”路径打破技术垄断,为国产大模型迈向实用化树立新标杆。 内容由 AI 生成,仅供参考!https://www.gaicert.com/gai/1087.html
文章分类:
新闻资讯
|