MiniMax开源推理模型M1:支持最高百万上下文输入,训练成本为R1的十分之一

zhq 2025-06-17 阅读:165 评论:0
MiniMax发布新款开源大模型,称其性价比优于DeepSeek。6月17日,国内大模型独角兽MiniMax发布世界上第一个开源的大规模混合架构的推理模型MiniMax-M1,这也是“MiniMaxWeek”系列发布活动的首个对外发布。据M...

MiniMax发布新款开源大模型,称其性价比优于DeepSeek。

6月17日,国内大模型独角兽MiniMax发布世界上第一个开源的大规模混合架构的推理模型MiniMax-M1,这也是“MiniMaxWeek”系列发布活动的首个对外发布。

据MiniMax介绍,M1在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型,接近海外的最领先模型,同时又有业内最高的性价比。

MiniMax披露,M1的优势是支持目前业内最高的100万上下文的输入,和闭源模型里面的Google Gemini 2.5 Pro一样,是DeepSeek R1的8倍,以及业内最长的8万Token推理输出。

此次MiniMax M1的最大优势之一体现在成本上。根据M1大模型分析自身的技术优势显示,MiniMax M1采用低成本训练,仅用512块 H800 GPU三周时间,成本53.47万美元(约385万人民币),仅为同类模型训练成本的 1/10。

MiniMax称,得益于以闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。根据推算,在生成长度为10万tokens的场景下,MiniMax-M1的计算量(FLOPs)为DeepSeek R1的25%,在长文本处理任务中具备显著优势。

据介绍,MiniMax M1的核心优势在于超长上下文处理能力和极低的算力消耗,同时在复杂任务(如工具调用、长文本理解)中表现接近甚至超越 DeepSeek R1。其训练成本仅为R1的1/10,且提供更灵活的API定价策略,尤其适合需要处理百万级token的场景(如法律文档分析、代码库理解)。DeepSeek R1则在传统数学推理和编程基准测试中略占优势,但受限于上下文长度和计算效率,在长文本任务中明显落后M1。

价格方面,M1在MiniMax APP和Web上支持不限量免费使用。在API方面,第一档0-32k的输入长度时,输入0.8元/百万token, 输出8元/百万token;第二档32k-128k的输入长度时,输入1.2元/百万token, 输出16元/百万token;第三档128k-1M输入长度时,输入2.4元/百万token, 输出24元/百万token。

值得注意的是,DeepSeek已成为大模型厂商对标的“风向标”。此前字节跳动旗下火山引擎最新发布豆包大模型1.6,首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格,称其综合成本只有DeepSeek R1三分之一,每生成一条5秒的1080P视频只需3.67元,为行业最低。

不过,被视为集体竞争对手的DeepSeek R1也在持续升级中。5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

新版DeepSeek R1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低45-50%左右,能够有效地提供更为准确、可靠的结果。

从社交媒体的反馈来看,网友最为关注的是此次DeepSeek R1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

发表评论
热门文章
  • 遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名

    遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名
    记者|赵阳戈 一家“接地气”的公司将要亮相联交所。近日,广州遇见小面餐饮股份有限公司(以下简称遇见小面)披露招股说明书,拟登陆联交所,招银国际为独家保荐人。 来源:联交所遇见小面成立已11年,开店增至380家,2024年卖出了11亿元的营业额。盈利方面,虽说在2022年因疫情录得亏损,但2023年实现扭亏,2024年有逾6000万元的净利润。 据了解,遇见小面还将继续扩张,2025年、2026年及2027年,计划在中国内地、中国香港及海外分別新开设约...
  • “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加

    “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加
    据新华社报道,外交部发言人林剑5月15日在例行记者会上说,为进一步便利中外人员往来,中方决定扩大免签国家范围,自2025年6月1日起至2026年5月31日,对巴西、阿根廷、智利、秘鲁、乌拉圭持普通护照人员试行免签政策。上述5国持普通护照人员来华经商、旅游观光、探亲访友、交流访问、过境不超过30天,可免办签证入境。“免签圈”扩容将进一步促进中国入境旅游的利好发展。当天,携程数据显示,今年以来,该平台上入境游订单量比去年增长接近翻倍。新增的五国入境游潜力巨大,今年以来阿根廷入境游...
  • 长城基金梁福睿:解码创新药的DeepSeek时刻

    长城基金梁福睿:解码创新药的DeepSeek时刻
      今年以来,医药板块尤其是创新药领域迎来一波强劲复苏,但在近期市场调整中也出现了波动。不过,创新药板块的长期投资价值依然显著。长城医药产业精选基金经理梁福睿认为,类似于DeepSeek,未来市场会更加认知到中国创新药从追赶到超越的实力。   在“515”全国投资者保护宣传日来临之际,基金经理...
  • 外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定

    外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定
    5月15日,外交部发言人林剑主持例行记者会。有记者提问,据了解,第78届世界卫生大会将于5月19日开幕,台湾地区方面迄今没有收到与会邀请。中国政府对此有何评论?林剑表示,在中国台湾地区参与国际组包括世界卫生组织问题上,中方的立场是一贯明确的,即必须按照一个中国原则来处理,这也是联合国大会第2758号决议和世界卫生大会25.1号决议确认的根本原则。中国台湾地区在未经中央政府同意的前提下,没有任何根据理由或权利参加世卫大会。台民进党当局顽固坚持“台独”分裂立场,导致台湾地区参加世...
  • 美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期

    美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期
      美联储主席杰罗姆・鲍威尔周四表示,美国可能进入供应冲击更频繁、通胀更不稳定的时期,这需要央行采取更透明的沟通方式。   鲍威尔在启动对央行货币政策框架五年一次的评估时发表了上述言论。   “关键问题在于如何让公众更广泛地理解经济普遍面临的不确定性,” 鲍威尔在华盛顿的演讲中表示,并预测 “...
标签列表