中国证券网

美团开源“重思考”模型 AI实现“深思熟虑”再行动

摘要:中证报中证网讯(记者 杨洁)1月16日,美团宣布开源LongCat-Flash-Thinking模型升级版——LongCat-Flash-Thin...

中证报中证网讯(记者 杨洁)1月16日,美团宣布开源LongCat-Flash-Thinking模型升级版——LongCat-Flash-Thinking-2601。新模型在Agentic Search(智能体搜索)、Agentic Tool Use(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,均达到开源模型SOTA水平。

值得一提的是,该模型在工具调用的泛化能力上优势尤其明显,在依赖工具调用的随机复杂任务中,可大幅度降低真实场景下新工具的适配训练成本;同时,新模型支持“重思考”模式,可同时启动8个“大脑”执行任务,确保思考周全、决策可靠。

据介绍,美团LongCat团队在新模型中推出“重思考”模式,已让“龙猫”学会了“深思熟虑”再行动。具体来看,当遇到高难度问题时,新模型会把思考过程拆分成“并行思考”和“总结归纳”两步进行:并行思考阶段,与人类面对难题会同时尝试多种解法相似,“重思考”模式下的模型,会在保证思路多样性的同时,独立梳理出多条推理路径寻找最优解;总结归纳阶段,则会对多条路径进行梳理、优化与合成,并将优化结果重新输入,形成闭环迭代推理,推动思考持续深化。

除此之外,LongCat团队在新模型中加入了额外的强化学习环节,针对性打磨模型的总结归纳能力,从而让LongCat-Flash-Thinking-2601实现了“想清楚再行动”的结果。

对于新模型的技术思路,LongCat团队解释称,传统智能体往往仅在数个简单模拟环境里训练,而基于“环境扩展+多环境强化学习”核心技术,团队为模型打造了多样化的“高强度练兵场”,构建了多套高质量训练环境,并在每套环境中集成60余种工具形成密集依赖关系图谱与复杂联动,支撑起高度复杂的任务场景。

据悉,LongCat团队针对性扩展自研强化学习基础设施,在保留原有高效异步训练特性的基础上,实现大规模多环境智能体的稳定并行训练,通过均衡搭配多环境任务、按难度与训练进度智能分配算力,最大化提升训练效率与资源利用率;团队还从复杂度、多样性双维度严控训练任务,配套专属数据库及优化方案,杜绝模型“偏科”与训练漏洞,让这套全流程方案持续赋能模型,使其稳居智能体能力第一梯队。

LongCat团队还在训练数据的过程中主动注入多类噪声,模拟API的调用失败、返回错误信息、数据缺失等场景,并用课程学习的方式循序渐进地进行模型训练,在训练过程中逐步增加噪声的类型与强度——类比教新手骑车,首先会让其在平坦路面做练习,等技能成熟后再逐步增加路面的复杂度。

经过系统化的抗干扰训练,LongCat-Flash-Thinking-2601(Training w/Noise组)拥有极强的环境适应能力,在复杂场景中,也能稳定发挥、高效完成任务。

以下内容为友情赞助提供

项目群

全网新项目分享交流群
扫码进群,获取最新项目资讯

本文内容摘抄自互联网,如您觉得侵犯了您的权益,请联系 TG:@say588 反馈,本站将立刻删除!

分享:
发表列表
美团开源“重思考”模型 AI实现“深思熟虑”再行动
游客游客
此处应有掌声~
评论列表
  • 中证网
    2026-01-16 20:23:00
    美团开源“重思考”模型 AI实现“深思熟虑”再行动
  • 佚名
    2026-01-16 20:23:00
    @中证网:中证报中证网讯(记者 杨洁)1月16日,美团宣布开源LongCat-Flash-Thinking模型升级版——LongCat-Flash-Thinking-2601。新模型在Agentic Search(智能体搜索)、Agentic Tool Use(智能体工具调用)、TIR(工具交互推
  • 匿名用户
    2026-01-16 20:23:00
    合盛硅业:因信披违规被责令整改 公司高度重视并引以为戒
  • 游客
    2026-01-16 20:23:00
    海信电视工厂获评全球电视行业首个“灯塔工厂”

联系我们

QQ号:209508609

TG号:@say588

TG群:

关注我们