林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理
3月27日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。
文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。
林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量 Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是,Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。
针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励***(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。
来源:凤凰网科技返回搜狐,查看更多
同类文章排行
- 普通人用得着4k分辨率的显示器吗?
- 月之暗面 Kimi 首个 Agent 开启内测,可生成易追溯的万字报告,有哪些技术亮点?
- 儿子抑郁四年左右了,他的未来该怎么办?
- 为什么 Windows 的兼容性这么强大,到底用了什么技术?
- 成都石室中学一群学生自发举行的汉服舞台剧节目在网络上得到了好评,该如何评价学生们的自发汉服表演活动?
- 如何评价钟南山院士?
- 如何评价剪映svip,599一年,有替代方案吗?
- 未来几年,市场对 AI 人才的需求会集中在哪几个方向?
- 如何评价张靓颖刘宇宁《九万字》?
- 英国登山队靠人均 124 万元的氙气疗法,无高反四天登顶珠峰,该方法究竟是什么体验?背后有哪些争议?
最新资讯文章
- 什么是防抖和节流?有什么区别?如何实现?
- 到底有什么是 Node.js 无法实现的?
- 金山办公继续聘任雷军为“名誉董事长”,但不享权利、不担义务、不领薪酬,这个头衔的实际意义是什么?
- 工业克苏鲁什么意思?
- 为什么现在键盘轴体不用颜色命名了,全是些莫名其妙的名字,看不懂到底是什么?
- 爱尔兰一机构化粪池发现近 800 幼童遗骨,具体是怎么回事?
- 泰国旅游真的很危险吗?
- 电脑出现了这样的问题要怎么办?
- 女生到底应不应该穿***的衣服?
- 前端真的已经凉了么?
- 为什么日本经济下降,大学排名跌至谷底,还有那么多人挤破脑袋去日本留学?
- 人死了以后意识去哪了?
- 如何评价高圆圆的身材算是美女类型的吗?
- 你身边身材最好的女生是什么样?
- PHP现在真的已经过时了吗?
- 紧身牛仔裤看起来不正经,真的是这样吗?
- 曾经的班花,现在还多少人惦记?
- 大一计算机新生想玩Linux,收台二手笔记本电脑重装系统是不是最优解?
- 养的鱼为什么总死?
- 你是在哪一瞬间突然感觉到苹果创新乏力的?





