
China's AI "Max Moment"! Qianwen's strongest model opens the second growth curve

中国 AI 领域迎来 “Max 时刻”,千问推出旗舰推理模型 Qwen3-Max-Thinking,性能超越 GPT-5.2 和 Gemini 3 Pro,成为接近国际顶尖水平的国产 AI 模型。此次突破源于模型推理机制的代际升级,采用 “测试时扩展” 机制,实现更高效的计算和智能结果。尽管市场对中国科技企业的信心仍需提升,但新产品的推出有望改变投资者的看法。
回顾2024 年至 2025 年,资本市场对中国科技资产的定价逻辑经历了一场漫长的拉锯。
随着Qwen2.5 和 DeepSeek 的惊艳表现,市场曾短暂掀起过一轮对中国 AI 的 “重估浪潮”。那时候,投资者看到了中国大模型 “追平” 硅谷的希望,阿里巴巴的股价也曾因此出现修复性反弹。
然而,那轮行情的性质更多是“情绪修复”。
全球资金虽然承认中国科技企业“没有掉队”,但依然顽固地拒绝相信它们能够 “领跑”。在华尔街的定价模型中,阿里电商基因依旧强大,其 AI 与云业务的潜在价值,仅仅被视为一种看涨期权,有潜力,但并非是进攻性的增长引擎。
想要改变这种惯性定价,中国大模型们只能不断用新产品逐渐改变市场看法。
2026 年 1 月 26 日,阿里云正式发布旗舰推理模型 Qwen3-Max-Thinking,性能爆表,甚至在多项全球权威评测中超越GPT-5.2、Gemini 3 Pro,成为首个真正意义上性能最接近国际顶尖模型的国产 AI 大模型。
值得注意的是,本次模型突破的关键在于模型推理机制的代际升级。
业界普遍的推理计算,往往只会简单增加并行推理路径,通过重复推导已知结论来撞大运,造成了巨大的算力冗余。千问新模型则采用了一种全新的“测试时扩展”(Test-time Scaling)机制。
它引入了“经验提取” 式的提炼过程,模型可对此前的推理结果进行多轮自我迭代,在相同的上下文中实现更高效的计算,获得更智能的结果。这是一种让模型 “慢思考” 的策略,以计算换智能,同时保证了经济性。
基于这一创新,Qwen3-Max-Thinking 的推理性能实现了质的飞跃。在启用工具的 “人类最后的测试” HLE(Humanity's Last Exam)评测中,千问得分高达 58.3。作为对比,OpenAI 的 GPT-5.2-Thinking 得分为 45.5,Google 的 Gemini 3 Pro 为 45.8。超过 10 分的差距,在 AI 评测领域意味着代际级的领先。

面向即将到来的智能体Agent 时代,Qwen3-Max-Thinking 还大幅增强了自主调用工具的原生能力。
当技术代差不断被抹平,资本市场对阿里巴巴的AI 重定价便不再是一个“是否” 的问题。
从“拼算力” 到 “拼智能”,国产 AI 找到了第二曲线
过去五年,AI 行业的发展主线遵循 Scaling Laws,即通过堆砌更多的卡、喂更多的数据来提升智能。
然而进入2025 年后,这一路径遭遇了物理墙,高质量数据枯竭,训练成本指数级爆炸。
从训练转向推理,行业迫切需要第二条增长曲线。
Qwen3-Max-Thinking 的核心突破之一便在于测试时扩展,这类似于人类心理学中的“系统 2” 思维,当面对高阶数学证明或复杂代码架构时,模型不会立即吐出第一个生成的Token,而是会在后台启动一个深思熟虑的思考过程。
这一过程包含思维链搜索、自我验证与多轮迭代。
千问团队引入了独特的经验提取机制,让模型在推理过程中“学习如何寻找答案”,识别并剪枝冗余的逻辑路径,这种机制确保了算力被用于探索最有价值的分支,从而在同等算力消耗下产出极高密度的智能。
作为目前阿里乃至中国科技界规模最大的模型,Qwen3-Max-Thinking 总参数超万亿,预训练数据高达 36T Tokens。其在 HLE 测试中的表现极具标志性意义,Qwen 的高分证明了其技术不仅能解数学题,更能处理现实世界中模糊、多变的任务。
此外,模型实现了原生Agent 能力的内化。
在以往,大模型只是“大脑”,需要外挂工具,常导致指令遵循不稳定。Qwen3-Max-Thinking 则像专业人士一样,边用工具边思考,它可以自主判断何时搜索互联网、何时编写代码、何时查阅知识库,并根据反馈动态调整计划。
这种能力大幅降低了模型幻觉,为企业级应用提供了必要的可靠性保障,展现出了极高的面向Agent 时代的规模化工程落地的可能性。
这也意味着,阿里不再是单纯“卖算力”,也不只是提供单个的大模型,而是通过真实可用的完整 “智能化解决方案”,探索 AI 落地的更大可能,从以往的 “成本叙事” 迈向 “价值叙事”。
开源的倒戈:西谷东阿与全球开发者的用脚投票
如果说Qwen3-Max-Thinking 的技术突破是阿里的 “里子”,那么 Qwen 系列在开源生态的统治力则是其光鲜的 “面子”。这一领域的格局变化,正在重写全球 AI 的地缘政治版图。
Meta 的 Llama 系列曾被视为开源大模型的默认标准,但在2026 年 1 月,这一局面已被彻底打破。
Hugging Face 数据显示,基于 Qwen 的衍生模型数量突破 20 万个,成为全球首个达成此目标的开源家族。其累计下载量突破 10 亿次,日均下载量高达 110 万次,已完全超越 Llama,稳居全球第一。

MIT 的研究指出,中国开源 AI 模型的全球采用份额已跃升至 17.1%,首次超越美国的 15.8%。
Qwen 的胜利源于其 “全尺寸、全模态” 的策略。从 0.5B 到 480B 的全参数段覆盖,以及对 119 种语言的支持,使其在东南亚、中东等新兴市场迅速成为首选。
更具戏剧性的信号来自硅谷内部。
据彭博社报道,Meta 内部代号 “牛油果”(Avocado)的秘密项目,不得不开始采用 “蒸馏” 技术向 Qwen 学习。扎克伯格亲自关注的新组建的 TBD 实验室团队,在训练其新模型时蒸馏了多方开源模型,其中就包括 Qwen。
这在技术层面间接承认了Qwen 在特定能力上的领先。
英伟达CEO 黄仁勋在 2025 GTC 大会上直言:“中国在开源领域遥遥领先。” 这番话为这一趋势做了注脚。

硅谷工程师展现出了极度的实用主义:谁好用就用谁。
全栈的护城河:云、芯、应用与资本市场的估值重构
在分析中国科技巨头时,投资者常犯的一个错误是将阿里简单视为“电商公司 + 云服务商”。
事实上,AI 时代,从底层的基础设施、中间的模型能力、再到上层的应用,综合到一起,才是一家公司 AI 能力的完整体现。而阿里巴巴正是目前中国唯一、全球唯三具备 “算力、模型、应用” 全栈闭环能力的科技公司,这种全栈优势正在转化为公司护城河。
AI 竞争的尽头是能源与算力。
面对英伟达高端芯片的出口限制,阿里的硬件布局展现了极强的前瞻性。阿里平头哥研发的PPU 在特定推理任务上的性能已与英伟达 H20 相当。配合倚天 710 服务器芯片,阿里构建了 “一云多芯” 的异构算力体系。
上周,更有市场消息指出,阿里巴巴已决定支持平头哥未来独立上市。这不仅意味着阿里手里多了一张可以在资本市场单独定价的王牌,更意味着国产大模型在底层算力支撑上,有了更充足的底气
但芯片只是起点。AI 时代,真正决定企业长期竞争力的,是整套云计算架构能否完成从 “通用计算” 向 “AI 原生” 的系统性重构,这涉及到计算、存储、网络、乃至 MaaS 平台的全栈升级。
在这方面,阿里云已构建起目前中国最完整的AI 基础设施。摩根士丹利在最新报告中预测,阿里云的收入将在三年内翻倍,从 2025 财年的 1180 亿元增长至 2028 财年的 2400 亿元。其目标是在 2026 年拿下中国 AI 云市场增量的 80%。
在应用层,千问APP 正快速验证这一技术闭环的商业潜力。
上线首周下载量突破1000 万,两个月月活(MAU)即突破 1 亿。更为关键的是,千问 APP 正在重新定义 AI 应用的形态,从一个单纯的聊天机器人,进化成全球首个“能办事” 的 AI。全面接入淘宝、支付宝、飞猪、高德等生态,用户只需一句语音指令,模型即可自主完成订机票、叫外卖、买东西的全流程。这种 “AI+ 生活全场景闭环”,将 AI 的价值从信息层推向了交易层,打开了远超订阅制的商业化空间。
在AI 竞赛中,Capex(资本开支)是通往未来的门票。阿里CEO 吴泳铭去年宣布,未来三年将投入超过3800 亿元用于建设云和 AI 硬件基础设施。
对比美股,谷歌、Meta 和 Amazon 同样在疯狂烧钱,因为他们看清了 AI 带来的赢家通吃效应。阿里高达 3000 亿级别的投入,更应被视为对未来十年竞争资格的买断。
当Qwen3-Max-Thinking 证明了中国在算法上的顶级实力,当阿里云证明了其在算力上的可控,当千问 APP 证明了 AI 在商业场景中的落地能力,阿里的AI估值便具备了重构的坚实基础。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
