"Token New Era" – A "Ten Questions, Ten Answers" on China's AI Industry

华尔街见闻
2026.03.30 06:36

摩根大通系统回答了 AI 行业十大核心问题,中国 AI 行业正从价格战转向模型质量之争,智能体场景下” 任务完成率” 远比” token 单价” 更能决定客户留存。盈利的核心问题是毛利润增速能否持续超越研发支出增速,智谱和 MiniMax 预计均将从 2029 年起扭亏为盈,整体市场不会形成赢家通吃格局。

中国人工智能基础模型行业正从"预期驱动"转向"需求驱动"的关键阶段。摩根大通在一份最新研究报告中系统回答了投资者对该行业的十大核心问题,认为模型质量已成为决定市场格局的首要变量,行业分化将加速。

据摩根大通 3 月 27 日发布的报告,报告指出,中国 AI 市场正处于明显拐点,编码和智能体场景的需求增长正在加速,国内模型能力已接近甚至超过美国领先模型一年前的水平,而本土定价更符合经济效益,两者共同改善了落地回报。

2026 年是中国企业 AI 需求能否复制 2025 年美国增长曲线的关键一年。以 Anthropic 为参照,其年度经常性收入(ARR)从 2024 年 12 月的 10 亿美元增至 2026 年 3 月的 190 亿美元,15 个月内增长约 19 倍。

中国市场具备遵循类似路径的条件,尤其是在编码领域,腾讯、阿里巴巴和字节跳动等互联网巨头已将相关工具融入现有生态系统,推动需求从单独演示转向全面部署。该行维持对智谱和 MiniMax 的"增持"评级,目标价分别为 800 港元和 1100 港元。

问题一:AI 需求是线性增长,还是拐点爆发?

需求是拐点驱动,而非线性增长。

只要模型质量好到足以解锁真实应用场景,使用量就会从线性增长切换为"上凸曲线"式爆发。最有力的佐证来自美国市场:Anthropic 的年度经常性收入(ARR)从 2024 年 12 月的 10 亿美元,在短短 15 个月内飙升至 2026 年 3 月的 190 亿美元,增长近 19 倍。

中国目前具备类似爆发的基础条件:国内模型能力已超越美国领先模型一年前的水平,且本土定价更符合中国的人工经济效益,两者叠加显著改善了 AI 落地的回报预期。

在智能体侧,OpenClaw 成为重要催化剂,将使用场景从单轮交互推向多步骤任务执行,大幅提升每个任务消耗的 token 量。腾讯、阿里巴巴、字节跳动等互联网巨头已将 OpenClaw 相关工具融入现有生态系统,标志着趋势从"开发者实验"进化为"生态全面部署"。

问题二:API 定价将上升、下降,还是分化?

定价不会单向移动,分化才是主旋律。

一方面,能力强的模型形成定价权。如果某模型能独一无二地解锁高价值任务(智能体编码、长时程工作流、企业级可靠性),客户愿意支付溢价,因为回报可量化。另一方面,随着硬件、算法效率不断提升,推理单位成本将持续下降,对能力停滞的模型形成价格压力。

最终结果是分化的定价结构:持续保持前沿能力的模型可同时实现量价齐升;未能持续迭代的模型则将面临价格下滑,即便使用量仍在增长,利润率也将变得不确定。

问题三:如果定价不是主战场,竞争焦点在哪里?

主战场已从 token 价格转移至模型能力。

这是与去年相比的关键变化——2025 年中国市场的焦点是全面价格战,而如今需求增长最快的编码和智能体场景中,质量远比单价更重要。

在多步骤工作流中,客户购买的本质不是"廉价 token",而是"任务顺利完成"。研报给出了一个直观的数学例子:若单步骤成功率从 85% 提升至 98%,一个 20 步骤任务的最终完成率将从 4% 跃升至 67%。在这种逻辑下,每 token 定价最低的模型,其完成每项任务的实际综合成本反而可能最高。

研报同时指出,拥有强大前沿模型的公司可以轻易向低端市场延伸,但仅凭低价立足的公司却难以向高端进军。

问题四:为何基础大模型仍是"生死相搏"的行业?

技术差距小、迭代周期无止境、变现模式趋同,三重因素决定行业高度残酷。

中国各家大模型公司之间的能力差距往往比投资者预想的更小,市场因此高度不稳定。在这个行业,"原地踏步"不是中性结果,而意味着地位的丧失——公司必须持续投入、不断迭代才能避免落后。

商业模式的聚拢加剧了淘汰压力。收入增长和利润率都主要取决于产品实力,转换成本仍然较低,这意味着失去技术动能的公司将在商业和财务上迅速失去防御能力,行业内真正可靠的公司数量将逐步减少。

问题五:盈利能力的决定因素是什么?

核心问题是毛利润增速能否持续超越研发支出增速。

Token 业务的基本经济模型清晰:收入=token 使用量×价格,主要成本是推理计算,最大运营支出是训练相关研发。随着模型效率和推理芯片效率持续提升,前沿模型的毛利率应逐步上升。

但营业利润前景更为复杂。Anthropic 是一个警示案例:即使在 2026 年 2 月月收入水平已达 140 亿美元,该公司同期仍宣布了 300 亿美元的新一轮融资,并强调持续前沿开发——高收入并不意味着训练强度正常化。

基准情景是,智谱和 MiniMax 预计均将从 2029 年起扭亏为盈。研报强调,比具体盈利年份更重要的追踪指标是:使用量的持续增长趋势,以及单位经济效益的持续改善。

问题六:投资者应如何追踪模型实力?

需结合 token 价格、使用量和第三方评估三个维度,单一指标不足以说明问题。

  • Token 价格:是最重要的指标,因为它是公司对自身产品市场定位的实时表达。与最佳模型的价格差正在成为模型实际竞争力的良好代理变量。

  • Token 使用量:实际消耗量反映用户和开发者的真实选择。OpenRouter 等第三方 API 聚合器可作为参考,尤其需要关注智能体类工作负载的增长,因为该类工作负载每任务消耗的 token 量远超简单工作流。

  • 第三方评估:Artificial Analysis 提供结构化评估,LMArena 反映真实用户的盲选偏好,两者互补,形成更完整的外部视角。

问题七:互联网巨头大举进军 B 端,独立模型公司何去何从?

竞争边界趋同,最终仍回归模型能力的比拼。

阿里巴巴已明确将云和 AI 作为战略重点,将模型开发与企业工作流深度绑定;腾讯推出的智能体产品已覆盖个人、开发者和企业全场景;OpenAI 也将商业化重心转向企业产品和编码部署。头部公司方向一致:AI 正从"消费端功能"进化为"直接创造企业收入的工具"。

在这一背景下,独立模型公司仅凭"云中立"标签已不足以形成护城河,互联网巨头仅靠生态流量优势也无法完全覆盖模型能力的不足。企业客户在部署 AI 时,购买的核心仍是模型质量——更强的编码推理能力、更可靠的工作流完成率。

问题八:哪些因素决定公司的存活?

人才第一、算力第二、组织第三,三者缺一不可。

  • 顶尖研究人才:这仍是一个研究驱动的行业。高层的技术判断力本身就是竞争要素,管理层能否做出正确的研究方向决策,直接影响公司的技术轨迹。

  • 算力与资本:前沿训练成本高昂,推理经济性取决于基础设施质量。算力获取能力薄弱是结构性劣势——不仅影响模型训练效率,也削弱以合理成本响应需求的能力。

  • 组织执行力:在快速迭代的市场中,将研究成果转化为产品、产品转化为使用量、使用量转化为变现的能力,几乎与模型本身同等重要。

问题九:如果大家都在进步,模型最终会趋同吗?

整体实力趋近,但不会趋同,市场不会形成赢家通吃格局。

不同公司在架构选择、训练数据、产品侧重和技术路径上存在差异,这些差异将持续产生不同的能力优势。研报认为,在一个仍在快速扩大的市场中,多家公司可以同时增长,即便存在部分能力重叠——现阶段整体市场扩张的意义远大于过早担忧商品化。

长远来看,更现实的市场终局不是"一家独大、其余出局",而是留下几家真正有实力的公司,各有优势领域,在一个足以支持多个赢家的市场中竞争。随着 AI 从生产力工具扩展到消费端场景,个人口味、风格与偏好的差异将进一步强化这种多元化格局。

问题十:开源/闭源、模型迭代与全球扩张风险,如何统一理解?

迭代是必选项,开源/闭源是策略选择,全球扩张的核心风险在算力和合规。

模型迭代方面,预期节奏约为每年推出一代旗舰模型(如 GLM 4.7 到 GLM 5,MiniMax M2 系列到 M3 系列),中间伴随强化学习驱动的小幅升级,停止迭代意味着失去竞争地位。

开源/闭源方面,研报认为答案不是非此即彼。闭源模型商业防御性更强,降低被去中介化的风险;开源则有助于生态建设、提升采用率并加速技术反馈。因此,大多数中国模型公司最终将采取混合策略:闭源最新最强的模型,开源部分其他版本。

全球扩张方面,最大风险仍是算力获取。训练和推理均高度依赖高性能芯片,出口管制收紧将同时削弱模型进步速度和成本竞争力。其次是数据与安全合规风险:若模型部署、用户服务和数据存储能实现海外本地化,跨境数据传输问题相对可控;但当地隐私法规和中国关联实体的数据访问权限认定,仍是不确定性来源。