
Ant Group's Wang Lei: The training cost of vertical large models has decreased by an order of magnitude, and the implementation of financial AI requires the construction of three major cornerstones of "trustworthy intelligent agents" | Alpha Summit

王磊指出,开源基础模型的出现,使得垂直大模型迭代周期从数月缩短至两周,算力需求从” 万卡” 降至” 百卡”。同时,他强调金融 AI 落地还必须关注严谨性、专业性和遵从性,首要任务是构建压制幻觉的体系,守住安全底线。他认为,大模型在产业中的应用不仅是一场技术革命,更是一次业务战略的重塑。
12 月 20 日,在华尔街见闻和中欧国际工商学院联合主办的「Alpha 峰会」上,蚂蚁数科 AI 原生事业部总经理王磊发表题为《探索金融 AI 深水区 -- 大模型垂直落地的实践与启示》的演讲。
他表示,随着 DeepSeek、Qwen 等开源基础模型的出现,行业大模型落地不再依赖昂贵的预训练,而是转向 “后训练” 模式。这一转变使得金融垂类模型的迭代周期从数月缩短至两周,算力需求从 “万卡” 降至 “百卡”,训练成本实现百倍级下降,大幅降低了产业应用门槛。

他认为,在金融等严肃产业落地 AI,必须关注严谨性、专业性和遵从性。他强调,大模型无法完全避免幻觉,甚至随着推理能力提升幻觉可能增强。因此,构建一套压制幻觉的体系和方法论,是面向垂直行业应用大模型的第一要务,必须守住安全底线。
他并指出,金融行业落地大模型的核心在于构建 “可信智能体”,这需要三大基石:一是叠加行业数据的 “金融大模型” 作为大脑;二是补充时效性与私有数据的 “金融知识库” 作为经验;三是连接业务系统的 “金融工具集” 作为双手,三者结合才能让 AI 像专业员工一样工作。
蚂蚁数科 AI 原生事业部总经理王磊还表示,大模型在产业中的应用不仅是一场技术革命,更是一次业务战略的重塑。他呼吁企业不应只做平庸的中立者,而应突破既有工作流程的条条框框,思考如何让大模型重塑所有的业务流和工作流,从而带来真正的产业价值。
以下为演讲精彩观点:
随着 DeepSeek 的问世,首批面临淘汰的是那些专注于基础模型研发的企业,这促使整个行业将关注重心转向应用落地。
大模型的问世带来了自然语言理解领域的革命性突破,这一核心能力极大地降低了人机交互的门槛。
产业界无需再单纯依靠堆砌海量算力与人力,或购买大量数据进行模型重训。我们已探索出一条切实可行的产业落地路径,即通过叠加垂直领域的专业数据来赋能模型。
我们必须正视大模型这把 “双刃剑”。在深入应用大模型的过程中,构建一套有效抑制 “幻觉” 的体系与方法论,是面向垂直行业应用时的首要任务。
模型的构建决定了能力的上限,而安全能力则是不可逾越的底线。
评测是大模型应用的起点。智能体的构建并非一次性的软件交付,而是一个持续培养与迭代优化的过程。
以往的预训练模型往往依赖万卡集群,而训练此类金融垂直领域模型仅需百卡规模,算力需求实现了两个数量级的缩减。
推动 AI 在产业界落地时,需关注众多可信特征。将其高度概括,核心在于三点:严谨性、专业性与遵从性。
将大模型应用于产业时,我不愿止步于平庸的中立立场,而坚定地选择变革的一方,即致力于 “战略重塑”。
在探讨大模型于业务及工作流程中的作用时,我们需要突破既有框架的束缚,致力于利用大模型全面重塑现有的工作流程。
以下为演讲实录:
尊敬的各位朋友:
很高兴今天能有机会与大家分享蚂蚁集团过去一年在大模型金融行业落地过程中的思考与实践。
这一主题的分享在当下正当其时。因为我们正处于产业拥抱 AI 的关键节点,而这个节点的源头可以追溯到十年前。
一、AI 发展的十年历程与变革
回顾过去十几年,这是 AI 浪潮蓬勃发展的十年,大家也能切身感知到 AI 给生活带来的显著变化。这张图将蚂蚁集团在 AI 领域的探索与主要产品紧密连接,展示了技术发展的脉络。
我们可以用技术语言来标记这个起点:2012 年,当时,大家可能不熟悉 AlexNet 这家公司,但或许听说过 “卷积神经网络”。在那年美国的 ImageNet 大赛中,AlexNet 凭借卷积神经网络大幅提升了图像识别的准确度、速度和效率,以大幅领先第二名的优势取得了优异成绩。自此,行业内诞生了如旷视科技、海康威视等大量以识别为核心技术的公司。如今道路上广泛使用的摄像头进行车牌和人脸识别的高效运作,皆源于此起点。
同样在 2012 年,支付宝推出了革命性的移动支付技术——二维码支付。其识别效率的提升并真正走进千家万户,归功于 AI 技术。2016 年,AlphaGo 战胜韩国围棋世界冠军李世石,打破了人类对围棋这一 “掌上明珠” 不可被战胜的认知,证明了强化学习构建的决策模型在复杂决策领域已能超越人类。
此后,我们将决策模型广泛应用于生活。例如余额宝、花呗、借呗、网商贷等产品,其背后的服务主体并非人力,而是人工智能。普惠金融建立在 AI 基础之上,通过模型我们要么能快速识别授信额度与放款时长,识别真正的需求者与潜在的欺诈风险。
决策模型的出现,让大众享受到了 AI 的价值。如果说彼时还是 “小模型” 时代,那么 2022 年 OpenAI 发布的 ChatGPT 则开启了 “大模型” 时代,参数量从万级跃升至万亿级。大模型(常被称为 AIGC 生成模型)的核心价值在于自然语言理解的革命性突破。从文本理解到多模态(图片、音频、视频)的识别与生成,其本质变革在于极大地降低了人机交互的门槛。
纵观计算机产业过去三十年,每一次人机交互效率的提升与门槛的降低,都会引发影响未来五至二十年的产业革命。从微软到 iPhone 再到如今的大模型,这一进程不可逆转且奔涌向前。
二、蚂蚁集团的 AI 产业布局与智能体元年
在此过程中,阿里巴巴与蚂蚁集团也在适应科技变化,推出了一系列 AI 应用,如医疗领域的 “阿福”(原名 AQ)、金融大模型应用 “蚂小财”、多模态助手 “灵光” 以及阿里集团旗下的众多 AI 助手。
当前 ToC 领域格局已趋于明确。今天我想重点探讨产业化 ToB 领域。蚂蚁数科作为蚂蚁集团旗下致力于产业 AI 赋能的 ToB 科技公司,我们认为今年是 AI Agent(智能体)元年。
过去几年,大模型构建往往局限于拥有大量数据、算力和人才的大公司,高昂的门槛使其对许多企业而言可望不可及。如果产业应用的前提是必须自研大模型,则无法实现真正的产业化。
但今年 DeepSeek 等开源模型的出现改变了这一局面。它们不仅提供了优秀的算法,更代表了基础模型向全行业的开放。这使得产业界无需再通过堆砌资源进行预训练,而是找到了一条行之有效的落地路径:在开源基础模型(如 DeepSeek、通义千问、蚂蚁百灵)基础上,叠加产业垂直领域数据进行后训练。这一模式将模型迭代周期从三至六个月缩短至一个月甚至两周,极大降低了垂类应用的门槛,促使行业目光从基础模型转向应用层。
三、 金融行业大模型落地的痛点与 “可信智能体”
关于大模型是否能带来实际业务价值,我们的答案是肯定的。但在与银行业 CIO 的交流中,我们总结了金融行业落地的六大痛点:算力有限、数据不足且质量不高、模型迭代太快、知识经验沉淀不足、缺乏应用落地方法论以及人才短缺。
针对这些痛点,蚂蚁数科提出了面向 AI 的战略。在金融这类严肃产业落地 AI,必须关注三点核心特征:严谨性、专业性与遵从性。
严谨性(对抗幻觉):大模型无法完全避免幻觉,某种程度上这也是其智力水平的体现(如 DeepSeek R1 的推理能力增强伴随着幻觉率波动)。因此,应用大模型的首要任务是构建一套压制幻觉的体系。
专业性(对齐专家):大模型需体现机构自身的意志,避免千篇一律。
遵从性(合规底线):在强监管行业,必须确保模型不触碰红线和底线。
我们将具备上述特征的称为 “可信智能体”。在金融领域,其构建依赖三大基石:
金融大模型:类似经过寒窗苦读的 “金融博士”,具备通用与金融专业知识。
金融知识库:补充高时效性数据及银行私有知识,使其成为熟悉行内情况的 “管培生”。
金融工具集:连接银行内部数字化系统的 API,赋予智能体 “手” 的能力,使其能执行具体操作。
四、训练方法论与未来展望
在构建金融大模型时,我们采用两阶段训练方法,核心在于数据的理解与治理。仅叠加金融数据是不够的,需将通用数据(数学、历史等)与金融数据合理配比,以确保在提升金融能力的同时,不降低通用能力。相较于预训练,这种垂类模型训练成本极低,算力需求下降了两个数量级(仅需百卡级别)。
同时,模型训练需设定安全围栏,将安全领域知识融入训练,确保智能体知晓业务底线。
智能体的应用不是一次性的软件交付,而是一个持续培养与迭代的过程(类似从入学到工作的成长)。我们需要从评测入手,通过分析错题(Badcase)来判断是知识缺失、工具不足还是产生幻觉。例如,针对大模型在大数计算上的短板(如概率导致的数值错误),我们限制其直接计算,转而强制调用银行系统 API 以确保准确性。
最后,我想强调:大模型在产业应用中不仅是技术的重塑,更是业务战略的重塑。我们应突破传统思维框架,思考如何让大模型重塑现有的工作流程。
谢谢大家。
