隐秘 AI 巨头 “幻方量化”:大模型,不止用来炒股 | 焦点分析
文|周鑫雨 编辑|苏建勋 4 月 14 日,千亿量化私募巨头幻方量化公告称,将集中资源和力量,投身人工智能技术,成立新的独立研究组织,探索 AGI(通用人工智能)。 当幻方量化的公告卷起 “AI 炒股说” 之时,两天天后,幻方量化董事总经理陆政哲在朋友圈泼了盆冷水:“我用中文重申一下:AGI 不是用来炒股的,有大得多的用处和大得多的价值。” 自概念诞生之初,量化投资就与 AI 挂了钩。与人为管理基金产品不同,量化投资仰赖的是数学和统计模型进行预测和风控,并通过计算机技术实现下单交易。 对于量化私募基金而言,准确性和速度是核心竞争力。这也意味着,一家量化私募基金需要在程序化技术上烧大量的钱——其一,需要专业人才搭建效果更优的预测和风控模型,其二,还需要使用处理速度更快的设备和与交易所服务器物理距离更近的服务器,以提升交易速度。 当 “AGI 不是用来炒股的” 一句从幻方量化口中说出,一方面,我们有理由相信,拥有万张英伟达 A100 显卡储备的幻方量化具有训练出 AGI 的资源储备;但另一方面,在这一轮 AI 浪潮中,金融领域除了拥抱,别无选择。
文|周鑫雨
编辑|苏建勋
4 月 14 日,千亿量化私募巨头幻方量化公告称,将集中资源和力量,投身人工智能技术,成立新的独立研究组织,探索 AGI(通用人工智能)。
当幻方量化的公告卷起 “AI 炒股说” 之时,两天天后,幻方量化董事总经理陆政哲在朋友圈泼了盆冷水:“我用中文重申一下:AGI 不是用来炒股的,有大得多的用处和大得多的价值。”
自概念诞生之初,量化投资就与 AI 挂了钩。与人为管理基金产品不同,量化投资仰赖的是数学和统计模型进行预测和风控,并通过计算机技术实现下单交易。
对于量化私募基金而言,准确性和速度是核心竞争力。这也意味着,一家量化私募基金需要在程序化技术上烧大量的钱——其一,需要专业人才搭建效果更优的预测和风控模型,其二,还需要使用处理速度更快的设备和与交易所服务器物理距离更近的服务器,以提升交易速度。
当 “AGI 不是用来炒股的” 一句从幻方量化口中说出,一方面,我们有理由相信,拥有万张英伟达 A100 显卡储备的幻方量化具有训练出 AGI 的资源储备;但另一方面,在这一轮 AI 浪潮中,金融领域除了拥抱,别无选择。
非 AI 领域出身的金融机构,也能用大模型打仗
翻阅公开资料就能发现,高算力是不少量化机构宣传的重点。
比如 2022 年 9 月,头部量化私募基金明汯投资合伙人、投资总监解环宇就在世界人工智能大会上强调:“2021 年,我们自有的高性能计算集群已经位居世界超算排名 TOP500 榜单前列。预计到今年(2022 年)底,我们的计算集群将拥有 1500 张 GPU 卡,3 万 CPU 核、1Pb 内存以及 5Pb 磁盘存储,在金融数据的应用场景下 AI 算力达到 400P Flops。”
重算力的特性与长期以来我国的算力资源较为分散不无关系,能够靠高性能算力集群支撑起模型训练的金融机构更是少之又少。
据《财经十一人》介绍,国内 GPU 持有量超过 1 万张的企业不超过 5 家,即使规模最大的企业也不超过 5 万枚,而且这里面有不少都是英伟达中低端数据中心芯片。
但幻方量化担得起金融领域 “卡王” 之称。
作为目前国内唯一公开宣称拥有万张英伟达 A100 显卡的企业,幻方量化即便出了金融圈,其算力储备量在一众科技公司中也豪不逊色。
2019 年,幻方量化就成立了 AI 公司幻方 AI。从 2020 年官方披露的数据来看,幻方 AI 自研的深度学习训练平台 “萤火一号” 总投资近 2 亿元,搭载了 1100 块 GPU。
一年后,“萤火二号” 的投入增加到 10 亿元,算力约为 “萤火一号” 的 18 倍,搭载了约 1 万张英伟达 A100 显卡。数据显示,“萤火二号” 2022 年全年运行任务 135 万个,共计 5674 万 GPU 时。用于科研支持的闲时算力高达 1533 万 GPU 时,占比 27%。
用大算力砸出来的模型表现也是亮眼的。私募排排网数据显示,幻方量化自成立以来的累计收益率为 181.63%,年化收益率达 18.02%。截至 2023 年 3 月 24 日,幻方量化旗下管理的具有历史数据的 100 只基金中,94 只均为正收益。
大算力固然重要,但多个案例证明,比起算力,大量高质的数据是金融垂直领域跑出高性能模型更关键的资源。
即便具有丰富的算力储备,幻方量化仍然发文表示,数据才是 Alpha(超额收益)的根本来源。截至 2021 年,幻方量化累积的数据量超过了 10PB,每天还在从数十个不同数据源持续更新。
一个更典型的 “薄算力,厚数据” 的案例则发生在最近。
3 月 31 日,金融商业咨询平台彭博社(Bloomberg)推出了其为金融界打造的大语言模型 BloombergGPT。从官方发布的技术细节来看,BloombergGPT 的参数规模为 500 亿,远不到 GPT-3 1750 亿的参数规模。
在算力上,BloombergGPT 在训练中备份了 4 个模型,共使用了约 512 块内存为 40GB 的 A100——这对于不少头部金融机构而言,是可复制的路径。
但官方测试的结果显示,BloombergGPT 对金融任务的执行效果已经超过了现有的通用语言大模型,在通用场景的表现则持平——优异表现的根源在于 Bloomberg 构建了目前规模最大的金融数据集 FINPILE,其中涵盖了 7000 亿预训练数据量。
这一案例或许也能将不少机构从 “算力焦虑” 中解放,优质开源模型底座 + 优质垂直领域数据的思路,依然可以在垂直领域训练出专精的大模型。
AI 代替人炒股,仍在征途
不可否认的是,ChatGPT 引起的大模型热潮,对包括量化在内的金融行业会产生广泛的影响。
一方面,接入大模型有助于提升投研的效率,以个人智能助手为应用形态的 AI 能够理解分析师和研究员所输入的信息,并呈现出经过逻辑分析的检索结果。
另一方面,AI 可以通过基于大量数据的深度学习,辅助人们做出更准确的投资决策、优化交易策略,以及进行风险管理。
不少业内人士也指出,大模型对金融领域的重要意义在于超越人有限的思维,站在更高的维度对行业进行全面的解构。
“AI 做金融风险评估,不是基于人的规则,因为人的规则容易被破解,需要更高维的 AI 模型来做。” 氪信科技 CEO 朱明杰为 36 氪举了个例子:比如对交易风险的检测,银行每天有上亿笔交易,靠专家人力无法一一审核。而通过金融数据和金融专家经验数据去训练 AI 模型,就能够拥有更多的 “专家”。
但相对地,让 AI 通过深度学习从而产生超越人的思维能力,在现阶段是不少金融机构可望而不可即的图景。
就决定垂直领域模型核心能力的数据而言,出于数据安全等因素的考虑,不同金融机构之间的数据并未打通,这也意味着单一机构的数据资源较有限。尤其对于成立初期、规模有限的中小型金融机构而言,难以具备构建垂直领域模型的能力。
另一亟待完善的层面在于算法。朱明杰认为,目前 ChatGPT 有模仿的能力,但本质上还是人的思维,没有自主创新的能力,很难应对一些黑天鹅事件,“大模型涌现的能力还很有限”。
一个案例是,随着 2020 年下半年小票市场行情分化,明汯投资在同年 Q4 调整了选股模型,从而存在过度风格暴露(指基金持有的资产在风格特征上与某个特定的市场、指数或其他资产组合相关联的程度)的嫌疑。
2021 年初,招商证券发布的一篇报告提到,量化投资在未来越来越难以靠 “单纯的风格、行业暴露” 来挣钱,一定会在新的赛道展开激烈比拼,包括基本面因子深度挖掘、舆情等另类数据,以及进一步优化模型与提高算力。
量化投资行业与科技行业的缝隙正在缩窄,这也意味着金融机构在研发上依然需要舍得出血。在瞬息万变的市场环境中,不存在 “躺平数钱” 的时刻。
36kr 制图