做 “APP” 才是未来 AI 公司的出路?
通用语言大模型如智能手机时代中的 iOS、安卓,也就类似于智能时代只需要两、三个手机系统足矣,在 AI 的全新时代里,也只需要几个通用语言大模型。对垂直领域的 AI 公司而言,机遇并不在于赶不赶得上 ChatGPT 这辆车,而是在通用语言大模型下,如何做出微信、抖音、淘宝……
作者 | 胡描 编辑 | 罗丽娟
“AI 改变世界” 似乎正在被 ChatGPT 实践,其强大的自然语言处理能力改变着各行各业,带来更多可能性。
但巨变也带来了焦虑和不安。在近期,美国非营利组织未来生命研究所发布了一封 “暂停巨型 AI 实验” 的公开信。包括埃隆·马斯克在内的上千名人工智能专家、行业高管在信中呼吁:所有人工智能实验室暂停半年对更强大的人工智能系统的开发和训练。
“人工智能大模型已经是一个既成事实,谁联名说反对都阻挡不了这件事情会跟我们共存。 ” 氪信科技 CEO、粤港澳大湾区数字经济研究院计算金融 CTO 工作室负责人朱明杰告诉全天候科技,“我们要考虑的是智能的能力突破了使用的阈值以后,我们的社会和行业会如何去改变。”
在 2015 年,朱明杰创立了氪信科技。这是一家将搜索引擎的机器学习技术用于金融领域的人工智能公司,为金融机构提供智能风控、智能营销、智能客服、异常交易监测等服务。
在企业刚成立时,投资人问朱明杰公司做的是什么,他解释了许多次:“卖模型”,模型即服务 MaaS(Model as a Service),能够解决客户的问题,客户并愿意为此付钱订阅。“说得抽象一点,就是把人类的智慧教给计算机模型,它能复用给你服务。” 但都很难被人理解。
“今年 OpenAI 的 ChatGPT 帮我们很大的忙,我不用解释很多了。” 朱明杰说。
ChatGPT 的出现,给整个 AI 行业带来了机会,同时也在重塑 AI 行业的结构。
朱明杰认为,AI 大模型是一个基础设施,可以理解智能手机时代中的手机系统,如 IOS、安卓。AI 行业不需要太多的” 系统 “,但需要许多的 “APP”。对于 AI 公司而言,机会出现在应用侧,如何在一个垂直领域中把模型做好,做得更专业才是关键。
在如今,通用语言大模型已经证明了 AI 处理自然语言的能力,但距离可信的专业大模型还有一定的距离。作为一个金融领域的 AI 企业,让一个通用型 AI 成为一个金融领域专家,这是目前朱明杰团队正在解决的难题。
对于 AI 大模型的研发壁垒,创业型 AI 公司的机会,通用语言大模型与专业模型的关系,如何打造专业的金融语言模型等问题,媒体与朱明杰进行了一场交流。
以下为对话内容,经全天候科技整理:
氪信科技 CEO、粤港澳大湾区数字经济研究院计算金融 CTO 工作室负责人朱明杰
01 “最难解决的是数据问题”
Q:最近看到了马斯克等科技人士联名呼吁暂停研发更强大的 AI,你怎么看待这个事情?
朱明杰:人工智能大模型已经是一个既成事实,谁联名说反对都阻挡不了这件事情会跟我们共存。我们要考虑的是智能的能力突破了使用的阈值以后,我们的社会和行业会如何去改变。
我们今天日常生活看新闻,玩抖音,用电商,都是基于 20 多年前的搜索革命。第一次搜索让你主动查得信息,搜索接下来带来推荐,我们的日常生活被这个技术改变了。ChatGPT 之后,你不用自己去辨别信息,你只要提出问题,它把答案全给你了,带来了完全不一样的东西。
GPT模型的核心是预测,AI 具备预测能力,因为它学习了过去人类所有的信息,及互联网的数据,汇集了人类的智慧。它能够基于此预测下面最有可能的发生的事情,所以很吓人。
OpenAI 的突破本质上第一次用了上万张 A100 的卡,并搭载巨大数据量,由 100 个年轻的没有包袱的研究员团队做到的。简单来说,做成这件事要有算力的基础,要有团队的基础,要有数据的基础。
Q:目前在 AI 大模型的研发中,大家经常谈到算力的问题,算力是最大的阻碍吗?
朱明杰:我们可以思考一下大模型的规模集训在哪里。黄仁勋他说过,他下面新的产品算力会有 50 倍的提升,算力一下子突破,原来担心的那些规模问题可能就不是问题。最后它商业上有用一定会变得成本完全可控。
今天 ChatGPT 已经证明了它巨大的商业价值,这个很像人类进入集成电路时代,最早开始搭建晶体管、电子管这些东西,这也导致最早计算机巨大无比,后来大家把这个东西封装到一个晶片上面,在晶片上把一些逻辑层封进去。
GPT 大模型和它很像,把人类的知识封装到这里面去。巨大的训练和推理背后需要很大的算力做支撑,都是有这些消耗在里面。恰恰因为半导体晶片做了芯片以后,这个东西发挥了巨大价值。有这么大的需求,就一定会以足够低的代价让大家用到。
本质上 OpenAI 解决的问题是如何把这么大的数据压缩到模型里面去,变成知识,这是它的终极目标。中间算力到底用 A100 还是 A800,用了这个 GPU 架构还是 CPU 架构,这些反而都是可解的事情。只是因为我们买不到 A100,变成卡脖子,让所有人第一个反应这个问题很重要,没有想到这个问题是为了什么。
Q:那你认为最大的难点是什么呢?
朱明杰:核心是你能不能拿到那些有价值的数据。所以最难解决的是数据问题,因此现在凡是巨头有这个条件都会全力干这个事。
10 亿美金起步价仅限于做通用的大模型这件事。垂直领域上不是钱的问题,是能不能获得那个领域上的数据,这个事情怎么干的,这写是要评估的。没干过这件事,闭上眼睛说训练大模型,这个不可能的,比通用大模型更难。
通用大模型是暴力出奇迹,砸钱按这个方法能做出来。这是一个新的时代,不缺奇迹的出现,对大家来说都有紧迫感。怀着悲观的心情在做乐观的事。
02 “大模型关上了很多门,有点像《三体》里面物理学不存在”
Q:当前有很多科技公司、互联网公司、行业大佬下场做大模型,你认为谁更可能跑出来?
朱明杰:大模型是一个基础设施,可以理解成 IOS 和安卓系统。这件事情本质上不会有很多人能做成,也不应该有很多人去做,就一两家最后做这个事情。你今天会在意你的手机到底是安卓、IOS,还是鸿蒙系统?这些不重要,关键是这上面有没有微信、小红书、淘宝……
美国在 OpenAI 之后,可能再出现一家,之后第三方初创公司的机会会很小,因为大家都不需要了。中国也会有一两家。
需要注意的是,ChatGPT 是 OpenAI 做出来的,不是微软、GOOGLE、Facebook 做出来的,他们是非常年轻的精英团队。做成这件事情真不是说要多知名的人来干,更多是一群优秀的年轻人。但也不能太多大,人类的协作不能超过规模,超过规模反而效率降低。
坦白来说,不管是国内还是国外,他们今天做这件事,今天能跟上 OpenAI 的尾灯就很不错。花三年的时间做出来一个跟得上别人东西的东西,这个难度远远超过我们的想象。
OpenAI 如果没有成功,你们都不知道有这么一拨人。我现在对大模型的观点,需要靠时间去检验。也许两年以后我们再回头看,大家会想没想到当初是他做出来的。这个东西不是能够计划出来的,有太多的变量变数在里面。
2017 年,朱明杰等人访问 Open AI 时的照片,讲话人为创始人山姆·阿尔特曼 照片拍摄:朱明杰
Q:AI 大模型的出现,对 AI 公司尤其做应用的 AI 公司来说,到底是机会还是威胁?
朱明杰:首先大模型关上了很多门,有点像《三体》里面物理学不存在。很多同行用大半生的心血做自然语言处理的具体工作,类似对话、翻译以及文本的辅助生成。但 ChatGPT 的出现导致这些工作没有价值了,很多公司做的事情不需要了。
但是 AI 的能力强到这个程度以后,就开始变成了基础设施。它就好比电,大家都看不到摸不着这些东西,但可以通过通用电气、飞利浦、西门子,甚至戴森、小米等公司的产品去感受它。简单来说,未来 AI 公司其实就是产品公司。
在我看来,中国很有必要做大模型。但不应该所有的人都去做,能做出来极少数那么一两家,剩下来的可以做飞利浦、西门子。所以对 AI 公司来说,未来有很大的窗口机会。
Q:你认为做应用的 AI 公司应该往哪个方向探索?
朱明杰:既然 iOS 已经出来了,现在就是市场被倒逼,我关心的是我们做出什么样的 APP 应用来解决它们的问题。
这里面两个挑战,一个怎么把行业的数据融合进去。比如我做金融,金融知识、专家经验及场景三个数据到底怎么去融合到一个能够帮人解决问题的金融模型里面去,做到可靠、可信。
另外,这个东西怎么去改造它的业务场景,这个对已经做了一些年的公司来说,既有挑战也有机遇,总体还是偏机会的一个事情。你的技术要与时俱进,跟新的工具整合,原来用的那套东西要升级。另一方面更大的事情,你长期在这个场景上,你了解这个场景的数据。
很薄的应用、功能点的应用不要去做了。比如前段时间很多人说多模态的事情,从文本到图到视频这些东西,既然单一的文本模态这件事情已经解决得很好了,我是不是弯道超车。问题是 4.0 出来多模态合作,就不需要了。
包括原来很多人想根据 ChatGPT 跟 Office 做一些整合,这种事情不用做了,本身就是微软的场景。有了新的 AI 大模型以后,得场景者得天下。
03 “垂直领域需要更高维的 AI 模型”
Q:氪信做的是金融行业的 AI 模型,应用到哪些方面?做金融行业的 AI 是否有风险呢?
朱明杰:我们这个公司一直在为金融行业服务,以前 AI 的门槛太高了,导致只有极少数头部的,有能力的,和有足够数据量的金融机构才愿意来尝试这个事情。
我们不是来讲故事的,要真的帮他解决问题,比如用人工智能帮人家做金融风险评估,不是靠人的规则来弄,因为人的规则容易被破解,需要更高维的 AI 模型来做这个事情。
比如交易风险的检测,银行每天有上亿笔交易,人没办法一笔笔审核。虽然专家很准,但我们没有那么多专家,培养一个专家就很难,可能 20 年经验。我们做的事情,用金融这些数据和金融专家经验去训练 AI 模型,再让 AI 模型去自动跑,从而拥有更多 “专家”。
金融行业绕不开两个问题,一个合规问题,一个是专业性问题。今天语言模型是胡说八道的,还没有人能够解决专业性问题。对金融机构来说,这是很危险的事情,如果出现问题会有一系列后果,也很难解决。
今天大家对大模型可用性和价值没有疑问了。接下来则是你落地到各个行业以后要解决的问题,如何让它变得可信。除了金融领域,还有医疗、教育等领域,都不可以胡说八道。
Q:你提到 “准确” 这件事情,现在让生成式 AI 做到这件事情几乎不可能,你们是怎么解决的?
朱明杰:这件事情相当于 ChatGPT 在内容生成上面做了一个单点突破,先证明我有这个写作能力,但可能是错的。接下来大家都在想各种办法训练出垂直领域上的可信模型出来。
这件事理论上可行,但实际操作有一些困难。因为目前包括中美等国家,很多行业大量的数据是不连通的,有的是在行业内部特有的,更往下一层在企业内部还有。比如中国银行所有的外汇交易信息、票据信息、债券信息,这些不可能跟别人共享。
我们在里面的实现路径要把三类知识装进去。
第一类是金融的领域知识,我们会跟银行合作。第二类,金融模型在不断学习相关领域所发生的场景,比如哪些人信贷违约,交易里面哪些人是骗子,营销过程中的用户行为。第三类就是把专家的经验整合到 Credit AI 模型里面去。
我们做的金融账户安全大模型目前形成了以亿为量级的模型,这个模型放到今天来讲是小模型,但对金融行业是大模型。这里面有大量金融专家的标注在里面,也有过去很多实际损失发生得来的教训。我把这个模型部署到一个银行,就能提前预测三天到两个月之内会出问题的账户。
Q:已经有实践了吗?效果如何呢?
朱明杰:最初大家不相信,我们就把预测的模型部署到客户那边,每天训练并预测你下面三天到两个月之内会有哪些账户变成坏人,但先不处理。等到月底的时候,公安会把所有的东西汇总,验证这些账户是否真的有问题。
有一家银行测试了一个月,到了月底发现出问题的账户里面超过七成的账户都是被提前预测的。
有人问我一个问题,你们用了什么规则?用了什么特征找到这些事情?我无法解释,这是我们的大模型预测出来的。但是你看它们预测出来找到的这些有问题的嫌疑对象,肯定是有问题的。他们的专家看了以后发现真是有问题。
AI帮专家做了一个大海捞针的事情,捞到的针,专家一看是针,他明白这个事情,但是没有精力天天 24 小时去看,我们相当于提供了一个机器人帮他来去监控这些事情。
Q:对金融行业来说,垂直 AI 大模型的出现,会改变这个行业的那些方面?
朱明杰:我来形容一下我们今天在金融行业做的 Credit AI 模型有和没有的区别。
没有的时候,一个银行可能几十万上百万的员工几万个网点,这里面靠大家的管理培训来做一些操作,来识别风险,这里面肯定是参差不齐的,只能靠总行来几个专家不停给他们培训提升水平。
今天我们有了 Credit AI 模型,已经把专家的经验灌到里面去,只要少数几个专家就可以完成大部分的事情。
但是这个东西不断迭代,牺牲的是普通人,在专业的领域里面依然需要专家的反馈。比如我在金融领域我的 Credit AI 模型很大程度依赖的是来自于专家的输入反馈,他觉得这个不对,这个 case 模型处理错了,就要迭代到模型里面去。
我在金融行业里面,今天很多人觉得会被改变掉。比如财富管理,在传统模式下,大家买基金或者买保险可能找朋友找顾问聊聊,知道这件事情很可信,最终解决信任的问题。但人的精力终究有限,不能一天给一百个人每人讲一个小时。通用人工智能完全可以把你的价值观和产品灌输到里面去,可以做一个专属的替代产品的入口级应用。
这件事情一定会发生,未来可能塑造像 “梁朝伟”、“刘德华” 这样形象的超级数字人去服务几百万粉丝。