周鸿祎谈大模型扎堆：现在说超越 ChatGPT 的叫吹牛

一天前科大讯飞发布讯飞星火认知大模型，称已经在文本生成、知识问答、数学能力三大能力上超过 ChatGPT。

跨入东方甄选直播间的第一件事，三六零 (601360.SH，简称 “360”) 集团创始人周鸿祎先尝了尝桌上摆放了零食。

5 月 7 日，周鸿祎连轴转场俞敏洪与东方甄选直播间，销售其名下两本书——《超越好奇》《数字安全网络战》。在东方甄选直播间不足十分钟的时间内，《超越好奇》的销量已超过在俞敏洪直播间一个半小时的销售量。

周鸿祎在东方甄选直播间内顺应了董宇辉的主播风格，主要以闲聊为主，浅谈了何为创业、年轻人的好奇心等。在俞敏洪直播间内，周鸿祎谈及对当下火热大模型与 ChatGPT 的看法，他称，以前的人工智能技术很碎片，“不通用” 的问题导致大家对它丧失了热情。

OpenAI 的成功让行业热议是否过去中国公司过于 “功利” 地追求盈利，而不愿长期投入技术。对此，周鸿祎认为，这是因为公司都比较现实，美国公司也一样，Meta(NASDAQ:META) 搞元宇宙亏了 100 亿美元也受不了，OpenAI 最牛的一点就是坚信通用人工智能能成功，且最终把这条路给趟出来了，这里面既有运气也有坚持。

至于目前国内多家公司密集推出大模型产品的现象，周鸿祎称，首先要感谢 OpenAI 与 ChatGPT 把方向跟技术路线探索出来了，第二要感谢开源生态与开放论文，剩下留给公司们要做的主要是工程化的训练层面，这是当下大家都能做大模型的原因。

至于目前国内大模型发展与OpenAI之间的差距，周鸿祎称他同意王小川的观点——差距最少有两年。此前王小川认为OpenAI比国内领先三年时间。追上GPT-3.5可能一年时间是有机会的，但目前OpenAI已经达到GPT-4的级别，GPT-5也在训练过程当中了，因此“追上”需要三年。

回到国内大模型发展问题，周鸿祎表示，互联网公司都去做大模型的原因，是因为没人能笃定某一家公司能做出来成功的大模型产品。但这个技术对中国很重要，它是工业级的，对各行各业都能带来工业革命级的推动。但在早期，周鸿祎认为后来者在大模型技术领域肯定是模仿与 “抄袭”，但在做的过程中一定会越来越了解，未来有可能会弯道超车、后来者居上，“但上来就说能超越，那才叫吹牛呢”，周鸿祎表示。

5 月 6 日，科大讯飞 (002230.SZ) 推出星火认知大模型，科大讯飞董事长刘庆峰表示，认知大模型成为通用人工智能的曙光，科大讯飞有信心实现 “智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上超过 ChatGPT。

“到今年的 10 月 24 日（科大讯飞全球开发者节），我们希望星火能够在通用认知大模型能力上对标 ChatGPT，在中文上超越 ChatGPT，在英文上达到跟它相当的水平。” 刘庆峰表示。

此前 360 推出大模型产品 “360 智脑”，在俞敏洪直播间，周鸿祎也对 “360 智脑” 进行了多模态演示。在制图环节，“360 智脑” 完成了周鸿祎与俞敏洪合照、松鼠喝啤酒等要求，但在制作 “俞敏洪喝啤酒” 图片环节发生卡顿，据了解是因 “360 智脑” 储备俞敏洪图片不足所致。

5 月 5 日收盘，360 股价 15.45 元，涨 2.73%，总市值 1104 亿元。

文章作者

吕倩