OpenAI 官宣第一笔收购!开源「我的世界」8 人顶级团队加盟,押注 AI 智能体
OpenAI 收购了制作开源版 “我的世界” 的初创公司 Global illumination。OpenAI 下一步会在 GPT-5 上运行多智能体文明模拟?“我的世界” 就是打造 AGI 所需要的一切?
OpenAI 官宣了有史以来,第一次收购。
刚刚,OpenAI 收购了制作开源版「我的世界」的初创公司 Global illumination,具体收购金额未知。
根据公告,Global illumination 整个团队将加入 OpenAI,未来专注于 ChatGPT 研发。
Global illumination 是由 Thomas Dimson、Taylor Gordon 和 Joey Flynn 三人共同创立,是一家利用 AI 构建创意工具、基础设施和数字体验的公司。
OpenAI 收购这个动作暗示着什么?
对此,英伟达高级研究科学家 Jim Fan 表示非常好奇:「下一步是什么?在 GPT-5 上运行多智能体文明模拟?也许「我的世界」就是打造 AGI 所需要的一切?」
「八大金刚」加入 OpenAI
Global Illumination 于 2021 年创立,是一家总部位于纽约的数字产品公司。
最近,这家公司开发了最受欢迎的产品——开源多人在线角色扮演游戏「Biomes」。
项目地址:https://github.com/ill-inc/biomes-game
一直以来,Global Illumination 所做的工作侧重在面向视觉的产品和服务上。
也就是说,OpenAI 有可能正为 ChatGPT 拓展更多的图像/视频类功能,或者是为了构建 Dall-E 2 图像生成服务,又或是推出一个文本 - 视频产品,以与初创公司 Runway 的 Gen-2 竞争。
从另一面看,这家公司命名也是与众不同。
「Global Illumination」(全局光照)一词在计算机图形学领域已经使用了很多年,用于描述在 3D 物体上创建逼真光照效果的算法。
全局光照的最初算法之一是加州理工学院(Caltech)的研究员 James Jim Kajiya 在 1986 年提出的。
这家公司共有 8 位成员组成,3 位创始人。有趣的是,官网每个人头像都用的是像素小人。
一些网友表示,此举是 OpenAI 的一次出色的「收购」,通过收购来收揽新人才。
在 OpenAI 公告中,也列出了 Global Illumination 团队在 Instagram、Facebook、YouTube、谷歌、Pixar, Riot Games 等著名公司做出贡献。
一起看看,OpenAI 从这次收购得到背后团队的强大之处在哪?
Thomas Dimson
Thomas Dimson 是 Global illumination 首席执行官。
在创办公司前,他大部分职业生涯在 Ins 度过。
2013 年,Thomas 加入 Ins,成为首席工程师,并在 5 年后,升任为工程总监。
他被称为 Ins「第 16 号工程师」,「Instagram 内容排名算法原始创作者」,于 2020 年正式离职。
在 Ins 工作的 7 年里,他在 Ins 在迭代平台的发现算法方面发挥了重要作用,比如信息排名算法、探索排名、故事排名。
另外,他还发明了故事投票贴纸、Hyperlapse,emojineering 等产品,并被 Fast Company 评为商业领域十大最具创造力的人之一。
去年,Thomas 在为 Future 写的一篇文章中,透露了他领导的团队开发了 Instagram 的个性化内容排名/推荐系统,取代了默认的反向时间顺序推荐。
Taylor Gordon
Taylor Gordon 是 Global Illumination 的首席技术官。
Taylor 已有 20 多年的编程经验,并有 8 年以上的计算机科学教育,在领先的科技公司有 10 多年的工作经验。
他本人丰富经历,遍布许多实验室 Facebook AI、Instagram、YouTube、谷歌、微软。
2019 年,他在 Facebook AI 主要做计算机视觉研究。
同样,他在 2015 年加入 Ins 后,就领导了 Feed 排名的开发,专注于机器学习和基础设施组件的排名。
2012 年,作为 YouTube 机器学习工程师,他主要负责视频推荐,领导了核心基础排名设施重构。
在微软期间,为必应搜索结果中的站内链接设计并构建了生产算法。在谷歌,负责内部核心服务和基础设施开发分析,以及监控软件。
Joey Flynn
Joey Flynn 是 Global Illumination 的首席产品官。
他本人也曾在 Facebook、Ins 工作过,被外界誉为 Facebook 的顶级设计师之一。
2010 年,他加入了 Facebook,领导了一些重要的项目,比如,Chat Heads,以及 Facebook 的移动软件 Home。
2014 年,Flynn 构思并打造了一款 Facebook 即时通讯应用 Slingshot。
Alexei Karpenko
Alexei Karpenko 本人也曾在 Facebook、Midnox、苹果工作过。
Andrew Top
Andrew Top 是 YouTube 电视应用程序背后应用程序平台 Cobalt 的技术主管,在 YouTube 工作了 7 年。
2012 年,他作为一位图形负责人加入团队,为 PlayStation 3、PlayStation 4 和 WiiU 实现各自专有图形应用程序接口 GLES 图形 API 子集。
他还设计了 Cobalt 图形渲染堆栈,让嵌入式设备上的动画帧率速度比 Chrome 更快。
Andrew 的其他贡献包括:
-设计了主要浏览器组件的高级布局,JavaScript 引擎、Web API(包括 DOM)、网络引擎和图形。
-设计并实现了一个跨平台的低延迟基于网络的解决方案,可以在电视和 VR 头显上观看 YouTube 的 3D 360 球形视频。
-设计用于监控和分析性能问题的系统。
Nick Cooper
Nick Cooper 曾在 Artifact、Ins、谷歌工作过。
Ian Silber
根据他的主页,Ian Silber 也曾在 Artifact、Ins 任职。
Brandon Wang
团队里唯一一位华人研究员,曾在 Riot Games、Pixar 致力于游戏动画的研究。
他个人也是非常擅长实时渲染、基于物理渲染、以及 Networked Gameplay。
如下,是 Brandon Wang 设计的部分项目。
开源版「我的世界」,用浏览器就能跑
「Biomes」是一个为 Web 构建的开源沙盒 MMORPG(大型多人在线角色扮演游戏)。
只需打开浏览器,就可以建造、采集、玩小游戏等等。
而对于 OpenAI 来说,其实早在 2022 年的时候就提出了一种全新的 VPT「视频预训练模型」,能够让 AI 学会了在「我的世界」里从头开始造石镐。
而整套流程需要一个骨灰级玩家至少 20 分钟的时间才能完成,总计要操作 24000 次。
研究地址:https://openai.com/research/vpt
具体来说,研究人员首先收集一波数据标注外包们玩游戏的数据,其中包含视频和键鼠操作的记录。
VPT 方法概述
然后,利用这些数据制作逆动力学模型(inverse dynamics model,IDM),从而推测出视频里每一步在进行的时候,键鼠都是怎么动的。
这样,整个任务就变得简单多了,只需要比原来少很多的数据就可以实现目的。
基础模型训练数据对微调的影响
在训练了 70000 个小时以后,OpenAI 的行为克隆模型就能实现其他模型做不到的工作了。
比如,怎么砍树收集木头,怎么用木头做木条,怎么用木条做桌子。而这一套事儿需要一个比较熟练的玩家操作小 50 秒的时间。
除了做桌子,模型还能游泳,打猎,吃东西。
甚至还有「跑跳搭」的骚操作,也就是起跳的时候脚下放个砖块或者木块,跳着跳着就能搭个柱子。这属于是骨灰级玩家的必修课了。
「跑跳搭」简陋版
而难度更大的制作钻石镐,则需要一系列漫长而复杂的子任务。
为了使这项任务易于处理,研究人员为序列中的每个项目奖励智能体。
他们发现,利用传统方法训练的 RL 策略几乎没有获得任何奖励,从不学习收集日志,而且很少收集木棍。
与之形成鲜明对比的是,基于人来数据微调后的 VPT 模型不仅可以学习如何制作钻石镐,而且在收集所有物品方面的成功率,甚至达到人类水平。
制作石镐
对此,有网友认为 OpenAI Gym playgrounds 就是一个「我的世界」。
在现实世界中应用这些系统之前,最好先在虚拟世界中进行练习,看看会发生什么。训练的速度可能也会更快。期待几个月后能看到一些「我的世界」加速运行的惊人视频。
这家初创公司的工程师团队来自高水平的设计团队,我认为 ChatGPT 很快得到大幅升级。
还有人认为,从 Global Illumination 做过的事情来看。他们的产品能力是 OpenAI 非常需要的,但是结合前几天的斯坦福 AI 小镇来看,这种高自由度运行成本低的沙盒游戏结合 AI 会有无限可能,所以 OpenAI 可能是看重了他们成员的产品能力,也可能纯粹的看上了这个高自由度的游戏。
本文来源:新智元,原文标题:《OpenAI 官宣第一笔收购!开源「我的世界」8 人顶级团队加盟,押注 AI 智能体》