GPT-5 首次曝光后,Altman:现在最重要的事就是 GPT-5
据 Altman 介绍,GPT-5 将是一个多模态模型,支持语音、图像、代码和视频,并在个性化和定制化功能方面实现重大更新,具备更强的推理能力和更高的准确性。当前大模型的通病——幻觉问题也将在 GPT-5 中得到解决。
OpenAI 首席执行官 Sam Altman 周三在达沃斯论坛接受媒体采访时表示,他现在的首要任务就是推出下一代大模型,这款模型可能被称为 GPT-5,与现有模型相比,GPT-5 “能做更多、更多的事情”。
OpenAI 从去年开始训练 GPT-5,几天前,Altman 在与微软创始人比尔·盖茨的对话中,首次曝光了有关 GPT-5 的详细信息,对其未来的应用前景进行了分享。
据 Altman 介绍, GPT-5 将是一个多模态模型,支持语音、图像、代码和视频,并在个性化和定制化功能方面实现重大更新,具备更强的推理能力和更高的准确性。当前大模型的通病——幻觉问题也将在 GPT-5 中得到解决。
个性化大礼包,真正的多模态模型?
Altman 强调,GPT-4.5 或 GPT-5 预计将在个性化和定制化功能方面实现重大更新,最关键的增强部分将围绕理解个人偏好的能力,比如整合用户信息、电子邮件、日历、约会偏好,以及与外部数据源建立联系。
“人们对 GPT-4 的不满和希望加强的部分,” Altman 说,“包括不同的风格,不同的假设集,我们将使所有这些成为可能,然后还能让它使用你自己的数据。”
当前外界对 GPT-5 的了解知之甚少,但从当前 Altman 披露的信息,分析预计 GPT-5 将是一个真正的多模态模型,类似于谷歌最近推出的新 Gemini Ultra 模型。
据 Altman 介绍,GPT-5 不仅支持文本输入,还支持语音、图像、代码和视频。
“输入语音,输出语音,图像、视频亦是如此,” Altman 表示,“显然,人们真的希望如此。我们已经支持了图像和音频,它的反馈比我们预期的要强烈得多。”
不再出现幻觉,大模型的可靠性迈上新台阶
据 Altman 介绍,GPT-5 将具有更强的推理能力、更高的准确性。
当代大模型存在的最大问题——幻觉(胡编乱造)将在 GPT-5 中得到解决,这涉及到大模型的可靠性。
他告诉比尔·盖茨:“如果你问 GPT-4 大部分问题 10000 次,这 10000 次中可能有一次回答得很好,但它不一定知道是哪一次。而你却希望每次都能得到这 10000 次中最好的回答,因此可靠性的提升将非常重要。”
通往 AGI 之路,GPT-5 可能是下一步
Altman 告诉比尔•盖茨,现有 AI 模型都将变成最愚蠢的模型,至少在未来的五年或十年内,这项技术将处于一个非常陡峭的成长曲线上。
他表示:“未来 AI 系统的计算能力将是 GPT-4 的 10 万倍或 100 万倍,AI 将影响社会,影响地缘政治力量的平衡,以及其他许多事物。”
众所周知,OpenAI 等许多大型人工智能实验室都将通用人工智能 (AGI) 作为最终目标,因此,早期有人认为,GPT-5 可能是某种形式的超级智能。
但根据现有的信息,GPT-5 很可能只是 GPT-4、Claude 2 或 Gemini Ultra 的改进版,它将具备更强的推理能力,不仅在许多学术评估上优于人类,理解能力也在一定程度上超越人类。
不过,GPT-5 也可能是通往 AGI 道路上的下一步。据媒体报道,在上周五的 Y-Combinator W24 活动上,Altman 告诉在场的创始人和企业家,他们应该抱着 AGI 将 “相对较快” 实现的心态。
GPT-5 何时面世?
在达沃斯论坛的媒体采访中,Altman 并没有透露 GPT-5 的具体发布时间。他说:
“我希望我们能够慢慢来,确保我们能够推出一个让我们感到满意并且对 OpenAI 来书足够负责任的产品。”
Altman 还说,GPT-5 也可能不会被叫做 GPT-5,因为这并不符合 Altman 发布产品的风格。