GPT-5 首次曝光后，Altman：现在最重要的事就是 GPT-5

据 Altman 介绍，GPT-5 将是一个多模态模型，支持语音、图像、代码和视频，并在个性化和定制化功能方面实现重大更新，具备更强的推理能力和更高的准确性。当前大模型的通病——幻觉问题也将在 GPT-5 中得到解决。

OpenAI 首席执行官 Sam Altman 周三在达沃斯论坛接受媒体采访时表示，他现在的首要任务就是推出下一代大模型，这款模型可能被称为 GPT-5，与现有模型相比，GPT-5 “能做更多、更多的事情”。

OpenAI 从去年开始训练 GPT-5，几天前，Altman 在与微软创始人比尔·盖茨的对话中，首次曝光了有关 GPT-5 的详细信息，对其未来的应用前景进行了分享。

据 Altman 介绍， GPT-5 将是一个多模态模型，支持语音、图像、代码和视频，并在个性化和定制化功能方面实现重大更新，具备更强的推理能力和更高的准确性。当前大模型的通病——幻觉问题也将在 GPT-5 中得到解决。

个性化大礼包，真正的多模态模型？

Altman 强调，GPT-4.5 或 GPT-5 预计将在个性化和定制化功能方面实现重大更新，最关键的增强部分将围绕理解个人偏好的能力，比如整合用户信息、电子邮件、日历、约会偏好，以及与外部数据源建立联系。

“人们对 GPT-4 的不满和希望加强的部分，” Altman 说，“包括不同的风格，不同的假设集，我们将使所有这些成为可能，然后还能让它使用你自己的数据。”

当前外界对 GPT-5 的了解知之甚少，但从当前 Altman 披露的信息，分析预计 GPT-5 将是一个真正的多模态模型，类似于谷歌最近推出的新 Gemini Ultra 模型。

据 Altman 介绍，GPT-5 不仅支持文本输入，还支持语音、图像、代码和视频。

“输入语音，输出语音，图像、视频亦是如此，” Altman 表示，“显然，人们真的希望如此。我们已经支持了图像和音频，它的反馈比我们预期的要强烈得多。”

据 Altman 介绍，GPT-5 将具有更强的推理能力、更高的准确性。

当代大模型存在的最大问题——幻觉（胡编乱造）将在 GPT-5 中得到解决，这涉及到大模型的可靠性。

他告诉比尔·盖茨：“如果你问 GPT-4 大部分问题 10000 次，这 10000 次中可能有一次回答得很好，但它不一定知道是哪一次。而你却希望每次都能得到这 10000 次中最好的回答，因此可靠性的提升将非常重要。”

Altman 告诉比尔•盖茨，现有 AI 模型都将变成最愚蠢的模型，至少在未来的五年或十年内，这项技术将处于一个非常陡峭的成长曲线上。

他表示：“未来 AI 系统的计算能力将是 GPT-4 的 10 万倍或 100 万倍，AI 将影响社会，影响地缘政治力量的平衡，以及其他许多事物。”

众所周知，OpenAI 等许多大型人工智能实验室都将通用人工智能 (AGI) 作为最终目标，因此，早期有人认为，GPT-5 可能是某种形式的超级智能。

但根据现有的信息，GPT-5 很可能只是 GPT-4、Claude 2 或 Gemini Ultra 的改进版，它将具备更强的推理能力，不仅在许多学术评估上优于人类，理解能力也在一定程度上超越人类。

不过，GPT-5 也可能是通往 AGI 道路上的下一步。据媒体报道，在上周五的 Y-Combinator W24 活动上，Altman 告诉在场的创始人和企业家，他们应该抱着 AGI 将 “相对较快” 实现的心态。

在达沃斯论坛的媒体采访中，Altman 并没有透露 GPT-5 的具体发布时间。他说：

“我希望我们能够慢慢来，确保我们能够推出一个让我们感到满意并且对 OpenAI 来书足够负责任的产品。”

Altman 还说，GPT-5 也可能不会被叫做 GPT-5，因为这并不符合 Altman 发布产品的风格。