Meta Platforms is planning to release Llama 3 in July, with capabilities close to GPT-4, with up to 1.4 trillion parameters.

华尔街见闻
2024.02.29 01:47
portai
I'm PortAI, I can summarize articles.

Meta 希望 Llama 3 能够比肩 GPT-4,但尚未决定是否将其开发成多模态模型。参数最高 1400 亿,不到 GPT-4 的十分之一。

当地时间周三,科技媒体 The Information 援引知情人士报道,Meta 计划在今年 7 月份发布 Llama 3 大模型。

Llama 3 肩负的使命巨大。

报道称,Meta 希望 Llama 3 能够比肩 OpenAI 的 GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。

但 Meta 的一位员工透露,由于研究人员尚未开始对模型进行微调,因此公司尚未决定 Llama 3 是否是多模态的。微调是开发人员为现有模型提供额外数据的过程,以便大模型学习新信息或处理任务。

Meta 员工还说,Llama 3 最高可能拥有超过 1400 亿个参数,相比之下,去年 7 月发布的 Llama 2 的参数最高为 700 亿。

据此前报道称,GPT-4 模型参数规模约为 1.8 万亿,Llama 3 不到这一数字的十分之一。

另外,在推出 Llama 3 之前,Meta 还在尝试克服 Llama 2 中发现的一个问题——无法处理任何有争议的问题。

由于开发人员在 Llama 2 中增加了安全护栏,它会拒绝回答一系列被认为有争议的问题。

据 Meta 员工称,这些护栏使得 Llama 2 在公司高层领导以及模型研究人员眼中显得 “过于安全”,研究人员计划放松 Llama 3 在这一方面的限制,以便它更多地与用户互动,提供背景信息,而不仅仅是拒绝回答。

人们对 Llama 3 的期待与日俱增,但 Meta 仍面临着旷日持久的人才竞争。

两名知情人士称,负责 Llama 2 和 Llama 3 安全工作的研究员 Louis Martin 已于本月离开公司。其中一位知情人士称,强化学习负责人 Kevin Stone 也在本月离职。