"The best open-source large model"! Reports say that Meta will launch 2 small versions next week, with Llama 3 paving the way for the official version to be released in the summer

华尔街见闻

2024.04.09 00:22

I'm PortAI, I can summarize articles.

报道称，正式版 Llama 3 将支持多模态处理，先行推出的两个小版本则不具备这一能力。

当地时间周一，科技媒体 The Information 援引一位 Meta 员工消息报道称，该公司计划在下周推出两个小型的 Llama 3 大语言模型（LLM），作为夏季推出正式版 Llama 3 的先行版本。

这两个小模型的发布，预计将为 Llama 3 的正式亮相进行铺垫。Meta 在去年 7 月份发布了 Llama 2，此后，包括谷歌、马斯克旗下的 xAI 与 Mistral 等在内的数家公司发布了开源的大语言模型，竞争十分激烈。

Llama 3 直接对标 OpenAI 的 GPT-4，后者已经成为一个强大的多模态模型，不仅能够处理更长的文本，还支持图像输入。

报道称，正式版 Llama 3 也将支持多模态处理，即同时理解和生成文本及图片；而先行推出的两个小版本则不具备这一能力。

一般而言，较小的模型成本更低，运行更快，尤其在运行大型模型成本高昂的当下，其价值尤为凸显。小型模型还便于开发者在移动设备上开发人工智能软件。

Meta 此前已推出三个版本的 Llama 2，其中最大的一个拥有 700 亿个参数，另外两个版本分别拥有 130 亿和 70 亿个参数。

据硬 AI 此前文章，Llama 3 的最大版本可能会拥有超过 1400 亿个参数。

Meta 还将在 Llama 3 中改进 Llama 2 在响应争议性话题时过于保守的问题，研究人员计划放松大模型在这一方面的限制，以便它更多地与用户互动，提供背景信息，而不仅仅是拒绝回答。