
"The best open-source large model"! Reports say that Meta will launch 2 small versions next week, with Llama 3 paving the way for the official version to be released in the summer

I'm PortAI, I can summarize articles.
报道称,正式版 Llama 3 将支持多模态处理,先行推出的两个小版本则不具备这一能力。
当地时间周一,科技媒体 The Information 援引一位 Meta 员工消息报道称,该公司计划在下周推出两个小型的 Llama 3 大语言模型(LLM),作为夏季推出正式版 Llama 3 的先行版本。
这两个小模型的发布,预计将为 Llama 3 的正式亮相进行铺垫。Meta 在去年 7 月份发布了 Llama 2,此后,包括谷歌、马斯克旗下的 xAI 与 Mistral 等在内的数家公司发布了开源的大语言模型,竞争十分激烈。
Llama 3 直接对标 OpenAI 的 GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。
报道称,正式版 Llama 3 也将支持多模态处理,即同时理解和生成文本及图片;而先行推出的两个小版本则不具备这一能力。
一般而言,较小的模型成本更低,运行更快,尤其在运行大型模型成本高昂的当下,其价值尤为凸显。小型模型还便于开发者在移动设备上开发人工智能软件。
Meta 此前已推出三个版本的 Llama 2,其中最大的一个拥有 700 亿个参数,另外两个版本分别拥有 130 亿和 70 亿个参数。
据硬 AI 此前文章,Llama 3 的最大版本可能会拥有超过 1400 亿个参数。
Meta 还将在 Llama 3 中改进 Llama 2 在响应争议性话题时过于保守的问题,研究人员计划放松大模型在这一方面的限制,以便它更多地与用户互动,提供背景信息,而不仅仅是拒绝回答。
