长江证券:OpenAI 揭秘 “草莓” AI Meta 多模态新技术重磅落地

Zhitong
2024.09.05 02:21
portai
I'm PortAI, I can summarize articles.

长江证券发布报告称 OpenAI 和 Meta 在 AI 技术领域取得重大突破,OpenAI 计划推出代号为"草莓"的新 AI,旨在提升答案准确性和解决复杂数学问题。Meta 发布的 Transfusion 方法将推动多模态模型训练。这些技术进展预示着 AI 行业将继续发展,提升用户体验并带来全行业技术创新。

智通财经 APP 获悉,长江证券发布研报称,OpenAI 计划最早在今年秋天推出代号为 “草莓” 的新人工智能,该人工智能旨在改进即将推出的 “Orion(猎户座)”,以帮助 OpenAI 减少模型生成的错误数量,提高答案的准确性。Meta(META.US) 最近发布了融合 Transformer 和 Diffusion 的训练能够生成文本和图像模型的统一方法 Transfusion,该方法有望用于训练真正的多模态模型。AI 技术关卡持续突破,用户体验逐步提升。OpenAI 和 Meta 等头部企业对 AI 技术的突破以及应用拓展将会带领全行业技术创新和用户体验的提升,AI 行业拥有广阔的发展前景。

OpenAI 计划推出代号为 “草莓” 的新人工智能。1) AI 大模型技术更新推动演算能力提高。“草莓” 具备解决以前从未见过的数学问题的能力,这是当今的聊天机器人所无法准确做到的。给予长时间演算时,“草莓” 还能够回答用户更主观的问题,适用于对时间不太敏感的用例。2) 训练数据生成能力增强。“草莓” 旨在改进即将推出的 “Orion(猎户座)”,可以帮助 OpenAI 克服获取足够高质量数据的限制,以便利用现实世界的数据训练新模型,并帮助 OpenAI 减少模型生成的错误数量,提高答案的准确性。“草莓” 的推理能力有望被整合进 ChatGPT,同时,该技术还将对未来能够完成多步骤任务的智能体产品产生深远影响。

Meta 多模态模型训练方法取得新进展,全新视觉模型性能出色。1) 高性能图像与文本生成能力。Transfusion 能够生成与相似规模的扩散模型相媲美的高质量图像,而且,它同时也保持了强大的文本生成能力。在 GenEval 基准上,Transfusion 模型优于 DALL-E2 和 SDXL 等其他流行模型,且在文本基准上达到了 Llama1 级别的性能水平。该方法使用前景十分广阔,有望用于训练真正的多模态模型。2) Sapiens 优化视觉任务。Meta 推出的全新视觉模型 Sapiens 对二维姿势预估、身体部位分割、深度估计和表面法线预测四大关键视觉认为进行了优化,在多种场景均有用武之地。3) 泛化能力卓越,用户使用便利。Sapiens 模型易于针对个别任务进行调整,面对真实世界数据时表现出卓越的泛化能力。即便是在标注数据稀缺或完全使用合成数据的情况下,Sapiens 依然拥有出色的性能。此外,该模型易用性强,为具有不同训练设置偏好的用户提供了多样化的安装路径选择。

AI 技术关卡持续突破,用户体验逐步提升。OpenAI 和 Meta 等头部企业对 AI 技术的突破以及应用拓展将会带领全行业技术创新和用户体验的提升,AI 行业拥有广阔的发展前景。AI 技术及应用领域持续突破,建议持续关注 AI 在视觉成像和内容创作等各领域的商业化落地。

风险提示

1、AI 技术发展不及预期风险;

2、内容监管风险。