
过去 24 小时 AI 和技术发展总结(2025 年 10 月 23 日-24 日)

模型发布与更新
• xAI 推出物理世界交互 AI 模型:xAI 发布一款突破性 AI 模型,旨在提升对物理世界的理解和操作,支持机器人和自主系统应用。
• OpenAI 更新 ChatGPT:OpenAI 为 ChatGPT 推出重大更新,提升复杂问题解决的推理能力,并发布 ChatGPT Atlas,一款集成 AI 的浏览器,支持上下文记忆和自主操作(macOS 版已上线,其他平台即将跟进)。
• Anthropic 发布 Claude 3.7 与更新:Anthropic 推出 Claude 3.7,强调增强安全协议;同时更新 Claude 3.5 Sonnet 和 Claude 3.5 Haiku,并添加 “计算机控制” 功能,支持 AI 驱动任务。
• 阿里巴巴(中国)发布 Qwen3-VL 系列:阿里巴巴推出 Qwen3-VL-2B(适用于边缘/云端)和 Qwen3-VL-32B(性能超越 GPT-5-mini 和 Claude 4 Sonnet,与 235B 参数模型相当),并发布免费 AI 聊天机器人服务,支持实时文本/语音交互。
• MistralAI 推出边缘设备轻量模型:MistralAI 发布优化版轻量 AI 模型,适用于边缘设备,降低延迟和功耗。
• DeepSeek(中国背景)开源 DeepSeek-OCR:DeepSeek 开源视觉编码器模型,支持长文档光学上下文压缩,提升 LLM 在视觉任务的表现。
• NVIDIA 开源机器人 AI 模型:NVIDIA 发布开源机器人 AI 模型和模拟工具,加速人形机器人开发,并开始出货 DGX Spark 桌面 AI 超级计算机。
新论文
• LightMem:轻量高效记忆增强生成:新论文提出 LightMem 系统,模拟人类记忆模型(Atkinson-Shiffrin),显著提升 LLM 准确率(+10.9%),减少令牌使用(117 倍)和 API 调用(159 倍),运行时间缩短 12 倍。
• Efficient Long-context Language Model Training:通过核心注意力分离(CAD)技术,提升长上下文 LLM 训练吞吐量 1.35 倍,在 512 H200 GPU 上支持 512k 令牌上下文。
• Sentient AGI NeurIPS 论文:Sentient AGI 有 4 篇论文入选 NeurIPS,包括 OML 1.0(嵌入 24k 指纹证明模型所有权,无性能损失)、LiveCodeBench Pro(小模型编码评估,10 倍缩小参数)、MindGames Arena(代理社交学习基准)和 LOCK-LLMs(加密保护开源模型)。
• 其他论文:包括 World-in-World(闭环世界模型)、Grasp Any Region(多模态 LLM 像素理解)和模拟计算芯片论文(模拟内存计算,提升 AI 效率 1000 倍)。
开源项目与公告
• Krea 开源实时文本到视频模型:Krea 开源 14B 参数文本到视频模型,支持 B200 GPU 上~11 FPS 实时生成。
• HuggingFace 开源 AI 安全工具包:HuggingFace 发布开源工具包,帮助开发者保护 AI 模型免受对抗攻击。
• DeepMind 医疗影像突破:DeepMind 发布 AI 算法,提升医疗影像诊断准确性。
• Google 量子处理器 Willow:Google 发布 105 量子比特 Willow 处理器,展示可验证加速,执行物理算法模拟信息传播。
• 中国相关公告:阿里 CEO 吴泳铭宣布开源国内最大 720 亿参数模型;京东 CEO 表示正测试 AI 自动生成营销内容;Sentient AGI 开启东亚巡回(北京、上海、首尔),推动开源 AGI。
本文版权归属原作者/机构所有。
当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。
