Latest News Yesterday News Quote List Topic List Quote List

一次 10 万 token！GPT4 最强对手史诗升级，百页资料一分钟总结完毕

Wallstreetcn

2023.05.12 05:53

I'm PortAI, I can summarize articles.

Claude 反向开卷 GPT-4，卷对了方向？

号称 ChatGPT“最强竞争对手” 的Claude，今天迎来史诗级更新——

模型记忆力原地起飞，现在1 分钟看完一本数万字的小说，已经不在话下。

消息一出，评论区直接炸了，网友们蜂拥而至，“woc 连连”：

疯了疯了！

事情进展得太快了，又是为人类担心的一天！

原来，这次更新，将模型的上下文窗口token 数提到了足足 10 万，相当于 7.5 万个单词！

这意味着，大模型 “记性” 不好的缺陷现在得到补强，我们可以直接丢给它上百页上万字的材料，比如财报、技术文档甚至是一本书。

而它都能在一分钟之内帮你分析总结完毕！

要知道，之前市面上几乎所有 AI 聊天机器一次都只能读取有限数量的文本，理解长资料里的上下文关系非常灾难。

而我们人类自己去处理大篇幅的文本又太慢了，比如光是要读完 10 万 token 的材料，就需要大约 5 个多小时，更别提还要花更多的时间去理解去消化才能进行总结。

现在，Claude 直接一把搞定。

这波，简直是 “五雷轰顶”、“反向开卷” GPT-4，因为，刚刚后者也不过才做到3.2 万token。

所以，一次性比 GPT-4 多出 3 倍的处理量，Claude 效果提升究竟如何？

Claude 重磅更新：一次记忆 10 万 token

据 Anthropic 官方介绍，升级后的 Claude-100k 版本，对话和任务处理能力双双得到极大提升。

一方面，是 “一次性可处理文本量” 的增加，直接拓宽了 Claude 的可从事岗位类型。

之前，大模型最多用来处理个几十页的文档。

现在，Claude 已经能速读公司财报年报、技术开发文档、识别法律文件中的风险、阅读上百页研究论文、乃至于处理整个代码库中的数据。

最关键的是，它不仅能通读全文总结其中的要点，还能进一步完成具体任务，如写代码、整理表格等。

例如，快速理解几百页的开发文档，并根据文档开发应用程序 demo。

以 Claude 之前没见过的一项新技术 LangChain 作为示例：

当交给它一个240 页的 LangChain API 报告后，要求它快速给出一个 LangChain 的 demo 演示：

几乎没用多少时间，Claude 就快速给出了一个基于 LangChain 开发的应用程序 demo：

又例如，甩给它一个漫长但又不得不听的5 小时知识播客：

它不仅能将重点转成文字提取出来，还能快速整理表格，对观点进行分析：

难度增大一点，30 页的研究论文也能很好地处理，甚至能准确指定它整理某一章节的某一段落：

除此之外，还能帮导演处理剧本选址一类的问题。如给出《沙丘》的电影脚本，问 Claude 最适合拍摄的地点，它很快就能给出几个对应的参考地址：

最后，官方还给出了一个《了不起的盖茨比》案例，虽然没有 demo 演示。

他们将这篇喂给 Claude 后，替换了其中一个角色 Mr. Carraway，把他的角色变成 “Anthropic 里的一位工程师”，再交给 Claude 阅读，让它找不同。

几乎只用 22 秒钟，Claude 就读完这本书，并发现了 Mr. Carraway 的 “不同身份”。

另一方面则是 “记忆力” 的增加，带来了对话题掌控度的提升、以及聊天能力的提升。

此前大模型经常会出现 “聊着聊着忘了话题” 的情况，对话窗口总字数超过几千字后，开始胡言乱语。

举个栗子，如果你用大量提示词设置了一个 ChatGPT 版猫娘，那么它开始聊天后，可能几个小时就忘记了自己和你说过的话，开始表现出一些 “出轨” 的迹象（手动狗头）

但现在，拥有一次 10 万 + 个 token 记忆力的 Claude，则不太可能出现这种情况，反而能牢牢记住和你聊过的话题，连续交谈上好几天。

那么，目前我们能通过什么方式用上最新版 Claude 呢？

API 和网页版均已上线

Anthropic 先是宣布推出了 Claude-100k 的 API 版本，之后又火速上线了网页端。

所以无论你是用网页端还是用 API，目前都已经可以直接体验这个拥有 “超长记忆力” 的 Claude 版本。

很快啊，已经有网友迫不及待玩上了。

像 OthersideAI 的 CEO Matt Shumer，就试用了一下网页端的 Claude-100k 总结技术报告的效果。

他先测了波Claude-9k的效果，发现它面对长达上百页的 GPT-4 技术报告，还是会出现 “幻觉”；随后测试新版Claude-100k，发现它给出了有理有据的估计：

GPT-4 的参数量级大约在5000 亿左右！

这是它的推测过程：

不知道这波 OpenAI 的奥特曼会不会出来辟谣（手动狗头）。

还有一位 Assembly AI 的老哥，测试了一下 Claude-100k 的API 版本。

在视频演示中，他用 Claude-100k 总结了一下 Lex Friedman 的5 小时长播客（内容与 John Carmack 有关），效果看起来也非常不错：

但无论是网页版还是 API，都还不是我们能免注册直接试玩的版本。

之前我们说的不用注册、不用申请、不用 “骚操作” 就能玩、体验也很不错的是slack 端，它的添加方法我们在之前的文章中介绍过，非常简单。

遗憾的是，目前它还是 Claude-9k“体验版”。

所以，总结一下就是，这个 Claude-100k 的版本：

可以用 API 的方式体验，不过不是免费的；
网页版也行，但需要你有试用资格，没有就去申请，等一等；
Slack 端还不行，只是个体验版。

反向开卷 GPT-4，网友：卷对了方向

昨天，谷歌刚刚在 I/O 大会上宣布了数项重大更新，包括：

重构谷歌搜索、开启 AI 对话
发布大模型 PaLM 2
全面开放 Bard，不用排队直接玩

……

这被视作针对微软和 OpenAI 的一系列反击。

现在，来自 Anthropic 的 Claude 紧随其后，发布如此重大更新，直接反向开卷 GPT-4——

有网友评价：

Claude 卷对了方向。

确实，目前大部分语言模型普遍都只能处理 2-8k 的 token 量，大家都在苦苦追寻提高模型记忆力的办法。

比如上个月那篇可将 Transformer token 上限扩展到 100 万甚至 200 万的论文就引起了非常大的关注，不过网友测试效果似乎不太理想。

现在，Claude 直接 “业内第一人” 宣布做到了 100k，并拿出来给大家用，很难不让人称赞。

除此之外，还有网友 “站得更高”，称：

资本主义之间的竞争果然很美妙。

言外之意，卷得好啊卷得妙。没有巨头和各垂直企业之间的你争我抢，我们哪能在短短两天之间又目睹了如此多和重大的进展呢？

诶，不过话说回来，鉴于 Anthropic 是由当初不满意 OpenAI 与微软走得太近的几位前员工创立，而谷歌也斥资 3 亿美元投资了这家公司。

大胆猜测：

这次两人前后脚的 “一唱一和”，是不是提前商量好的？

本文作者：丰色、萧箫，来源：量子位，原文标题:《一次 10 万 token！GPT4 最强对手史诗升级，百页资料一分钟总结完毕》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。