AI 总结能力是 AI 出现时最基本也是使用最多的场景。

我在平时可以快速阅读如此多的内容,维持每天高强度的输出也很依赖 AI 总结能力。

现在几乎每一个 AI 助手都有总结能力,不管是网页版本还是浏览器插件。

从我的体验结果来看在长内容总结这件事情上做得好的产品寥寥无几。

如何更好的总结长文内容?

对内容进行总结化用然后用自己的上下文进行理解和记录是我们学习知识的必经之路。

总结的目的就是对知识用我们自己的方法进行压缩并且在合适的时候可以被我们找到。

Tiago Forte 是 Forte Labs 的创始人,他一直在帮助人们用成体系的方式创建自己的“第二大脑”。

他提出了一种叫“渐进式总结”的方式帮助人们建立可查找和可复用的笔记。

这是一种通过逐层压缩信息来设计易于发现的笔记的技术。

渐进式总结总共分为五个阶段

  • 第1层:渐进式摘要的起点,就像一切其他内容建立的基石,基本就是原文。
  • 第2层:是第一轮真正意义上的总结。寻找关键词、短语和句子,觉得它们代表了所讨论的观点的核心或本质。在这部分需要完成价值的判断,看一下是不是值得记录为第三层做准备,对我来说也是是不是值得发布。
  • 第3层:用高亮显示,在所有加粗的段落中找出数量较少的高亮段落。追求的是 "精华中的精华",只有在真正有特色或有价值的地方才会加亮。而且只在复习笔记的时候添加第三层。
  • 第4层:虽然还是在总结,但已经超越了强调别人的话,而是用自己的话来记录。
  • 第5层:对于极少数的资源,即那些让想让它们立即成为你思考和工作方式的一部分,对它们进行融合。在从1-4层的各个角度进行剖析后,再加入自己的想法和创意,把它们变成别的东西。

An image to describe post

一个好的 AI 总结工具应该满足哪些要求?

渐进式总结基本上覆盖了我们需要对长内容压缩和总结的各个阶段,所以我们可以以这个原则来考核和设计 AI 总结产品。

所以一个好的 AI 总结工具需要满足下面这些要求:

  • 足够长的上下文,支持大文件和多文件上传,支持多种格式文档或内容(这个跟模型以及 RAG 能力相关)。
  • 需要保证可理解性,排版合理,不能丢失关键信息,总结需要逻辑完备(大部分总结工具这里问题很严重 LLM 偷懒复述标题)。
  • 确保可发现性,不能又臭又长几乎把全文吐出来(这部分较少出现,LLM 现在的问题还是输出过少而不是过多)。
  • 在第三层总结需要识别出最具价值的内容,精炼的展示出来供用户挑选。
  • 总结后的内容以及用户按照文档项目和 AI 交流的内容需要方便检索和回顾,方便完成第三层和第四层的总结。

案例分析-如何实现这些要求?

前几天对这些AI 工具做测试的时候给腾讯的元宝扔了一个长文档让他总结一下,结果发现输出结果后面跟了一个“深度阅读该文档”的按钮。

试用了一下给了我很大的惊喜,在长内容总结和深度阅读的任务,我现在几乎只用元宝来做了。

我们先看上面要求的第一部分,元宝的深度阅读支持单文件 100M 大小的文件,最多支持 256K Token 接近 50 万字的上下文,这可能是除了 Gemini 之外我见过的支持上下文最多的产品了。

在常见的文档总结和论文总结上几乎不存在需要超过这个量级的需求场景。
An image to describe post

这里我们用前几天苹果发布的关于他们自己 AI 系统的论文来做测试,这篇论文有 47 页内容之多。

进入深度阅读页面之后,顶层主要分层两部分,分别是精读和原文。精读由三部分组成,分别是核心速览、论文评价以及关键问题和回答。

核心速览的部分对应渐进式总结的第二层,将整个文章完整的内容和逻辑展示给你,让你快速判断内容价值,而且不会有常见的 AI 总结工具存在的偷懒问题,甚至将 PDF 中的图片提取了出来,做了图文混排帮助你理解。
An image to describe post

然后论文评价和关键问题解答的部分就对应渐进式总结的第三层,通过让 LLM 主动反思的方式挑选内容最有价值的部分供用户挑选。

比如这里 LLM 主动找到的数据集收集和处理的内容、后训练阶段性能提升以及低延迟和能力的平衡都是苹果 AI 系统比较关键的部分。

如果我要记笔记的话可能也会从这几个点去记,尤其是实现低延迟的部分。
An image to describe post

另外元宝也给了万一 LLM 没有找到对应的高价值内容的补救方案,你可以选择右上角的提问,直接询问元宝对应内容

而且这个提问的内容和文档是绑定的,你下次回来可以直接查看自己上次询问的内容,不需要找到聊天记录,滚动好久找半天。而且深度阅读的聊天记录和别的对话记录是独立的

相较于其他 AI 助手在内容的检索和回顾这里也做的很好。
An image to describe post

另外你也可以在顶部 TAB 切到原文阅读,阅读的时候选中内容的快捷方式也很合适,可以翻译内容、以及直接调用 AI 搜索搜索自己不知道大相关知识。

An image to describe post

目前看下来唯一的问题是触发入口有点深,单拆开其实挺好的,不然每次为了触发还得先在主流程走一遍浪费 Token 不说还等浪费时间等待第一次的输出。

另外如果总结的内容支持划线之后收藏到一个地方就更好了,还可以提高用户留存。

我们日常其实最多的还是网页,希望也可以尽快搞一个浏览器插件或者总结链接内容,我尝试了一下直接给他网页链接是可以总结的,但是无法触发深度阅读。

如果觉得有帮助的话可以把内容发给你觉得有需要的朋友🙏。