关于本刊

这是猫鱼周刊的第 52 期,本系列每周日更新,主要内容为每周收集内容的分享,同时发布在

博客:阿猫的博客-猫鱼周刊

RSS:猫鱼周刊

邮件订阅:猫鱼周刊

微信公众号:猫兄的和谐号列车

私信:[email protected]

周刊马上迎来一周年,预告一篇特刊,会分享一下这一年多来写周刊的经历、收获等等。如果你有感兴趣的问题,可以邮件或者评论,到时候解答一下。

文章

不要轻易地走进 AI Native(AI 原生)

原文链接

一个很关键的观点:

绝大部分 AI 不是一个产品,只是一个功能。

我之前也说过:

对于其他一些 C 端用户来说,不同厂商的大模型体验差别会更加小。这是第一个变与不变——模型的特性、性能在变,但用户的体验基本不变。这点从一些集成了 AI 的产品来观察就能发现,很多产品并不强调背后的模型,只要打磨好用户体验就行了。

文章中,作者用地铁和支付体验作引,将产品本身的功能比作地铁,将 AI 体验比作地铁的支付体验;尝试用 AI 体验去颠覆产品本身,是不实际的,AI 只能作为里面一个亮眼的功能。

其实这个观点有很多应用实证:技术圈很火的 Cursor,没有重新开发编辑器,只是基于 vscode 深度开发,打磨 AI 编辑的体验;很火的 Arc 浏览器,也没有重新开发浏览器内核,基于 Chrome 重新打磨了 UI 和一些 AI 相关的功能;Midjourney 一开始甚至没有开发自己的网站和界面,而是基于 Discord 进行交互。

AI 对白领工作的替代并不需要重新定义工作的方式,而是以“无感接入”的形式悄然融入现有的办公流程。

针对 B 端落地场景,AI 更多的是做「提效」,甚至如果你用出「颠覆」这样的字眼,一定会遭到很大的反对:在 AI 能完成“一般”的效果的前提下,其职业稳定性、地位是否会被其动摇。另,原本一天工作量的事情,引入提效后,是否会影响其效率安排。

AutoConsis:UI 内容一致性智能检测

原文链接

美团团队的研究成果,利用算法识别目标区域,并通过 LLM 进行目标信息提取、一致性校验,来进行自动化测试,解决这类错误长期以来主要依赖测试人员对于 UI 的熟悉度,主要靠手工测试执行时来随机进行发现的问题。

比较有意思的是,采用传统算法进行识别和推理,无论是成本还是准确性都比直接用多模态 LLM 要优。

An image to describe post

近段时间在工作中的体验是,对 AI 一知半解的同事总是把 AI 当成银弹,总觉得 AI 是问题的万能终极解决方案。在我的认知中,LLM (或现在普遍认知中的 AI)算是一种「力大砖飞」,而传统的算法(或曾经的 AI)算是一种「小而美」。在具体应用上,大致是这样的经验:

  • 在细分场景下(例如提取画面中关键区域信息、给文章打标签等),算法在准确性、速度、成本都有非常大的优势,劣势是需要相关的训练数据和开发。在机器学习常见的任务(分类、回归等)中,算法比 LLM 更高效。
  • 在综合场景下,LLM 更加泛用,而且效果可能会更好。例如翻译问题,即使是预训练模型,在小语种上也依赖微调才能达到比较好的效果,但 LLM 由于训练语料大、参数多,只需要通过 Prompt 工程基本上就能达到比较好的效果,开发和调试成本都要低很多。
  • LLM 几乎不可能给出完全正确的结果。举一个比较极端的例子,OpenAI 有一篇文章讲述了他们的结构化输出是怎么实现的,其中提到,他们通过语法去过滤下一个输出的 token,使它符合 JSON 的语法。可以认为,如果没有人工规则/逻辑的限制,LLM 基本不可能输出完全符合规则的内容,这是通过 Prompt 工程也没法完全解决的。

在工程中,不能一味地觉得 AI(LLM)能解决一切问题,不要对它有过高且不切实际的期待。

AI 内容时代的反直觉现象:编辑需求不减反增

原文链接

AI 没有取代传统编辑,而是导致了 AI 内容泛滥,进而编辑的需求更多了,因为需要专业编辑去修改 AI 生成的内容。

我在 vol. 020 提到过一个「职业威胁论」的概念,不少岗位都非常忌惮 AI,提出用 AI 去颠覆或者替代他们,会遭到非常大的抵触,导致一些 AI 的不足被无限放大。但比较反直觉的是,AI 铺开之后,具备专业技能的岗位其实需求是更大的。

举一个例子,我在公司做的一个 AI 翻译的项目,把内容通过 AI 翻译后,找兼职去审校。在收集反馈的时候,有人给 AI 打了比较低的分数,指出 AI 翻译的效果细节不如人类,强调「人工审校是(翻译)最重要的组成部分」。

从专业岗位的角度说,AI 应用在更多行业铺开是必然,冲击也是必然。但短时间内,AI 暂时还做不到「替代」的能力,在专业领域只能作为「辅助」,因此保持自己的能力在 AI 之上才是不被取代的关键,也大可不必担忧被「替代」。我之前提到过的,AI 决定下限,人决定上限,在各个行业其实都是一样的。

对 AI 从业人员来说,可以预料到在专业领域推广 AI 会遇到非常大的阻力,甚至会遇到比较恶意的评价。比较安全的做法是把 AI 作为「锦上添花」的功能,夹带私货一样带进产品功能里,让他们试用后「真香」。

项目

google-gemini/cookbook

google-gemini/cookbook - GitHubgoogle-gemini/cookbook - GitHub
项目链接

Google 的 Gemini demo,最近发布了 Gemini 2.0,用起来效果挺不错。

drduh/Yubikey-Guide

drduh/YubiKey-Guide - GitHubdrduh/YubiKey-Guide - GitHub
项目链接

一个非常完善的 Yubikey 使用指南,包括设置 GPG 和 SSH 等。

CapibaraZero

CapibaraZero/fw - GitHubCapibaraZero/fw - GitHub
项目链接

FlipperZero 的开源廉价替代,基于 ESP32 开发。可以实现 WiFi/蓝牙扫描、嗅探,BadUSB,红外录制、模拟,以及一些常见的攻击等等。

最后

本周刊已在 GitHub 开源,欢迎 star。同时,如果你有好的内容,也欢迎投稿。如果你觉得周刊的内容不错,可以分享给你的朋友,让更多人了解到好的内容,对我也是一种认可和鼓励。(或许你也可以请我喝杯咖啡

另外,我建了一个交流群,欢迎入群讨论或反馈,可以通过文章头部的联系邮箱私信我获得入群方式。