AIGC Weekly #98

介绍了多个重要的开源 AI 模型和工具，包括 Ai2 的 Tülu 3 模型、Mistral AI 的 Pixtral Large 124B 和 FLUX 工具套件。还讨论了诸如 Grok 能力更新、Runway 扩展视频支持、Anthropic 与 AWS 的合作等动态。此外，推荐了多款 AI 应用和工具，如 Hero 日常助理和 Notclass 视频搜索工具。精选内容包括关于马斯克与 Sam 的诉讼电子邮件、AI 代理的构建指南以及大型语言模型的介绍等。

歸藏

封面提示词在这里

上周精选✦

Ai2发布完全开源的 Tülu 3 模型

Ai2依然在坚持他们的完全开源LLM计划，不同的是这次的模型看起来很强大，意味着你跟着他的训练代码、数据和训练方式也可以训练出类似的模型。

Tülu 3 是一系列开源的最先进的后训练模型，它不仅包括了模型本身，还提供了所有的数据、数据混合、训练方案、代码、基础设施和评估框架。

这个系列的模型通过多轮训练、人工数据与合成数据的结合、多种训练算法和目标，以及新的训练方法和数据集，实现了在不同任务之间保持性能平衡的能力。

Tülu 3 还提供了详细的评估指南、数据去污、配方设计的指导，以及可扩展的合成指令数据集、基于策略的偏好数据集、带有可验证奖励的强化学习方法等。这些发布的资源使得研究人员、开发者、AI 从业者和企业家能够根据自己的需求，训练出与 GPT、Claude 和 Gemini 等领先闭源模型相当的开源模型

An image to describe post

Mistral AI 开源 Pixtral Large 124B&le Chat大幅迭代

Mastral AI上周直接拿了一个完全免费的的类似 ChatGPT 的产品出来。不全了自己在Chatbot上的短板，基本上该有的功能都有了。

开源 Pixtral Large 124B 多模态模型
- 原生多模态，使用交错图像和文本数据进行训练
- 在多模式任务上表现出色，在遵循指令方面表现出色
- 从头开始训练的新型 400M 参数视觉编码器
- 基于Mistral Nemo的12B参数多模态解码器
- 支持可变图像尺寸和长宽比
- 支持 128k token 的长上下文窗口中的多个图像
支持 AI搜索、Artifact、图像理解、图像生成的 le Chat
- 带有引用的网络搜索功能
- 用于构思、内联编辑和导出的画布（Artifact）
- 最先进的文档和图像理解
- 图像生成，由 Black Forest Labs Flux Pro 提供支持
- 所有功能完全免费

An image to describe post

Black Forest Labs 开源官方 FLUX 工具套件

在FLUX发布的FLUX Pro 和后面的模型都没开源后，我本来以为黑森林工作室都不想再开源FLUX的内容了，没想到直接整了个大的，发布了三个重要的FLUX辅助套件工具。

FLUX.1 Fill：局部重绘和扩图模型，超越了 Ideogram 2.0 等现有工具和 AlimamaCreative 的FLUX-Controlnet-Inpainting等流行的开源变体。
FLUX.1 Depth&Canny：官方Controlnet模型， FLUX.1 Depth优于Midjourney ReTexture等专有模型。特别是， *FLUX.1 Depth [pro]*提供了更高的输出多样性。
FLUX.1 Redux：用于生成图像变化。给定输入图像，FLUX.1 Redux 可以重现具有轻微变化的图像，从而可以细化给定图像。

我自己尝试了之后最惊喜的是 Fill 模型，重绘和扩图的效果自然而且提示词遵循很好，两个Controlnet中规中矩，Redux的在Dev上效果看起来没那么好，还得等社区探索一下。

模型下载在标题的链接里，Fill的FP8模型在这里小显存可以用这个，ComfyUI也第一时间支持了这几个模型，工作流可以在这里找到。

An image to describe post