The Agent Watch
EN FR DE ES 中文 中文 IT PT SV FI DA
简报 文章 工具 关于 EN FR DE ES 中文 IT PT SV FI DA

每日简报

2026 年 7 月 1 日 · 4 简报 (site)

🔥 头条

01

Nvidia 发布完整的免费工具包,让任何人都能构建自己的 AI 智能体

想象一下,你想构建一个能搜索信息、下订单、为你填写表格的助手 —— 简而言之,一个「AI 智能体」。如今,你要么为现成方案付出高昂代价,要么自己拼凑数十个互不兼容的零件。Nvidia 刚刚一次性发布了整套工具包,而且免费:一个用于编排多个智能体的框架、它们之间共享的记忆、一个让它们安全运行的隔离空间,以及一个拥有 5500 亿参数的、据称比上一代快 5 倍的语言模型。这就好比一家汽车厂商同时以开源许可证发布发动机、底盘、仪表盘和变速箱。首批用户都是你耳熟能详的名字:Perplexity、Palantir、ServiceNow、CrowdStrike。对于像 Info-Sys 这样每天都在使用 Claude Code 的公司来说,这意味着现在有了一个可信的备选方案,万一美国供应商变得无法访问 —— 例如因 6 月 12 日那样的新出口管制。

02

Anthropic 让大企业把 Claude Code 锁在自己的云里

很多 IT 部门拒绝使用 AI 助手,因为它们会把数据传出去。Anthropic 刚刚为大企业解决了这个问题:现在你可以在公司自己的云墙后面运行 Claude Code —— 无论是 Amazon、Google 还是 Microsoft —— 同时保持与企业账户的连接。打个比方,这就像你可以租下世界级运动员的肌肉,却永远不让他离开你的健身房。该系统处理员工身份验证、团队级规则、按用户计费,并以行业标准格式发送活动日志。对于像 Info-Sys 这样每天都在使用 Claude Code Pro 的技术团队而言,这是从试验性使用走向在有严格安全要求的客户那里真正部署生产时,所缺失的入口

03

Anthropic 推出「研究者的 Claude」,能使用 60 种实验室工具并自查引用来源

做科学研究意味着整天在不同工具之间跳来跳去:PubMed 查文献、Jupyter 做计算、终端跑模拟、UniProt 查蛋白质,诸如此类。Claude Science 把这一切整合进一个智能体,它知道每项任务该用哪个工具,并让第二个智能体(其职责是核对引用是否准确、计算是否正确)来审阅它的回答。对一个生物学实验室而言,这相当于一个永不疲倦的研究助手,它永远不会用错索引,也永远不会编造参考文献。Anthropic 并未止步于生命科学:模型被设计为可扩展到其他领域 —— 金融、法律、工程。对于任何构建产品的人来说,这证明了同一个智能体引擎可以按行业专精化,并自身成为一种产品。

04

一家日本初创公司推出能自行决定把工作交给谁的助手:ChatGPT、Claude、Gemini 或它自己

如今选择 AI 助手意味着选定一家供应商 —— 然后坚守。日本初创公司 Sakana 采取另一种思路:单一智能体,针对每个问题自行决定是直接回答,还是把工作交给另一个模型 —— 无论是 GPT、Claude、Gemini 还是它自己的模型。这就像有一位项目经理,他了解每位团队成员的专长,并知道该根据问题的性质找谁。Sakana 的主张既是政治性的,也是技术性的:它声称自己的性能可比肩美国顶尖模型,却不依赖其中任何一家 —— 这是对 6 月份某些模型遭遇出口管制的明确回应。对于密切关注此事的观察者来说,这印证了单体模型正在让位于编排者

📡 值得关注

Claude Sonnet 5:比之前便宜 5 到 7 倍,个人用户免费 —— 智能体经济的天平倾斜了

Anthropic 推出了 Claude Sonnet 5,定位为 Sonnet 系列中「最具智能体特性」的一代,并将其设为免费版与付费消费版的默认模型。入门价格比顶级 Opus 低 5 到 7 倍,而在常见智能体任务上的性能与 Opus 非常接近。对于消耗大量 token 的技术栈而言,这意味着性价比出现了重大转变:到 8 月底之前,引入价格为每百万输入 token 2 美元、每百万输出 token 10 美元。如果基准测试在真实条件下成立,那就是一个信号 —— 在非关键负载上转向 Sonnet 5 成了不假思索的选择。

Anthropic 会把 Claude Science 扩展到生物之外吗?

Claude Science 目前仅以 beta 形式向生命科学开放。如果 Anthropic 把它扩展到金融、法律或工程领域,那就意味着 Anthropic 正在进军一系列「按行业垂直细分的 Claude Cowork」。值得密切跟踪,因为这是任何智能体厂商都可以复制的产品模式。

围绕 Nvidia 的联盟在壮大 —— 2026 年底谁来掌控开源智能体技术栈?

已有七家首批合作伙伴加入 NemoClaw 联盟(Perplexity、Palantir、ServiceNow、CrowdStrike、Glean、Kilo Code、LangChain Deep Agents)。如果该联盟在年底前达到二十家成员,Nvidia 将在事实上成为西方开源智能体技术栈的参照厂商,其分量堪比服务器领域的 Linux。

由 Nvidia、Microsoft、Canonical 和 Red Hat 共同打造的「信任沙箱」会成为标准吗?

在与系统其余部分完全隔离的空间中运行智能体,是安全性的基石。由 Nvidia、Microsoft、Canonical 和 Red Hat 联合宣布的OpenShell Secure Runtime 正瞄准这一角色。如果它被早期用户之外的更多厂商采用,它可能成为生产环境中运行智能体的事实标准 —— 与 Google 和 Amazon 各自云上的技术相当。

📊 趋势

2026 年 7 月 1 日印证了智能体技术栈正在高速成型。四层同时涌现:模型层(Nvidia 的 Nemotron 3 Ultra 与 Anthropic 的 Claude Sonnet 5 价格降到原来的 1/5 至 1/7);编排工具层(Sakana Fugu 打出「一个为所有人」的牌,NemoClaw 发布完整技术栈);信任沙箱层(OpenShell Secure Runtime 跻身事实标准的候选);垂直化产品层(Claude Science 证明同一个引擎可以按行业产品化)。对用 AI 构建产品的人而言:对单一厂商的依赖从未如此危险 —— 也从未如此容易被削减。