The Agent Watch
简报 文章 工具 关于 EN FR DE ES 中文 IT PT SV FI DA

每日简报

2026年6月25日 · 5条(网站)· 7条(数据库)

🔥 头条

01

Cognition AI融资10亿美元、估值260亿美元:Devin现已编写自身89%的代码

为开发者代劳编程的AI代理Devin背后的团队,刚刚完成超过10亿美元的D轮融资,估值达260亿美元,由Lux Capital、General Catalyst和8VC领投。震撼数字:在Cognition内部推向生产的代码中,89%如今由Devin自己编写。剩余的11%来自Windsurf编辑器中的姊妹代理。年度经常性收入达4.92亿美元,企业级使用量自1月以来翻了10倍,奔驰、高盛、花旗、戴尔、美国陆军等大客户已付费。真实案例:奔驰将一个耗时8个月的遗留系统迁移项目压缩为8天。代理实验室把自家代理当成最大的客户来用——市场也按顶级AI公司的价格给其定价。

02

OpenAI收购Ona:Codex在您合上笔记本后仍能继续工作

OpenAI宣布收购Ona——一家为开发者构建安全、可复现云环境的初创公司,目前服务200万用户。这一押注的逻辑是:Codex应当在客户的云端持续工作数小时乃至数天,即便您的笔记本已经合上。这笔交易回应了代理编程最常见的质疑——「我关掉标签页后会怎样?」——通过为代理提供一个常驻的家,配备恰当的权限、日志与隔离。Codex目前已有500万周活跃用户,较1月增长4倍。有了Ona,Codex不再是一个登出即遗忘一切的智能补全,而成为一位在您睡觉时仍能完成工作的同事。对企业而言,这是把一份有趣的演示变成生产系统所缺失的最后一块。

03

Cursor Bugbot速度提升3倍、成本降低22%——AI代码审查器现已在推送前运行

Cursor编辑器背后的团队升级了Bugbot——这款负责审查您代码的AI代理。依托新模型Composer 2.5,Bugbot现在仅需约90秒即可完成一次审查(此前约5分钟),每次运行多发现10%的Bug,运营成本降低22%。新命令/review将Bugbot与Security Review代理合二为一,您打开拉取请求之前一键完成——并记忆已检查内容,避免GitHub与GitLab重复审查。简言之:更便宜、更快、更前置、更少重复告警——正是那些看似无聊却决定代理能否在真实团队中被使用的优化。

04

OpenAI推出Daybreak:GPT-5.5-Cyber、Codex Security与Patch the Planet守护开源

OpenAI在Daybreak品牌下一次发布三款安全产品。GPT-5.5-Cyber在CyberGym基准上取得85.6%分数(标准GPT-5.5为81.8%),仅向已核实的防御方发放。Codex Security是Codex的新插件:构建仓库的威胁模型、识别漏洞、判断哪些可被实际利用、生成补丁、验证补丁有效。Patch the Planet是与Trail of Bits、HackerOne及28家发布伙伴共同发起的项目,向cURL、Go、Python、Sigstore、pyca/cryptography等知名开源项目推送自动化补丁——已扫描30,000个仓库与3,000万次提交。OpenAI押注的是:真正的网络安全瓶颈不是发现漏洞,而是交付补丁。

05

OpenAI揭晓Jalapeño:与Broadcom用9个月打造的首款推理芯片

OpenAI揭开了Jalapeño的神秘面纱——其首款专为大规模运行大语言模型而设计的芯片。与Broadcom(硅片)和Celestica(板卡与机架)仅用9个月联合开发,该芯片已在OpenAI实验室驱动GPT-5.3-Codex-Spark。吉瓦级规模部署计划于2026年末在微软及其他合作伙伴处落地。不同于通用GPU,Jalapeño针对ChatGPT、Codex与API的真实内存与流量模式深度调优。对普通用户而言,AI响应更快、更便宜;对行业而言,OpenAI不再向英伟达租用全部算力。

📡 关注

DeepSeek V4.1 Flash与Pro:降价15%、多模态、为代理编程而生

DeepSeek发布了V4家族的更新版本:保持100万token上下文窗口,V4.1 Flash每token价格降低约15%,两个版本都针对更长的多步骤代理任务与工具调用进行优化。V4.1同时新增图像与音频输入(V4所缺失)以及MCP标准。V4.1 Flash继续保持开源权重(MIT许可证),并已集成至Cursor、Continue、Aider与Cline。凭借上周完成的融资,DeepSeek能够继续压低美国市场报价——关注V5,预计Q3发布。

Cerebras对阵OpenAI Jalapeño:专用推理芯片之战正式打响

OpenAI的Jalapeño是继Cerebras发布后一个月内登场的第二款专用推理芯片。据称Broadcom正向微软施压,要求其承诺包下Jalapeño首批产能的40%——但微软也在自研Maia 2与Trainium芯片。预计未来18个月将上演三方角逐,将决定每次代理调用背后的利润空间。

代理基础设施正被吞并:Ona(OpenAI)、Windsurf(Cognition)、Tavus传闻中

短短数周内,三笔代理基础设施布局被收购或整合:Ona并入OpenAI,Windsurf并入Cognition,Tavus据传正在洽谈。实验室们正在购买让代理真正跑起来的层——云工作空间、编辑器界面、超写实视频。预计在模型层自身走向整合之前,代理「管道」领域将出现更多整合。

Patch the Planet对阵Anthropic Glasswing:两家实验室,一场开源安全之战

OpenAI的Patch the Planet与Anthropic的Glasswing都希望资助关键开源项目的自动化补丁,以维护者为核心受众。若两家都认真投入,将显著加速整个互联网所依赖之软件的修复;若仅有一家跟进,另一家将独揽开源社区的好感垄断。

📊 趋势

2026年6月25日似乎是代理经济跨过门槛的一天。四件事同时交汇。(1)代理运营自己的公司:Cognition的Devin编写了Cognition自身89%的代码,市场据此给出260亿美元估值。(2)代理不再受会话束缚:OpenAI收购Ona使Codex成为您睡眠时仍持续工作的同事,配备恰当的权限、日志与隔离。(3)代理变得更便宜、更早进入循环:Cursor的Bugbot 90秒出结果、成本降低22%,且在代码离开您的机器前就完成审查。(4)代理获得了缺失的芯片:OpenAI的Jalapeño为模型实验室提供自有推理引擎,达到吉瓦级规模。这不是某一孤立突破——而是同时补齐了将代理拒于生产之外的四道最大缺口:信任(89%自产自用)、持久性(Ona)、成本(Bugbot,以及上周的Engram)、基础设施(Jalapeño)。当这四道缺口被补齐后,唯一剩下的悬念是:哪家实验室率先触及下一个十亿用户?