The Agent Watch
EN FR DE ES +5 IT PT SV FI DA
简报 文章 工具 关于 EN FR DE ES IT PT SV FI DA

最新简报

2026年7月3日 · 5 items (site) · 5 items (base)

2026年7月3日,AI智能体从原型走向基础设施:五角大楼部署10万个智能体,SpaceX与Reflection签署63亿美元超级合同,开源技术栈用于审计智能体风险——智能体技术栈正式成年。

🔥 头条

01

五角大楼把超过10万个AI智能体接入同一张网,帮指挥官几秒内做出决策

当一位军事指挥官必须在几分钟内选定一个目标时,今天他要召集分析师、卫星、无人机和战地报告。明天,他会直接问一张AI智能体网络。6月26日,美国战争部宣布"Agent Network"——一套把原始情报翻译成决策选项的作战智能体系统,最后由人类把关。这是五角大楼AI加速战略的第二个大项目。7月1日,五角大楼AI负责人确认,智能体现在已经能自动处理新软件上线前的行政审批——原本最长两年的流程如今压缩到几个小时。该部门已经有350万人在使用这些工具。对普通人来说,这证明我们进入了"智能体即基础设施"的时代:不再是你去请教的一个工具,而是一群在你睡觉时替你备好工作的数字同事。

02

Exabeam发布业内第一套对齐OWASP标准的AI智能体开源风险评级框架

今天,当你把一项任务交给AI助手——写邮件、转账、订机票——,没人会在它执行前先核查它有没有这个权限。全球网络攻击检测专家Exabeam于7月1日发布两款免费软件,改变了游戏规则:Observra读取Claude Code、Codex、Gemini和Copilot这些智能体的行为并把它们整理成统一格式;Praxen则在每次执行前校验授权。可以把它想成装进所有助手里的一道自动防欺诈过滤器。新增的50个监控场景叠加既有的40个,每一项行为都会按OWASP列出的十大智能体AI风险打分。对任何想推出智能体产品的公司来说,这确认安全正在变成一层必备要件——也是一个等着被审计服务商吃下的市场。

03

SpaceX与Reflection AI签下63亿美元大单,成为AI算力的第三极

造猎鹰火箭的SpaceX今天做了一件奇怪的事:出租自己的AI服务器。6月22日,该公司与专注"开放"AI模型的美国实验室Reflection AI签下每月1.5亿美元、为期三年合计63亿美元的合同。最新的英伟达GPU安装在它位于孟菲斯的Colossus 2数据中心。这是继Anthropic和谷歌之后的第三笔同类巨额合同。SpaceX每年总共拿到270亿美元的算力收入,却从来不自称AI公司。对普通人来说,这给出一个新视角:数据中心可以像市中心的写字楼一样,变成独立的金融资产。而一直在中国模型阴影下的美国"开放"模型,终于有了打仗需要的弹药库。

04

GitHub首次允许把一款开源中国模型选为编程助手

今天你用GitHub Copilot写代码时,只能选美国闭源模型。7月1日起,付费用户也能选择Kimi K2.7 Code——由中国企业月之暗面开发的开源模型。参数总量1万亿,每次请求激活320亿,上下文窗口25.6万字符,还可以调度多达300个子智能体来拆解复杂任务。该模型托管在Microsoft Azure上,这是华盛顿与北京关系紧张之际一个不动声色的外交姿态。对不想只依赖Claude或GPT、想分散技术栈的欧洲、加拿大开发者来说,这是一个有说服力的选项。对市场来说,它证明只要一个中立云同时托管双方,"中国模型 vs 美国模型"的边界就开始模糊。

05

Ory推出直接接入Claude Code、Codex和Gemini的身份插件——认证变得无感

今天,一个能访问你银行数据的AI智能体,必须像任何员工一样完成身份验证。问题是:身份表格上还没有"机器人"这一栏。已经在全球管理25亿数字账户的Ory于6月10日发布Agent DX,一套把身份认证、权限和审计能力自动注入最常用编程助手的免费插件。安装只需一条命令行,剩下的由AI自己生成。对一家正在打造智能体产品的初创公司来说,这相当于入职第一天就拿到一张预配置好的通行证,而不是事后才去补办。对行业来说,这是一个信号:智能体的数字身份正在变成一个独立的标准,谁定下它,谁就能主导下一个十年的规则。

📡 值得关注

芯片禁令倒逼中国改在软件端发力:推理竞速已经开跑

DeepSeek于6月27日发布DSpark,一款能将其模型提速60%到85%的免费软件。加上MiMo-V2.5(每秒超过1000个token)同步发布,可以确认:中国正在用代码效率来对冲高端GPU的禁运。值得跟踪:经由vLLM和SGLang在欧洲的落地、第一批独立基准、西方厂商的反应。

AI智能体评估市场正在整合——谁会成为2027年的"智能体界穆迪"?

Exabeam的Observra/Praxen不是唯一玩家:LangSmith、Arize、Langfuse、Helicone、WhyLabs和Fiddler都在同一赛道上布局。市场大概率会收敛到两到三家头部。值得跟踪:厂商收购、与OpenAI和Anthropic的官方合作、以及竞争性的开源项目(OpenAI Evals、HuggingFace LightEval)。

微软把Kimi托管在Azure上:既是商业合同,也是政治信号

在中美关系紧张之际,看到月之暗面的模型跑在微软服务器上就是一个信号。如果其他中国模型(GLM、Qwen、DeepSeek)跟上,云端的"中国 vs 美国"边界就会进一步模糊。值得跟踪:微软针对中国工作负载的官方政策、美欧监管机构的反应、欧洲第一个使用Azure+GLM的企业客户。

五角大楼5周内由非开发者创建10万个智能体:造智能体的门槛降到零

五角大楼用5周时间、通过"vibe-coding"(用自然语言描述想要什么)造出了超过10万个智能体。如果这个模式扩散到教育、医疗和地方政府,"AI用户"这个身份就会变成"智能体创建者"。对Agent Wealthy来说,这印证了目标市场的可行性:从来没写过代码的人也能上线自己的自动化微型SaaS。

📊 趋势

2026年7月3日是一个分水岭:AI智能体上升为国家级基础设施的一层。五角大楼大规模采用它来支持军事决策,微软通过Azure把它普及化,SpaceX把它做成每年270亿美元的金融资产,而长期被忽视的安全层,借Exabeam和Ory之力成为一款完整的开源产品。对所有用AI开发的人来说:2026年一个严肃的智能体,没有身份框架、没有行为监控层、没有上线前的对抗性测试,已经无法交付。一个周末原型,正在变成必须具备银行系统同等防护的关键软件。