The Agent Watch
Briefing Artigos Ferramentas Sobre EN FR DE ES 中文 IT PT SV FI DA

Último briefing

2 de julho de 2026 · 5 entradas (site) · 5 entradas (base)

A 2 de julho de 2026, três sinais convergem: o regresso do Claude Fable 5 após uma suspensão de três semanas, a oficialização do framework agêntico open source da Microsoft, e 230 milhões de dólares angariados por dois especialistas em auditoria de agentes. A stack agêntica entra na sua fase de maturidade industrial.

🔥 Em destaque

01

Anthropic recoloca em serviço no mundo inteiro o seu assistente IA de topo, suspenso três semanas após uma falha de segurança

Quando utiliza um assistente IA para escrever código, assinar documentos ou fazer pesquisas, assume que ele respeita as regras de segurança. Em junho, a Amazon descobriu uma falha no Claude Fable 5 — uma maneira de contornar os filtros de segurança e fabricar software malicioso. O governo dos EUA cortou imediatamente o acesso mundial ao modelo, e toda a cadeia de ferramentas parou de repente. A 30 de junho, a Anthropic anuncia que o Fable 5 está de volta: um novo filtro bloqueia mais de 99 % das tentativas de ataque, e as consultas sensíveis são automaticamente reencaminhadas para um modelo mais trancado. Para compensar o transtorno, os assinantes pagos recebem metade da sua quota semanal gratuita até 7 de julho. Na prática, termina uma pausa de três semanas em que os utilizadores profissionais tiveram de se desenrascar com modelos substitutos — mas o novo filtro gera mais falsos positivos, pelo que levará alguns dias a estabilizar os usos em produção.

02

Microsoft lança um kit completo e gratuito para construir agentes IA próprios, compatível com .NET e Python

Hoje, para montar um agente IA capaz de procurar ficheiros, executar comandos e lembrar-se do que fez, é preciso empilhar meia dúzia de bibliotecas que não se falam. A Microsoft publica o Microsoft Agent Framework 1.0 GA: uma única base de código aberto, disponível em .NET e Python, que junta tudo — acesso ao sistema de ficheiros, sandbox para execução de comandos, memória de longo prazo, aprovação humana para ações sensíveis, e um modo "plano" antes da execução. Toda a stack está também disponível como serviço cloud gerido com arranque sob procura — não se paga nada quando o agente dorme. É o sinal de que a Microsoft leva a sério o mercado agêntico face à Anthropic e à LangChain. Para uma equipa que já constrói agentes, é uma alternativa de diversificação credível — não necessariamente melhor, mas com uma grande editora a apoiá-la e um ecossistema cloud integrado.

03

LangChain lança um agente de código aberto cujo único trabalho é manter a documentação de um projeto sincronizada com o código

Em quase todas as equipas técnicas, a documentação fica atrasada em relação ao código: um programador muda o código, esquece o README, e três meses depois ninguém percebe a API. A LangChain Labs publicou agora o OpenWiki, um agente de código aberto que faz o trabalho inverso: examina o repositório, deteta o que mudou no código, e propõe uma atualização da documentação como pull request. Quando o responsável corrige a proposta, o agente aprende o estilo editorial da equipa e aplica-o da próxima vez. Para uma estrutura pequena que não pode ter um redator técnico dedicado, é o equivalente a um assistente que fecha o ciclo da documentação — de graça, e sem partir o fluxo Git existente. O projeto usa uma nova memória de longo prazo ("Wiki Memory") que lembra as preferências de cada projeto.

04

Patronus AI angaria 50 milhões de dólares para submeter agentes IA a testes de stress em mundos digitais simulados antes do lançamento

Os benchmarks tradicionais medem o que um modelo sabe fazer com perguntas fixas. Não dizem nada sobre o que acontece quando um agente é lançado num ambiente real e tem de lidar com falhas, utilizadores hostis ou instruções contraditórias. A Patronus AI, startup nova-iorquina fundada por ex-empregados da Meta, fechou a 29 de junho uma Série B de 50 milhões de dólares para se tornar a especialista desta nova disciplina: a avaliação de agentes em condições reais. A plataforma constrói "mundos digitais" — simuladores com utilizadores fictícios, APIs, falhas aleatórias e injeções de prompt — onde o agente é mergulhado e observado. Para uma empresa que quer pôr um agente em produção em temas sensíveis (finanças, saúde, direito), é a camada de garantia de qualidade que faltava. Para o público em geral, prova que os agentes IA já não são brinquedos: tornam-se software crítico que exige testes de resistência como qualquer sistema industrial.

05

LeapXpert angaria 180 milhões de dólares para se tornar a plataforma de referência das comunicações empresariais auditadas por IA

Num banco ou agência governamental, quando um consultor envia uma mensagem WhatsApp a um cliente para falar de um empréstimo, ninguém sabe exatamente o que foi dito — e a lei exige que a conversa seja arquivada e auditável. A LeapXpert, plataforma nova-iorquina, fechou a 30 de junho uma ronda de crescimento de 180 milhões de dólares para resolver este problema em larga escala. A sua plataforma captura conversas em WhatsApp, iMessage, Signal e WeChat, interpreta-as com uma camada de IA, e assinala em tempo real os riscos de conformidade — um pouco como um auditor fiscal digital que lê cada mensagem e o avisa quando algo ultrapassa a linha. O capital financia a expansão para o setor público e as grandes empresas. Para quem pensa em IA empresarial, é um sinal: os clientes pagam agora pela conformidade e pela rastreabilidade tanto quanto pela potência do modelo.

📡 A vigiar

O novo quadro de classificação de gravidade de jailbreaks co-construído pela Anthropic, Amazon, Microsoft e Google pode tornar-se uma norma mundial

Com a reposição em serviço do Fable 5, a Anthropic e três outros grandes editores publicaram um quadro comum para classificar a gravidade dos jailbreaks — as técnicas que contornam as barreiras de segurança. Se esta norma for adotada por outros editores (OpenAI, Meta) e validada pelos reguladores americanos, torna-se a referência mundial para decidir quando um modelo deve ser restringido. A observar: adesão da OpenAI e da Meta, validação pelo Departamento do Comércio, eventual aplicação aos modelos chineses open-weight.

O Microsoft Agent Framework tornar-se-á a alternativa de referência ao Claude Code na Europa?

O MAF é open source, apoiado pela Microsoft, e o SDK Python funciona com a maioria das stacks existentes. Se as implementações do Azure Foundry descolarem na Europa — onde a regulamentação empurra para soluções cloud locais — o MAF torna-se uma alternativa credível à dependência exclusiva da Anthropic. A observar: implementações do Azure Foundry em bancos e administrações europeias.

O mercado de avaliação de agentes consolida-se — quem será a "Moody's dos agentes IA" até 2027?

A Patronus AI não está sozinha: LangSmith, Arize, Langfuse, Helicone, WhyLabs e Fiddler também se posicionam no segmento da avaliação e observabilidade de agentes. O mercado provavelmente consolidar-se-á à volta de dois ou três líderes. A observar: aquisições de editoras, parcerias oficiais com a OpenAI e a Anthropic, projetos de código aberto (OpenAI Evals, HuggingFace LightEval).

Microsoft, Notion, GitHub ou Linear vão responder ao OpenWiki da LangChain?

O OpenWiki é um agente cujo único trabalho é manter a documentação de um repositório sincronizada com o código — um serviço que a Microsoft, a Notion, o GitHub e a Linear poderiam integrar de forma nativa nas suas ferramentas existentes. Se um destes atores integrar um agente equivalente como funcionalidade padrão no seu produto, a vantagem da LangChain dissolve-se. A observar: forks da comunidade, integrações nativas no GitHub Copilot, Cursor ou Linear.

📊 Tendência

A 2 de julho de 2026 mostra que a stack agêntica entra na sua fase de maturidade industrial. Três camadas emergem simultaneamente: os modelos fundacionais (o Fable 5 volta após três semanas de suspensão, sinal de que a regulamentação se torna um parâmetro de produção por direito próprio), as ferramentas de orquestração (o Microsoft Agent Framework e o LangChain OpenWiki posicionam-se no segmento dos frameworks agênticos open source, ao lado do LangGraph e do Anthropic Agent SDK), e a camada de avaliação e governação (Patronus AI e LeapXpert angariam em conjunto 230 milhões de dólares na QA de agentes e auditoria de comunicações). Consequência para quem constrói com IA: um produto agêntico sério já não pode dispensar um quadro de segurança verificado, uma camada de avaliação pré-lançamento, nem uma camada de auditoria para setores regulados. O "protótipo de fim de tarde" torna-se software crítico que exige as mesmas garantias de um sistema bancário.