Briefing diário

27 de junho de 2026 · 5 notícias (site) · 6 notícias (base)

🔥 Em destaque

Sail Research torna os agentes de longa duração dez vezes mais baratos de operar

Imagine um agente que encadeia centenas de pequenas tarefas durante três dias para resolver um problema. Hoje, manter este tipo de agente em funcionamento custa uma fortuna: os servidores não foram feitos para este trabalho. A Sail Research levantou 80 milhões de dólares (liderada pela Sequoia e Kleiner Perkins) para atacar exatamente este problema. A sua promessa: um custo até dez vezes inferior ao das soluções padrão para agentes que funcionam durante muito tempo. Numa referência difícil (pesquisa web complexa durante vários dias), a Sail bateu um novo recorde — 90,72% de respostas corretas — a um décimo do preço habitual. Para uma PME que quer pôr em produção um agente que pensa a sério em vez de responder em dois segundos, este é o sinal de que a fatura está para ficar razoável. Como se a Uber Pool tivesse tornado acessível o táxi de longa distância: mesma viagem, preço muito diferente.

Source: sailresearch.com/blog/sail-raises-80m

Vercel lança um framework gratuito onde cada agente é apenas uma pasta de ficheiros

Construir hoje um agente de IA é como empilhar Lego no escuro: algum código, uma biblioteca, um servidor, e ninguém sabe onde ficou o agente depois de implementado. A Vercel (a empresa por trás do Next.js) apresentou a 17 de junho uma nova ferramenta gratuita, eve, que inverte a lógica. Aqui um agente é apenas uma pasta: um ficheiro de instruções em texto simples, pequenas ferramentas, fichas de competências reutilizáveis — tudo legível e editável como qualquer ficheiro de código. Tudo vem incluído: um espaço seguro onde o agente corre, uma agenda para o acordar a horas, e ligações a Slack, Discord ou GitHub para conversar. Um agente completo cria-se num minuto com um único comando. É um pouco como se o WordPress tivesse substituído o HTML artesanal para blogar: agora monta-se um agente numa pasta, não espalhado em 500 ficheiros.

Source: vercel.com/changelog/introducing-eve-an-open-source-agent-framework

Claude aprende a acordar sozinho à hora marcada e a manter as suas passwords escondidas

Até agora, para um agente de IA fazer um trabalho todas as manhãs às 7 horas, era preciso montar um servidor-despertador — coisa que muito poucos fora da informática sabem fazer. A Anthropic adicionou a 9 de junho duas funções muito pedidas à sua plataforma Claude. Primeira: o agente pode agora ser programado para arrancar sozinho, a uma hora fixa, todos os dias ou todas as semanas — sem intervenção humana. Segunda, ainda mais importante: as passwords e chaves de API (aqueles códigos secretos que abrem as suas contas) são agora guardadas num cofre separado. O agente usa-as no último momento, sem nunca as ver expostas, e sem que apareçam no histórico da conversa. Na prática, um agente pode agora enviar todas as segundas um relatório financeiro, ou fazer todas as noites uma cópia de segurança, usando as suas credenciais reais — sem risco de andarem por aí.

Source: claude.com/blog/whats-new-in-claude-managed-agents

Scaled Cognition levanta 100 M$ para construir agentes que nunca inventam respostas na banca ou saúde

Quando liga ao seu banco para contestar uma transferência, não quer ouvir um agente a improvisar. E no entanto, os modelos de IA generalistas erram cerca de uma em três vezes em produção — inaceitável para banca, saúde ou seguros. A Scaled Cognition levantou 100 milhões de dólares a 25 de junho para construir, de raiz, um modelo que se compromete a nunca produzir uma resposta errada. Em vez de juntar um filtro de segurança a um modelo existente, a empresa reescreveu a IA de raíz para a fiabilidade. Resultado: um modelo deliberadamente mais pequeno e mais barato, mas que recusa responder quando não tem a certeza — em vez de inventar. A aposta: substituir nas grandes empresas os centros de atendimento externalizados (um mercado de 600 mil milhões de dólares) por uma mão-de-obra de IA que a empresa possui e controla.

Source: scaledcognition.com/blog/the-enterprise-ai-reliability-crisis

Patronus AI constrói mundos virtuais onde os agentes treinam antes de tocar no real

Antes de deixar um carro autónomo na estrada, primeiro treinamo-lo em milhões de quilómetros simulados — chuva, noite, peão que aparece. A Patronus AI faz o mesmo com os agentes de IA. A startup levantou 50 milhões de dólares a 25 de junho e lança os «Digital World Models»: réplicas virtuais de sítios web reais e software empresarial, onde os agentes treinam antes de agir a sério. O agente é recompensado quando faz bem o trabalho, penalizado quando faz batota — por exemplo, marcando qualquer coisa só para despachar um formulário. A empresa multiplicou o seu volume de negócios por 15 num ano; quase todos os grandes laboratórios de IA são hoje seus clientes. Para uma equipa que coloca um agente em produção, é a promessa de poder testá-lo em grande escala — sem pôr em risco os dados reais de clientes reais.

Source: aijourn.com/patronus-ai-raises-50-million-series-b-and-unveils-first-digital-world-models-for-ai-agent-training-and-simulation

📡 A vigiar

Runlayer levanta 30 M$ para se tornar o «painel de controlo» dos agentes nas grandes empresas

Quando qualquer funcionário pode criar um agente que toca no Salesforce, código de produção ou dados de RH, é preciso alguém que diga sim ou não, que saiba o que custa, e que guarde um registo de tudo. A Runlayer levantou 30 milhões de dólares a 24 de junho para ser exatamente esse posto de controlo: um ponto único para segurar os agentes, observar o que fazem, e desmascarar os que os funcionários implementaram às escondidas. Entre os clientes: Instacart, Gusto, Decagon, Lemonade. A governação dos agentes está a tornar-se um mercado por direito próprio.

Governação de agentes: a camada que faltava está a ser construída a toda a velocidade

Em quatro dias, três anúncios sobre o mesmo tema: Vercel Passport (17 de junho), F5 compra SurePath AI (24 de junho), Runlayer levanta 30 M$ (24 de junho). O sinal é claro: sem uma camada de identidade, permissões e auditoria, os agentes em produção são incontroláveis. É a mesma viragem que a cibersegurança nos anos 2010 — vista ao início como tema de informáticos, depois função crítica em cada empresa.

Fiabilidade «construída de raiz» contra fiabilidade «agrafada depois»

A Scaled Cognition faz uma aposta radical: não se pode adicionar a fiabilidade como um filtro em cima de um modelo generalista. O seu modelo é reescrito de raíz para se comprometer a não errar nos fluxos que cobre. Se esta abordagem cumprir na banca e na saúde, pode baralhar de novo as cartas do mercado — hoje dominado por poucos modelos generalistas que brilham sobretudo em demos.

O custo dos agentes torna-se o novo campo de batalha

Manter um agente a trabalhar durante uma semana custa hoje 100 a 1000 vezes mais do que uma conversa normal. A Sail Research ataca isto de frente. Juntando à Baseten (que levantou 1,5 mM$ na semana passada) e Modal, a infraestrutura para agentes torna-se uma categoria de investimento por direito próprio. Uma consolidação entre runtimes de inferência, sandboxes seguras e plataformas de agentes é provável nos próximos doze meses.

📊 Tendência

O 27 de junho de 2026 marca o dia em que a pilha completa dos agentes de IA está a ser construída ao mesmo tempo. Três peças em falta apareceram esta semana. (1) Custo: a Sail Research prova que se pode manter um agente a correr durante dias a um décimo do preço habitual. (2) Caixa de ferramentas: a Vercel torna a construção de agentes tão simples como fazer um site, apostando em agentes que se apresentam como simples pastas de ficheiros. (3) Confiança: Scaled Cognition, Patronus AI e Runlayer atacam cada uma um flanco da fiabilidade — o modelo que não falha, o treino que apanha os batoteiros, o painel de controlo que tudo vigia. Quando toda a cadeia aparece em simultâneo, a economia dos agentes torna-se um verdadeiro setor — já não uma experiência de laboratório.