Skip to content
primorpa+ai

O executor errado é um erro de custo, não uma escolha tecnológica

O setor vende robôs e agentes como uma escada de maturidade. No nível do passo, é uma correspondência de custo e você pode errar nas duas direções.

Alexey Nikolaev8 min de leitura

Você não manda todo paciente ao cirurgião. Não porque um cirurgião seja menos capaz do que um clínico geral; para o problema certo, esse treinamento extra é exatamente o que salva. É porque a condição na sala não requer esse custo. Você estaria pagando por doze anos de especialização que o caso à sua frente nunca vai precisar.

A automação funciona da mesma forma. Agora temos três tipos de executor: robôs de software, agentes de IA e pessoas. Cada um tem um preço. E a pergunta que quase todo mundo faz é "qual é mais inteligente?" Essa é a pergunta errada. A certa é mais estreita e menos confortável: qual executor corresponde ao custo deste passo específico?

O setor te empurra para a pergunta errada de propósito. Uma grande plataforma de RPA descreve sua história como uma escada: "primeiro havia automação robótica de processos… depois veio a automação impulsionada por IA… e agora, há a automação agêntica", o "mais recente passo na evolução da automação". Outra enquadra sua geração anterior como "limitada a tarefas relativamente simples" onde "complexidade, tomada de decisão, interpretação… estavam além de suas capacidades". Leia o suficiente disso e você começará a acreditar que mais novo significa melhor, e que colocar um agente em um passo é uma espécie de promoção.

Não é uma promoção. É uma compra. E a tarefa, não o executor, define o preço que você pode pagar.

Escrevi anteriormente sobre como robôs e agentes trabalham juntos, não um em vez do outro: "RPA and AI Agents: Not Instead, But Together." Esse artigo deixou uma pergunta em aberto: se eles trabalham lado a lado, como você decide quem faz o quê? Esta é a resposta. Você decide passo a passo, por custo. E pode errar nas duas direções.

Um passo de julgamento disfarçado de fluxo de trabalho

Esta é a primeira direção, de um projeto real nosso.

Uma empresa recebe uma solicitação de informações de conta de cliente. Para respondê-la, você precisa investigar: pesquisar em um sistema e, dependendo do que encontrar lá, ir para outro sistema e às vezes voltar a consultar o primeiro. O caminho não é fixo. Ele se ramifica com base no que os dados dizem em cada etapa.

Construímos um robô para isso. Muito trabalho analítico foi dedicado ao cenário de ramificação — mapeando os casos, as condições, os loops. No papel parecia um fluxo de trabalho. Em produção era frágil. Os dados chegavam com pequenas variações que o cenário não esperava. O caráter das consultas mudou. Os elementos de interface nem sempre estavam onde o bot os procurava. Então ele falhou, regularmente.

O erro raiz não foi engenharia ruim. Foi que a tarefa precisava de interpretação, e nós demos a ela determinismo. A Forrester tem uma regra aproximada para isso — a "Regra dos Cinco" de Craig LeClair: um processo se encaixa no RPA quando tem menos de cinco pontos de decisão, toca menos de cinco aplicações e é executado em menos de 500 toques de tecla. Nosso fluxo de investigação falhou nos três.

O que o tornou caro é a parte que você não vê em nenhum painel. Um robô em um passo de julgamento não falha ruidosamente e para. Ele exporta os casos difíceis para humanos, silenciosamente. A taxa de processamento direto que foi prometida entre 75 e 85 por cento aterra entre 30 e 50 na prática. A outra metade volta para a mesa de uma pessoa, e essas pessoas aparecem como tempo geral de operações, não como uma linha de erro de automação. Você automatizou a parte fácil e continuou pagando pela parte difícil, só com um nome diferente.

Um passo determinístico entregue ao julgamento

Agora a outra direção.

Faça a qualquer pessoa de operações uma pergunta simples: você preferiria ter seu salário calculado por um agente de IA que pode cometer um erro de decisão e cuja lógica não é fixa — ou por um robô que executa regras determinísticas e auditáveis todas as vezes? Já fiz essa pergunta em campo. Ninguém escolhe o agente.

Não é uma questão de confiança na tecnologia. A folha de pagamento tem uma resposta certa. As regras estão escritas. O que você quer desse passo é o mesmo resultado em cada execução, e uma trilha de auditoria limpa quando alguém pergunta por que um número é o que é. Um agente introduz lógica não fixa onde você precisava de lógica fixa, e agora você também precisa verificar a decisão dele, não apenas verificar que ele executou. Você está pagando para adicionar uma pergunta que o passo nunca teve.

Esta é a forma mais direta de colocar: um agente em um passo determinístico — risco de perder onde você poderia estar ganhando.

E também é mais caro em custo bruto, de uma forma que a maioria das pessoas não percebe porque precifica agentes como uma conta de nuvem. Em uma configuração corporativa fechada — seus próprios robôs, seus próprios agentes, sem IA pública tocando seus dados — não há preço por token. O custo do agente é infraestrutura: hardware de GPU e CPU que você comprou e amortiza, energia, refrigeração e os engenheiros que o mantêm funcionando. Um servidor A100 de 8 GPUs custa de 75.000 a 150.000 dólares para comprar. Distribua isso em três anos e adicione energia, refrigeração e meio engenheiro de IA/ML para mantê-lo funcionando, e o custo anual total chega a 90.000–160.000 dólares. Hardware de classe H100 aproximadamente dobra esse valor. (Modelos quantizados menores em CPU reduzem ainda mais o piso — mas a estrutura que estou prestes a descrever se mantém em todos os níveis.)

A estrutura é a armadilha. Esse custo é fixo. Ele não cai quando o servidor fica ocioso. E ocioso é o estado normal: a utilização real de GPU em produção fica entre 20 e 65 por cento, enquanto você precisa de 60 a 80 por cento apenas para equilibrar os custos em relação ao aluguel de nuvem. Portanto, o custo por execução não é uma tarifa fixa; é uma pilha fixa dividida por quanto você realmente executa. Coloque um passo determinístico e de baixo volume nessa infraestrutura e você está pagando preços de agente por trabalho de robô, mais a mão de obra de revisão, mais o risco de decisão que você introduziu de graça.

Os três cortes que realmente decidem

Você não precisa de um modelo de custo completo no quadro branco. Três cortes resolvem a maioria dos passos.

Utilização — quão ocupado está este passo? Uma licença de robô custa cerca de 5.000 a 15.000 dólares por ano por bot, mais 18 a 25 por cento para manutenção. Esse preço é o mesmo, quer o bot execute oito horas por dia ou vinte minutos. Um bot que preenche metade de sua capacidade de licença efetivamente dobrou seu custo por execução. A infraestrutura de agentes tem a mesma armadilha de ociosidade por uma porta diferente — amortização fixa e meio engenheiro fixo, divididos por uma produção que raramente está perto da capacidade. Portanto, a primeira pergunta é o volume real. Um passo que dispara mensalmente não consegue carregar nenhum dos dois custos fixos bem, e isso o empurra para um humano ou para capacidade compartilhada, não para um executor dedicado.

Supervisão — quem precisa verificar, e verificar o quê? Este é o corte que as pessoas esquecem, e é o mais caro. Um robô determinístico precisa de monitoramento de execução: ele foi concluído, rompeu um SLA? O resultado foi decidido com antecedência, então ninguém avalia a decisão. Um agente precisa de revisão de decisão: esse resultado foi correto neste caso ambíguo? E isso requer um especialista de domínio, não um monitor de operações. Mesmo implantações de agentes bem ajustadas escalam casos para um humano — de cerca de 2% em uma implantação madura de atendimento ao cliente até 12-18% na prática empresarial geral — e você contrata aproximadamente um revisor para cada 500 a 1.000 interações por dia como custo permanente. A EY agora lista "carga de governança — proteções, conformidade, revisões humanas no loop" como sua própria linha no custo total do agente. Essa linha simplesmente não existe para um robô determinístico. Se sua taxa de revisão humana não está caindo ao longo do tempo, você não comprou automação; comprou uma maneira mais cara de fazer a mesma revisão.

Economia unitária — quanto custa uma execução neste volume? On-prem, uma execução custa toda a base fixa — hardware, energia, supervisão — dividida por quantas vezes o passo é executado. Dobre o volume e o custo por execução cai aproximadamente pela metade, sem mudança em nenhuma fatura. Reduza o volume pela metade e ele dobra. É por isso que o mesmo agente pode ser barato em um passo interpretativo de alto volume e absurdo em um de baixo volume. Faça a divisão antes de atribuir o executor, não depois.

O modelo de custo completo tem seis dimensões: capex, software, mão de obra de lançamento, operações, supervisão de decisões e custo de erros. Esses três cortes são o subconjunto de maior sinal para uma decisão no quadro branco; o restante pertence à sua planilha. Esses três pertencem à parede.

Decomponha seu próprio processo

Então pegue um processo real e classifique cada passo com dois filtros.

Primeiro filtro, determinismo. Este passo tem regras fixas e auditáveis — uma saída correta que você poderia explicar a um auditor? Se sim, é território de robô, e você não deveria disfarçá-lo de nada mais. Se o passo se ramifica na interpretação, carrega conteúdo de decisão real, ou lê entrada não estruturada que varia, não é determinístico, e um robô aqui exportará exceções para sua equipe. Esse foi exatamente o Caso 1: parecia um fluxo de trabalho, pontuou como julgamento, e pagamos pelo intervalo.

Segundo filtro, os três cortes — mas apenas para os passos que falharam no primeiro filtro. Um passo não determinístico não é automaticamente um agente. Execute utilização: o volume é alto o suficiente para sustentar infraestrutura fixa? Execute supervisão: cada resultado precisará que um humano revise a decisão, e você pode pagar por essa revisão nesta taxa? Execute economia unitária: quanto vale uma execução aqui? Se o volume é escasso ou o custo de supervisão absorve a economia, a resposta honesta é um humano, não um agente. A folha de pagamento falha neste filtro de propósito — ela é determinística, portanto nunca sai do primeiro filtro, e o agente nunca chega perto dela.

Analise um processo com os dois filtros e algo útil acontece. Cada passo aterra no executor mais barato que ainda atende ao critério exigido do passo — robô para os passos de regras fixas, agente para os interpretativos de alto volume onde o custo de revisão é justificado, humano para o julgamento que é raro demais ou consequente demais para delegar. O Gartner espera que mais de 40 por cento dos projetos de IA agêntica sejam cancelados até 2027, principalmente por custo e controles fracos. Muitos desses são passos que falharam no segundo filtro e receberam um agente mesmo assim.

Vou ser honesto sobre algo que não resolvi. O segundo filtro precisa de um número — o custo de uma revisão de decisão humana em um determinado passo — e esse número é o mais difícil de precisar. Ele se esconde dentro do pessoal de operações e das equipes de qualidade, atribuído a nenhum sistema específico.

AI agentsRPAenterprise automationcost optimization
Get started

See Primo in your environment