El ejecutor equivocado es un error de costes, no una elección tecnológica

No envías a todo paciente al cirujano. No porque un cirujano sea menos capaz que un médico de cabecera; para el problema adecuado, esa formación adicional es exactamente lo que te salva. Es porque el cuadro en la sala no requiere ese coste. Estarías pagando doce años de especialización que el caso frente a ti nunca va a necesitar.

La automatización funciona igual. Ahora tenemos tres tipos de ejecutor: robots de software, agentes de IA y personas. Cada uno tiene un precio. Y la pregunta que casi todo el mundo hace es "¿cuál es más inteligente?" Esa es la pregunta equivocada. La correcta es más concreta e incómoda: ¿qué ejecutor corresponde al coste de este paso específico?

La industria te empuja hacia la pregunta equivocada a propósito. Una plataforma RPA importante describe su historia como una escalera: "primero hubo automatización robótica de procesos… luego llegó la automatización impulsada por IA… y ahora, está la automatización agéntica", el "último paso en la evolución de la automatización". Otra enmarca su generación anterior como "limitada a tareas relativamente simples" donde "la complejidad, la toma de decisiones, la interpretación… estaban fuera de sus capacidades". Lee suficiente de esto y empezarás a creer que más nuevo significa mejor, y que poner un agente en un paso es una especie de ascenso.

No es un ascenso. Es una compra. Y la tarea, no el ejecutor, establece el precio que puedes pagar.

Escribí anteriormente sobre cómo robots y agentes trabajan juntos, no uno en lugar del otro: "RPA and AI Agents: Not Instead, But Together." Ese artículo dejó una pregunta abierta: si trabajan uno al lado del otro, ¿cómo decides quién hace qué? Esta es la respuesta. Decides paso a paso, según el coste. Y puedes equivocarte en ambas direcciones.

Un paso de juicio disfrazado de flujo de trabajo

Esta es la primera dirección, de un proyecto real nuestro.

Una empresa recibe una solicitud de información de cuenta de cliente. Para responderla, hay que investigar: buscar en un sistema y, dependiendo de lo que encuentres allí, pasar a otro sistema, y a veces volver a consultar el primero. El camino no está fijado. Se ramifica según lo que dicen los datos en cada paso.

Construimos un robot para ello. Mucho trabajo analítico se dedicó al escenario de ramificación — mapear los casos, las condiciones, los bucles. En papel parecía un flujo de trabajo. En producción era frágil. Los datos llegaban con pequeñas variaciones que el escenario no esperaba. El carácter de las consultas cambió. Los elementos de la interfaz no estaban siempre donde el bot los buscaba. Así que fallaba, con regularidad.

El error de raíz no fue una mala ingeniería. Fue que la tarea necesitaba interpretación, y le habíamos dado determinismo. Forrester tiene una regla aproximada para esto — la "Regla de los Cinco" de Craig LeClair: un proceso encaja en RPA cuando tiene menos de cinco puntos de decisión, toca menos de cinco aplicaciones y se ejecuta en menos de 500 pulsaciones. Nuestro flujo de investigación falló los tres.

Lo que lo hizo caro es la parte que no ves en ningún panel. Un robot en un paso de juicio no falla ruidosamente y se detiene. Exporta los casos difíciles a personas, silenciosamente. La tasa de procesamiento directo que se prometió al 75-85 por ciento aterriza en 30-50 en la práctica. La otra mitad vuelve al escritorio de una persona, y esas personas aparecen como tiempo general de operaciones, no como una línea de error de automatización. Automatizaste la parte fácil y seguiste pagando por la parte difícil, solo con un nombre diferente.

Un paso determinista entregado al juicio

Ahora la otra dirección.

Haz a cualquier persona de operaciones una pregunta sencilla: ¿preferirías que tu salario lo calculara un agente de IA que puede cometer un error de decisión y cuya lógica no es fija — o un robot que ejecuta reglas deterministas y auditables cada vez? He hecho esta pregunta en el campo. Nadie elige al agente.

No es una cuestión de confianza en la tecnología. La nómina tiene una respuesta correcta. Las reglas están escritas. Lo que quieres de ese paso es el mismo resultado en cada ejecución, y un rastro de auditoría limpio cuando alguien pregunta por qué un número es lo que es. Un agente introduce lógica no fija donde necesitabas lógica fija, y ahora también tienes que comprobar su decisión, no solo comprobar que se ejecutó. Estás pagando para añadir una pregunta que el paso nunca tuvo.

Esta es la forma más directa de expresarlo: un agente en un paso determinista — riesgo de perder donde podrías estar ganando.

Y también es más caro en coste bruto, de una manera que la mayoría de la gente se pierde porque valora los agentes como una factura en la nube. En una configuración corporativa cerrada — tus propios robots, tus propios agentes, sin IA pública tocando tus datos — no hay precio por token. El coste del agente es infraestructura: hardware de GPU y CPU que compraste y amortizas, energía, refrigeración y los ingenieros que lo mantienen en funcionamiento. Un servidor A100 de 8 GPU cuesta 75.000–150.000 dólares para comprar. Reparte eso en tres años y añade energía, refrigeración y medio ingeniero de IA/ML para mantenerlo en funcionamiento, y el coste total anual llega a 90.000–160.000 dólares. El hardware de clase H100 aproximadamente duplica esa cifra. (Los modelos cuantizados más pequeños en CPU reducen más el suelo — pero la estructura que estoy a punto de describir se mantiene en todos los niveles.)

La estructura es la trampa. Ese coste es fijo. No baja cuando el servidor está inactivo. Y inactivo es el estado normal: la utilización real de GPU en producción se sitúa entre el 20 y el 65 por ciento, mientras que necesitas entre el 60 y el 80 por ciento solo para equilibrar costes frente al alquiler en la nube. Así que el coste por ejecución no es una tarifa plana; es un montón fijo dividido por cuánto realmente ejecutas. Pon un paso determinista y de bajo volumen en esa infraestructura y estás pagando precios de agente por trabajo de robot, más la mano de obra de revisión, más el riesgo de decisión que introdujiste gratis.

Los tres cortes que realmente lo deciden

No necesitas un modelo de costes completo en la pizarra. Tres cortes resuelven la mayoría de los pasos.

Utilización — ¿qué tan ocupado está este paso? Una licencia de robot cuesta alrededor de 5.000 a 15.000 dólares al año por bot, más del 18 al 25 por ciento para mantenimiento. Ese precio es el mismo ya sea que el bot se ejecute ocho horas al día o veinte minutos. Un bot que llena la mitad de su capacidad de licencia ha duplicado efectivamente su coste por ejecución. La infraestructura de agentes tiene la misma trampa de inactividad a través de una puerta diferente — amortización fija y medio ingeniero fijo, divididos por un rendimiento que rara vez está cerca de la capacidad. Así que la primera pregunta es el volumen honesto. Un paso que se activa mensualmente no puede cargar bien ninguno de los costes fijos, y eso lo empuja hacia una persona o hacia capacidad compartida, no hacia un ejecutor dedicado.

Supervisión — ¿quién tiene que comprobar, y comprobar qué? Este es el corte que la gente olvida, y es el más caro. Un robot determinista necesita monitoreo de ejecución: ¿se completó, rompió un SLA? El resultado se decidió de antemano, así que nadie evalúa la decisión. Un agente necesita revisión de decisiones: ¿fue correcto este resultado en este caso ambiguo? Y eso requiere un experto en el dominio, no un monitor de operaciones. Incluso los despliegues de agentes bien ajustados escalan casos a un humano — desde alrededor del 2% en un despliegue maduro de atención al cliente hasta el 12-18% en la práctica general empresarial — y dotarás de personal aproximadamente un revisor por cada 500 a 1.000 interacciones al día como coste permanente. EY ahora lista "carga de gobernanza — barreras, cumplimiento, revisiones humanas en el bucle" como su propia línea en el coste total del agente. Esa línea simplemente no existe para un robot determinista. Si tu tasa de revisión humana no está bajando con el tiempo, no compraste automatización; compraste una manera más cara de hacer la misma revisión.

Economía unitaria — ¿qué cuesta una ejecución a este volumen? On-prem, una ejecución cuesta toda la base fija — hardware, energía, supervisión — dividida por cuántas veces se ejecuta el paso. Dobla el volumen y el coste por ejecución se reduce aproximadamente a la mitad, sin cambio en ninguna factura. Reduce el volumen a la mitad y se duplica. Por eso el mismo agente puede ser barato en un paso interpretativo de alto volumen y absurdo en uno de bajo volumen. Haz la división antes de asignar el ejecutor, no después.

El modelo de costes completo tiene seis dimensiones: capex, software, mano de obra de lanzamiento, operaciones, supervisión de decisiones y coste de errores. Estos tres cortes son el subconjunto de mayor señal para una decisión en la pizarra; el resto pertenece a tu hoja de cálculo. Estos tres pertenecen a la pared.

Descompón tu propio proceso

Toma entonces un proceso real y etiqueta cada paso con dos filtros.

Primer filtro, determinismo. ¿Tiene este paso reglas fijas y auditables — una salida correcta que podrías explicar a un auditor? Si es así, es territorio de robot, y no deberías disfrazarlo de nada más. Si el paso se ramifica en interpretación, lleva contenido de decisión real, o lee entrada no estructurada que varía, no es determinista, y un robot aquí exportará excepciones a tu gente. Ese fue exactamente el Caso 1: parecía un flujo de trabajo, puntuó como juicio, y pagamos la diferencia.

Segundo filtro, los tres cortes — pero solo para los pasos que fallaron el primer filtro. Un paso no determinista no es automáticamente un agente. Ejecuta utilización: ¿es el volumen suficientemente alto para sostener infraestructura fija? Ejecuta supervisión: ¿necesitará cada resultado que un humano revise la decisión, y puedes permitirte esa revisión a esta tasa? Ejecuta economía unitaria: ¿cuánto vale aquí una ejecución? Si el volumen es escaso o el coste de supervisión absorbe el ahorro, la respuesta honesta es una persona, no un agente. La nómina falla este filtro a propósito — es determinista, así que nunca abandona el primer filtro, y el agente nunca se le acerca.

Analiza un proceso con ambos filtros y algo útil ocurre. Cada paso aterriza en el ejecutor más barato que aún supera el umbral requerido del paso — robot para los pasos de reglas fijas, agente para los interpretativos de alto volumen donde el coste de revisión está justificado, persona para el juicio que es demasiado raro o demasiado consecuente para delegarlo. Gartner espera que más del 40 por ciento de los proyectos de IA agéntica sean cancelados para 2027, principalmente por costes y controles débiles. Muchos de esos son pasos que fallaron el segundo filtro y obtuvieron un agente de todas formas.

Seré honesto sobre algo que no he resuelto. El segundo filtro necesita un número — el coste de una revisión de decisión humana en un paso dado — y ese número es el más difícil de precisar. Se esconde dentro del personal de operaciones y los equipos de calidad, atribuido a ningún sistema en particular.

El ejecutor equivocado es un error de costes, no una elección tecnológica

Un paso de juicio disfrazado de flujo de trabajo

Un paso determinista entregado al juicio

Los tres cortes que realmente lo deciden

Descompón tu propio proceso

See Primo in your environment