CeCo | Libre Competencia en el año de los Agentes (Parte 1)

https://centrocompetencia.com/wp-content/themes/Ceco

Libre Competencia en el año de los Agentes (Parte 1)

8.10.2025
CeCo Chile
Eugenio Ruiz-Tagle W. Abogado, Pontificia Universidad Católica de Chile. Master of Laws (University College London) y Master of Science in Computer Science (Birkbeck College, University of London). El autor se desempeñó como Sub Jefe de la División Anti-Carteles de la Fiscalía Nacional Económica entre 2017 y 2022. Actualmente es colaborador del proyecto Computational Antitrust del centro Codex de la Universidad de Stanford.

En la reciente conferencia internacional “Challenges in Digital Platforms” (co-organizada por CeCo), hice eco de una narrativa difundida por distintos medios a inicios de año: 2025 será el año de los “agentes” o entes automatizados con poder de manifestar o ejercitar la capacidad de actuar. Aunque las expectativas de los más entusiastas no se materialicen, nadie duda que la proliferación de esta tecnología impactará significativamente diversos ámbitos del quehacer humano, entre ellos, la  manera en que las empresas se enfrentan al proceso competitivo y a los cambios del mercado.

“Cuando las decisiones sobre variables de competencia son total o parcialmente delegadas a un sistema interconectado en base a IA, la firma, el jugador, se desprende parcialmente de su poder de agencia, aunque (teóricamente al menos) siga bajo su control”.

Vale la pena entonces retroceder un poco y evaluar el rol de la agencia en nuestra disciplina, lo que haré en la primera parte de esta columna. A continuación, exploraré las características distintivas de los sistemas autónomos basados en IA frente a otras herramientas computacionales. Para concluir, se ofrece un ejemplo de cómo podría diseñarse y funcionar en la práctica un agente encargado de ajustar precios dinámicamente en un marketplace digital.

Juegos y mercados: Agencia como ciencia

En su libro Games: Agency as Art, Nguyen propone que los juegos son el arte de la agencia. Cualquier juego consiste en desarrollar acciones en persecución de un objetivo predefinido, respetando ciertas restricciones, y los jugadores aceptan esta dinámica por el solo hecho de que valoran la actividad en sí. Por otra parte, la llamada Teoría de Juegos adopta ese nombre dado que la motivación de los participantes (eg., salir de la cárcel, maximizar utilidades, etc.) es exógena a lo que verdaderamente importa: la estructura de las elecciones que enfrenta cada jugador, y la dependencia mutua de sus posibles cursos de acción. La agencia, en este caso, es materia de un campo científico multidisciplinario, formal, aplicado y en permanente evolución.

Antes de Nash, el influyente matemático francés León Walras (1874) modeló un sistema para la distribución de recursos escasos, cuyo equilibrio se sostiene en la interdependencia entre un número finito de agentes que expresan preferencias (los consumidores), y un número finito de agentes que producen bienes o servicios (las firmas). Ambos representan unidades de decisión dotadas de una determinada función de utilidad, que interactúan en mercados cuyo elemento distintivo es la existencia de precios como principal mecanismo de coordinación. 

El concepto de ‘agente económico’ derivado de los equilibrios walrasianos es absolutamente central en el derecho de la competencia a nivel global, y está consagrado en múltiples leyes y guías de autoridades en la materia. Laboriosamente, la jurisprudencia ha resuelto ignorar estructuras legales y permear velos corporativos, centrando su atención en el comportamiento de aquellas entidades de facto, cualquiera sea su forma o denominación, donde residen los centros de toma de decisiones sobre oferta y demanda de bienes o servicios – en jerga económica, los jugadores.

En mi investigación para CeCo “De la Teoría a la Tecnología: Computational Antitrust” señalé que la adaptación inteligente a las condiciones del mercado, siempre que sea independiente, es transversalmente autorizada por la política de competencia. Asimismo, mencioné que esta adaptación ha impulsado el desarrollo de un conjunto de sistemas informáticos de business intelligence capaces de identificar patrones en grandes volúmenes de datos y recomendar cursos de acción. 

Los agentes representan, paradójicamente y a la vez, la continuación lógica y un cambio de paradigma dentro del business intelligence. Cuando las decisiones sobre variables de competencia son total o parcialmente delegadas a un sistema interconectado en base a IA, la firma, el jugador, se desprende parcialmente de su poder de agencia, aunque (teóricamente al menos) siga bajo su control. 

LLMs v/s Modelos de Aprendizaje v/s Agentes

Los agentes que me interesan para efectos de esta columna (‘Agentes’) son aquellos desarrollados sobre Large Language Models (‘LLMs’), que son sistemas predictivos de generación de texto, imágenes o código, capaces de hacer inferencias y establecer relaciones semánticas que emulan el razonamiento humano.

Los LLMs se caracterizan por su pasividad. De su propia experiencia interactuando con ellos, el lector sabe que los LLMs requieren información de entrada o prompts para operar y permanecen inactivos entre sesiones. Si bien algunos LLMs pueden acceder selectivamente a conversaciones pasadas, solo lo hacen en reacción a la actividad del usuario cuando el contexto lo precisa.

El desarrollo de entornos de trabajo o frameworks que habilitan la integración de LLMs con otras herramientas o plataformas, es el hito tecnológico que hizo posible el surgimiento de los Agentes. En este sentido, podemos pensar en los Agentes como sistemas autónomos internamente coordinados, esencialmente adaptables, con un LLM en su centro, diseñados para ejecutar una actividad determinada con mínima o sin intervención humana, de manera repetida o prolongada en el tiempo. 

Desde ya quiero aclarar que los modelos más recientes de servicios, como ChatGPT o Claude, incorporan componentes híbridos que les permiten desplegar cierta agencia inexistente en los primeros LLMs. Además de generar contenido, pueden realizar otras actividades como extraer información de la web y ejecutar un creciente número de tareas. Dejaré esta disquisición de lado por el momento para aproximarme a las características que a mi mejor entender distinguen a un LLM, un modelo de aprendizaje no basado en IA generativa, y un Agente.

  • LLMs: Modelos entrenados en grandes volúmenes de datos y retroalimentación humana que arrojan predicciones en respuesta a texto, imágenes o videos proporcionados por el usuario. Por definición, su ámbito de aplicación es general, no fueron diseñados para una función específica, y el contenido que generan no responde ni depende de un estado ajeno a sus propios parámetros. 
  • Modelos de aprendizaje (Machine Learning/Deep Learning): Pueden contar con arquitecturas altamente sofisticadas y ser capaces de procesar datos en tiempo real para optimizar una función específica – por ejemplo, predecir el precio óptimo en un escenario determinado. No obstante, no planifican acciones futuras, no evalúan su desempeño de manera independiente, y requieren intervención humana o supervisión para validar sus resultados. 
  • Agentes: De acuerdo con literatura reciente, pueden distinguirse de los dos conceptos anteriores en tres aspectos esenciales:
      1. Especificidad: Operan en un ecosistema que permite conectar un LLM a un circuito compuesto por otros servicios y herramientas (APIs). Esta integración es realizada con el objetivo de ejecutar una o más tareas cuyos contornos están bien definidos.
      2. Autonomía: Luego de su configuración inicial, no requieren ser instanciados. En otras palabras, no necesitan supervisión o control en sus ciclos o loops de operación.
      3. Reactividad: Están provistos de memoria de contexto, retienen información de episodios o eventos pasados, y cuentan con una suerte de ‘metacognición’. El Agente guarda registro de sus interacciones y actualiza su comportamiento en función de la retroalimentación o ‘estímulos’ que recibe de otros servicios o herramientas dentro de su circuito de ejecución, en forma adaptativa.

Un Agente a cargo del pricing

Supongamos que X, un retailer mediano, comercializa múltiples productos en un marketplace digital y quiere orquestar in-house un Agente, cuya función será fijar y ajustar precios en forma dinámica, sin intervención de los ejecutivos o administradores de X en la operación diaria de esta tarea. 

Configuración

El primer paso consiste en diseñar las directrices generales que deberá observar el Agente, y estructurar su composición interna. Para ello, los administradores y especialistas informáticos de X deben definir ciertas políticas comerciales y aspectos técnicos, tales como:

  • Variables a considerar en cada ciclo de revisión y ajuste de precios: Por ejemplo, el Agente deberá monitorear los precios de la competencia, las tendencias de la demanda, y sus existencias de inventario, y considerar estos factores al analizar posibles cambios de precio. 
  • Selección y configuración de aplicaciones o servicios externos: Se evaluarán los servicios disponibles para cada subrutina. Por ejemplo, el servicio PriceAPI podría utilizarse para monitorear precios de mercado en tiempo real, la API de Google Trends para acceder a datos de tendencias de la demanda en el sector, etc. Debe contemplarse que estas plataformas pueden ser de pago, y que cada ‘llamado’ o acceso del Agente a estos módulos tenga un costo asociado.
  • Restricciones: Reglas que el Agente debe respetar en cada ciclo de ajuste de precios. Precio máximo o mínimo por SKU, margen de utilidad mínimo, límites de cambios de precio por día, evitar quiebres de stock, etc.
  • Normas procedimentales: Deben programarse respuestas a preguntas tales como ¿qué eventos (reducción de precios de la competencia, agote de existencias del inventario, etc.) deben desencadenar una revisión de los precios? O en ausencia de eventos, ¿dentro de qué intervalos de tiempo debe agendarse cada ciclo de actividad?

Figura 1: Un Agente para la fijación dinámica de precios

Fuente: Trabajo del autor

 

El modelo de Agente exhibido en la Figura 1 integra un LLM, con sus módulos de memoria episódica y de contexto representados en el círculo amarillo, conectado a cuatro módulos externos, entre los cuales existe un constante flujo de intercambio de datos y retroalimentación.

Operación

Consideremos el siguiente caso como ejemplo de un ciclo de funcionamiento de este Agente en la tarea de monitorear y ajustar el precio de un producto específico comercializado por la empresa X en una plataforma e-commerce:

  1. El sensor del mercado PreciosAPI transmite al circuito del Agente que a las 15:00 hrs., se produjo un alza de precio de uno de los principales competidores de X, al tiempo que el módulo TendenciasAPI integra datos que indican que el producto en cuestión está experimentando un shock de demanda. 
  2. Esta información y su fuente se incorporan directamente en la Memoria de Contexto del LLM.
  3. El LLM es activado con estos datos. Antes de generar un output que decida (y ejecute) el siguiente curso de acción, el LLM llevará a cabo una secuencia de predicciones que simulan razonamiento, iniciando un proceso estructurado de deliberación y autocorrección. 
  4. Como parte de este ‘razonamiento’, el LLM podría tomar estos datos y evaluar que bajo estas condiciones de mercado, la función de maximización de utilidades se ve servida incrementando los precios ofrecidos por X en un 10%.
  5. A continuación, dentro del mismo proceso de razonamiento, el flujo predictivo integra texto incorporado desde la Memoria Episódica del Agente. Supongamos que el Agente cuenta con el siguiente episodio guardado en memoria: Hace 62 días, el mercado experimentó una fluctuación similar, y tras ejecutar un alza de 10%, se vendieron 1000 unidades en menos de 24 horas.
  6. Paralelamente, el circuito ha extraído información de InventarioAPI conectado en tiempo real a las bases de datos internas de X, incorporándose a la memoria que el stock actual es de 500 unidades.
  7. Las directrices de configuración del LLM apuntan a la existencia de una Regla de Control codificada en las instrucciones del sistema: Por política comercial, el quiebre de stock debe evitarse.
  8. Con todo esto en consideración, la secuencia de razonamiento termina con una predicción que funciona como mensaje de salida: Subir el precio en un 5% para aprovechar las condiciones favorables de demanda, esperando dar tiempo a la reposición de las existencias. Inmediatamente este mensaje se transmite al módulo de gestión de la cuenta de X en el e-commerce (E-Commerce API) con la instrucción de efectuar dicha alza.
  9. El Agente registra en una base de datos su ‘estado’ (eg., ‘monitoreo post alza’) y programa en un módulo de coordinación interno la actividad siguiente: revisión de los precios, condiciones de demanda y stock, a realizarse dentro de 15 minutos. Toda la conversación y el razonamiento producido en este ciclo formarán parte de la memoria del agente y estará disponible para la próxima sesión.

Cabe notar que este ciclo solo involucra a un Agente operando en forma aislada. En este sentido, se recordará que la especificidad funcional es una característica intrínseca a los Agentes. Empero, es factible conectar varios Agentes de diverso propósito en un mismo entorno. La evolución hacia un ecosistema coordinado en que varios subprocesos se distribuyen entre un coro de Agentes es denominado IA Agentiva o Agentic AI. Una tecnología incipiente, no exenta de riesgos y limitaciones, cuyo potencial, no obstante, es difícil de soslayar.