CeCo | ‘Orden’ y ‘Estabilidad’: Clasificación en competencia
Newsletter

https://centrocompetencia.com/wp-content/themes/Ceco

Imagen recuperada de IStock

‘Orden’ y ‘Estabilidad’: ¿Positivo o negativo? Clasificación de texto en sede libre competencia

14.05.2025
CeCo Chile
Eugenio Ruiz-Tagle W. Abogado, Pontificia Universidad Católica de Chile. Master of Laws (University College London) y Master of Science in Computer Science (Birkbeck College, University of London). El autor se desempeñó como Sub Jefe de la División Anti-Carteles de la Fiscalía Nacional Económica entre 2017 y 2022. Actualmente es colaborador del proyecto Computational Antitrust del centro Codex de la Universidad de Stanford.

En la sentencia dictada en el denominado caso Supermercados (2020), la Corte Suprema confirmó la resolución del Tribunal de Defensa de la Libre Competencia y tuvo por acreditada una práctica concertada entre las principales cadenas supermercadistas del país, tras citar una serie de correos electrónicos intercambiados entre sus ejecutivos y sus proveedores de pollo fresco. Entre otros antecedentes, ciertas referencias textuales a “estabilidad y orden” encontradas en estas comunicaciones fueron interpretadas por la Corte como señales de acatamiento o monitoreo de una ‘regla de comportamiento’ anticompetitiva.

Si nos abstraemos de las especificidades del caso – no tengo ninguna intención de relitigarlo – esta conclusión parece fundarse en el sentido natural y obvio de las palabras “estabilidad” y “orden”. Hoy, sin embargo, contamos con herramientas computacionales capaces de generar elementos de convicción basados en el dominio específico del lenguaje, o su uso por sujetos determinados, atendiendo a distintas connotaciones y sutilezas que puedan identificarse. Hipotéticamente, un ejercicio como este podría contradecir la tesis de la Corte, por ejemplo, si los vocablos referidos se utilizaron frecuentemente en contextos distintos, o en comunicaciones de los mismos ejecutivos con otros proveedores ajenos a la ‘regla de comportamiento’, o por el contrario respaldarla, o hacer más improbables las tesis alternativas.

«actualmente nuestra institucionalidad adopta decisiones en relación a la intencionalidad, asunto usualmente de suma relevancia para el derrotero de un caso, sin apelar a argumentos cuantitativos. Ello expone estas decisiones a imprecisiones o sesgos de interpretación, y lo que es peor, ignora la riqueza semántica contenida en el cuerpo de evidencia que puede estar disponible, por ejemplo, en casillas de correos electrónicos o en aplicaciones de mensajería».

Como en diversos ámbitos del quehacer jurídico, la prueba de los estados mentales asociados a las conductas infraccionales es central a la práctica forense del derecho de la competencia. Mientras la parte persecutora busca hacerse de documentos y comunicaciones que reflejen inclinaciones subjetivas relacionadas a la infracción que se intenta acreditar, las defensas se esmeran por contextualizar las palabras vertidas en los distintos elementos de prueba o enmarcarlas en el desarrollo de una práctica comercial legítima.

Sin embargo, hasta ahora, las discusiones sobre intencionalidad se basan exclusivamente en intentos no estructurados de interpretar y dar significado a un número reducido de expresiones lingüísticas. Las partes argumentan, y la judicatura decide, la relación o consistencia de ciertas palabras o frases contenidas en evidencia en formato de texto, con la teoría del caso de las partes, de acuerdo a sus propias concepciones respecto del uso corriente del lenguaje.

Dicho de otro modo, actualmente nuestra institucionalidad adopta decisiones en relación a la intencionalidad, asunto usualmente de suma relevancia para el derrotero de un caso, sin apelar a argumentos cuantitativos. Ello expone estas decisiones a imprecisiones o sesgos de interpretación, y lo que es peor, ignora la riqueza semántica contenida en el cuerpo de evidencia que puede estar disponible, por ejemplo, en casillas de correos electrónicos o en aplicaciones de mensajería

Si tuviéramos un caso como Supermercados en 2025, una primera aproximación podría consistir en filtrar todas las casillas de correos electrónicos de ejecutivos de cadenas de supermercados con sus proveedores, y correr un algoritmo de aprendizaje no supervisado de Topic Modelling para identificar temas subyacentes en dichas comunicaciones, etiquetarlos y agruparlos (eg., por tipo de productos, por referencias a fluctuaciones de precios, promociones, lanzamientos, etc.). A continuación, aplicar métricas a los distintos tópicos para identificar fechas relevantes, encontrar referencias cruzadas entre temas y ejecutivos, o hacer análisis estadísticos de temas que frecuentemente aparecen juntos, o la distribución de ciertas etiquetas entre determinadas cuentas de correo relevantes. 

A modo ejemplar, este análisis podría dar lugar a resultados como el siguiente: “La palabra ‘estabilidad’ fue identificada en un total de 53 correos electrónicos intercambiados entre las requeridas y sus proveedores. En el 94 % de los casos, se encuentra en correos etiquetados bajo la categoría ‘pollos’, y en el 89 %, bajo ‘precio de la competencia’”. 

Adicionalmente, puede recurrirse a métodos ya desarrollados para el análisis de sentimientos o Sentiment Analysis (SA). El SA es, esencialmente, una tarea de clasificación consistente en captar la orientación anímica del autor de un determinado texto según su adherencia a dos o más categorías predefinidas. Cada palabra o conjunto de palabras (token) se define,  etiqueta y valora de acuerdo a la inclinación e intensidad anímica que transmite. 

Una forma simple de implementar SA es vía metodologías basadas en reglas, como léxicos o diccionarios que asignan un valor relativo a las palabras en base a su polaridad, sea positiva o negativa. Por ejemplo, VADER (Valence Aware Dictionary and sEntiment Reasoner) es un programa de código abierto que opera en base a un léxico, creado por evaluadores humanos a partir de un banco de palabras, acrónimos y otros símbolos, que le atribuye a cada uno un valor en escala de [-4] Extremadamente Negativo a [4] Extremadamente Positivo, mientras que [0] indica Neutralidad. 

Así, de acuerdo a VADER, la expresión ‘bueno’ (good) se evalúa positivamente [+1.9], pero en una intensidad menor que ‘genial’ (great) [+3.1], mientras que ‘mal’ (bad) [-2.5] tiene una carga negativa menos vigorosa que ‘peor’ (worst) [-3.1]. Con unas cuantas líneas de código, es posible emplear funciones incorporadas a VADER para evaluar cuantitativamente la carga sentimental de una determinada secuencia de palabras, y obtener resultados matizados, que consideren circunstancias tales como palabras acentuadas o enfatizadas (‘bien!!!’) (‘BIEN’), o palabras que califican o modifican el sentido de otras por negación o sarcasmo (‘nada de bien’ / ‘no está mal’).

Volviendo al caso Supermercados, con técnicas como esta podría trazarse la prevalencia de expresiones con carga negativa en determinadas comunicaciones entre una empresa y determinados proveedores (‘tenemos un problema’ ‘hasta cuándo!’, etc.), o bien patrones de frases que reflejen dominancia o control, lo que, puntualmente, habría proveído otra forma de evaluar la alegación de algunos supermercados de que la denominada ‘regla de comportamiento’ fue ‘impuesta’ por los proveedores.

Ahora bien, dado que diccionarios como VADER fueron creados y refinados para analizar contenido de redes sociales, palabras como ‘estable’ (stable) [+1.2] y ‘acuerdo’ (agreement) [+2.2] tienen carga positiva. En un caso de libre competencia, identificar palabras como éstas puede ser relevante sólo si se verifican copulativamente un conjunto de condiciones específicas, relacionadas a los actores, al contexto en que se emiten y a la infracción que se investiga. Es necesario entonces desarrollar un léxico de dominio específico, en español, en el que la polaridad no se defina en el eje positivo/negativo, sino competitivo/anticompetitivo. Así, referencias a ‘ordenar el mercado’ ‘portarse bien’, etc., dada cierta estructura gramatical y dependencias (sujetos involucrados, acciones, etc.) serían identificadas y valoradas con un puntaje anticompetitivo, mientras que frases o referencias antagonizantes podrían catalogarse como competitivos de acuerdo a su consistencia con la operación de un mercado normal en el que existe rivalidad.

Finalmente, el análisis de texto también podría considerar la creación de reglas para identificar referencias orientadas a encubrir determinadas personas o situaciones. En un caso de colusión, el carácter sigiloso de ciertas expresiones puede ser indiciario de una determinada inclinación: ocultar o disimular la alusión a determinadas personas o acontecimientos. Si comunicaciones o planillas internas de una empresa identifican a la competencia de manera ininteligible para un tercero sin suficiente contexto, con aliases, números o palabras en clave, estamos frente a un tipo de representación anómala, que en principio podría respaldar la tesis de ocultamiento, salvo que surja una buena explicación que la descarte o al menos la ponga en duda. En este ámbito, es posible explorar el uso de modelos generativos como GPT (General Pre-trained Transformer) para analizar expresiones ambiguas o genéricas que podrían contener referencias implícitas a entidades ocultas. A partir del contexto discursivo ampliado (por ejemplo, otras comunicaciones del mismo remitente o empresa), podría pedirse al modelo que genere por inferencia las posibles entidades subyacentes. Las respuestas generadas pueden luego compararse con evidencia externa, o validarse mediante el conocimiento experto de los investigadores (Anthonio, T., & Roth, M., 2021).

Lo expuesto aquí es solo una pequeña muestra del potencial de este tipo de técnicas para ofrecer una lectura panorámica, sistemática y empírica de grandes volúmenes de evidencia textual. No obstante, como cualquier aproximación analítica, ellas se basan en supuestos y criterios que pueden introducir sesgos propios, y son vulnerables a errores metodológicos, por lo que requieren ser objeto de revisión crítica – una no muy distinta a la que actualmente se somete a informes económicos y modelos econométricos presentados en el marco de un litigio.

Como reflexión final: tenemos que dejar atrás la lógica de pensar en la evidencia digital como un puñado de archivos o comunicaciones ‘elegidos con pinzas’ por parecernos intuitivamente más explícitos o atingentes a los hechos que se pretende acreditar. Todo texto potencialmente atribuible a sujetos de interés para una investigación, en un período de tiempo determinado, es relevante. En la medida que se encuentre en un formato inteligible y susceptible a ser procesado, puede conducir a pistas sobre el uso del lenguaje, relaciones entre temas y personas, cargas emocionales o entidades encubiertas, que faciliten la valoración de la prueba por parte de los jueces conforme a la sana crítica.

Regístrate de forma gratuita para seguir leyendo este contenido

Contenido exclusivo para los usuarios registrados de CeCo