CeCo | Sistemas de Recomendación
Newsletter

Sistemas de Recomendación

18.01.2023
CeCo Chile
9 minutos.
Maikol Cerda Z. Economista, Universidad de Chile. Doctor en Economía Aplicada de New York University y M. Phil. en Economía Aplicada de la misma universidad. Investigador de Posdoctorado afiliado al MacMillan Center for International and Area Studies de Yale University, desde el 2019. Trabajó en la Fiscalía Nacional Económica entre el 2011 y 2013.

Definición y contexto

Uno de los objetivos principales de las empresas tecnológicas es atraer y mantener usuarios en la plataforma para generar efectos de red relevantes que les permitan obtener mayores beneficios económicos provenientes de la publicidad y de las cuentas premium de los usuarios. Para lograr dichos objetivos, las plataformas digitales han implementado – entre otras herramientas – sistemas de recomendación. Los sistemas de recomendación – los cuales reciben constantemente nueva información gracias a las decisiones que los usuarios toman cada día – son uno de los algoritmos de machine learning más comunes hoy en día. Dichos sistemas proveen a los usuarios recomendaciones en varias dimensiones, tales como productos del retail, música, películas y contenido especifico a exhibir en redes sociales. Algunos de los ejemplos más populares son el “You Might Also Like” de Amazon, el “Recommended to You” de Netflix, o el “New Feeds” de Facebook.

Los científicos de la computación han desarrollado dos métodos matemáticos principales que son relativamente simples, pero que retornan recomendaciones altamente efectivas. El primero de ellos es el método del filtro basado en contenido (content-based filtering), el cual recomienda productos o contenidos similares a los que el usuario ha disfrutado o elegido con anterioridad. Este método es relativamente rápido y puede escalar y funcionar fácilmente con millones de usuarios y no requiere de un conocimiento acabado más allá de las preferencias del consumidor en cuestión. El segundo método – conocido como filtro colaborativo (collaborative filtering) – recomienda contenido basado en lo que han visto o disfrutado en el pasado usuarios similares – usuarios que son definidos como similares por el propio algoritmo -. Estos dos métodos pueden ser usados de forma independiente o conjunta para maximizar la monetización (gracias al incremento en el número de transacciones), el uso eficiente de los datos privados (debido a la propia retroalimentación del sistema para mejorar la precisión de las recomendaciones futuras – feedback positivo -), y el compromiso del usuario para con la plataforma (gracias a la mayor satisfacción del uso de la misma). Dichos beneficios para la plataforma y los usuarios son, entonces, obtenidos gracias a las ganancias de eficiencia generadas por los sistemas de recomendación al reducir los costos de búsqueda y descubrimiento de un producto nuevo para el usuario.

Efectos y preocupaciones debido al uso de los sistemas de recomendación

Considerando el uso masivo de los algoritmos de recomendación, ha surgido evidencia reciente – proveniente de áreas diversas tales como las ciencias administrativas, la economía industrial, la salud pública, y la ciencia de la computación – que sugiere que dichos sistemas pueden causar impactos en diferentes ámbitos de interés para los hacedores de política, entre los cuales destacan la competencia, la seguridad nacional, la privacidad y la salud mental de la población. Así, por ejemplo, desde el punto de vista de la seguridad nacional, los sistemas de recomendación pueden incrementar la polarización política y el extremismo, particularmente cuando dichas recomendaciones son diseñadas con el solo objetivo de optimizar el compromiso para con la plataforma. Adicionalmente, los sistemas de recomendación controlados por un Estado pueden influenciar – culturalmente, políticamente, etc. – a los ciudadanos de otro Estado de forma negativa. En este sentido, Tiktok ha debido enfrentar diferentes prohibiciones tanto en Estados Unidos como en China y otros países orientales. Desde el punto de vista de la privacidad, los sistemas de recomendación pueden, accidentalmente, diseminar información respecto a la conducta de un usuario – que usó la plataforma con anterioridad – hacia otros usuarios del sistema (este caso es posible cuando, por ejemplo, un usuario visita la plataforma desde una conexión de internet con dominio público).

“No sorprende entonces que, en los últimos años, los sistemas de recomendación hayan estado bajo la lupa y el escrutinio de las autoridades regulatorias y de competencia, con el objetivo de mitigar los potenciales riesgos y daños, pero sin precluir de las importantes eficiencias que los mismos ofrecen a los usuarios finales.”

Ahora bien, centrándonos en los ámbitos de competencia y regulación, es importante mencionar que los impactos en las preferencias y decisiones de compra y consumo de los usuarios que los algoritmos generan en el corto y largo plazo, aún no son totalmente entendidos ni cuantificados. En mi opinión, los sistemas de recomendación pueden impactar la competencia en los mercados digitales en dos maneras fundamentales. Primero, estos sistemas pueden generar efectos de red suficientes de tal forma que las recomendaciones efectivas dependan de los datos usados – su calidad, escala, alcance y unicidad -, los cuales pueden generar una barrera de entrada y ventaja competitiva difícilmente contestable. En este escenario, la siguiente generación de plataformas digitales basadas en inteligencia artificial podrían ver exacerbada la dinámica del winner-take-all. Segundo, los sistemas de recomendación pueden favorecer el self-preferencing, estrategia que “sesga” las recomendaciones hacia productos o servicios que la misma plataforma ofrece. Dado que los sistemas de recomendación son, generalmente, no transparente en diseño -tanto para los usuarios como los reguladores -, dicha estrategia puede ser difícilmente detectable.

No sorprende entonces que, en los últimos años, los sistemas de recomendación hayan estado bajo la lupa y el escrutinio de las autoridades regulatorias y de competencia, con el objetivo de mitigar los potenciales riesgos y daños, pero sin precluir de las importantes eficiencias que los mismos ofrecen a los usuarios finales. Los potenciales riesgos que los sistemas de recomendación pueden generar son complejos, y no existe un consenso general sobre como mitigarlos. Sin embargo, y a pesar de los riesgos competitivos asociados, creo que la magnitud de las ganancias de eficiencias, el éxito de las big-tech a nivel global, y la mayor satisfacción que los usuarios obtienen, continuarán favoreciendo su uso masivo en el futuro.

Sugerencia de Políticas

Dado el esfuerzo actual para entender los potenciales riesgos derivados del uso de sistemas de recomendación – que son complejos y multidisciplinarios -, es recomendable implementar una colaboración estrecha entre las plataformas, los académicos y los reguladores para incrementar la transparencia y funcionamiento saludable de los mismos. A los académicos – quienes ofrecen el conocimiento y las herramientas científicas y teóricas – les hace falta el acceso a los datos y los sistemas tecnológicos para testear sus hipótesis. Así, cuando los académicos solo pueden implementar análisis conductuales basados en observaciones externas a los algoritmos, sus conclusiones revelan, en general, solo evidencia correlacional, no pudiendo testear causalidad.

Por su lado, las plataformas digitales poseen los datos y los recursos tecnológicos necesarios para medir los efectos de los sistemas de recomendación en diferentes áreas de interés para los hacedores de política. Sin embargo, dado que los costos experimentales (y de malfuncionamiento) son externalizados a los usuarios y la sociedad como un todo, las big-tech no tienen los incentivos necesarios para investigar estas cuestiones por sí solas. Incluso si las plataformas quisieran investigar, hoy en día, existen incertidumbres y vacíos legales y regulatorios que desincentivan dichas iniciativas. Sin embargo, al escoger invertir en transparencia, las compañías pueden posicionarse de mejor forma para enfrentar potenciales futuras regulaciones, promover un ambiente colaborativo con entidades externas, generando mayor confianza y satisfacción popular e incrementando la probabilidad de sobrevivencia de la plataforma en el largo plazo.

Algunos componentes necesarios que dichos programas de transparencia debiesen incluir son el seguimiento al inventario, el uso de métricas comparables, el compliance y la gobernanza. Las plataformas debiesen mantener inventario de todos los algoritmos de recomendación usados en el pasado, junto con la respectiva data con la que ellos fueron entrenados (training datasets). El inventario facilitaría el seguimiento de los efectos en el ecosistema a través del tiempo, poniendo énfasis en la performance del algoritmo y los sesgos que éste, computacionalmente, genera. Adicionalmente, las firmas pueden desarrollar métricas estándares con que analizar sus algoritmos, métricas que facilitarían la auditoría externa y la comparación entre las distintas metodologías y sistemas disponibles. Las firmas debiesen también hacer un seguimiento activo de las ultimas regulaciones en todas las legislaciones donde ellas operan y adaptar sus algoritmos en cumplimiento de las leyes y requerimientos locales. Por último, las plataformas debiesen permitir a los usuarios acceder a información detallada respecto a cómo ellas usan sus datos y por qué a ellos se les ha sido recomendado cierto contenido.

Finalmente, los legisladores podrían acelerar la velocidad con las cuales implementar regulaciones al establecer multas claras y bien definidas, y reducir las barreras estructurales que entorpecen una mayor transparencia. Lo anterior por la vía de implementar, por ejemplo, mecanismos para facilitar la auditoria de agentes externos a la plataforma. También, y dado que la regulación está corriendo esta carrera atrasada, se podrían generar instancias excepcionales en las cuales se condonen daños pasados a cambio de un mayor y más transparente acceso, tanto a los datos necesarios como a las herramientas tecnológicas que las plataformas poseen.

También te puede interesar: