Desde 1995 el libro Artificial Intelligence: A Modern Approach escrito por Stuart Russell y Peter Norvig ya nos habla de agentes inteligentes con una definición en la que se involucra al entorno en el que opera el agente, la toma de decisiones o el aprendizaje con una tipificación que 30 años más tarde sigue siendo útil. Este libro además ha sido reeditado en varias ocasiones, la última en 2020.
Tipos de agentes inteligentes propuestos en Artificial Intelligence: A Modern Approach
Tabla de contenidos
ToggleAgentes reactivos simples
Seleccionan acciones basándose únicamente en la percepción actual. Funcionan mediante reglas de condición-acción.
Por ejemplo una regla simple en un filtro de correo electrónico que marca automáticamente un email como importante si el remitente está en una lista.
Agentes reactivos basados en modelos
Son la evolución natural de los simples, mantienen un estado interno que representa aspectos de su entorno que no aparecen en la percepción actual. Este estado se actualiza utilizando un modelo de cómo funciona el entorno y del impacto de las acciones del agente sobre el mismo. La toma de decisiones se lleva a cabo utilizando tanto la percepción actual como el estado interno.
Por ejemplo un termostato que mantiene internamente el estado de la calefacción (encendido / apagado) y a través de la percepción obtiene la temperatura en una habitación. Su modelo del entorno le indicará que al encender la calefacción la temperatura subirá por tanto si el estado de la calefacción es apagado y la lectura de un sensor de temperatura es inferior a un valor deberá encender la calefacción para que la temperatura suba.
Agentes basados en objetivos
Estos agentes tienen información sobre objetivos y seleccionan acciones que los llevarán a alcanzar esos objetivos. Esto a menudo implica cierta planificación de secuencias de acciones futuras para encontrar un camino hacia el objetivo.
Por ejemplo, un enemigo en un videojuego que deba perseguir al jugador para atacar contará con un componente de planificación de rutas. Su objetivo serán las coordenadas del jugador, utilizará como modelo del mundo el mapa y el algoritmo A* para calcular diferentes secuencias de movimientos y encontrar una ruta que lleve desde el estado inicial hasta su estado objetivo.
Agentes basados en utilidad
Cuentan con una función de utilidad que asigna un valor numérico a cada estado posible. El agente elige la acción que conduce al estado con el valor de utilidad esperado más alto, permitiéndole tomar decisiones racionales incluso en situaciones con múltiples metas contrapuestas.
El ejemplo podría ser una versión avanzada caso anterior donde el enemigo cuente con capacidad para avanzar andando o nadando y con un sistema de cansancio. En su función de utilidad podría combinar el tiempo necesario para alcanzar al jugador dependiendo de la ruta pero minimizando los recursos necesarios.
Agentes de aprendizaje
Agentes que pueden mejorar su rendimiento con la experiencia. Tienen un sistema de aprendizaje que se retroalimenta con el resultado de las acciones del agente para modificar su comportamiento futuro. Puede ajustar distintas partes del agente como el modelo del contexto, las reglas de acción, la función de utilidad, etc. Esto permite que empiece a funcionar con un conocimiento incompleto y que poco a poco vaya adaptándose a situaciones desconocidas.
Por ejemplo, un filtro de spam adaptativo que va aprendiendo según el usuario marca correos como “spam» o «no es spam». El sistema de aprendizaje analiza estos casos y actualiza el modelo interno del filtro (por ejemplo aumenta la probabilidad de marcar como spam correos con ciertas palabras). Con el tiempo, el rendimiento del filtro mejora gracias a este aprendizaje.
Un detalle importante es que los tipos descritos no son completamente excluyentes ya que por ejemplo un agente basado en objetivos podría también incluir un sistema de aprendizaje.
¿Qué entendemos por inteligencia artificial en 2025?
Con la explosión de los LLMs parece que las técnicas de machine learning han quedado relegadas a un segundo plano y cualquier producto que incluya técnicas de IA esperamos que esté conectado con un LLM o utilice técnicas de RAG.
Aunque los algoritmos de machine learning nos pueden dar en ocasiones mejores resultados la implementación suele ser más compleja y por ejemplo usando técnicas de RAG y prompting combinadas podemos implementar agentes inteligentes con un sistema de aprendizaje usando LLMs.
Implementación de un pequeño sistema multiagente para mantener repositorios de git actualizados
Vamos a utilizar piezas modernas de tecnología para crear un sistema con muy poco código que se encargue de crear los commits adecuados en un repositorio que tenga varios commits pendientes de realizar.
Puesto que desde acceseo apostamos por desarrollar la mayoría de nuestros proyectos usando PHP nos vamos a basar en las siguientes herramientas que encajan perfectamente en nuestra filosofía:
- https://github.com/czproject/git-php
- https://github.com/inspector-apm/neuron-ai
- https://www.together.ai
Primero obtenemos el listado de archivos pendientes de commitear utilizando czproject/git-php.
A continuación creamos un agente con NeuronAI que agrupe los distintos paths que nos servirán para crear commits independientes.
Este agente lo invocaremos desde nuestro archivo principal y con su respuesta obtendremos el array con los archivos agrupados.
Ahora crearemos otro agente encargado de crear el mensaje del commit a partir de la lista de archivos de cada grupo.
Y por último combinaremos de nuevo el uso del agente y de git para hacer commit con el mensaje adecuado en cada caso.
Con unas 100 líneas de código tenemos 2 agentes cooperando para resolver nuestro problema de forma automática. Soluciones más clásicas a este problema podrían crear commits por carpeta (“Actualiza tema X”, “Actualiza traducciones”, etc) o por acción (“Añade archivos”, “Elimina carpeta”, etc) no adaptándose a nuestras necesidades reales como desarrolladores.
Utilizando un LLM conseguimos agrupar de una forma más semántica los archivos relacionados, en nuestro caso trabajando con un WordPress al que le hemos eliminado varios temas, añadido otro y añadido un plugin el sistema es capaz de agrupar las traducciones correspondientes al tema aunque no estén en la carpeta del tema como se puede observar en la siguiente imagen.
Ventajas de la implementación de agentes IA
Este es un claro ejemplo de aumento de productividad al quitarle tareas repetitivas a una persona. Además esto suele venir acompañado de reducción de costes y optimización de procesos. En otros casos se puede enfocar el sistema en la prevención de errores humanos, tener disponibilidad 24/7 o en la toma de decisiones con grandes volúmenes de datos.
Inconveniente principal de la implementación
Especialmente en los sistemas basados en LLMs los resultados no son consistentes. Esto en algunos escenarios puede representar un gran inconveniente mientras que en otros puede ser perfectamente asumible.
¿Cómo seguimos avanzando?
Podríamos añadir a nuestro sistema capacidades de aprendizaje usando como ejemplos de mensajes deseables los de los commits del repositorio, de esta forma además si una persona modifica un mensaje generado por el sistema estará “corrigiendo” posibles sesgos y evitándolos en el futuro.
Podríamos incluir también técnicas de RAG para mejorar los procesos obteniendo datos del histórico del repositorio relacionados con escenarios similares al estado del repositorio.
También podríamos integrar distintas herramientas a través de MCP, de esta forma por ejemplo podríamos delegar parte de la interacción con git.
Conclusión
Los agentes de IA son sistemas cada vez más autónomos capaces de percibir el contexto en el que se ejecutan, capaces de razonar, actuar en consecuencia e incluso aprender.
La expansión en capacidades y aplicaciones que están viviendo conlleva también nuevos retos como asegurar que los resultados sean adecuados, supervisarlos y garantizar que sus acciones sean éticas especialmente en áreas críticas como la sanidad o las finanzas. Evitar sesgos y consecuencias no deseadas definiendo mecanismos de control, protección de datos y monitorización será clave en el futuro a corto plazo.