Revolución IA
La Inteligencia Artificial está llamada a protagonizar la próxima Revolución tecnológica
Inicio | Sobre Revolucionia | Temas | Para saber más | Contacto |
Agentes inteligentes y su entorno
Fernando P. 10/08/2017
Temas: Fundamentos
El concepto básico y las ideas fundamentales sobre lo que es un
agente inteligente ya ha sido
tratado en un artículo anterior.
Existe una gran diversidad de posibles agentes inteligentes, desde el ejemplo de la
agentes inteligentes, desde el ejemplo de la
puerta automática, descrito en
el mismo artículo, hasta el ejemplo de las dificultades que entraña la
conducción autónoma.
Entre medias de estos ejemplos hay toda una variedad de situaciones cuya automatización sería
deseable, cada una con un grado de complejidad diferente y que requieren de diseños de
agentes acorde a las características del problema.
El entorno de un agente inteligente
Como ya se vio en el mencionado artículo, un
agente inteligente toma
información de su entorno y en base a esa información, a las reglas que rigen su funcionamiento
y a los objetivos perseguidos, ejecuta acciones que le permitan conseguir esos
objetivos.
Naturalmente, el primer problema que nos encontramos a la hora de diseñar un
agente inteligente es dotarle
de la capacidad necesaria para poder obtener la información que precisa de su entorno.
Esto puede parecer sencillo, pero hay problemas muy complejos en los que el simple
hecho de poder observar adecuadamente el entorno ya es en sí mismo un problema de
enorme dificultad.
Véase, como ejemplo de dificultad extrema para percibir el entorno, los problemas que
pueden llegan a tener los coches autónomos con
señalización que ha sido alterada.
Dada una situación que deseamos automatizar mediante un
agente inteligente, lo primero
que debemos hacer es estudiar cómo es el entorno de ese agente, qué información va
a necesitar y qué problemas se puede encontrar para obtenerla. En este sentido, vamos
a establecer 7 propiedades de cualquier entorno que nos permitirán estructurar bien
el diseño de nuestro
agente inteligente.
Entorno observable
Decimos que un entorno es observable si hay posibilidad de conocer todos los datos que nos interesen
en un momento dado. Por ejemplo, una máquina que juegue al ajedrez tiene un entorno
observable porque conoce las posiciones de las piezas en todo momento.
El entorno también puede ser parcialmente observable si en algún momento hay datos
deseables del mismo que no podemos llegar conocer. Por ejemplo, una máquina que juegue al
póker tiene un entorno parcialmente observable porque no conoce las cartas de los
adversarios.
Entorno secuencial
Un entorno es secuencial si una acción determinada del agente condiciona el entorno
de forma irreversible para el futuro. El jugador de ajedrez es un ejemplo de entorno
secuencial, cada movimiento condiciona todo lo que va a suceder después.
En un entorno no secuencial, cada acción del agente es aislada en el sentido de
que no va a condicionar el futuro. En el caso de un brazo robótico que ensambla piezas en una fábrica, cada pieza
que ensambla es independiente y una vez terminada se empieza de cero con otra nueva, es un entorno
no secuencial.
Entorno determinístico o estocástico
Estamos ante un entorno determinístico si las acciones del agente determinan de
forma unívoca una alteración del entorno. En el ejemplo del jugador de ajedrez
se trata de un entorno determinístico, las piezas del tablero van con seguridad a dónde se
las envía, no hay posibilidad de que deseemos un movimiento y resulte otro distinto.
Si ocurre que el resultado de una acción precisa del agente depende de una
distribución de probabilidad, entonces decimos que el entorno es estocástico. Por ejemplo,
un coche autónomo depende de un entorno estocástico porque hay muchas circunstancias
que pueden condicionar una acción determinada (otros coches, averías, fenómenos
atmosféricos ...), un acción de frenar no será efectiva si hay más agua de lo que pensamos en el firme.
Entorno discreto o contínuo
La información que un agente obtiene de su entorno viene a representarse mediante
números (en un ordenador todo son números) y lo mismo sucede para la cuantificación del tiempo que trancurre y para
representar las acciones de un agente.
Si sucede que el agente puede funcionar con
una cantidad limitada de números para funcionar hablamos de entorno discreto. El juego del Póker tiene
un entorno discreto porque una mano de cartas se representa con unos pocos números
y lo mismo sucede para el tiempo (número de jugadas) y las acciones posibles.
En el caso de que la representación del entorno, del tiempo o de las acciones requiera
potencialmente de rangos infinitos de números, hablamos de entorno contínuo. Por ejemplo,
un agente que analice imágenes buscando patrones tiene un entorno contínuo porque
la cantidad posible de imágenes que puede ver es potencialmente infinita.
Entorno estático o dinámico
Puede ocurrir que en el tiempo que transcurre mientras un agente obtiene información
del entorno y decide qué hacer, éste haya cambiado, posíblemente invalidando
el razonamiento del agente. En este caso decimos que el entorno es dinámico. La
conducción autónoma es un caso de entorno dinámico, todo cambia constantemente.
En el caso contrario hablamos en un entorno estático. Mientras el agente razona
nada se mueve, como sucede en el ajedrez.
Existe otra posibilidad que consiste en que deseamos que el agente sea rápido
ejecutando acciones y que el derroche de tiempo se penalice. Diremos que se trata de un
entorno semidinámico y el juego de ajedrez con reloj sería un ejemplo de esta posibilidad.
Entorno conocido o desconocido
Si un entorno se rige por unas reglas muy precisas que podemos dar por conocidas,
decimos que el entorno es conocido. Incluso si el entorno se rige por las reglas
de la Física podemos decir que es conocido porque conocemos buenas aproximaciones
a los fenónemos físicos habituales. Cualquier juego estándar tiene un entorno conocido.
Si no conocemos bien las reglas del entorno y pueden suceder en el mismo cosas que
no entendemos, decimos que el entorno es desconocido. Por ejemplo, un agente que realice
inversiones en bolsa está a merced de una cantidad de sucesos tan grande que
es imposible intentar preveerlo todo y diremos que es un entorno desconocido.
Entorno multiagente
Un entorno es multiagente si hay otros agentes operando además del nuestro y puede
ocurrir que las acciones del resto influyan sobre el nuestro. Por ejemplo,
un coche autónomo es un agente que opera en un entorno multiagente porque se va a
encontrar con otros coches que son equivalentes a él mismo.
Si en el entorno no hay otros agentes que pueden influir, decimos que es un entorno
de agente único. Por ejemplo, en el caso del brazo robótico estamos ante
un entorno de agente único porque su trabajo no se ve alterado por lo que puedan estar haciendo otras máquinas,
o no debería.
El entorno y la complejidad de un agente
Naturalmente, algunas de las propiedades que hemos visto sobre el entorno pueden
complicar de forma extraordinaria el funcionamiento del agente. Por ejemplo, un
coche con conducción autónoma se enfrenta a uno de los peores entornos imaginables.
Pero el conocimiento a priori de las características del entorno nos permitirá estar sobre aviso para
diseñar de forma adecuada nuestro
agente inteligente.
También sucede que un agente que haya sido diseñado para una tarea específica
posíblemente pueda ser transformado fácilmente en otro agente para otra
tarea distinta siempre que las características del
entorno no cambien significativamente.
Básicamente, podemos considerar que existen tantos tipos de agentes como variaciones
de las características básicas de un entorno.
También es posible describir tipos de agentes en base a la complejidad de sus objetivos y
de su lógica interna, pero eso será en otro artículo.
Para saber más:
Este libro tiene un capítulo completo dedicado a agentes inteligentes y clasificación de los mismos según su entorno. Seguramente sea el mejor recurso que se puede encontrar para profundizar en este tema.
Inicio |
![]() ![]() |
En general, todo el contenido de este sitio web es original, salvo referencias o enlaces a otros sitios web y citas o reproducciones expresamente presentadas como tales. No está permitida la reproducción ni la copia del contenido de este sitio web sin el permiso expreso de la propiedad del mismo. Este sitio web no utiliza cookies ni ningún otro mecanismo para almacenar información en los navegadores de los visitantes ni para realizar seguimiento de los mismos. 2017,2018 Revolucionia.net |
Sobre Revolucionia | ||
Temas | ||
Para saber más | ||
Contacto |