Revolución IA

La Inteligencia Artificial está llamada a protagonizar la próxima Revolución tecnológica

Inicio Sobre Revolucionia Temas Para saber más Contacto

Agentes inteligentes y su entorno

Fernando P.    10/08/2017

Temas:  Fundamentos

El concepto básico y las ideas fundamentales sobre lo que es un agente inteligente ya ha sido tratado en un artículo anterior.

Existe una gran diversidad de posibles agentes inteligentes, desde el ejemplo de la agentes inteligentes, desde el ejemplo de la puerta automática, descrito en el mismo artículo, hasta el ejemplo de las dificultades que entraña la conducción autónoma.

Entre medias de estos ejemplos hay toda una variedad de situaciones cuya automatización sería deseable, cada una con un grado de complejidad diferente y que requieren de diseños de agentes acorde a las características del problema.

El entorno de un agente inteligente
Como ya se vio en el mencionado artículo, un agente inteligente toma información de su entorno y en base a esa información, a las reglas que rigen su funcionamiento y a los objetivos perseguidos, ejecuta acciones que le permitan conseguir esos objetivos.

Naturalmente, el primer problema que nos encontramos a la hora de diseñar un agente inteligente es dotarle de la capacidad necesaria para poder obtener la información que precisa de su entorno.

Esto puede parecer sencillo, pero hay problemas muy complejos en los que el simple hecho de poder observar adecuadamente el entorno ya es en sí mismo un problema de enorme dificultad.

Véase, como ejemplo de dificultad extrema para percibir el entorno, los problemas que pueden llegan a tener los coches autónomos con señalización que ha sido alterada.

Dada una situación que deseamos automatizar mediante un agente inteligente, lo primero que debemos hacer es estudiar cómo es el entorno de ese agente, qué información va a necesitar y qué problemas se puede encontrar para obtenerla. En este sentido, vamos a establecer 7 propiedades de cualquier entorno que nos permitirán estructurar bien el diseño de nuestro agente inteligente.

Entorno observable Agente inteligente y su entorno
Decimos que un entorno es observable si hay posibilidad de conocer todos los datos que nos interesen en un momento dado. Por ejemplo, una máquina que juegue al ajedrez tiene un entorno observable porque conoce las posiciones de las piezas en todo momento.

El entorno también puede ser parcialmente observable si en algún momento hay datos deseables del mismo que no podemos llegar conocer. Por ejemplo, una máquina que juegue al póker tiene un entorno parcialmente observable porque no conoce las cartas de los adversarios.

Entorno secuencial
Un entorno es secuencial si una acción determinada del agente condiciona el entorno de forma irreversible para el futuro. El jugador de ajedrez es un ejemplo de entorno secuencial, cada movimiento condiciona todo lo que va a suceder después.

En un entorno no secuencial, cada acción del agente es aislada en el sentido de que no va a condicionar el futuro. En el caso de un brazo robótico que ensambla piezas en una fábrica, cada pieza que ensambla es independiente y una vez terminada se empieza de cero con otra nueva, es un entorno no secuencial.

Entorno determinístico o estocástico
Estamos ante un entorno determinístico si las acciones del agente determinan de forma unívoca una alteración del entorno. En el ejemplo del jugador de ajedrez se trata de un entorno determinístico, las piezas del tablero van con seguridad a dónde se las envía, no hay posibilidad de que deseemos un movimiento y resulte otro distinto.

Si ocurre que el resultado de una acción precisa del agente depende de una distribución de probabilidad, entonces decimos que el entorno es estocástico. Por ejemplo, un coche autónomo depende de un entorno estocástico porque hay muchas circunstancias que pueden condicionar una acción determinada (otros coches, averías, fenómenos atmosféricos ...), un acción de frenar no será efectiva si hay más agua de lo que pensamos en el firme.

Entorno discreto o contínuo
La información que un agente obtiene de su entorno viene a representarse mediante números (en un ordenador todo son números) y lo mismo sucede para la cuantificación del tiempo que trancurre y para representar las acciones de un agente.

Si sucede que el agente puede funcionar con una cantidad limitada de números para funcionar hablamos de entorno discreto. El juego del Póker tiene un entorno discreto porque una mano de cartas se representa con unos pocos números y lo mismo sucede para el tiempo (número de jugadas) y las acciones posibles.

En el caso de que la representación del entorno, del tiempo o de las acciones requiera potencialmente de rangos infinitos de números, hablamos de entorno contínuo. Por ejemplo, un agente que analice imágenes buscando patrones tiene un entorno contínuo porque la cantidad posible de imágenes que puede ver es potencialmente infinita.

Entorno estático o dinámico
Puede ocurrir que en el tiempo que transcurre mientras un agente obtiene información del entorno y decide qué hacer, éste haya cambiado, posíblemente invalidando el razonamiento del agente. En este caso decimos que el entorno es dinámico. La conducción autónoma es un caso de entorno dinámico, todo cambia constantemente.

En el caso contrario hablamos en un entorno estático. Mientras el agente razona nada se mueve, como sucede en el ajedrez.

Existe otra posibilidad que consiste en que deseamos que el agente sea rápido ejecutando acciones y que el derroche de tiempo se penalice. Diremos que se trata de un entorno semidinámico y el juego de ajedrez con reloj sería un ejemplo de esta posibilidad.

Entorno conocido o desconocido
Si un entorno se rige por unas reglas muy precisas que podemos dar por conocidas, decimos que el entorno es conocido. Incluso si el entorno se rige por las reglas de la Física podemos decir que es conocido porque conocemos buenas aproximaciones a los fenónemos físicos habituales. Cualquier juego estándar tiene un entorno conocido.

Si no conocemos bien las reglas del entorno y pueden suceder en el mismo cosas que no entendemos, decimos que el entorno es desconocido. Por ejemplo, un agente que realice inversiones en bolsa está a merced de una cantidad de sucesos tan grande que es imposible intentar preveerlo todo y diremos que es un entorno desconocido.

Entorno multiagente
Un entorno es multiagente si hay otros agentes operando además del nuestro y puede ocurrir que las acciones del resto influyan sobre el nuestro. Por ejemplo, un coche autónomo es un agente que opera en un entorno multiagente porque se va a encontrar con otros coches que son equivalentes a él mismo.

Si en el entorno no hay otros agentes que pueden influir, decimos que es un entorno de agente único. Por ejemplo, en el caso del brazo robótico estamos ante un entorno de agente único porque su trabajo no se ve alterado por lo que puedan estar haciendo otras máquinas, o no debería.

El entorno y la complejidad de un agente
Naturalmente, algunas de las propiedades que hemos visto sobre el entorno pueden complicar de forma extraordinaria el funcionamiento del agente. Por ejemplo, un coche con conducción autónoma se enfrenta a uno de los peores entornos imaginables. Pero el conocimiento a priori de las características del entorno nos permitirá estar sobre aviso para diseñar de forma adecuada nuestro agente inteligente.

También sucede que un agente que haya sido diseñado para una tarea específica posíblemente pueda ser transformado fácilmente en otro agente para otra tarea distinta siempre que las características del entorno no cambien significativamente.

Básicamente, podemos considerar que existen tantos tipos de agentes como variaciones de las características básicas de un entorno.

También es posible describir tipos de agentes en base a la complejidad de sus objetivos y de su lógica interna, pero eso será en otro artículo.


Para saber más:

Este libro tiene un capítulo completo dedicado a agentes inteligentes y clasificación de los mismos según su entorno. Seguramente sea el mejor recurso que se puede encontrar para profundizar en este tema.



 

Inicio Powered by NetBSD
 
HTML5
 
En general, todo el contenido de este sitio web es original, salvo referencias o enlaces a otros sitios web y citas o reproducciones expresamente presentadas como tales.

No está permitida la reproducción ni la copia del contenido de este sitio web sin el permiso expreso de la propiedad del mismo.

Este sitio web no utiliza cookies ni ningún otro mecanismo para almacenar información en los navegadores de los visitantes ni para realizar seguimiento de los mismos.

2017,2018 Revolucionia.net
Sobre Revolucionia
Temas
Para saber más
Contacto