Revolución IA

La Inteligencia Artificial está llamada a protagonizar la próxima Revolución tecnológica

Inicio Sobre Revolucionia Temas Para saber más Contacto

Clasificación frente a modelización

Fernando P.    23/08/2017

Temas:  Fundamentos

En artículos anteriores hemos tratado sobre la definición de clasificador y en otros artículos habíamos visto refinamientos de la idea de clasificador en situaciones con incertidumbre y en situaciones donde las características del conjunto de casos exigen generalización.

Cuando nos enfrentamos a un problema de clasificación, la solución pasa por construir un clasificador, que no es más que una aplicación desde el conjunto de casos al conjunto de categorías o clases.

Desde el punto de vista matemático, costruir un clasificador viene a ser equivalente a estimar o calcular la aplicación que lo define. Hay mucha teoría matemática sobre esto y conviene ver en qué casos puede ser de utilidad.

Modelización
En Matemáticas existen gran cantidad de técnicas para realizar lo que llamamos modelización. Básicamente, se trata de obtener una aplicación (que suele ser una función de valores y argumentos reales) que se ajuste bien a un conjunto de datos que tenemos, que, en el caso más simple, suelen ser pares de números en la forma (valor_entrada,valor_salida).

Una característica clave de la modelización es que hacemos hipótesis relativamente fuertes sobre la forma de la función que vamos a obtener. No existe una técnica general de modelización que pueda resultar en funciones arbitrarias, para cada tipo de función existe una técnica distinta.
Regresión lineal
Por ejemplo, el caso más sencillo de modelización (y el más usado) es lo que se conoce por regresión lineal. En este caso tenemos muchos pares de números reales en la forma (x,y), que podemos considerar que representan puntos en el plano. Buscamos una función f que represente una recta en el plano y tal que f(x) = y, o al menos que se ajuste lo mejor posible a la nube de puntos que tenemos en el plano.

La regresión lineal es una técnica de modelización muy potente que nos ayuda a descubrir una relación lineal entre los datos y que puede ser muy útil para realizar predicciones suponiendo que nuestros datos sigan, efectivamente, una relación lineal.

Hay otras técnicas de modelización que permiten estimar funciones más complejas que una simple recta, incluso con muchas variables de entrada. Pero, cuanto más complicadas son las funciones, peor funcionan las técnicas de modelización.

Si tenemos información a priori sobre alguna relación relevante entre los datos de entrada y el valor de salida que debe tener la función (como puede ser la linealidad), seguramente podemos usar alguna técnica de modelización.

En general, las técnicas estándar de modelización no se pueden considerar técnicas de Inteligencia Artificial porque están bien delimitadas sobre problemas concretos, que se conocen bien y cuya resolución está bastante estudiada. No suelen ser problemas difíciles, aunque a veces pueden ser muy costosos de resolver desde el punto de vista computacional por la cantidad de cálculos que hay que realizar.

Problemas de clasificación que se pueden modelizar
Hay problemas de clasificación lo suficientemente sencillos como para que se puedan resolver modelizando en base a una función de un tipo conocido, para la que sólo haya que calcular los parámetros que permitan que se ajuste bien a los datos concretos que tenemos.
Clasificador lineal
Por ejemplo, una simple regresión lineal puede actuar como un clasificador en cuanto que una recta divide el plano en dos regiones. Si tenemos un problema de clasificación con dos categorías, podemos asimilar una categoría a una mitad del plano (delimitada por una recta) y la otra categoría a la otra mitad del plano. Esto puede funcionar con algunos problemas muy sencillos y para estos problemas no vamos a necesitar nada de Inteligencia Artificial, las técnicas estándar de modelización matemática nos van a resolver el problema.

Como nos podemos imaginar, a medida que vamos considerando problemas de clasificación más complejos, la posibilidad de poder resolverlos mediante modelización estándar se va esfumando. Si añadimos las complicaciones ya vistas y que pueden darse en problemas de clasificación, la posibilidad de resolverlos mediante modelización estándar viene a ser cero.

Cuanto más complejo es un problema de clasificación más poco probable es que podamos hacer hipótesis fuertes que permitan modelizar el problema a base de funciones matemáticas conocidas (que suelen ser bastante sencillas). Si pensamos en problemas de clasificación del tipo de imágenes, es básicamente imposible pensar en funciones matemáticas que puedan ayudarnos a nada que tengamos unas cuantas imágenes de cierta complejidad.

¿ Qué hacemos con los problemas de clasificación complejos ?
Cuando la modelización matemática estándar es demasiado simple para ayudarnos en nuestro problema, lo primero que debemos reconocer es que no sabemos nada sobre la estructura de nuestro problema, no podemos hacer hipótesis a priori como hacemos en la modelización.

Es decir, cuando estamos ante un problema de clasificación relativamente complejo, nuestro verdadero problema es que no tenemos hipótesis, no tenemos modelo.

Hay que tener en cuenta que hay problemas de clasificación complicados (como el reconocimiento de cosas en imágenes) que un humano puede solucionar muy bien. Pero es fundamental darse cuenta de que el humano tampoco tiene modelo para resolver el problema, será capaz de clasificar, pero será incapaz de describir cómo lo hace o será incapaz de proporcionar un método general.

Podemos decir entonces que hay dos formas de resolver problemas de clasificación. Los problemas fáciles podrán ser modelados mediante las técnicas estándar que hay en Matemáticas. Los problemas difíciles no son modelizables, pero sí que se pueden resolver (un humano lo hace). Es en este tipo de problemas dónde las técnicas de construcción de clasificadores desarrolladas en Inteligencia Artificial nos pueden ayudar. Se trata de técnicas que son capaces de construir e ir modificando clasificadores sin modelo a priori, igual que lo haría un humano.

La principal técnica de construcción de clasificadores sin modelo es el aprendizaje automático o machine learning.


Para saber más:

Esta página de la Wikipedia proporciona una descripción diferente, menos precisa (aunque equivalente) a lo que hemos visto aquí como clasificador.

Página de la Wikipedia sobre la regresión lineal, que es una de las técnicas matemáticas de modelización más usadas y más potentes que existen.

El aprendizaje automático o machine learning es una disciplina de las ciencias de la computación que trata la cuestión de sí las máquinas pueden llegar a aprender por la vía de la generalización. Básicamente, se trata de construir funciones sin modelo a priori.



 

Inicio Powered by NetBSD
 
HTML5
 
En general, todo el contenido de este sitio web es original, salvo referencias o enlaces a otros sitios web y citas o reproducciones expresamente presentadas como tales.

No está permitida la reproducción ni la copia del contenido de este sitio web sin el permiso expreso de la propiedad del mismo.

Este sitio web no utiliza cookies ni ningún otro mecanismo para almacenar información en los navegadores de los visitantes ni para realizar seguimiento de los mismos.

2017,2018 Revolucionia.net
Sobre Revolucionia
Temas
Para saber más
Contacto