Revolución IA
La Inteligencia Artificial está llamada a protagonizar la próxima Revolución tecnológica
Inicio | Sobre Revolucionia | Temas | Para saber más | Contacto |
Clasificación frente a modelización
Fernando P. 23/08/2017
Temas: Fundamentos
En artículos anteriores hemos tratado sobre la definición de
clasificador y en otros
artículos habíamos visto refinamientos de la idea de clasificador en situaciones con
incertidumbre y en situaciones
donde las características del conjunto de casos exigen
generalización.
Cuando nos enfrentamos a un problema de clasificación, la solución pasa por construir un clasificador, que
no es más que una aplicación desde el conjunto de casos al conjunto de categorías o clases.
Desde el punto de vista matemático, costruir un clasificador viene a ser equivalente a estimar o calcular
la aplicación que lo define. Hay mucha teoría matemática sobre esto y conviene ver en qué casos puede
ser de utilidad.
Modelización
En Matemáticas existen gran cantidad de técnicas para realizar lo que llamamos modelización. Básicamente,
se trata de obtener una aplicación (que suele ser una función de valores y argumentos reales) que se ajuste
bien a un conjunto de datos que tenemos, que, en el caso más simple, suelen ser pares de números en la forma
(valor_entrada,valor_salida).
Una característica clave de la modelización es que hacemos hipótesis relativamente fuertes sobre la
forma de la función que vamos a obtener. No existe una técnica general de modelización que pueda resultar
en funciones arbitrarias, para cada tipo de función existe una técnica distinta.
Por ejemplo, el caso más sencillo de modelización (y el más usado) es lo que se conoce por regresión
lineal. En este caso tenemos muchos pares de números reales en la forma (x,y), que podemos
considerar que representan puntos en el plano. Buscamos una función
f que represente una recta en el plano y tal que f(x) = y, o al menos
que se ajuste lo mejor posible a la nube de puntos que tenemos en el plano.
La regresión lineal es una técnica de modelización muy potente que nos ayuda a descubrir
una relación lineal entre los datos y que puede ser muy útil para realizar predicciones suponiendo que
nuestros datos sigan, efectivamente, una relación lineal.
Hay otras técnicas de modelización que permiten estimar funciones más complejas que una simple recta,
incluso con muchas variables de entrada. Pero, cuanto más complicadas son las funciones, peor funcionan
las técnicas de modelización.
Si tenemos información a priori sobre alguna relación relevante entre los datos de entrada y el
valor de salida que debe tener la función (como puede ser la linealidad), seguramente podemos
usar alguna técnica de modelización.
En general, las técnicas estándar de modelización no se pueden considerar técnicas de Inteligencia Artificial
porque están bien delimitadas sobre problemas concretos, que se conocen bien y cuya resolución está
bastante estudiada. No suelen ser
problemas difíciles, aunque
a veces pueden ser muy costosos de resolver desde el punto de vista computacional por la cantidad
de cálculos que hay que realizar.
Problemas de clasificación que se pueden modelizar
Hay problemas de clasificación lo suficientemente sencillos como para que se puedan
resolver modelizando en base a una función de un tipo conocido, para la que sólo haya que calcular los
parámetros que permitan que se ajuste bien a los datos concretos que tenemos.
Por ejemplo, una simple regresión lineal puede actuar como un clasificador en cuanto que una recta
divide el plano en dos regiones. Si tenemos un problema de clasificación con dos categorías, podemos
asimilar una categoría a una mitad del plano (delimitada por una recta) y la otra categoría a la otra
mitad del plano. Esto puede funcionar con algunos problemas muy sencillos y para estos problemas no
vamos a necesitar nada de Inteligencia Artificial, las técnicas estándar de modelización matemática nos
van a resolver el problema.
Como nos podemos imaginar, a medida que vamos considerando problemas de clasificación
más complejos, la posibilidad de poder resolverlos mediante modelización estándar se va esfumando. Si
añadimos las complicaciones ya vistas y que pueden darse en problemas de clasificación, la posibilidad
de resolverlos mediante modelización estándar viene a ser cero.
Cuanto más complejo es un problema de clasificación más poco probable es que podamos hacer hipótesis
fuertes que permitan modelizar el problema a base de funciones matemáticas conocidas (que suelen ser bastante sencillas).
Si pensamos en problemas de clasificación del tipo de imágenes, es básicamente imposible pensar en
funciones matemáticas que puedan ayudarnos a nada que tengamos unas cuantas imágenes de cierta complejidad.
¿ Qué hacemos con los problemas de clasificación complejos ?
Cuando la modelización matemática estándar es demasiado simple para ayudarnos en nuestro problema, lo
primero que debemos reconocer es que no sabemos nada sobre la estructura de nuestro problema, no podemos
hacer hipótesis a priori como hacemos en la modelización.
Es decir, cuando estamos ante un problema de clasificación relativamente complejo, nuestro verdadero
problema es que no tenemos hipótesis, no tenemos modelo.
Hay que tener en cuenta que hay problemas de clasificación complicados (como el reconocimiento de cosas
en imágenes) que un humano puede solucionar muy bien. Pero es fundamental darse cuenta de que el humano
tampoco tiene modelo para resolver el problema, será capaz de clasificar, pero será incapaz de
describir cómo lo hace o será incapaz de proporcionar un método general.
Podemos decir entonces que hay dos formas de resolver problemas de clasificación. Los problemas fáciles
podrán ser modelados mediante las técnicas estándar que hay en Matemáticas. Los problemas difíciles no son
modelizables, pero sí que se pueden resolver (un humano lo hace). Es en este tipo de problemas dónde
las técnicas de construcción de clasificadores desarrolladas en Inteligencia Artificial nos pueden
ayudar. Se trata de técnicas que son capaces de construir e ir modificando clasificadores sin modelo a priori,
igual que lo haría un humano.
La principal técnica de construcción de clasificadores sin modelo es el
aprendizaje automático o machine learning.
Para saber más:
Esta página de la Wikipedia proporciona una descripción diferente, menos precisa (aunque equivalente) a lo que hemos visto aquí como clasificador.
Página de la Wikipedia sobre la regresión lineal, que es una de las técnicas matemáticas de modelización más usadas y más potentes que existen.
El aprendizaje automático o machine learning es una disciplina de las ciencias de la computación que trata la cuestión de sí las máquinas pueden llegar a aprender por la vía de la generalización. Básicamente, se trata de construir funciones sin modelo a priori.
Inicio |
![]() ![]() |
En general, todo el contenido de este sitio web es original, salvo referencias o enlaces a otros sitios web y citas o reproducciones expresamente presentadas como tales. No está permitida la reproducción ni la copia del contenido de este sitio web sin el permiso expreso de la propiedad del mismo. Este sitio web no utiliza cookies ni ningún otro mecanismo para almacenar información en los navegadores de los visitantes ni para realizar seguimiento de los mismos. 2017,2018 Revolucionia.net |
Sobre Revolucionia | ||
Temas | ||
Para saber más | ||
Contacto |