Revolución IA

La Inteligencia Artificial está llamada a protagonizar la próxima Revolución tecnológica

Inicio Sobre Revolucionia Temas Para saber más Contacto

Clasificadores: problemas con incertidumbre

Fernando P.    08/08/2017

Temas:  Fundamentos

En artículos anteriores ya se intrudujo el concepto de clasificador y se proporcionó su definición básica, pero también se advertía de que había refinamientos de la definición básica que eran de utilidad para problemas de complejidad añadida.

En este artículo se va a tratar sobre una de estas posibles complicaciones que nos exigen refinar la definición de clasificador. Se usará la misma notación desarrollada en el artículo que desarrollaba la definición de clasificador

Incertidumbre en la clasificación
En la definición básica decíamos que un clasificador es una aplicación fc entre el conjunto casos X y el conjunto de clases C.

Se trata de una definición determinística, en el sentido de que para cada caso posible vamos a tener una clase con la que poder etiquetarlo, no hay dudas sobre el proceso de asignación de clases a cada caso posible.

Pero en situaciones reales, esta formulación no tiene porqué ser así, sobre todo con problemas de cierta complejidad. Es habitual que haya incertidumbre o duda sobre a qué clase asignar algunos casos.

Ejemplo de incertidumbre: el reconocimiento de voz
Consideremos, por ejemplo, el problema de reconocimiento de voz o lenguaje hablado. Básicamente se trata de utilizar una fuente de sonido que contiene lenguaje hablado para dividirla en una sucesión de sonidos o fonemas, que posteriormente se ensamblarán para identificar palabras completas.

El problema de reconocer lenguaje hablado puede reducirse a la construcción de un clasificador que asigne cada sonido que va recibiendo secuencialmente a un determinado fonema, que posteriormente se ensamblan en forma de palabras completas.

En teoría, todos los fonemas del lenguaje hablado son distintos, pero sabemos por experiencia que algunos se parecen mucho entre sí y además dependen bastante de la forma de hablar de cada persona.

En estas condiciones, vamos a tener problemas para construir nuestro clasificador porque se va a encontrar con fonemas que pueden encajar en más de un modelo de fonema que conozca, no nos va a funcionar la aproximación determinística al problema.

Sucederá que en ocasiones tengamos varios fonemas candidatos que puedan corresponder al sonido que hemos recibido y, además, sucederá que entre esos candidatos unos serán más verosímiles que otros.
Distribución de probabilidad
Podemos pensar en construir un clasificador que, en vez de asignar una clase unívoca a cada caso de entrada, proporcione una lista de clases probables, con su medida de probabilidad respectiva.

Clasificadores estocásticos
Vamos a extender el concepto de clasificador para el caso de existencia de incertidumbre y a proponer una nueva definición que, como veremos, resulta más general.


Dados los conjuntos de casos de entrada X y clases de salida C,

definimos un clasificador estocástico como una aplicación Hc : XDP(C)

donde DP(C) es el conjunto de todas las distribuciones de probabilidad sobre C

Es decir, nuestro clasificador, en vez de proporcionar una clase única para cada caso de entrada, proporciona una distribución de probabilidades sobre el conjunto de clases C. Al ser C finito, se trata de distribuciones de probabilidad discretas.

En notación más precisa:

xX,   Hc(x) = PxDP(C)

... y se verifica que

cC,  Px(c) ≥ 0

Px(c1) + ... + Px(cn) = 1, siendo n el número de clases en C

Diremos que este nuevo tipo de clasificador Hc es un clasificador estocástico, en contraposición al clasificador determinístico descrito originalmente.

Generalización de los clasificadores determinísticos
Es fácil ver que la definición de clasificador estocástico permite generalizar a los clasificadores determinísticos.

En el caso de que estemos seguros de cual es la clase que corresponde a cada caso de entrada, no tenemos más que asignar una distribución de probabilidad degenerada (vale 1 en una sóla clase y 0 para el resto) a ese caso y tenemos jústamente un clasificador que opera como si fuera determinístico.

Con la posibilidad de usar clasificadores estocásticos podemos atacar una clase de problemas mucho más amplia y que están mucho más cercanos a lo que solemos encontrarnos en la realidad. Las cosas no suelen ser muy determinísticas, no son blancas o negras, y es mejor reconocer que hay incertidumbre (y cuantificarla) que arriesgarse a equivocarse de forma constante asignando clases que no corresponden de ninguna manera.

Clasificadores Bayesianos
La incertidumbre introducida con los clasificadores estocásticos puede reducirse de distintas formas.

En los problemas para los que tenemos que clasificar los casos de forma secuencial, suele existir información a priori sobre la probabilidad de que ocurran ciertas secuencias de clases. Se trata de la aproximación Bayesiana al problema y la información a priori viene dada en forma de probabilidades condicionadas.

Por ejemplo, en el caso de reconocimiento de voz, no todas las secuencias de fonemas son posibles, sólo algunas son válidas, podemos usar esta información para desechar fonemas que se han detectado con probabilidad positiva pero que, realmente, son incompatibles con el anterior o el posterior.

La aproximación Bayesiana sólo es posible en ciertos problemas, pero se trata de un concepto de gran utilidad.


Para saber más:

Esta página de la Wikipedia trata el concepto de distribución de probabilidad, clave para entender los clasificadores estocásticos. Es importante notar que aquí sólo necesitamos distribuciones discretas, que son mucho más sencillas que las distribuciones contínuas.

Esta página de la Wikipedia proporciona una descripción diferente, menos precisa (aunque equivalente) a lo que hemos visto aquí como clasificador, pero sí que trata con algo más de detalle el concepto de clasificador Bayesiano.



 

Inicio Powered by NetBSD
 
HTML5
 
En general, todo el contenido de este sitio web es original, salvo referencias o enlaces a otros sitios web y citas o reproducciones expresamente presentadas como tales.

No está permitida la reproducción ni la copia del contenido de este sitio web sin el permiso expreso de la propiedad del mismo.

Este sitio web no utiliza cookies ni ningún otro mecanismo para almacenar información en los navegadores de los visitantes ni para realizar seguimiento de los mismos.

2017,2018 Revolucionia.net
Sobre Revolucionia
Temas
Para saber más
Contacto