h1

Delving into the Image CLEF set

marzo 17, 2010

Estos días he estado trabajando en dos campos. El primero de ellos ha sido la comprensión de la clasificación que hace Image CLEF de las imágenes que ofrece en su colección. Y es que tiene imágenes que pueden estar clasificadas como hombre y como persona. Lo cual no implica que siempre que sea hombre, sea persona. Un ejemplo claro de esto es la sombra de un hombre. Esta se considera hombre pero no se considera persona.

Man shadow 13

Por otro lado, un gran grupo de gente apelotonada en un concierto lo considera persona pero no lo clasifica ni como hombre ni como mujer.

Concert 16

¿Por qué es esto importante? A la hora de alimentar el clasificador con un set de entrenamiento, debo tener bien claro lo que le estoy metiendo y cómo lo clasifico. Sino, el entrenamiento se verá falseado o enturbiado en el mejor de los casos. Más adelante comentaré como afecta esto a los clasificadores. Para intentar minimizar estos efectos, debo decidir lo que considero persona.

Pero en cualquier caso es mejor hacer un aprendizaje mas específico. Por ejemplo, clasificar como personas imágenes que sean de gente mas o menos cercana que al menos se les vea la cara. Esto incluiría imágenes del tipo hombre, mujer, bebe y grupo, siempre y cuando cumplan en mayor o menor medida las condiciones anteriormente mencionadas. El resto… por ahora no clasificarlas.

Various people

La idea sería lo mismo para flores y otras posibles clasificaciones. Claro está que aún no se cómo clasificar muchas de las imágenes que image CLEF clasifica como: pájaros (estos van a veces mezclados con flores), dog (van a veces mezclados con personas), night (aquí puede haber de todo el resto de tipos), river, sea, sky.

Various pics

A parte de todo esto he creado ciertos programitas para crear los ARFF con los parámetros que me va pasando el compañero Álvaro. Estos son extraídos de los sets de imágenes que le envío.

El otro campo en el que he estado trabajando han sido los clasificadores. Ayudándome del interfaz gráfico de weka he realizado varias pruebas. Entre los algoritmos que mayor tasa de acierto tienen a la hora del aprendizaje se encuentran algunos árboles de decisión. Probando con las muestras de personas y flores que tengo (unas 50) es capaz de clasificar todas menos una. ¿Esto que quiere decir? Pues que esa imagen aunque este etiquetada como persona, por ejemplo, no se ajusta al patrón que se está formando por el resto de imágenes que estamos introduciendo como persona. Esas son las imágenes que debemos desechar para nuestros sets de entrenamientos, para no contaminar dicho set. Al menos por ahora, con los parámetros que tenemos, el algoritmo no la considera de la clase en la cual la estamos etiquetando. Cuanto mayor sea la tasa de acierto del entrenamiento, mayor será la tasa de acierto de la clasificación basada en dicho entrenamiento. Es por ello que desecharemos las imágenes con mas ruido o menos claras. Al menos en esta fase inicial.

Anuncios

One comment

  1. Entonces, ¿ya tenéis el enganche entre el proyecto de Alvaro y el tuyo?, tengo muchas ganas de ver lo que sale con cosas raras… aunque sea desastroso es un grandísimo comienzo. Mucho ánimo!



Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: