Archive for 17 marzo 2010

h1

Delving into the Image CLEF set

marzo 17, 2010

Estos días he estado trabajando en dos campos. El primero de ellos ha sido la comprensión de la clasificación que hace Image CLEF de las imágenes que ofrece en su colección. Y es que tiene imágenes que pueden estar clasificadas como hombre y como persona. Lo cual no implica que siempre que sea hombre, sea persona. Un ejemplo claro de esto es la sombra de un hombre. Esta se considera hombre pero no se considera persona.

Man shadow 13

Por otro lado, un gran grupo de gente apelotonada en un concierto lo considera persona pero no lo clasifica ni como hombre ni como mujer.

Concert 16

¿Por qué es esto importante? A la hora de alimentar el clasificador con un set de entrenamiento, debo tener bien claro lo que le estoy metiendo y cómo lo clasifico. Sino, el entrenamiento se verá falseado o enturbiado en el mejor de los casos. Más adelante comentaré como afecta esto a los clasificadores. Para intentar minimizar estos efectos, debo decidir lo que considero persona.

Pero en cualquier caso es mejor hacer un aprendizaje mas específico. Por ejemplo, clasificar como personas imágenes que sean de gente mas o menos cercana que al menos se les vea la cara. Esto incluiría imágenes del tipo hombre, mujer, bebe y grupo, siempre y cuando cumplan en mayor o menor medida las condiciones anteriormente mencionadas. El resto… por ahora no clasificarlas.

Various people

La idea sería lo mismo para flores y otras posibles clasificaciones. Claro está que aún no se cómo clasificar muchas de las imágenes que image CLEF clasifica como: pájaros (estos van a veces mezclados con flores), dog (van a veces mezclados con personas), night (aquí puede haber de todo el resto de tipos), river, sea, sky.

Various pics

A parte de todo esto he creado ciertos programitas para crear los ARFF con los parámetros que me va pasando el compañero Álvaro. Estos son extraídos de los sets de imágenes que le envío.

El otro campo en el que he estado trabajando han sido los clasificadores. Ayudándome del interfaz gráfico de weka he realizado varias pruebas. Entre los algoritmos que mayor tasa de acierto tienen a la hora del aprendizaje se encuentran algunos árboles de decisión. Probando con las muestras de personas y flores que tengo (unas 50) es capaz de clasificar todas menos una. ¿Esto que quiere decir? Pues que esa imagen aunque este etiquetada como persona, por ejemplo, no se ajusta al patrón que se está formando por el resto de imágenes que estamos introduciendo como persona. Esas son las imágenes que debemos desechar para nuestros sets de entrenamientos, para no contaminar dicho set. Al menos por ahora, con los parámetros que tenemos, el algoritmo no la considera de la clase en la cual la estamos etiquetando. Cuanto mayor sea la tasa de acierto del entrenamiento, mayor será la tasa de acierto de la clasificación basada en dicho entrenamiento. Es por ello que desecharemos las imágenes con mas ruido o menos claras. Al menos en esta fase inicial.

Anuncios
h1

Image CLEF Terror

marzo 4, 2010

En busca de imágenes, para usar como entranamiento y como test, he acudido al Image CLEF (The CLEF Cross Language Image Retrieval Track). He entrado en la sección de este año, 2010, mas en concreto en photo annotation. Me he descargado un set que tienen de 25000 fotos!!. Como lo lees 2.85GB. También me he bajado otro zip que tienen con las anotaciones. Las imágenes vienen con unos ficheros de metadata e información sobre la realización de la foto, los cuales he eliminado ya que no nos interesan para nuestro propósito.

CLEAF

Al final te quedan 25k ficheros de imágenes nombrados como im<id>.jpg. Y un fichero por cada etiqueta. Dichos ficheros de texto contienen una columna con la id de las fotos que han sido anotadas con esa etiqueta. Pero una imagen puede estar anotada en varios ficheros, lo cual significa que puede estar clasificada con dos etiquetas. No se como responder a eso. El caso, es que me estoy volviendo loco pensando como manejar estos datos. No termino de ver la forma de generar el fichero de entrada en el formato que quiero. No veo cómo anotar los resultados que me pase  Alvaro, con sus respectivas etiquetas. No se, se me va de las manos.