h1

Image CLEF Terror

marzo 4, 2010

En busca de imágenes, para usar como entranamiento y como test, he acudido al Image CLEF (The CLEF Cross Language Image Retrieval Track). He entrado en la sección de este año, 2010, mas en concreto en photo annotation. Me he descargado un set que tienen de 25000 fotos!!. Como lo lees 2.85GB. También me he bajado otro zip que tienen con las anotaciones. Las imágenes vienen con unos ficheros de metadata e información sobre la realización de la foto, los cuales he eliminado ya que no nos interesan para nuestro propósito.

CLEAF

Al final te quedan 25k ficheros de imágenes nombrados como im<id>.jpg. Y un fichero por cada etiqueta. Dichos ficheros de texto contienen una columna con la id de las fotos que han sido anotadas con esa etiqueta. Pero una imagen puede estar anotada en varios ficheros, lo cual significa que puede estar clasificada con dos etiquetas. No se como responder a eso. El caso, es que me estoy volviendo loco pensando como manejar estos datos. No termino de ver la forma de generar el fichero de entrada en el formato que quiero. No veo cómo anotar los resultados que me pase  Alvaro, con sus respectivas etiquetas. No se, se me va de las manos.

Un comentario

  1. Bueno, bueno.. no te desanimes porque lo llevas mejor de lo que crees. Veamos, no pienses en los 25K ficheros. Piensa en 10 que Alvaro te va a describir numéricamente y piensa en un par de categorías. Ahora clasifica algunas de las imagenes y pasa por el clasificador los numeritos que Alvaro te pase. Obviamente si quedáis en un formato común para el paso de información será más fácil porque así no tendrás que editar cada fichero de datos. Ahora vas asignando sabiduría al clasificador diciéndolo para cada descripción a donde va y terminará aprendiendo. Así con una entrada parecida, te dirá si pertenece al grupo en el que le quieres meter o no… ¿cómo lo ves?, sin duda, no te atragantes…



Replica a Antonio Cancelar la respuesta