h1

Needs train harder?

diciembre 14, 2010

Estuve investigando los problemas comentados en la entrada anterior. Y se llegaron a las siguientes conclusiones.

En el código que tenía hecho para borrado de attributos tan solo añadía a la cabecera (complemento el nombre de la relacion) los elementos que se iban a borrar.

@relation imageRelation-weka.filters.unsupervised.attribute.Remove-R5

Sin darme cuenta de que esto no era sufciente para borrar los attibutos. Ya que para ello también era necesario borrarlo del listado de attributos

@attribute 1 numeric
@attribute 2 numeric
@attribute 3 numeric
@attribute 4 numeric
@attribute 5 numeric

Y para terminar también borrar los datos pertenecientes a ese atributo

@data
1,2,3,4,5
1,2,3,4,5
23,434,54,23,34
23,2,435,54,45

Cuando vi esto y lo trabajoso que podía llegar a ser, pensé que tenía que haber una manera mas fácil de hacerlo. Y así  es. Hay un método (filtro) de weka para eliminar atributos. A este se le pasa un listado de parámetros

1-3,20-25  ….

y se le especifica si son los que se quieren borrar (false) o si son los que se quieren mantener (true). Esto último implica que borra el resto.

Training harderUna vez visto esto, y haberme fustigado unas cuantas veces por la perdida de tiempo con la anterior idea, me puse manos a la obra para reestructurar el código en función de la nueva metodología a seguir.

Tras hacer correr unos test con las distintas opciones de borrado se han obtenido procentajes de aciertos bastante bajos (57% – 67%). Esto puede ser debido a que el entrenamiento es insuficiente ya que tan solo lo estoy haceindo con unas 12 instancias de cada clase. Es por ello que el siguiente paso se va a centrar en seleccionar mas imágenes para entrenamiento. Y así poder aumentar el porcentaje de acierto o por el contrario descartarlo como impedimento y ver qué puede estar fallando

 

Anuncios

2 comentarios

  1. No está mal que hayas dado un paso adelante, aunque ahora la pregunta es si realmente tenemos datos suficientes para poder clasificar. ¿Qué características estás extrayendo?, ¿utilizas el PFC de tu compañero Álvaro?


    • Si si Antonio. Por supuesto que utilizo los parámetros de Alvaro. Al ser tantos atributos el aprendizaje es más difuso y es por ello que necesita de mas entrenamiento. Ya que 12 instancias por clase son pocas para entrenar 100 o 300 atributos. Toy en ello 😉



Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: