- Probar los métodos de regresión que ofrece el paquete R para realizar predicciones sobre las bases de datos generadas por mi método ASPFgen.
- Generar sólo las subsecuencias de longitud 2 para realizar selecciones de atributos y predicciones. Se trata de empezar por lo más sencillo e ir subiendo de nivel (luego subsecuencias de longitud 3, etc).
- Afinar más en los valores que se generan para los atributos: no usar medias de PFQ, sino quizás diferencias de valores entre el primer y segundo aminoácido de las subsecuencias de longitud 2.
- Siempre tomar conjuntos de proteínas que se encuentren en la misma localización en el ser vivo (para que el entorno físico-químico sea el mismo para todas y pueda éste ser despreciado).
Significado de los números que aparecen en las hojas de un árbol de Weka J48
-
------------------------------
J48 pruned tree
node-caps = yes
| deg-malig = 1: recurrence-events (1.01/0.4)
| deg-malig = 2: no-recurrence-events (26.2/8...
Hace 6 años

No hay comentarios:
Publicar un comentario