- Calcular el centroide de los puntos desplazados por los pesos y calcular las distancias al centroide ponderadas por dichos pesos.
- Visualizar distribuciones de puntos de cada propiedad coloreados por contacto/no-contacto. Lo suyo es eliminar puntos "irrelevantes". Para eliminarlos, ¿tomar un Top N del MSA en orden creciente de e-value? Hmm.
- En una fase de training, crear un modelo para ciertos rangos de la diferencia entre propiedades de pares de aminoácidos.
- Encontrar las propiedades que al estar menos dispersas hay, en términos medios, más contactos reales y que, simultáneamente, al estar más dispersas se producen menos contactos. Estas son las mejores propiedades para predecir y este estudio debe hacerse en una fase de training con proteínas completamente distintas.
Significado de los números que aparecen en las hojas de un árbol de Weka J48
-
------------------------------
J48 pruned tree
node-caps = yes
| deg-malig = 1: recurrence-events (1.01/0.4)
| deg-malig = 2: no-recurrence-events (26.2/8...
Hace 6 años

No hay comentarios:
Publicar un comentario