viernes, 21 de diciembre de 2012

Ideas para mejorar MSAPCPD


  1. Calcular el centroide de los puntos desplazados por los pesos y calcular las distancias al centroide ponderadas por dichos pesos.
  2. Visualizar distribuciones de puntos de cada propiedad coloreados por contacto/no-contacto. Lo suyo es eliminar puntos "irrelevantes". Para eliminarlos, ¿tomar un Top N del MSA en orden creciente de e-value? Hmm.
  3. En una fase de training, crear un modelo para ciertos rangos de la diferencia entre propiedades de pares de aminoácidos.
  4. Encontrar las propiedades que al estar menos dispersas hay, en términos medios, más contactos reales y que, simultáneamente, al estar más dispersas se producen menos contactos. Estas son las mejores propiedades para predecir y este estudio debe hacerse en una fase de training con proteínas completamente distintas.


No hay comentarios:

Publicar un comentario