Estoy asistiendo a clases de la asignatura Biomoléculas en la Univ. de Sevilla como oyente con la intención, por una parte, de no perder el tiempo averiguando cosas que ya están resueltas, y por otra parte, de conducir mis algoritmos y mis experimentos hacia lo que tiene más sentido biológico, no informático.
Prestigiosos biólogos de esta Universidad me han concedido amablemente su tiempo para poder hablarles sobre mi tema de tesis. Además, me han brindado la oportunidad de mantener una conversación conjunta con dos de ellos, la cual ha tenido lugar el pasado 23 de Febrero de 2010. A continuación voy a describir los puntos principales tratados durante la reunión.
¿Se puede determinar una estructura de proteína a partir de los ángulos Phi y Psi de cada aminoácido?
Sí, es posible. Además también es posible determinar una estructura a partir de un mapa de distancias entre aminoácidos.
Valoración personal: Estoy seguro entonces que el resultado que producen mis algoritmos (mapas de distancias) son realmente necesarios y suficientes para reconstruir la estructura de una proteína.
Para la predicción de estructuras de proteínas, ¿aconsejaría predecir los ángulos Phi y Psi de cada aminoácido o un mapa de distancias?
Un mapa de distancias mejor (no recuerdo bien qué razón me dijo)
Valoración personal: Seguiré con mapas de distancias.
¿Por qué desciende el error relativo medio en mis experimentos para valores de separación cercanos a la longitud de las proteínas?
Tienes que hacer dos experimentos más: 1. probando con proteínas de mayor longitud y 2. probando con proteínas no homólogas (identidad < 30%). Ambos experimentos para comprobar si el error continúa descendiendo y en qué valores de separación desciende. También debes de hacer gráficas independientes para cada par de aminoácidos. En cuanto a interpretar este resultado concreto, parece ocurrir que los aminoácidos cercanos a los extremos en todas las proteínas tuvieran distancias muy similares, o que siempre fueran los mismos aminoácidos.
Valoración personal: Con los dos experimentos adicionales propuestos aquí, las gráficas independientes para cada par y algún análisis detallado por regiones de separación, creo que tengo para un nuevo artículo.
¿Por qué la longitud de la subsecuencia más parecida físico-químicamente parece ser múltiplo de la longitud de la subsecuencia problema?
Debido a la discretización que haces en los valores de las propiedades físico-químicas. Si usaras más valores posibles en las propiedades o usaras un valor numérico continuo, las franjas de la gráfica se convertirían en un abanico y se perdería el carácter de longitud múltiplo. Se trata de probarlo. También es posible la idea de los patrones modulares, pero habría que intentar refutarla antes probando con dominios continuos para las propiedades. Sobre todo parece interesante que en ausencia de la separación para predecir se tenga la línea bisectriz del primer cuadrante. Eso sí es interesante y hay que estudiarlo más profundamente.
Valoración personal: Generar la misma gráfica (sepTest x setNN) con un set de PFQ continuo. Si siguen saliendo las bandas, sigo teniendo para escribir un artículo. Sino, también tengo para un artículillo con lo de la línea bisectriz en ausencia de separación.
¿Qué les parece mi idea: S-->F, F-->E* ==> S-->E?
Que hay casos en los que una misma función es “conseguida” con dos o más estructuras “completamente” diferentes y que hay casos en los que una misma estructura provee, en distintas proteínas, diferentes funciones. Así que no pronosticamos muy buen acierto, aunque parece interesante.
¿Y qué les parece la misma idea donde el “operador” de comparación entre secuencias y entre estructuras no se basa en igualdad de aminoácidos sino en parecido en propiedades físico-químicas?
Eso está mucho mejor, así si puede dar buen resultado.
Valoración personal: En especial, para cumplir mi idea, me interesa la relación entre F-->E* para lo que tengo ideado lo que por ahora llamo el modelo de caracterización estructural de una función proteínica. ¡Quién sabe, igual tengo éxito con esta idea!
A la hora de analizar grupos de proteínas, ¿qué criterio de agrupación les parece más conveniente, en el marco de la PEP? ¿por dominios de proteínas? ¿por función: función molecular? ¿por función: proceso biológico (coevolución y coadaptación)?
Por dominios es interesante. Por función no, porque introduciría mucho ruido, las estructuras de dichas proteínas no se parecen.
Valoración personal: Trabajaré con dominios.
A la hora de elegir el vecino más cercano a una subsecuencia problema, ¿qué opinan de considerar subsecuencias cuyos extremos no sean iguales, sino “parecidos” en propiedades físico-químicas?
Muy buena idea.
Valoración personal: Así se amplía también el espacio de búsqueda.
Significado de los números que aparecen en las hojas de un árbol de Weka J48
-
------------------------------
J48 pruned tree
node-caps = yes
| deg-malig = 1: recurrence-events (1.01/0.4)
| deg-malig = 2: no-recurrence-events (26.2/8...
Hace 6 años

No hay comentarios:
Publicar un comentario