miércoles, 14 de octubre de 2009

Segunda Aproximación Biológica sobre la PEP

Dado que mi última visita a la Facultad de Biología fue algo breve, concerté una cita con un profesor esta semana para seguir indagando acerca del misterioso (al menos para mí) proceso de plegamiento de las proteínas. En la reunión con el profesor pude conocer algunos detalles más que, poco a poco, me van formando un concepto algo más rico de este proceso.

Dado que mi arma es la informática y ésta procesa datos, debo conocer qué datos usar y saber cómo orientar a mi algoritmo para predecir un patrón oculto desconocido. Muchas veces ha ocurrido que sólo un patrón es descubierto cuando uno usa las "gafas" apropiadas. En este contexto, las "gafas" deben ser qué plano material considerar como dato de entrada y en qué aspectos biológicos incidir como determinantes.

Lo que me queda claro, y esto es una reflexión aparte de lo hablado con el profesor, es que el proceso de plegamiento de una proteína es el resultado de muchísimos años de evolución y es un proceso muy refinado y sofisticado. Aún no hemos llegado con nuestras construcciones industriales a tal grado de sofisticación y no podemos inferir completamente los detalles del proceso. No obstante (todo esto según mi opinión), existen numerosas particularidades presentes en ambas escalas (proteínas e industria) que pueden ser objeto de comparación y, en consecuencia, de descubrimiento.

Esto último requiere una explicación más completa, pues es sólo un ejemplo concreto de una teoría mucho más general que mantengo y amplío constantemente desde hace muchos años, que comentaré en otra ocasión.

Bueno, comencemos a contar un poco los puntos principales de la reunión. En primer lugar, me explicó que era importante probar en los estudios que realice con conjuntos de proteínas no redundantes, es decir, que haya un solo miembro de cada familia homóloga (eliminando todas las proteínas homólogas). En PDB hay una opción para filtrar aquellas con similitud mayor que un porcentaje (50%, 60%, ...).

Además, precisamente en la base de datos del PDB existen numerosas proteínas casi repetidas, e incluso repetidas (misma cadena) pero con identificadores distintos. Yo mismo he podido comprobarlo, y además aunque se le indique a PDB que elimine proteínas similares, estos casos "repetidos" no se suprimen. Esto hace evidentemente que los resultados de los estudios parezcan ser mejores, pues se cuenta con datos de entrenamiento muy parecidos a los de test.

El alineamiento de secuencias (homología) consiste en comparar dos o más estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre las proteínas. La homología funciona muy bien, pero sólo cuando existe alguna proteína parecida con la que comparar.

Cuando se hace un alineamiento de secuencias, en un par de proteinas o con varias de ellas (múltiple), es de interés conocer, para cada discrepancia en la secuencia, qué puntuación otorgar a dicha mutación, y se recurre a matrices obtenidas experimentalmente. Éstas proponen ponderaciones para la mutación entre los pares de aminoácidos y se obtienen según las características de los aminoácidos implicados, es decir, su fisico-química (hidrofobicidad, cargas, peso molecular, ...), número y tipo de codones que los codifican, o la frecuencia con que estos son remplazados en una alineación dada.

Unas de estas matrices son las conocidas BLOSUM y PAM.

PAM describe resultados empíricos en los que una mutación de un aminoácido por otro no ha supuesto un cambio en la función de la proteína (ni por supuesto en su estructura espacial), es decir, una mutación aceptada por la naturaleza que conserva la función de una proteína.

Ideas a desarrollar:

- Observar distribución de valores de distancia real en sucesivos vecinos más cercanos para comprobar si existe algún patrón, o si en la mayoría de los casos la elección de únicamente el vecino más cercano conduce a error (k=3,5,...).

- Una vez que se obtiene un mapa de distancias de predicción, ¿existe un procedimiento determinista para obtener la estructura terciaria/cuaternaria en 3D?

- Sin entrar en detalle, explicar la interpretación del profesor sobre la gráfica de separaciones: componentes modulares de las proteínas.

- Comparar BLOSUM / PAM con similitud de propiedades físico-químicas.

- Fractalidad.

No hay comentarios:

Publicar un comentario