domingo, 12 de julio de 2009

Propiedades físico-químicas de los aminoácidos

Para determinar la estructura de las proteínas, parece necesario observar los valores que ofrecen los aminoácidos que las componen para un determinado conjunto de propiedades físico-químicas.

En este contexto, he probado inicialmente con un conjunto de 8 propiedades, de forma que creando atributos para cada valor distinto de dichas propiedades, obtengo 23 atributos con los que hacer minería de datos. Este primer conjunto de propiedades se encuentra publicado en PRIMER SET DE PROPIEDADES.

Actualmente me encuentro probando vecinos más cercanos 1-KNN para dicho set de atributos y con un conjunto de 65365 proteínas procedente del PDB.

No obstante, estoy investigando otro conjunto parecido de propiedades físico-químicas (11 propiedades), publicado en SEGUNDO SET DE PROPIEDADES.

Además, he encontrado un repositorio aún mayor de propiedades de aminoácidos (544 propiedades) sobre las que se habla en SOBRE EL TERCER SET DE PROPIEDADES y se listan en TERCER SET DE PROPIEDADES.

Algún subconjunto de todas estas propiedades físico-químicas de aminoácidos, junto a un conocimiento más profundo del proceso de formación de proteínas en las células, debería bastar para configurar y ejecutar un proceso de aprendizaje automático sobre todas las proteínas conocidas y obtener un modelo con valor para predecir las estructuras.

Saludos.

No hay comentarios:

Publicar un comentario