Ortólogos

Con el fin de estudiar mejor las variaciones que presenta nuestra secuencia de la proteína GPR146 y el grado de conservación de esa secuencia, vamos a realizar alineamientos de las proteínas y las secuencias de ácidos nucleicos con un par de ortólogos. El primer ortólogo con el que lo vamos a comparar va a ser Vervet AGM (Chlorecebus sabaeus), el cual es un simio y por lo tanto está evolutivamente más cerca. El segundo es la Vaca (Bos taurus), está mas lejos evolutivamente que el Vervet.

 Ninguno de los ortólogos tiene Splicing alternativo.

Además de el alineamiento con los ortólogos será necesario realizar el alineamiento con la secuencias de la bases de datos, para así con ambas comparaciones podremos ver como de conservada esta nuestra proteína, y el nivel en el que afectan los SNP a la funcionalidad de la proteína.

Primero se realiza la comparación de DNA genómico.

  • DNA genómico contig frente a DNA genómico ortólogos
  Cobertura Identidad Bases alineadas Gaps
Chlorecebus sabaeus 100% 94% 945/1003 0
Bos taurus 99% 76% 757/995 10

Tabla 4. 4. Resultados de cobertura, identidad, bases alineadas y gaps, entre la secuencia de DNA genómico.

  • DNA genómico ensembl frente a DNA genómico ortólogos
  Cobertura Identidad Bases alineadas Gaps
Chlorecebus sabaeus 100% 95% 950/1003 0
Bos taurus 99% 77% 762/995 12
 
Tabla 4. 5. Resultado de la cobertura, identidad, bases alineadas y gaps entre las secuencias de DNA geóomico. 
 

En las tablas vemos la diferencia entre las especies, se ve claramente que en Chlorecebus sabaeus la secuencia de ácidos nucleicos esta mas conservada que en Bos taurus. También vemos como afectan las mutaciones en los alineamientos. Como el código genético esta degenerado, es decir existen más tripletes o codones que aminoácidos, de forma que un determinado aminoácido puede estar codificado por más de un triplete, de modo que es necesario realizar el alineamiento de las secuencias de las proteínas.  

Así que segundo lugar se compararan las secuencias de las proteínas, en el caso de la proteína que se sintetizaría a partir del contig, vamos a alinearla omitiendo el codón de STOP de modo que uno de los Gaps que encontraremos al realizar el alineamiento corresponderá a la falta de ese aminoácido.

  • Proteína  contig frente a DNA genómico ortólogos
  Cobertura Identidad aa alineados Gaps
Chlorecebus sabaeus 100% 94% 313/333 1
Bos taurus 99% 66% 219/331 7
 

Tabla 4. 6. Resultado de la cobertura, identidad, bases alineadas y gaps entre las secuencias de aminoácidos de las proteínas.

  • Proteína ensembl frente a DNA genómico ortólogos
  Cobertura Identidad aa alineados Gaps
Chlorecebus sabaeus 100% 95% 318/333 0
Bos taurus 99% 66% 219/331 2
 

Tabla 4. 7Resultado de la cobertura, identidad, bases alineadas y gaps entre las secuencias de aminoácidos de las proteínas.

En las imagenes 4.7 y 4.8, se representan el alineamiento entre la proteina que se sintetizaria a partir del DNA genómico del contig y la de los ortólogos. 

Figura 4. 7. alineamiento entre la proteina que se sintetizaria a partir del DNA genómico del contig y la de Chlorecebus sabaeus.

Recta de alineamiento correspondiente a Bos taurus:

Figura 4. 8. alineamiento entre la proteina que se sintetizaria a partir del DNA genómico del contig y la de Bos taurus.

En las rectas se puede ver que las regiones coincidentes son las de mayor homologia mientras que las que se encontrarian entre los gaps las de menor homología. Es importante señalar que la region de mayor homologia es la region que se eliminaria con la insercion del codon de STOP. 

Por otra parte hay que tener en cuenta que por splicing alternativo se puede codificar una proteina de 39 aminoacidos la cual es funcional. Asi que para ampliar nuestra informacion se realizara un alineamiento entre la secuencia de la proteina que se codificaria en el contig con la proteina del splicing alternativo. No se cubre el total de la secuencia solo se cubren 23 aminoácidos.

  Cobertura Identidad aa alineados Gaps
GPR 146-005 24% 100% 23/23 0

Tabla 4. 8. Resultado alineamiento proteina con splicing alternativo contra la proteína que se codificaría a partir del DNA del contig4.