Ortólogos

Teniendo en cuenta la definición de genes ortólogos que hace referencia a que la semejanza entre dichos genes de dos o más especies se debe a que tienen un origen común, se va a estudiar en este apartado el Gen SRY en dos organismos que tienen un origen común, como son Vervet-AGM (Chlorocebus sabaeus) y Vaca (Bos taurus) con el fin de tener una mayor información de la evolución que ha tenido este gen y que variaciones se han dado tanto a nivel nucleotídico como a nivel proteico. Además, el resto de genes humanos encontrados en el resto de contigs serán estudiados del mismo modo y con los mismos organismos lo cual dará una idea de la evolución que los distintos genes han sufrido.

En primer lugar se realizará un análisis en base a la secuencia nucleotídica para lo cual será necesario disponer las distintas secuencias: la secuencia del gen SRY consenso (proveniente de Ensembl) y del gen SRY proveniente del contig y que presenta mutaciones (Gen SRY Reverse). Cabe destacar que el gen SRY Reverse será transformado a forward y complementario para poder compararlo con mayor adecuación. Será necesario también disponer de las secuencias nucleotídicas del gen en los animales indicados, para lo cual Ensembl vuelve a ser la base de datos de referencia. Se debe resaltar de estas secuencias una característica, y es que no tienen o no se les conocen regiones UTR a ninguna de las dos secuencias.

 

De este modo, conociendo todas las secuencias indicadas el primer alineamiento será el gen SRY (Reverse) del contig con la secuencia de dicho gen de la vaca:

Figura 5.15 - Alineamiento del gen SRY (Reverse) hallado en el contig (query) frente al gen SRY de la vaca obtenido de la base de datos Ensembl (Sbjct)

 

En base a los datos obtenidos de este alineamiento se puede observar que parece existir una región más conservada en la zona central del gen. De hecho tras estudiarlo en mayor profundidad se ha comprobado que la identidad del 70% presente en el Blast anterior puede incrementarse hasta una identidad del 82% en el caso en el que se escojan del gen SRY humano las bases desde la posición 292 a la 508 y en el caso de la vaca desde la posición 178 a la 394. Los resultados se muestran a continuación:

 

Figura 5.16 - Demostración de una mayor similitud en una región de nucleotidos entre el gen de la vaca y el gen humano

 

El segundo alineamiento se realiza contra el Vervet-AGM y, puesto que en este caso no se encuentra curiosidad alguna sobre regiones más conservadas, no se adjuntas las imágenes relativas al resultado del alineamiento. Se muestra como resumen final la siguiente tabla:

 

  Cobertura Identidad Bases alineadas Gaps
Chlorocebus sabaeus 72% 93% 571/612 0
Bos taurus 81% 70% 490/704 30
 
Tabla 5.4 - Resultados del alineamiento del gen SRY del contig frente al DNA genómico de los genes ortólogos.
 

Así pues la conclusión a la que se llega es que la secuencia del gen SRY está muy conservada y ha sufrido pocas variaciones a lo largo de la evolución. Al comparar el gen de humano con la vaca se demuestra que, aun estando relativamente lejos en la evolución, la identidad del gen de la vaca con el del humano puede llegar incluso a un considerable valor de 82% por lo que la variación que ha sufrido este gen ha sido escasa, probablemente debido a la vital importancia que presenta ya que alteraciones en el mismo pueden provocar individuos estériles y con un fenotipo sexual distinto al que por genotipo les correspondería. Esta suposición, referente a la conservación del gen a lo largo de la evolución, se corrobora al alinear la secuencia del gen de humano con la de Vervet-AGM pues se logra una increíble identidad del 93%. Si bien es cierto que este animal no está tan lejos en la evolución del ser humano y por tanto los valores tan altos son lógicos y esperables, el hecho de que dicho valor sea tan alto y además también lo sea en la vaca, como ya se ha indicado, apoyan la hipótesis realizada sobre la alta conservación de este gen a lo largo de la evolución.

Hay que destacar un detalle encontrado en el alineamiento del gen de la vaca con el del humano y es que, si se observa la Figura 5.15 se puede ver como la secuencia de la vaca comienza a alinearse con la del humano desde la primera base, que forma parte de un codón ATG, mientras que la secuencia del humano comienza desde la base 118 con una adenina que también forma parte de un codón ATG. Esta situación da lugar a pensar que ese fragmento de 22 nucleótidos (pues 96 forman parte de la UTR que no está presente en la secuencia consenso de la vaca)  que se encuentra al comienzo de la secuencia del gen humano puede ser algún tipo de modificación que no tenga especial interés en su actividad o conformación, o, por otro lado, que sea una secuencia de aminoácidos que permitan dar una mayor estabilidad a la proteína.

Finalmente, otro aspecto a destacar, hace referencia a la cobertura observada en el alineamiento del gen SRY con el de la vaca que resulta en un valor superior al observado con Vervet-AGM lo cual, si bien puede resultar curioso, se explica porque una parte del gen SRY de la vaca alinea con la 3’ UTR del gen SRY humano.

 

 

A continuación se realiza el mismo estudio que se ha realizado con el Gen SRY del contig pero utilizando en este caso el Gen SRY genómico obtenido de Ensembl. Así pues, se realizan los alineamientos y se observa que los resultados logrados no difieren en gran medida de los logrados con el gen SRY extraído del contig. Principalmente porque la secuencia de dicho gen es prácticamente idéntica a la consenso, con la única diferencia de cuatro SNPs que, como se ha estudiado en el apartado de mutaciones, tienen una mayor trascendencia a nivel proteico:

  Cobertura Identidad Bases alineadas Gaps
Chlorocebus sabaeus 72% 94% 575/612 0
Bos taurus 81% 70% 495/704 30

Tabla 5.5 - Resultados del alineamiento del gen SRY genómico frente al DNA genómico de los genes ortólogos.

 

 

Una vez se han analizado los ortólogos a nivel de secuencia de nucleótidos se ha repetido el mismo proceso a nivel proteico. Para este caso será necesario conocer las secuencias de las proteínas del gen SRY consenso en humanos, del gen SRY (Reverse) del contig, de Vervet-AGM y de la Vaca.

Con todos esos datos extraídos de las bases de datos, en el mismo orden que se han estudiado las secuencias de nucleótidos se llevará a cabo el estudio de las secuencias de aminoácidos. Para ello en primer lugar se realiza un alineamiento de la secuencia de la proteína del gen SRY del contig (que presenta alguna variación respecto a la secuencia consenso, tal y como se ha explicado en el apartado de mutaciones) contra la secuencia de la proteína vacuna:

 

Figura 5.17 - Alineamiento de la proteína del gen SRY (query) extraido del contig con la proteína de la vaca extraída de Ensembl.

 

Observando los resultados obtenidos en este alineamiento se concluye que la región que abarca desde el aminoácido 57 en humano y 51 en vaca, hasta el aminoácido 136 en humano y 130 en vaca parecen estar más conservados que el resto. Por tanto se realiza un alineamiento que permita comprobar dicha observación.

Figura 5.18 - Resultado del alineamiento en la región que se observa más conservada

 

La identidad ha aumentado claramente un 23% respecto a la identidad que presenta el alineamiento del total de la proteína lo cual sirve como prueba para decir que la conclusión sobre la conservación de la región indicada es cierta, es decir, la región indicada se trata de una región importante que se ha conservado a lo largo de la evolución. De hecho, como era de esperar esta región coincide aproximadamente con la región considerada como conservada en la secuencia nucleotídica. Esta información, posteriormente, podrá contrastarse con la información obtenida de las bases de datos para conocer si en dichas posiciones se encuentran secuencias de unión a DNA, a proteína u otras secuencias que sean de interés y por tanto se hayan mantenido en la evolución.

A continuación se realiza un segundo alineamiento de la proteína del gen SRY extraído del contig con el gen SRY de Vervet-AGM. Los resultados finales, tanto para el segundo alineamiento como para el primero,  se adjuntan en la siguiente tabla:

 

  Cobertura Identidad Aminoácidos alineados Gaps
Chlorocebus sabaeus 100% 88% 179/204 0
Bos taurus 96% 54% 110/202 10

Tabla 5.6 -  Resultados del alineamiento de la proteína SRY humana del contig frente a la proteína de los genes ortólogos.

Como era de esperar, la identidad observada entre la proteína humana y la de Vervet-AGM es considerablemente alta, en gran parte debido a la relativa cercanía existente entre las dos especies en la evolución.

 

Siguiendo con el orden llevado para la secuencia de nucleótidos se realiza a continuación un alineamiento de la secuencia consenso de la proteína del gen SRY humano genómico con los dos ortólogos. Los resultados obtenidos son los siguientes:

  Cobertura Identidad Aminoácidos alineados Gaps
Chlorocebus sabaeus 100% 89% 181/204 0
Bos taurus 96% 54% 110/202 10

Tabla 5.7 -  Resultados del alineamiento de la proteína SRY humana consenso frente a la proteína de los genes ortólogos.

 

Los resultados logrados realizando el alineamiento con la proteína SRY consenso de humano o con la proteína extraída del contig son prácticamente idénticos, es decir, las variaciones observadas no son muy grandes, ahora bien, como se explicará a continuación, más importante que la cantidad de variaciones es el tipo de variación y la localización de estas.

De este modo, conociendo los resultados que se han presentado hasta el momento, así como los presentados en el apartado de mutaciones, se puede llegar a conclusiones interesantes. En primer lugar, conociendo los datos obtenidos en este apartado se puede inferir que la suposición realizada sobre la conservación de la proteína a lo largo de la evolución es correcta, pues se dan unas identidades considerablemente altas en ambos ortólogos, especialmente en Vervet-AGM debido a que está más cerca en la línea evolutiva. Además, en una región determinada y gracias al alineamiento con la vaca a nivel proteico y nucleotídico, se ha reconocido una identidad mayor que indica que dicha región está más conservada. En segundo lugar, si se superponen los resultados logrados en el apartado de mutaciones con los resultados logrados en este apartado se puede conocer la importancia que tienen las mutaciones en función de la importancia que tiene la región en la que se dan. Así pues, conociendo que existe una región más conservada y profundizando en la información existente en las bases de datos sobre los dominios que la proteína presenta se obtiene información sobre la siguiente característica: La presencia de un dominio de unión a DNA de 69 aminoácidos, una HMG box, que se encuentra entre los aminoácidos 60 – 128, los cuales están incluidos en la secuencia que se ha supuesto anteriormente como más conservada. Por tanto, toda esta información corrobora las suposiciones realizadas hasta el momento: 

Figura 5.19 - Información sobre el dominio de unión a DNA extraído de las bases de datos.

 

Ahora bien ¿Qué relación presenta esta información con las mutaciones? La relación es clara y es que, en el gen SRY que se encuentra en el contig en reverse existe una mutación que provoca el cambio del aminoácido 89, un glutámico, a una lisina justo en la región que se conoce que actúa como dominio de unión a DNA. Por tanto, teniendo en cuenta dos aspectos, el primero que el cambio de aminoácido bioquímicamente hablando es un cambio muy grande (de un aminoácido con carga negativa a uno con carga positiva) y segundo que se da en una región muy conservada e importante, se puede concluir que la proteína que expresa este gen es inactiva. Ahora bien, el contig dispone de otro gen SRY en forward, el cual no presenta variación alguna, por tanto la proteína que expresa es adecuada y su función es realizada. De manera que, la pregunta que esta situación da lugar es ¿El fenotipo del humano con este genotipo era normal o era enfermo? Debido a que se conoce la función de la proteína y existe información en las bases de datos se puede decir que el individuo era enfermo, que presentaba una disgenesia gonadal XY “parcial” pues disponía de una cierta cantidad de proteína funcional pero no de la necesaria para superar el umbral y considerarse un individuo sano por lo que, probablemente, el fenotipo que desarrollase sería unos genitales ambiguos, una mezcla de estructuras de Müller y Wolff y gónadas disgénicas, que suelen ser túbulos seminíferos desorganizados mezclados con estroma ovárico.