Mutaciones

Con el objetivo de buscar mutaciones en las secuencias del gen SRY presente en el contig 5 se realiza un BLAST de ambas secuencias, tanto la forward como la reverse, frente a la secuencia de dicho gen obtenida de la base de datos Ensembl, la secuencia consenso. De este modo, con los resultados obtenidos se podrán analizar las mutaciones y las variaciones presentes. En primer lugar se realizará un alineamiento de los genes SRY del contig con el gen SRY de la base de datos que contará, en este primer paso, del exón y las UTR tanto  5’ como 3’.

 

  • Alineamiento del gen SRY (Forward) con el gen SRY de la base de datos
 

Figura 5.9 - Resultados del BLAST del alineamiento realizado entre el gen SRY (Forward) del contig y el gen SRY de la base de datos Ensembl. Cabe destacar que lo que se denomina como "Query" es la secuencia del gen SRY (Forward).

 

En este caso se observa claramente que alinea completamente el gen que se encuentra en el contig con la secuencia del gen extraído de la base de datos por lo tanto se puede indicar que no existe ningún tipo de mutación o variación que se deba resaltar en el exón o en las UTRs

 

  • Alineamiento del gen SRY (Reverse) con el gen SRY de la base de datos
 
Figura 5.10 - Resultados del BLAST del alineamiento realizado entre el gen SRY (Reverse) del contig y el gen SRY de la base de datos Ensembl. Cabe destacar que lo que se denomina como "Query" es la secuencia del gen SRY (Reverse).
 

A diferencia de la situación observada para la secuencia del gen SRY (forward), en este caso, para el gen SRY (reverse), se observan una serie de variaciones respecto al gen consenso extraido de Ensembl es por esto que se deberá profundizar en este caso y analizar si dichas variaciones son polimorfismos, variaciones raras, mutaciones sinónimas o si tienen trascendencia a nivel proteico. Así como si dichas variaciones se encuentran en el exón o en las UTR.

 

En primer lugar, los estudios que se realizarán sobre las variaciones observadas se basarán en realizar un análisis de las variaciones a nivel de cDNA, lo cual permitirá también localizar dichas variaciones en el gen, es decir, conocer si las mismas se dan en los exones o en las regiones UTR. Para ello se alineará la secuencia consenso (CCDS) del gen SRY (que carece de UTRs) con la secuencia del gen SRY (reverse) en el contig.

 

El resultado obtenido del alineamiento es el siguiente:

 

Figura 5.11 - Resultados del BLAST del alineamiento realizado entre el gen SRY (Reverse) del contig y la secuencia CCDS del gen SRY de la base de datos Ensembl. Cabe destacar que lo que se denomina como "Query" es la secuencia del gen SRY (Reverse).

 

Con este resultado, se conoce que las 4 variaciones halladas al realizar el alineamiento del gen SRYconsenso con el extraído del contig, se encuentran en el exón y que por lo tanto, las UTRs, tanto la 5’ como la 3’, carecen de variación alguna. Estas variaciones son, en reverse:

  • Nucleotido 189: G de la CCDS se cambia por una A 
  • Nucleotido 280: A de la CCDS se cambia por una G
  • Nucleotido 485: C de la CCDS se cambia por una T
  • Nucleotido 663: C de la CCDS se cambia por una T

Son por tanto, todas ellas, sustituciones

 

En segundo lugar, para conocer el tipo de variaciones que se tienen en el gen se cotejará la información que se tiene hasta el momento con la información de la base de datos Ensembl que permite resaltar los distintos tipos de variaciones conocidos hasta el momento en la secuencia del gen. Así pues, extrayendo dicha información se tiene lo siguiente: 

Figura 5.12 - Variaciones que la base de datos Ensembl aporta sobre el gen SRY. Se encuentra en la parte superior de la imagen la leyenda que indica el código de colores y en la parte inferior la secuencia del gen SRY con las variaciones estudiadas y publicadas hasta el momento.

 

Las variaciones encontradas en la secuencia del gen por el equipo investigador no se corresponden con ninguna de las variaciones que la base de datos Ensembl aporta por tanto se tienen dos posibles explicaciones sobre las que se profundizará en las conclusiones finales:

  • No se han descrito todavía esas variaciones.
  • Puede que se deban a errores azarosos de la secuenciación

En todo caso para solucionar esta duda lo que se debería realizar es una repetición de la secuenciación teniendo en cuenta que los errores que pueda realizar la secuenciación son al azar de manera que si en el nuevo resultado obtenido las variaciones que se observan vuelven a ser las mismas, serán la primera opción y si varían es que se deben a errores de la secuenciación.

 

En tercer lugar, una vez se han analizado las variaciones encontradas a nivel de DNA genómico, y a nivel de cDNA, el equipo de investigación realizó un análisis de las posibles modificaciones a nivel de proteína que se puedan dar debido a las variaciones de nucleótidos encontradas. Para ello únicamente estudiaron la secuencia en reverse pues la forward carecía de variaciones. Así pues, el primer paso consistió en transformar la secuencia del gen reverse a forward y traducirla a aminoácidos para, posteriormente, compararla con la secuencia que se extraiga de la base de datos Ensembl.

Con todos estos datos recopilados el equipo de investigación fue capaz de realizar un alineamiento entre la proteína obtenida del gen SRY (Reverse) y la proteína de la base de datos de modo que se pudo conocer si las variaciones observadas a nivel nucleotídico tienen afección a nivel proteico:

Figura 5.13 -  Resultados del BLAST del alineamiento realizado entre la proteína del gen SRY (Reverse) del contig y la proteína SRY de la base de datos Ensembl. Cabe destacar que lo que se denomina como "Query" es la secuencia de la proteína del gen SRY (Reverse)

 

El resultado obtenido indica que hay dos cambios a nivel proteico. En la posición 157, donde debería haber una valina (V) se encuentra una alanina (A) y en la posición 89, donde debería haber un glutámico (E) se tiene una lisina (K).

Como análisis bioquímico preliminar se puede resaltar que el primer cambio indicado, teniendo en cuenta la estructura de la valina y la alanina, probablemente tenga un efecto nulo sobre la proteína pues se está dando el cambio de un aminoácido hidrófobo por otro hidrófobo. Ahora bien, en el caso del segundo cambio indicado las consecuencias podrían ser mayores porque se está cambiando un aminoácido con carga negativa por uno con carga positiva lo cual podría afectar a las interacciones tridimensionales de la proteína tanto a nivel interno como con el resto de elementos con los que se deba asociar.

Con el objetivo de profundizar más en las variaciones observadas a nivel proteico se extrae de la base de datos Ensembl la secuencia de aminoácidos con las variaciones que hasta el momento se han estudiado y reportado:

Figura 5.14 - Variaciones que la base de datos Ensembl aporta sobre la proteína SRY. Se encuentra en la parte superior de la imagen la leyenda que indica el código de colores y en la parte inferior la secuencia de la proteína SRY con las variaciones estudiadas y publicadas hasta el momento.

 

  • Posición 89 E --> K

La variación encontrada se encuentra documentada a nivel proteico pero carece de consecuencias fenotípicas estudiadas pues únicamente se clasifica como una variación en la secuencia codificante y como una característica de elongación.

 

  • Posición 157 V-->A

No se encuentra información sobre esta variación por lo que puede deberse a las razones ya expuestas: Un fallo de la secuenciación o una variación no descrita.

 

Finalmente, todos los datos observados se pueden resumir en la siguiente tabla:

 

Variación Localización (Secuencia gen SRY 845pb) Codon contig Codon consenso Aminoácido del contig Aminoácido consenso Tipo de variación
1 189 CGA CGG R R Sustitución
2 280 AAG GAG K E Sustitución
3 485 GCG GTG A V Sustitución
4 663 AAT AAC N N Sustitución

Tabla 5.3 - Tabla resumen de las variaciones encontradas entre el gen SRY y la secuencia de la base de datos a nivel nucleotídico y a nivel aminoacídico.

 

Se puede observar mediante esta tabla, que gracias a la degeneración del código genético, aquellas variaciones de nucleótidos que se dan en las últimas bases del codón no afectan generalmente (y en ningún caso en esta situación) al aminoácido que codifican mientras que modificaciones de la primera y la segunda base si lo hacen.