Mutaciones

A continuación se van a analizar las mutaciones que presenta en contig 3 tanto a nivel de DNA genómico como a nivel de proteína.

En primer lugar, para estudiar las mutaciones que presenta el contig 3 se realiza un alineamiento con la herramienta Blast entre la secuencia entera del contig frente al DNA genómico del gen DDX53, que incluye la 5'UTR, el exón y la 3'UTR.

Tal y como muestra la figura 3.9 se obtiene un 99% de identidad y una cobertura de nuestra secuencia de un 20%. ¿Qué quiere decir esto? Esto significa que en el contig 3 tenemos la secuencia entera del gen DDX53 (5'UTR+Exón+3'UTR) con alguna variación con respecto al DNA genómico consenso. El 20% indica que Blast solamente puede alinear un 20% de la secuencia del contig 3 con el gen DDX53. Esto es porque únicamente se cubre del nucleótido 2491 al 5746 del contig (que representa el 20% de la secuencia total), que es la región en la que se expresa este gen. Esta explicación se puede entender mejor con ayuda de la figura 3.7.

Ahora bien, si nos fijamos en la figura 3.8, no aparece una línea recta en diagonal continua, como era de esperar, si no que hay varias líneas que se solapan en una zona. Además, atendiendo detenidamente, se observan discontinuidades en las líneas. Estas discontinuidades se deben a inserciones que existen en la secuencia de contig 3, y en la secuencia del gen, no.

Figura 3.7. En la imagen "Query" es el esquema del contig 3. Los números que aparecen son las bases del contig y sirven para tener una idea de la posición en la que se ha dado el alineamiento.

Figura 3.8. Gráfico en el que el eje de abscisas se representa un fragmento de la secuencia del contig 3, que es en el que se da el alineamiento. El eje de ordenadas se representa otro fragmento de la secuencia del DNA genómico del gen DDX53.

Figura 3.9. Descripción de los parámetros del alineamiento que ha realizado Blast.

Como la posición en la que se encuentran las inserciones y SNP se corresponden entre los nucleótidos 4484 y 5746, todas estas mutaciones se encuentran en la región 3'UTR. Para verificarlo, se ha vuelto a alinear solamente la 3'UTR del gen del contig 3 frente a la 3'UTR del DNA genómico consenso. Efectivamente se observa un gráfico idéntico al de la figura 3.8, mientras que la cobertura es del 100 %. El porcentaje de identidad sigue siendo un 99%, por lo que hay variaciones en el contig. 

Figura 3.10. Resultado del alineamiento de las regiones 3'UTR del contig 3 y del DNA genómico de DDX53. También está el gráfico de las regiones que se han alineado y los parámetros.

En los gráficos las figura 3.8 y 3.10 aparecen varios segmentos alineados. Esto significa que Blast ofrece diferentes opciones porque va optimizando el alineamiento y las regiones que aparecen las gráficas son las que tienen secuencias iguales en común. Sin embargo, solamente nos interesan los dos fragmentos de mayor tamaño del contig 3, que son del nucleótido 2492 al 4988 y del 4612 al 5746. Estos fragmentos presentan dos discontinuidades, por lo que son los que contienen las dos inserciones. El resto de fragmentos más pequeños no nos interesan.

Por consiguiente, se deduce que en el contig 3 hay dos inserciones en la región 3'UTR del gen DDX53, por eso el alineamiento se produce de esta manera.

También sería correcto hacer una alineación del contig frente a la secuencia consenso del DNA genómico, pero en este caso como las mutaciones se encuentran en las regiones UTR, no tiene sentido realizar este paso, ya que la secuencia consenso es el DNA genómico sin intrones ni regiones UTR. No obstante, si se efectúa esta tarea, la identidad de ambas secuencias es del 100%, mientras que las mutaciones existentes en las UTR no se hallarán.

Ahora, hay que estudiar las inserciones que se han producido así como los polimorfismos que existen en la 3'UTR del gen. Al hacer el alineamiento con Blast se encuentran las mutaciones que aparecen en la tabla 3.3. Todas estas variaciones se encuentran en la región 3'UTR, ya que ésta está comprendida entre el nucleótido 4485 y 5746.

Para saber si estas variaciones se habían descrito anteriormente, se han buscado en Ensembl (figura 3.11). Como resultado se ha obtenido que todas las variaciones que presenta el contig 3 excepto dos han aparecido y se han descrito. Para saber más sobre las variaciones se puede pinchar sobre la referencia que aparece en la tabla 3.3. En cuanto a las dos variaciones que no han sido puntualizadas anteriormente, habría que volver a repetir la secuenciación de la muestra de la que se parte. Si vuelven a aparecer, pueden considerarse como nuevas variaciones, ya es prácticamente imposible que se vuelva a dar ese mismo fallo. Por el contrario, si no se vuelven a repetir, habrán sido errores de secuenciación. 

Tipo de variación Localización en el contig 3 Nucleótido contig Nucleótido CCDS Localización cromosoma Referencia del SNP
SNP 4677 G A - -
SNP 4692 G A X:23002536 rs5970673
SNP 4786 C T X:23002630 rs5970674
Inserción 4834 G - - -
Inserción 4855-4858 GAGT - X:23002698-23002701 rs374254833
SNP 4879 A G X:23002722 rs11094879
SNP 4915 T C X:23002758 rs11094880
SNP 4948 A T X:23002791 rs11094881

Tabla 3.3. Variaciones que tiene el contig 3 respecto del DNA genómico del gen DDX53.


Figura 3.11. Secuencia de la región 3'UTR. En azul se indican los nucleótidos que pueden ser variaciones.

Las UTR (untranslated region) son regiones no traducidas de los genes, debido a que se encuentran colindando los ORF. Las UTRs poseen gran importancia en la regulación de la expresión génica.  Además, están implicadas en la correcta expresión espacial y temporal de los genes.

La longitud de la región 3' UTR muestra una variación considerable en los mRNA de mamíferos (desde 60-80 hasta 4000 nucleótidos). Esto sugiere que el genoma humano ha evolucionado para incrementar el uso de mecanismos de control post-transcripcional en la expresión de genes.

Las regiones 3' UTR pueden influir poliadenilación, la eficiencia de traducción, localización, y la estabilidad del mRNA y sobre todo gobiernan la expresión de los genes. Se ha comprobado que mutaciones en la secuencias 3' UTR reguladoras producen niveles aberrantes de mRNA, así como desorden en la localización y posterior traducción, pudiendo de esta manera producir el fenotipo tumoral en las células.  Por tanto, las variaciones en la 3' UTR del contig 3 pueden influir sobre cualquiera de estos factores, así como ser causante de cáncer. Serian necesarios posteriores estudios para conocer con exactitud sobre cual afectaría.

Por otro lado, también se hace un Blast para alinear la secuencia de aminoácidos consenso del gen DDX53 frente a la secuencia de aminoácidos que va expresar este mismo gen del contig 3. En este caso, tanto la identidad como la cobertura de la secuencia son del 100%, por tanto, a priori la proteína no presentará ninguna variación con respecto a la consenso, salvo que los SNP de la 3'UTR provoquen alguna variación en la expresión. Pero, si la proteína se traduce, podría ser totalmente funcional.

No obstante, para la proteína que codifica el gen DDX53 se han descrito las variaciones que se muestran en la figura 3.12.

Figura 3.12. Secuencia de aminoácidos del gen DDX53. En colores se marcan las distintas variaciones que pueden sufrir los aminoácidos.