Transposones

Uno de los pasos claves para el estudio de la secuencia del contig se trata de la búsqueda de transposones en la misma. Tal y como se ha explicado en el procedimiento y en los otros contigs se utilizará el programa CENSOR para la búsqueda de los transposones. Este programa considera los factores ya explicados para asignar un score a los posibles transposones que puedan encontrarse en la secuencia, de manera que, si bien actualmente no se tiene un método exacto para definir qué es exactamente un transposón y qué no en una secuencia dada, este equipo de investigación ha considerado un score de 1900 y una similitud superior al 0.8 como criterios clave:

Figura 5.6 - Transposones encontrados en la secuencia del contig5. Se señalan en verde aquellos que en base a los criterios indicados son considerados como transposones.

 

Con estos criterios establecidos se observan dos transposones candidatos:

  • MER31A: Desde la posición 5024 a la posición 5489.
  • AluYb10: En este caso se observan dos transposones candidato de este tipo en diferentes localizaciones del contig. El primero en orden de aparición cubre un secuencia de nucleótidos desde 6556 a 6865 mientras que el segundo desde 7438 a 7716.

Una vez que se han identificado los transposones candidatos se realiza un proceso de estudio manual, pues es necesario y lógicamente evidente, comprobar que dichos transposones son de humanos y no de otras especies ya que el contig del que se dispone es un fragmento del cromosoma Y humano.

 

MER31A

Se trata de un LTR que cuenta con una secuencia consenso de 4936 bp aunque en el caso que nos atañe solo presenta una cantidad de 465 bp. Se conoce que este transposón está presente en el clado Eutheria o Placentalia, clado que se caracteriza porque los animales que lo forman retienen a sus crías en el útero materno durante largo tiempo donde son alimentadas por una placenta alantoica.

 

AluYb10

Una secuencia Alu es un fragmento de DNA de aproximadamente 300 pares de bases, y que por tanto se clasifica como SINE. Esta secuencia, con ligeras variaciones puede encontrarse en un gran número de lugares en el genoma de los primates. La subfamilia AluYb acapara aproximadamente el 40% de los elementos Alu específicos de los humanos y es actualmente uno de los linajes Alu más activos en su genoma (de hecho también se encuentra en el contig 3). Algunos elementos AluYb todavía se movilizan activamente en nuestro genoma, causando mutaciones de inserción que han llevado al desarrollo de numerosas enfermedades hereditarias. Cabe destacar que es un transposón presente en primates y humanos.

 

Sabiendo que ambos transposones pueden encontrarse en humanos, y que no son de otras especies ilógicas de estar presentes en la secuencia del contig, se dio lugar a un proceso de masking conociendo las bases a las cuales afectaban dichos transposones de manera que los algoritmos no las tuviesen en cuenta.