Ortólogos
Se van a realizan dos alineamientos, a nivel de DNA genómico y a nivel de proteína con las mismas especies que en los demás casos. En primer lugar, se comparan a las secuencias a nivel de DNA genómico. Los resultados se muestran a continuación.
En la tabla 3.7 se muestran los resultados del alineamiento del DNA genómico del gen que presenta el contig frente al DNA genómico de los ortólogos.
Cobertura | Identidad | Bases alineadas | Gaps | |
Chlorocebus sabaeus | 64% | 95% | 545/575 | 7 |
Bos taurus | 50% | 78% | 348/447 | 6 |
Tabla 3.7. Restultados del alineamiento del DNA genómico del gen que presenta el contig frente al DNA genómico de los ortólogos.
El DNA genómico del gen DUSP21 tanto en el vervet como en la vaca solamente presenta un exón, sin regiones UTR. Por esta razón, también se han alineado el exón de humano (que es igual al del contig 3= frente al exón de ambas especies, cuyo resultado se indica en la tabla 3.8.
Cobertura | Identidad | Bases alineadas | Gaps | |
Chlorocebus sabaeus | 100% | 95% | 545/575 | 7 |
Bos taurus | 77% | 78% | 348/447 | 6 |
Tabla 3.8. Resultados del alineamiento del exon de humano frente al exón del vervet y la vaca.
También se ha realizado el alineamiento con la secuencia de aminoácidos. Los resultados se muestran en la tabla 3.9.
Cobertura | Identidad | Aminoácidos alineados | Gaps | |
Chlorocebus sabaeus | 100% | 91% | 172/190 | 1 |
Bos taurus | 94% | 68% | 121/179 | 1 |
Tabla 3.9. Resultados del alineamiento de la secuencia de aminoácios de humano frente al vervet y la vaca.
En cuanto a Chlorocebus sabaeus:
Cuando se hace el alineamiento con el exón únicamente es cuando se da el 100% de cobertura, mientras que cuando se hace con el DNA genómico un 64%. Esto quiere decir que el gen DUSP21 en el vervet no tiene regiones UTR.
También, caben destacar las modificaciones que han tenido lugar en humanos:
- Inserción de tres bases, que son TCC, en la posición del exón 16-17-18 (si tenemos en cuenta la región 5'UTR, la posición sería 146-147-148).
- Inserción de una G en la posición 554 (teniendo en cuenta la 5'UTR, sería en la 684). Esta variación ha sido descrita y se puede identificar en la figura 3.21.
- Inserción de una A en la posición 556 (teniendo en cuenta la 5'UTR, sería en la 686). Esta variación ha sido descrita y se puede identificar en la figura 3.21.
- Delección de una C en la posición 559 (teniendo en cuenta la 5'UTR, sería en la 689).
- Delección de una G en la posición 561 (teniendo en cuenta la 5'UTR, sería en la 691).
Así, el exón del vervet cuenta con un total de 570 nucleótidos mientras que el de humano con 573. Esta diferencia se traduce en que la secuencia de aminoácidos en el vervet tenga un aminoácido menos (189) que el gen humano (190). Las bases que se han insertado han dado lugar a un nuevo aminoácido en la posición 7, que es una serina. Asimismo, las modificaciones producidas al final de la secuencia del exón han provocado cambios en la secuencia de la proteína. Concretamente, las posiciones de aminoácidos 183-186 en humano son LRMM (Leu-Arg-Met-Met), mientras que en el vervet son ILAV(Ile-Leu-Ala-Val). Estas variaciones en la secuencia de aminoácidos se pueden ver en la figura 3.22. Entonces, se puede establecer que las regiones más variables son la del principio y final del exón.
En cuanto a Bos taurus:
El grado de identidad es bastante menor que el del vervet. El gen DUSP21 en la vaca también presenta sólo un exón, por lo que al alinear los dos exones, la cobertura es mayor que al hacerlo con el DNA genómico. El gen en la vaca tampoco presenta regiones UTR igual que en el vervet. En cambio, el tamaño es mayor ya que consta de 591 nucleótidos.
Al comparar el DNA genómico llama la atención la gran cantidad de SNP que se pueden observar a lo largo de toda la secuencia. Asimismo, se han producido las siguientes variaciones en la secuencia del gen humano con respecto a la vaca:
- Delección de una G en la posición 305.
- Delección de una C en la posición 307.
- Inserción de una TA en la posición 311-312.
- Delección de una T en la posición 447.
- Inserción de una G en la posición 451.
Aunque la cobertura de la secuencia de la proteína es muy alta, la identidad es muy pequeña con un solo 68%. El gen de la vaca codifica para 196 aminoácidos, seis más que el de humano. Al realizar el alineamiento destaca la gran variabilidad de las regiones de aminoácidos del 12 a 74 y del 153 al 190. Además, los aminoácidos que se encuentran en la posición 183-186 son ICLM (Ile-Cys-Leu-Met), es decir, son diferentes a los del vervet y humano que se han comentado anteriormente. Estos resultados sugieren que la región central de la proteína está más conservada que los extremos.