Anotação e Classificação de Elementos Transponíveis no Gênero Macaca (Catarrhini, Primates): Um Estudo Comparativo
Cercopithecidae, Elemento Alu, Mobiloma.
Elementos transponíveis (TEs) são sequências de DNA móveis que desempenham um papel crucial na evolução genômica e constituem cerca de 50% do genoma dos primatas. Os TEs podem ser classificados em duas principais classes: Classe I, que inclui os retrotransposons LTRs e não-LTRs; e Classe II que engloba os transposons de DNA. Entre os TEs, os elementos Alu são específicos de primatas e pertencem à classe de elementos não-autônomos conhecidos como Elementos Nucleares Curtos Interdispersos (SINEs), os quais são amplamente usados em estudos filogenéticos como marcadores moleculares. O gênero Macaca faz parte dos primatas do Velho Mundo, encontrados principalmente na Ásia e em partes da África. Eles são frequentemente usados como modelos em pesquisas biomédicas devido a sua semelhança com os humanos. O objetivo deste estudo foi estimar a diversidade e frequência de TEs nos genomas de nove espécies do gênero Macaca. O genoma completo de cada espécie foi obtido no banco de dados do National Center for Biotechnology Information (NCBI). A frequência e diversidade de TEs em cada genoma foi avaliada usando o pipeline EDTA (Extensive de novo TE Annotator) e o software RepeatModeler2. Os resultados de cada análise genômica foram agrupados e passaram por duas etapas de filtragem. Na primeira etapa, apenas TEs que foram encontrados pelo menos três vezes em todo o genoma e tinham um tamanho mínimo de 50% do consenso de TE presente na biblioteca DFAM foram retidos. A segunda etapa envolveu a remoção de sequências de consenso que mostraram mais de 80% de similaridade com as sequências codificadoras de Homo sapiens. Para a classificação dos elementos Unknown e sem superfamília, foram realizadas três etapas: 1) Análise dessas sequências com o programa TRF para verificar se são sequências repetitivas não-TEs. Caso tenham sido classificadas como repetições não-TEs, seriam descartadas; 2) Comparação das sequências remanescentes com a biblioteca DFAM usando BLAST, classificando-as de acordo com a sequência consenso do DFAM que apresentou pelo menos 80% de similaridade e 80% de cobertura; 3) Uso do TE-Aid para comparar as sequências restantes com o banco de TEs anotados do programa, usando o genoma de Macaca mulatta como referência. Gráficos de Kimura landscape foram gerados para representar a mobilidade de cada genoma. As análises de Kimura landscape revelaram 3 padrões de curva em Macaca: aquelas com curvas em forma de L, em forma de sino e em formato bimodal. A mineração de TEs revelou uma frequência média de 39.5% de TEs no gênero. A frequência média dos tipos de TEs é igual a 26,1% para não-LTR, 9,2% para LTR, 6,3% para transposons de DNA e 0,2% para elementos não classificados. A frequência média de elementos LINE é de 16,6%, enquanto para elementos SINE é de 9,2%. Os elementos Alu e MIR em SINEs exibem médias de frequência de 8,0% e 1,5%, enquanto em LINEs, os elementos L1 e L2 têm médias de 14,7% e 1,7%, respectivamente. Nas subfamílias de Alu, as frequências médias variam de 1,1% para AluY, 4,3% para AluS, 1,7% para AluJ, 0,2% para Alu monomérico e 0,7% para Alus sem subfamília. As famílias LTR mais abundantes foram ERV1, ERVL e ERVL-MaLR. ERV1 teve uma frequência média de 2,70%, variando de 2,49% a 3,22%. Dentre as famílias de transposon, as mais frequentes foram hAT e TcMar, com frequências médias de 1,8% e 1,3% respectivamente. Através dos resultados obtidos é possível entender e verificar a diversidade e frequência dos TEs nos genomas de Macaca. Dessa forma, com o grande número de dados obtidos, futuros estudos mais detalhados podem ser feitos para verificar e aprofundar os dados já obtidos, contribuindo assim para a compreensão da história evolutiva do genoma de primatas do Velho Mundo.