GAFOGA: Um Algoritmo Genéticopara Montagem de Genomas
Bioinformática, Inteligência Artificial, Montagem de genomas, Vírus, Algoritmos genéticos.
A bioinformática tem crescido consideravelmente desde o desenvolvimento do primeiro sequenciador de DNA, sendo bastante utilizada atualmente para análise e tratamento dos dados gerados pelos chamados sequenciadores de nova geração. Genomas virais representam um grande desafio para a bioinformática devido a apresentarem uma alta taxa de mutação, o que os permite formar quasi-espécies em um mesmo hospedeiro infectado, o que dificulta bastante a montagem e posterior análise desses genomas virais. Neste trabalho, foi implementado e avaliada a performance de um algoritmo genético, chamado GAVGA, que realiza a montagem de genomas virais. O processo de montagem do GAVGA primeiramente realiza a clusterização das sequências (reads) que compartilham uma substring comum (seed) e, para cada cluster, é utilizado um algoritmo genético para verificar se há sobreposição essas reads, dada uma porcentagem de similaridade mínima. Os resultados do GAVGA foram comparados aos montadores Newbler, SPAdes e ABySS, assim como também ao montador viral VICUNA. Tais resultados confirmaram que o GAVGA montou corretamente os dados, obtendo dados melhores que dos outros montadores. O GAVGA foi implementado em Python 2.7+ e pode ser baixado no endereço https://sourceforge.net/projects/gavga-assembler/.