Ferramenta de Alto Desempenho para Identificação e Remoção de Adaptadores de Dados NGS
Remoção de Adaptadores, Sequenciamento de Alto Rendimento, Bit-paralelismo, Programação Dinâmica
A remoção de adaptadores e regiões de baixa qualidade vindas de leituras brutas de dados gerados por plataformas NGS, é a etapa inicial dos pipelines de montagem de genomas. A remoção dessas sequências visa melhorar a qualidade dos dados na fase de montagem, permitindo melhor alinhamento entre as sequências. Além disso, desempenho em processamento é uma característica importante já que a quantidade de dados gerados pelas plataformas de alto rendimento é muito superior à quantidade real, por conta da busca por alta cobertura de regiões genômicas. Para isso, desenvolvemos o FAIR, uma ferramenta de corte de adaptadores para dados de extremidade única e emparelhada, que utiliza dois algoritmos de casamento de cadeias que se aproveitam do paralelismo intrínseco das operações sobre bits a fim, de encontrar regiões contaminantes com eficiência em processamento.