ESTRATÉGIA DE APRENDIZADO DE MÁQUINA PARA A DETECÇÃO DE ERROS ORIUNDOS DE NÓS QUIMÉRICOS EM METAGENOMAS
aprendizado de máquinas, classificação, montagem de genomas, metagenômica
Apesar da grande diversidade de organismos no planeta, eles compartilham grande parte do DNA . Sendo assim, essas semelhanças nos levam a regiões parecidas no código genético de dois ou mais organismos. Essa proximidade genética, no momento da montagem, pode induzir alguns erros no momento de determinar para qual organismo atribuir determinada sequência. Essas regiões que podem pertencer a mais de um organismo são chamadas de regiões quimeradas ou nós quiméricos. Diante disso, encontramos dificuldade em separar, montar e identificar dados em um metagenoma. Atualmente, na computação, técnicas de aprendizado de máquinas têm ganhado destaque na comunidade científica e estão sendo aplicadas nas mais diversas áreas, entre elas a bioinformática. Este trabalho visa criar um modelo de aprendizado de máquina supervisionado para melhor identificar e separar regiões muito próximas de DNA - nós quiméricos - e, com isso, contribuir para um melhor diagnóstico de resultados de montagens de metagenomas.