DESENVOLVIMENTO DE UMA FERRAMENTA WEB PARA A IDENTIFICAÇÃO E ANÁLISE EM LARGA ESCALA DE MICROSSATÉLITES COMO POTENCIAIS MARCADORES EM AGENTES INFECCIOSOS
Microssatélites, SSRs, EasySSR, Bioinformática, Agentes infecciosos
Microssatélites, também conhecidos como SSRs ou STRs, são repetições em tandem de padrões de 1 a 6 pares de bases. Eles estão presentes tanto em eucariotos quanto em procariotos e têm aplicações especialmente em estudos relacionados a agentes infecciosos, como o patógeno Corynebacterium pseudotuberculosis. No entanto, o desenvolvimento tradicional de SSRs apresenta limitações, o que levou ao surgimento de técnicas computacionais. Apesar da disponibilidade de ferramentas para mineração de SSRs, muitos pesquisadores enfrentam desafios devido à sua complexidade e falta de facilidade de uso. Diante dessas lacunas, desenvolvemos o EasySSR, uma ferramenta web intuitiva que automatiza a análise de SSRs e o desenvolvimento de marcadores, fornecendo resultados abrangentes, estatísticas e gráficos. Desta forma, o objetivo geral deste estudo foi desenvolver e validar a ferramenta web EasySSR para a identificação e análise em larga escala de microssatélites como potenciais marcadores em agentes infecciosos. A metodologia consistiu em duas partes principais. Primeiramente, fornecemos uma descrição detalhada da implementação e fluxo de trabalho da ferramenta. Em seguida, conduzimos uma validação abrangente do EasySSR a partir de três perspectivas. Dado que o EasySSR é uma ferramenta web, realizamos uma Comparação de Funcionalidades em relação às 10 ferramentas web mais citadas. Além disso, considerando a capacidade principal do EasySSR de análise em lote para grandes conjuntos de dados, o que não é suportado por outros serviços web, realizamos Testes de Desempenho em comparaçãão com servidores web e ferramentas de linha de comando. Por fim, conduzimos testes, com parâmetros padrão e personalizados, em 54 genomas completos de Corynebacterium pseudotuberculosis. Os resultados deste estudo revelaram que o EasySSR é uma ferramenta web intuitiva para análise de SSRs, e produz diversos resultados prontos para download, incluindo arquivos PTT, saídas brutas IMEx HTML/TXT, 09 gráficos interativos de proporções e frequência de motivos, e 03 tabelas com dados resumidos, frequência de padrões e estatísticas Ele está disponível https://computationalbiology.ufpa.br/easyssr/, tutoriais em https://github.com/labgm/EasySSR. Os Testes de validação revelaram que em comparação com as 10 ferramentas web mais citadas, o EasySSR apresenta características que se destacam, como ser o único a aceitar múltiplos arquivos FASTA em uma única execução, sem limite máximo de tamanho, possuindo funcionalidades de linha de comando, permitindo a identificação de regiões codificantes/não codificantes, facilitando comparações de grandes conjuntos de dados e entregando resultados processados para análises online ou locais. Os Testes de desempenho indicaram que o EasySSR, usando os mesmos parâmetros e conjuntos de dados, apresenta sensibilidade igual ou maior, com o mesmo tempo, em comparação com as ferramentas com as quais foi comparado, entregando resultados pós processados. Por fim, a análise em lote de 54 genomas completos do patógeno Corynebacterium pseudotuberculosis levou apenas 8 minutos, produzindo resultados quantitativos e qualitativos abrangentes. Esses resultados processados permitiram a pronta caracterização dos genomas individuais, análise comparativa entre todas as amostras, avaliação das assinaturas de SSRs, cálculo da incidência média de SSRs e identificação de potenciais marcadores moleculares para a espécie. Em conclusão, o EasySSR é uma ferramenta web intuitiva projetada para pesquisa de microssatélites, especialmente em estudos de agentes infecciosos como Corynebacterium pseudotuberculosis. Ele automatiza a análise de SSRs, oferecendo resultados abrangentes e estatísticas. A capacidade do EasySSR de lidar com diversos formatos de entrada, replicar funcionalidades de ferramentas de linha de comando e processar eficientemente grandes conjuntos de dados o torna um recurso valioso para pesquisadores. Sua acessibilidade e tempos de processamento rápidos proporcionam uma solução robusta e fácil de usar para análise de microssatélites, contribuindo significativamente para pesquisas em genômica e agentes infecciosos.