Investigando descritores moleculares na previsão de peptídeos de penetração celular com Deep Learning: empregando N, O e momento hidrofóbico de acordo com a escala de Eisenberg
Peptídeos de Penetração Celular. Composição de Recursos. Bioinformática. Quimioinformática. Redução de Dimensionalidade. Aprendizado Profundo.
Os peptídeos de penetração celular compreendem um grupo de aminoácidos curtos comcapacidade de atravessar naturalmente a bicamada lipídica que protege as células, compartilhando propriedades físico-químicas e estruturais, e possuindo diversas aplicaçõesfarmacêuticas, particularmente a entrega de substâncias terapêuticas às células. Ao longo do tempo, as investigações sobre descritores moleculares baseados em sequência e estrutura peptídica proporcionaram não apenas uma melhoria no desempenho dos classificadores, com uma menor complexidade computacional devido seleção destes recursos, mas também uma melhor compreensão sobre a permeabilidade da membrana. Além disso, o emprego de novas tecnologias e técnicas promove melhor performance nas classificações, como a construção de modelos ensemble por meios da combinação de estimadores, o uso de aprendizagem profunda, a utilização de técnicas de tratamento de overfitting e busca de hiperparâmetros. Neste estudo, foram investigados os descritores nitrogênio, oxigênio e momento hidrofóbico de acordo com a escala de Eisenberg em conjunto com outros descritores abordados no estado da arte para prever peptídeos de penetração celular. O classificador ConvBoost-CPP proposto, combina as estimativas de um modelo XGBoost com hiperparâmetros ajustados e de uma Rede Neural Convolucional aprimorada com regularizadores para tratar overfitting. Os resultados revelaram-se favoráveis ao ConvBoost-CPP em relação a classificadores baseados em deep learning anteriormente publicados e, contrastando conjuntos de descritores para classificar o grupo de peptídeos aqui estudado, foi descoberto que nitrogênio, oxigênio e hidrofobicidade contribuem para um aumento na acurácia de 88% para 90,7% na validação cruzada e 82,6% a 92% em teste independente.