REDES NEURAIS RECORRENTES LSTM PARA CLASSIFICAÇÃO DE TWITTERS INDICADORES DE CRIME NA CIDADE DE BELÉM DO PARÁ
Deep Learning; Redes Neurais Recorrentes; LSTM; Twitter
O Twitter se tornou uma grande fonte de dados de pesquisa para descoberta de conhecimento, sendo uma rede social na qual é possível compartilhar, além de informações pessoais, opiniões e informações sobre eventos em geral. Partindo desse princípio, o presente estudo tem como objetivo desenvolver um classificador com o objetivo de analisar e identificar tweets com postagens relacionadas a crime e não crime. Uma Rede Neural Recorrente Long Short-Term Memory (RNN - LSTM) foi testada para esse processo de classificação. Para a execução do algoritmo, foi necessário criar um banco de dados, uma vez que não há um banco de dados disponível para atender o escopo desse trabalho, relacionando os tweets à classificação de notícias em crime ou não. Foram coletados da conta do site do DOL (Diário Online) e classificados manualmente, contendo 6000 registros. Os resultados obtidos com o uso da RNN (LSTM) se mostraram bastante satisfatórios para o domínio escolhido. Com base nos resultados desta pesquisa, observamos a efetividade do classificador RNN (LSTM) que atingiu um f1_score de 98%. Com os resultados obtidos, pode-se analisar que a Rede Neural Recorrente (LSTM) é um modelo eficiente e satisfatório para o processo de classificação de tweets relacionados a crimes.