Avaliação de arquiteturas de Redes Neurais Convolucionais para classificação de imagens de gráficos
Deep learning, Redes Neurais Convolucionais, Visualização da Informação, Imagens de gráficos
Em uma era onde a quantidade de dados disponíveis cresce continuamente, formas de representar esses dados se fazem necessárias para que o ser humano possa entendê-los e fazer inferências a partir dos mesmos. No entanto, nem sempre é possível acessar esses dados, de modo que em vários cenários somente os gráficos estão disponíveis para análise. Assim, métodos automáticos de extração de dados de imagens de gráficos se fazem necessários, permitindo um posterior tratamento desses dados recuperados. Nesse contexto, o processo de extração de dados dos gráficos pode ser dividido em duas etapas: classificação e extração. Este trabalho foca na etapa de classificação, propondo uma avaliação de Redes Neurais Convolucionais para esta tarefa. Para treinamento e teste, foi utilizada uma base de imagens geradas automaticamente e de forma aleatória, para 10 tipos de gráficos (Arco, Área, Barra, Coordenadas Paralelas, Linha, Matriz, Pizza, Scatter Plot, Sunburst e Treemap). Da mesma forma, imagens foram coletadas da internet para compor uma base de validação, de modo que se possa verificar se os classificadores conseguem generalizar os 10 tipos de gráficos de forma satisfatória treinando somente com imagens sintéticas. Para validar a metodologia proposta, testes sistemáticos foram realizados utilizando diferentes arquiteturas de Redes Neurais Convolucionais que estão presentes na literatura (VGG-19, Resnet-50 e Inception-V3), e comparando as mesmas com classificadores convencionais (K-Nearest Neighbor, Naive Bayes, Support Vector Machine e Random Forest) combinados com o método de extração de características HOG. Os resultados mostraram que os modelos Resnet-50 e Inception-V3 obtiveram as maiores acurácias na base de validação, com 77,76% e 76,77% respectivamente. Além disso, as matrizes de confusão foram analisadas a fim de verificar não só as diferenças em desempenho dos classificadores mas também como cada um se comporta para cada classe.