Notícias

Banca de DEFESA: DANIELE MOURA DE QUEIROZ

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: DANIELE MOURA DE QUEIROZ
DATA: 24/01/2020
HORA: 09:00
LOCAL: Sala de Aula 03 - PGITEC
TÍTULO:

UMA PROPOSTA DE ARQUITETURA DE BIG DATA PARA DETECÇÃO DE FAKE NEWS


PALAVRAS-CHAVES:

Big Data; Fake News; Arquitetura de Big Data; Hadoop


PÁGINAS: 50
GRANDE ÁREA: Engenharias
ÁREA: Engenharia Elétrica
RESUMO:

Nos últimos anos, uma grande quantidade de informações tem sido veiculada através da internet, especialmente em mídias sociais, proporcionando uma maior facilidade na obtenção de conhecimentos sobre diversos temas, mas tornando as pessoas suscetíveis a informações falsas que podem acarretar danos variados. A disseminação destas informações falsas tornou difícil detectar fontes de notícias confiáveis, aumentando a necessidade de ferramentas computacionais que sejam capazes de auxiliar na identificação da confiabilidade do conteúdo digital. Ademais, estimativas indicam que a quantidade de dados digitais produzida por dia atinge o valor de mais de um milhão de gigabytes, dentre os quais 79% consistem em dados não estruturados.  Essa quantidade massiva de dados gerados diariamente em alta velocidade e com diferentes tipos de formatos tais como textos, imagens, vídeos e áudios, torna a análise destes dados um grande desafio. Emerge, assim, o conceito de Big Data, definido, sobretudo, pelo volume, variedade e velocidade. Com o advento das tecnologias de Big Data, é possível utilizar uma gama de ferramentas e técnicas para armazenar, processar e analisar, de maneira eficiente, o massivo volume de dados, de forma a contribuir com a investigação da credibilidade de notícias divulgadas e compartilhadas por meio da internet. Neste trabalho discutimos a importância do Big Data para o combate à fake news, pautado em um apropriado enquadramento conceitual e tecnológico, e apresentamos uma proposta de arquitetura de Big Data para armazenamento, processamento e análise de grandes conjuntos de dados, objetivando auxiliar na investigação da veracidade de notícias. Para tanto, foram realizados experimentos utilizando uma massa de dados contendo formatos distintos, ou seja, dados estruturados e não estruturados, extraídos a partir de fontes de notícias e formando um corpus composto por notícias falsas e verdadeiras. Essa massa de dados foi armazenada em um cluster Hadoop, utilizando o sistema de arquivos distribuído denominado HDFS (Hadoop Distributed File System). O processamento do corpus ocorreu através do modelo de programação MapReduce e a classificação das notícias foi realizada através da biblioteca Mahout. Os resultados preliminares produzidos pelo desenvolvimento deste estudo revelam uma arquitetura capaz de armazenar, processar e analisar Big Data no contexto do combate à fake news.


MEMBROS DA BANCA:
Presidente - 1353026 - CARLOS RENATO LISBOA FRANCES
Interno - 2522772 - JASMINE PRISCYLA LEITE DE ARAUJO
Externo à Instituição - SILVANA ROSSY DE BRITO
Notícia cadastrada em: 13/01/2020 11:10
SIGAA | Centro de Tecnologia da Informação e Comunicação (CTIC) - (91)3201-7793 | Copyright © 2006-2024 - UFPA - bacaba.ufpa.br.bacaba1