News

Banca de QUALIFICAÇÃO: CAIO MARCOS FLEXA RODRIGUES

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE: CAIO MARCOS FLEXA RODRIGUES
DATA: 22/02/2018
HORA: 10:30
LOCAL: ICEN
TÍTULO:

Um novo índice de validade de cluster baseado no espalhamento equidistante mútuo para clusterização crisp


PALAVRAS-CHAVES:

índice de validade de cluster, Espalhamento equidistante mútuo, Número de clusters, Clusterização crisp, Aprendizagem não supervisionada


PÁGINAS: 60
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Metodologia e Técnicas da Computação
ESPECIALIDADE: Sistemas de Informação
RESUMO:

A análise de cluster é uma das tarefas mais importantes do reconhecimento de padrões, bem conceituada como um método para a clusterização de um conjunto de dados em grupos de objetos cujas propriedades são intrinsecamente similares, sendo largamente empregada para a descoberta do conhecimento a fim de revelar estruturas de dados que possam ser extremamente úteis ao analista. Em algoritmos de clusterização, usualmente é assumido que o número de clusters é conhecido ou dado e, uma vez que a clusterização é um procedimento de aprendizagem não supervisionada (isto é, que não existe conhecimento a priori da distribuição de dados no conjunto de subjacência), a significância dos clusters definidos precisa ser validada em conjunto de dados. Neste trabalho, propomos um novo índice de validade interna não paramétrico baseado no espalhamento equidistante mútuo entre dados intra-clusters, a partir da saída de qualquer algoritmo (por exemplo, K-means ou Hierárquico) no contexto da clusterização crisp, chamado: critério de espalhamento equidistante mútuo (Mutual Equidistant-scattering Criterion – MEC). A maioria dos índices de validade encontrados na literatura são considerados dependentes do número de exemplos em clusters e, com frequência, tendem a ignorar grupos pequenos e de baixa densidade, assim como selecionam soluções subótimas de agrupamento quando os clusters se encontram em determinado grau de sobreposição ou baixa separação. Analisamos diferentes índices de validade para o ajuste fino do número de clusters: CH, DB, SC, BIC, GS, LM e WB. Experimentos em ambos os dados, sintéticos e do mundo real, demonstraram a eficácia e confiabilidade de nossa abordagem para a avaliação e seleção de algoritmos de clusterização e seus parâmetros apropriados. Além disso, um estudo de caso do Monitoramento de Integridade Estrutural (Structural Health Monitoring – SHM) foi realizado pela utilização de algumas bases de dados bem conhecidas da área, com a finalidade mesma de, por fim, corroborar a viabilidade de uso do índice proposto para determinar o número de clusters em casos concretos do mundo real.


MEMBROS DA BANCA:
Presidente - 1809092 - CLAUDOMIRO DE SOUZA DE SALES JUNIOR
Interno - 381.226.502-87 - RONNIE CLEY DE OLIVEIRA ALVES - UFRGS
Externo ao Programa - 2324982 - REGIANE SILVA KAWASAKI FRANCES
Notícia cadastrada em: 23/02/2018 10:42
SIGAA | Centro de Tecnologia da Informação e Comunicação (CTIC) - (91)3201-7793 | Copyright © 2006-2024 - UFPA - castanha.ufpa.br.castanha2