Programação Automática Aplicada a Algoritmos de Agrupamento Baseados em Densidade
Automatic Programming, Density-Based Clustering, Estimation of Distribution Algorithms, Data Mining
A programação automática estuda mecanismos para geração automática de programas de computador. Este trabalho busca produzir automaticamente algoritmos de Mineração de Dados, em particular os algoritmos de agrupamento baseados em densidade. Existem várias vantagens de se usar esta classe de algoritmos de agrupamento, baseada no conceito de densidade, para identificar grupos de dados, como por exemplo a identificação de grupos de forma arbitraria. Este trabalho propõe o uso da técnica de Computação Evolutiva chamada “Algoritmos de Estimativa de Distribuição” (EDA, do inglês Estimation of Distribution Algorithms) para a geração de algoritmos de agrupamento baseados em densidade. De forma a garantir a geração de agrupamentos válidos, foi definido um grafo acíclico direcionado, onde cada nó representa um bloco de construção – um procedimento representativo de um algoritmo de agrupamento; e cada aresta representa uma possível sequência de execução entre dois nós. O grafo especifica o alfabeto do EDA, ou seja, cada caminho representa um potencial algoritmo resultante. Resultados preliminares comparam os algoritmos de agrupamento produzidos artificialmente a algoritmos clássicos de agrupamento, elaborados de forma tradicional.