Automatic Programming, Density-Based Clustering, Estimation of Distribution Algorithms, Data Mining
A programação automática estuda mecanismos para geração automatizada de programas de computador. Este trabalho busca produzir automaticamente algoritmos de mineração de dados, em particular os algoritmos de agrupamento baseados em densidade. Esta classe de algoritmos de agrupamento suporta a identificação de grupos de forma arbitrária, no lugar do formato tipicamente esférico de outras abordagens de agrupamento. Para a geração dos algoritmos, usou-se a técnica de Computação Evolutiva chamada "Algoritmos de Estimativa de Distribuição'' (EDA, do inglês Estimation of Distribution Algorithms). De forma a garantir a geração de algoritmos válidos de agrupamento, definiu-se um grafo acíclico direcionado, onde cada nó representa um bloco de construção – um procedimento representativo de um algoritmo de agrupamento; e cada aresta representa uma possível sequência de execução entre dois nós. O grafo especifica o alfabeto do EDA, ou seja, cada caminho representa um potencial algoritmo resultante. Os resultados apresentados avaliam os algoritmos de agrupamento automaticamente produzidos para bases de dados de domínio público.