Métodos de detecção de fraudes em redes elétricas inteligentes utilizando técnicas de aprendizado de máquina
Redes elétricas inteligentes, aprendizado de máquina, detecção de fraudes, classificadores de séries temporais
As perdas não técnicas, na maioria dos casos ocasionadas por fraudes, são as principais causadoras dos prejuízos financeiros das concessionárias de energia elétrica. Essas perdas diminuem drasticamente a qualidade das redes elétricas, aumentando os riscos de blackout, curtos-circuitos e avarias de equipamentos. Desta forma, torna-se estratégico o desenvolvimento de métodos que consigam detectar perdas não técnicas. Esta dissertação apresenta dois métodos desenvolvidos e validados para a detecção de perdas não técnicas em redes elétricas inteligentes. O primeiro método consiste em um Detector de Fraudes Elétricas Baseado em Aprendizado de Máquina, denominado DFEBAM, o qual classifica as amostras dos usuários em honestas ou fraudulentas. O DFEBAM emprega diferentes algoritmos de aprendizado de máquina que aprendem padrões com os dados de consumo elétrico dos usuários, posteriormente o método selecionado o algoritmo que obteve a melhor performance e é adicionado novas features estocásticas geradas a partir dos dados originais. Ao adicionar novas as novas features, o modelo final foi validado e obteve uma taxa de detecção igual a 98.02% e uma taxa de falsos positivos igual a 2,47%. O segundo método consiste em um preditor ensemble orientado aos dados baseado em classificadores de séries temporais para a detecção de fraudes (do inglês Data-oriented Ensemble Predictor based on Time Series Classiers for Fraud Detection), denominado DETECT. O preditor ensemble é criado a partir de cinco classificadores de séries temporais, o qual utiliza os dados de consumo elétrico dos usuários para aprender padrões e posteriormente classificar as novas amostras em honestas ou em um dos seis casos específicos de fraude. O DETECT é totalmente voltado para tratar dados de séries temporais, o que o diferencia da maioria dos detectores de perdas não técnicas da literatura. Além de utilizar classificadores de séries temporais individuais para serem comparados com o DETECT, também foram utilizados classificadores convencionais, no final o DETECT teve uma taxa de falsos positivos igual a 1,61%, o que é considerada extremamente baixa, assim como uma melhora de até 24% em termos de taxa de detecção quando comparado a outros classificadores.