ESTRATÉGIA DE OTIMIZAÇÃO DE TRAJETOS DE UAVS EM CENÁRIOS DE DESASTRE, CONSIDERANDO MORFOLOGIA URBANA, MICROCLIMA E EFICIÊNCIA ENERGÉTICA, USANDO Q-LEARNING E MALHA VOADORA PARA LIDAR COM REDES ÓPTICAS DANIFICADAS
Desastres, Veículos Aéreos não Tripulados, Redes Metro, Interfaces Óticas-Rádio, Gerenciamento de Recursos, Otimização; Aprendizado de Máquina; Q-Learning; Velocidade do Vento; Consumo de Energia
Nos paradigmas de cidades inteligentes é imprescindível garantir o bem-estar da população em termos de infraestrutura social. Dentre as ações que podem ser adotadas para tornar uma cidade mais resiliente, estão medidas preventivas, mecanismos de informação da população e tecnologias que aceleram a ação em casos de emergência. O estabelecimento de uma estrutura de comunicações que sobreviva a desastres é de suma importância para que as autoridades possam agir de imediato na prestação de socorro e salvar vidas. Nesse sentido, o uso de UAVs (unmanned aerial vehicle) como alternativa de comunicação é uma solução ideal para cenários como desastres naturais ou ataques intencionais que possam causar interrupção parcial ou completa dos serviços de telecomunicações. No entanto, a autonomia de energia é uma limitação que afeta a vida da missão. Como estratégia para solucionar este problema, desenvolveu-se um novo método baseado em aprendizado por reforço que visa reduzir o consumo de energia das missões de UAV em cenários de desastre, contornando os efeitos negativos das variações do vento e otimizando o tempo da malha aérea em locais afetados pela interrupção dos serviços de telecomunicações baseados em fibra óptica. O objetivo principal da presente Tese de Doutorado é oferecer uma nova metodologia capaz de dimensionar os elementos de backup em uma rede ótica metropolitana, considerando a adoção de UAVs e interfaces sem fio para realizar links aéreos provisórios e fornece um gerenciamento eficiente dos recursos de backup de modo a estender o tempo de vida da rede de malha voadora durante a catástrofe. O método considera o K-means para escalonar a posição das estações de recursos - a partir das quais os UAVs são lançados. Para otimizar o trajeto dos UAVs até as posições finais, foi utilizado o método Q-learning para investigar possíveis ações que os UAVs poderiam tomar tendo consciência dos obstáculos urbanos distribuídos aleatoriamente no cenário e devido às variações de velocidade do vento, o que está relacionado à forma como os UAVs são organizados durante a missão. Para os testes, utilizou-se uma topologia de rede ótica metropolitana de Estocolmo, Suécia. A heurística foi implementada usando três métodos de aprendizado reforçado (Simple Q-learning, ε-greedy e SARSA) e comparada a uma solução ingênua. Os resultados numéricos das simulações mostraram que a solução baseada em aprendizado por reforço foi capaz de reduzir o consumo de energia em até 15,93% em comparação com a solução ingênua, o que pode levar a um aumento significativo na vida útil de missões baseadas em UAV. Os resultados deste trabalho contribuem para o aumento da eficiência do roteamento de UAV, o que por sua vez favorece o aumento do uso de UAVs em aplicações civis, como esperado para cidades inteligentes.