UM DATA WAREHOUSE PARA ACESSO À DADOS PÚBLICOS BRASILEIROS
Ciência de dados; Dados Públicos; Big Data; Armazenamento de dados; Lei de Acesso à Informação.
Nas últimas décadas, período conhecido como “Era da Informação”, vem acontecendo um processo de massiva adoção de sistemas informatizados na gestão de empresas públicas e privadas, os quais provocam uma geração significativa de dados brutos relativos às operações dessas organizações. Esses dados podem representar uma importante vantagem estratégica caso sejam analisados e devidamente utilizados nos processos decisórios dos seus respectivos empreendimentos. No Brasil, a partir da Lei de Acesso à Informação (LAI), de 2011, observa-se diversas iniciativas de divulgação de conjuntos dados públicos, dentre as quais o Portal da Transparência e o Portal Brasileiro de dados Abertos. Essa abordagem possui como efeito colateral a disponibilização de um grande volume de dados em contextos isolados, em formatos pouco amigáveis e, consequentemente, não facilmente reutilizáveis pela população em geral. Dessa forma, nota-se uma tendência de análise parcial ou limitada, por conta da dificuldade de obtenção, limpeza e tratamento de grandes volumes de dados antes de sua efetiva utilização para análise. Nesse cenário, este documento apresenta uma proposta de desenvolvimento de um Framework para acesso e análise de dados públicos brasileiros, visando permitir a usuários não especializados em tecnologia da informação um acesso simplificado e efetivo a grandes volumes de dados públicos, permitindo a eles a concentração de esforços em atividades de análise, e não mais em obtenção e pré-processamento de dados, representando uma iniciativa no sentido de estimular a reutilização dos dados pela sociedade, gerando valor às iniciativas de divulgação desses.