Tamanho da fonte:
ESTUDO DE MÉTODOS DE ACESSO AUTOMATIZADO PARA CLASSIFICAÇÃO DE CONTEÚDO EM WEBSITES DE ACORDO COM DADOS ABERTOS GOVERNAMENTAIS
Última alteração: 2017-11-14
Resumo
De acordo com a legislação brasileira, os registros públicos governamentais devem ser disponibilizados de forma aberta à sociedade, porém a ineficiência na disponibilização destes dados em formato aberto e legíveis por máquina gera desperdício de recursos e compromete o acesso às informações, atualmente veiculadas por websites não-padronizados e muitas vezes incompatíveis com os princípios de dados abertos. Visando garantir a qualidade das formas de disponibilização de dados atualmente adotadas, este projeto objetiva estudar, comparar e aplicar métodos automatizados de acesso a esses websites para permitir posterior classificação de seus conteúdos. Os resultados serão utilizados para extrair métricas de avaliação que serão expostas à sociedade. Como resultado preliminar, tem-se uma nota resultante da análise de três critérios distintos: acessibilidade, complexidade e qualidade. A acessibilidade consiste na compatibilidade do website em prover conteúdo às pessoas com deficiência, sendo dividida em três níveis de prioridade. A complexidade se refere ao grau de dificuldade imposto aos usuários ao obter as informações e a qualidade é relacionada diretamente ao conteúdo semântico da página HTML, com a checagem de links e a disponibilidade do que é fornecido pelas páginas web.
Palavras-chave
dados abertos governamentais, web scraping, portal de transparência
Texto completo:
PDF