Conferências do IFSP, 8º Congresso de Iniciação Científica e Tecnológica do IFSP

Tamanho da fonte: 
ESTUDO DE MÉTODOS DE ACESSO AUTOMATIZADO PARA CLASSIFICAÇÃO DE CONTEÚDO EM WEBSITES DE ACORDO COM DADOS ABERTOS GOVERNAMENTAIS
Arthur Pereira Rozado, Raul Mendes de Souza, Andreiwid Sheffer Corrêa

Última alteração: 2017-11-14

Resumo


De acordo com a legislação brasileira, os registros públicos governamentais devem ser disponibilizados de forma aberta à sociedade, porém a ineficiência na disponibilização destes dados em formato aberto e legíveis por máquina gera desperdício de recursos e compromete o acesso às informações, atualmente veiculadas por websites não-padronizados e muitas vezes incompatíveis com os princípios de dados abertos. Visando garantir a qualidade das formas de disponibilização de dados atualmente adotadas, este projeto objetiva estudar, comparar e aplicar métodos automatizados de acesso a esses websites para permitir posterior classificação de seus conteúdos. Os resultados serão utilizados para extrair métricas de avaliação que serão expostas à sociedade. Como resultado preliminar, tem-se uma nota resultante da análise de três critérios distintos: acessibilidade, complexidade e qualidade. A acessibilidade consiste na compatibilidade do website em prover conteúdo às pessoas com deficiência, sendo dividida em três níveis de prioridade. A complexidade se refere ao grau de dificuldade imposto aos usuários ao obter as informações e a qualidade é relacionada diretamente ao conteúdo semântico da página HTML, com a checagem de links e a disponibilidade do que é fornecido pelas páginas web.

Palavras-chave


dados abertos governamentais, web scraping, portal de transparência

Texto completo: PDF