Manifesto
O Problema
Após a criação da Lei de Acesso à Informação, todas as informações produzidas ou custodiadas pelo poder público são públicas e portanto, disponíveis a todos os cidadãos, exceto aquelas que são sigilosas por lei. Contudo, mesmo que a informação esteja disponível não significa que ela está em um formato acessível, ou seja, que ela possui um formato estruturado ou que possua metadados que facilitem a extração manual ou automática desses dados. Se você já precisou utilizar algum dado público provavelmente já passou por algum desses problemas:
- Achar sites que disponibilizam tais informações, mas que não possibilitam o download dos dados consolidados, fazendo com que seja necessário criar um programa que acesse o site automaticamente.
- Encontrar informações disponibilizadas em formato PDF (não estruturado) em vez de em formato de planilha eletrônica.
- Ter planilhas disponíveis em formatos fechados (XLS e XLSX) em vez de abertos(CSV e ODS).
- Acessar páginas que disponibilizam um grande número de arquivos (por exemplo, um arquivo para cada unidade federativa) em vez de um único arquivo consolidado, o que dificulta bastante as análises globais.
Restringir acesso a dados públicos é elitizar a democracia.
Nesse sentido, programadores possuem privilégios sobre outros cidadãos: eles conseguem criar programas que acessam os dados que não estão em um formato amigável. Muitos jornalistas, cientistas sociais, advogados, e profissionais de diversas outras áreas precisam contratar desenvolvedores para conseguir esses dados em um formato que eles consigam mexer ou preferem aprender a programar para resolver esse problema, porém, acabam levando mais tempo para atingir o objetivo principal: analisar os dados.
Além do problema relativo à acessibilidade, que torna tudo mais lento e custoso, não existe um lugar comum em que todos os esses dados estejam organizados, catalogados e linkados, o que dificulta ainda mais o acesso (ou a descoberta desse tipo de informação).
O Brasil.IO foi criado para resolver esses problemas!
Os 4 Problemas de Acessibilidade
Quatro situações problemáticas costumam tornar dados menos acessíveis. São eles:
- Formato (qualidade técnica)
- Exemplo: Boletim de balneabilidade em PDF (INEMA/BA)
- Dispersão
- Exemplo: Filiações partidárias em 945 ZIPs com CSVs (TSE)
- Quantidade de dados
- Exemplo: 18 milhões de sócios (Receita Federal)
- Domínio da área
- Exemplo: o que é unidade eleitoral? (TSE)
Missão e Valores
Nossa missão é tornar acessíveis os dados brasileiros de interesse público e temos como valores principais a transparência e colaboração. Dessa maneira, tudo o que produzimos pode ser verificável, pois além de disponibilizarmos os dados em formatos abertos, nosso software é livre e produzimos tudo isso de maneira colaborativa. Entre em nosso chat para saber como colaborar ou em nosso repositório de código no GitHub.
Chamamos de "libertação de dados" #dataliberation o processo de capturar, converter, limpar e disponibilizar dados em formato estruturado e aberto.
Aplicações
Diversas áreas podem se beneficiar dos dados mais acessíveis. Algumas delas:
- O jornalismo guiado por dados: durante o processo de investigação, citação de fontes e checagem de dados, que pode ser feita inclusive pelos leitores.
- Projetos de inovação cívica e controle social, como, por exemplo, a Operação Serenata de Amor. A centralização dessas informações em um formato acessível torna viável projetos que sofreriam muitas dificuldades técnicas sem esses dados disponibilizados dessa maneira.
- Gestão pública: gerando maneiras eficientes de utilização do orçamento através do cruzamento de informações disponíveis em órgãos distintos - as bases de dados muitas vezes não conversam entre si por falta de padronização.