Manifesto

O Problema

Após a criação da Lei de Acesso à Informação, todas as informações produzidas ou custodiadas pelo poder público são públicas e portanto, disponíveis a todos os cidadãos, exceto aquelas que são sigilosas por lei. Contudo, mesmo que a informação esteja disponível não significa que ela está em um formato acessível, ou seja, que ela possui um formato estruturado ou que possua metadados que facilitem a extração manual ou automática desses dados. Se você já precisou utilizar algum dado público provavelmente já passou por algum desses problemas:

  1. Achar sites que disponibilizam tais informações, mas que não possibilitam o download dos dados consolidados, fazendo com que seja necessário criar um programa que acesse o site automaticamente.
  2. Encontrar informações disponibilizadas em formato PDF (não estruturado) em vez de em formato de planilha eletrônica.
  3. Ter planilhas disponíveis em formatos fechados (XLS e XLSX) em vez de abertos(CSV e ODS).
  4. Acessar páginas que disponibilizam um grande número de arquivos (por exemplo, um arquivo para cada unidade federativa) em vez de um único arquivo consolidado, o que dificulta bastante as análises globais.

Restringir acesso a dados públicos é elitizar a democracia.

Nesse sentido, programadores possuem privilégios sobre outros cidadãos: eles conseguem criar programas que acessam os dados que não estão em um formato amigável. Muitos jornalistas, cientistas sociais, advogados, e profissionais de diversas outras áreas precisam contratar desenvolvedores para conseguir esses dados em um formato que eles consigam mexer ou preferem aprender a programar para resolver esse problema, porém, acabam levando mais tempo para atingir o objetivo principal: analisar os dados.

Além do problema relativo à acessibilidade, que torna tudo mais lento e custoso, não existe um lugar comum em que todos os esses dados estejam organizados, catalogados e linkados, o que dificulta ainda mais o acesso (ou a descoberta desse tipo de informação).

O Brasil.IO foi criado para resolver esses problemas!

Os 4 Problemas de Acessibilidade

Quatro situações problemáticas costumam tornar dados menos acessíveis. São eles:

  1. Formato (qualidade técnica)
    • Exemplo: Boletim de balneabilidade em PDF (INEMA/BA)
  2. Dispersão
    • Exemplo: Filiações partidárias em 945 ZIPs com CSVs (TSE)
  3. Quantidade de dados
  4. Domínio da área
    • Exemplo: o que é unidade eleitoral? (TSE)

Missão e Valores

Nossa missão é tornar acessíveis os dados brasileiros de interesse público e temos como valores principais a transparência e colaboração. Dessa maneira, tudo o que produzimos pode ser verificável, pois além de disponibilizarmos os dados em formatos abertos, nosso software é livre e produzimos tudo isso de maneira colaborativa. Entre em nosso chat para saber como colaborar ou em nosso repositório de código no GitHub.

Chamamos de "libertação de dados" #dataliberation o processo de capturar, converter, limpar e disponibilizar dados em formato estruturado e aberto.

Aplicações

Diversas áreas podem se beneficiar dos dados mais acessíveis. Algumas delas:

  1. O jornalismo guiado por dados: durante o processo de investigação, citação de fontes e checagem de dados, que pode ser feita inclusive pelos leitores.
  2. Projetos de inovação cívica e controle social, como, por exemplo, a Operação Serenata de Amor. A centralização dessas informações em um formato acessível torna viável projetos que sofreriam muitas dificuldades técnicas sem esses dados disponibilizados dessa maneira.
  3. Gestão pública: gerando maneiras eficientes de utilização do orçamento através do cruzamento de informações disponíveis em órgãos distintos - as bases de dados muitas vezes não conversam entre si por falta de padronização.