O CepespData

O CepespData, é uma plataforma de acesso a dados eleitorais brasileiros desenvolvida pelo Centro de Política e Economia do Setor Público (CEPESP) da Fundação Getulio Vargas (FGV) com coordenação do professor Dr. George Avelino Filho.

Para citar o banco de dados do CespepData, utilize o seguinte modelo:

FGV CEPESP (2020). CepespData - Banco de Dados Políticos. Visitado em XX/XX/XXX. Disponível em http://cepespdata.io

Princípios

Transparência

  • Fonte bruta do TSE: O CepespData foi elaborado utilizando como fonte os dados disponibilizados pelo TSE no Repositório de Dados Eleitorais. O CepespData provê um repositório da atividade eleitoral no Brasil, não um registro de como o TSE armazena os seus dados.

  • Tirando um foto do dia da eleição: Optou-se por se trabalhar com a votação por seção eleitoral (em vez dos resultados agregados por município e zona), privilegiando a vontade do eleitor, uma vez que esse é o único arquivo em que o TSE não atualiza o resultado conforme decisões judiciais posteriores ao dia da eleição. Esses dados, portanto, são a representação mais próxima do que ocorreu no dia da eleição.

Rigor

  • Alto grau de consistência: Um persistente trabalho para reforçar a consistência dos dados garante que as diferenças de votos reportada pelas bases do Cepespdata /FGV nunca sejam superior a 1% aos resultados reportados pelo TSE.

  • Integridade de dados originais: Não mexemos em nenhum dado do TSE para preservar consistência com os dados originais e outras pesquisas. Erros descobertos nos dados brutos são comunicados ao TSE para correção na origem.

Inclusão

  • Múltiplas formas de acesso: Os dados são facilmente acessáveis por meio de um website interativo, API REST, mapas interativos, pacote R e Python APIs. “Chaves” comuns, como os códigos de munícipio do IBGE, foram incluídos para facilitar a junção com outros bancos de dados.

  • Simplificando a vida do pesquisador: O CepespData padroniza, simplifica, e complementa os dados do TSE para facilitar análises de usuários. Os dados são nomeados e categorizados de forma clara, padronizando formatos e tipos de variáveis. Seguindo os princípios do tidy data, cada linha é uma observação, cada variável é uma coluna e (com exceção da base dados consolidada) cada tipo de observação uma tabela.

Escopo do Banco de Dados

Notas sobre as consultas aos dados eleitorais

  • Tanto as consultas pelas API’s, quanto as consultas realizadas no site do CepespData (Resultados eleitorais, Resumo das eleições e Bancos desagregados) requerem o preenchimentos de pelo menos dois dos campos acima. Clique aqui para mais informações sobre como usar as API’s

  • Além das consultas aos resultados eleitorais também estão disponíveis os dados de bens dos candidatos, filiados, carreiras dos candidatos, secretários estaduais, indicadores e mapas eleitorais.

Testes de Consistência

A equipe do CepespData realiza testes de consistência periodicamente e tem como princípio o alto grau de consistência dos dados disponibilizados nas plataformas que produz.

Todas as manipulações das bases originais procuram ser transparentes e replicáveis de ponta a ponta. Ou seja, qualquer pessoa, tendo em mãos os dados do TSE e nossos códigos, deverá poder replicar nossa limpeza e manipulação dos dados.

Com esse intuito disponibilizamos via Github os códigos de extração e manipulação dos dados provenientes do TSE. A cada atualização da base de dados do CepespData realizamos os seguintes testes: