O CepespData, é uma plataforma de acesso a dados eleitorais brasileiros desenvolvida pelo Centro de Política e Economia do Setor Público (CEPESP) da Fundação Getulio Vargas (FGV) com coordenação do professor Dr. George Avelino Filho.
Para citar o banco de dados do CespepData, utilize o seguinte modelo:
FGV CEPESP (2020). CepespData - Banco de Dados Políticos. Visitado em XX/XX/XXX. Disponível em http://cepespdata.io
Fonte bruta do TSE: O CepespData foi elaborado utilizando como fonte os dados disponibilizados pelo TSE no Repositório de Dados Eleitorais. O CepespData provê um repositório da atividade eleitoral no Brasil, não um registro de como o TSE armazena os seus dados.
Tirando um foto do dia da eleição: Optou-se por se trabalhar com a votação por seção eleitoral (em vez dos resultados agregados por município e zona), privilegiando a vontade do eleitor, uma vez que esse é o único arquivo em que o TSE não atualiza o resultado conforme decisões judiciais posteriores ao dia da eleição. Esses dados, portanto, são a representação mais próxima do que ocorreu no dia da eleição.
Alto grau de consistência: Um persistente trabalho para reforçar a consistência dos dados garante que as diferenças de votos reportada pelas bases do Cepespdata /FGV nunca sejam superior a 1% aos resultados reportados pelo TSE.
Integridade de dados originais: Não mexemos em nenhum dado do TSE para preservar consistência com os dados originais e outras pesquisas. Erros descobertos nos dados brutos são comunicados ao TSE para correção na origem.
Múltiplas formas de acesso: Os dados são facilmente acessáveis por meio de um website interativo, API REST, mapas interativos, pacote R e Python APIs. “Chaves” comuns, como os códigos de munícipio do IBGE, foram incluídos para facilitar a junção com outros bancos de dados.
Simplificando a vida do pesquisador: O CepespData padroniza, simplifica, e complementa os dados do TSE para facilitar análises de usuários. Os dados são nomeados e categorizados de forma clara, padronizando formatos e tipos de variáveis. Seguindo os princípios do tidy data, cada linha é uma observação, cada variável é uma coluna e (com exceção da base dados consolidada) cada tipo de observação uma tabela.
Notas sobre as consultas aos dados eleitorais
Tanto as consultas pelas API’s, quanto as consultas realizadas no site do CepespData (Resultados eleitorais, Resumo das eleições e Bancos desagregados) requerem o preenchimentos de pelo menos dois dos campos acima. Clique aqui para mais informações sobre como usar as API’s
Além das consultas aos resultados eleitorais também estão disponíveis os dados de bens dos candidatos, filiados, carreiras dos candidatos, secretários estaduais, indicadores e mapas eleitorais.
A equipe do CepespData realiza testes de consistência periodicamente e tem como princípio o alto grau de consistência dos dados disponibilizados nas plataformas que produz.
Todas as manipulações das bases originais procuram ser transparentes e replicáveis de ponta a ponta. Ou seja, qualquer pessoa, tendo em mãos os dados do TSE e nossos códigos, deverá poder replicar nossa limpeza e manipulação dos dados.
Com esse intuito disponibilizamos via Github os códigos de extração e manipulação dos dados provenientes do TSE. A cada atualização da base de dados do CepespData realizamos os seguintes testes: