Hoje eu vou fazer uma análise de um relatório preliminar do primeiro turno das eleições que está rolando na internet, que um dos inscritos do canal do meu YouTube me mandou por email para eu dar uma olhada.
**Para quem está aguardando minhas análises sobre o segundo turno, eu peguei uma gripe muito forte essa semana, então não consegui ainda olhar os dados, mas estou baixando aqui os arquivos de logs e BUs para poder olhar e, em breve, trago as minhas conclusões aqui.**
Não vou nem botar o relatório aqui, porque eu já vou iniciar fazendo uma crítica construtiva para quem fez esse relatório: O relatório não tem em nenhum momento nenhuma fonte de dados, não tem como baixar as informações que foram apresentadas e nem tem os nomes dos autores do relatório, ainda assim é um relatório que está correndo a internet e que muita gente que já recebeu. Ele começa afirmando ser um relatório preliminar da análise das urnas eletrônicas usadas nas eleições presidenciais do Brasil no primeiro turno, dia 02 de outubro de 2022, mas não consta o autor, fontes, arquivos utilizados, nem scripts utilizados, o que, no meu ponto de vista, já descredibiliza bastante esse relatório no geral. Eu não tenho como baixar esses dados para fazer uma análise. Por mais que a minha área não seja estatística, mas programação, se eu não consigo saber de onde é que vieram essas informações, não tem como eu credibilizar os gráficos apresentados no relatório.
O relatório faz uma série de questionamentos com relação aos modelos de urna, ele afirma que as urnas utilizadas no primeiro turno eram dos modelos 2009, 2010, 2011, 2013, 2015 e 2020. Então seriam vários modelos de urna diferentes, e cada um desses modelos teria apresentado, segundo o relatório, uma diferença de consistência nos dados, sugerindo que urnas mais antigas apresentam um resultado mais favorável a um dos candidatos, além de possivelmente existirem dois softwares de urna diferentes. Analisando, grosso modo, se de fato existem vários modelos de urna, o que eu honestamente não sei se procede, caso essas urnas tenham hardwares diferentes, provavelmente o software para cada uma dessas urnas seria diferente, porque o sistema teria que comportar todos os drivers necessários para o funcionamento da urna. No final do processo, a pergunta é: poderia ser o mesmo software? Teria que ser um software com suporte a todos esses modelos de urna, mesmo com o hardware sendo diferente. É mais ou menos como um software de celular Android, que tem várias versões e atende a vários tipos de celulares diferentes, e que na hora que é gerado o build, ele identifica qual é a CPU do dispositivo, ou mesmo quando você vai fazer o build de um arquivo .exe pro Windows e ele diferencia o Windows 64 bits e o 32 bits. Mas eu teria que entrar um pouco mais a fundo em como é a estrutura dessas urnas de 2009/2010, para saber se existem softwares diferentes para cada uma das versões das urnas. Essa é uma discussão até interessante de saber e a única entidade que vai poder responder essa pergunta é o TSE, mas existe essa possibilidade de urnas com hardware diferente precisarem de um software diferente.
Outra pergunta que me fizeram é, tendo softwares diferentes, como garantir a assinatura digital dos softwares? Bom, quando você faz um software executável de desktop, no caso da urna, ela é construída sobre um sistema Linux, você faz o processo de build, que “constrói” o executável. Depois que esse build foi gerado, você vai fazer o processo de assinatura do software, e precisa ter um certificado digital apropriado para assinatura de software, não é qualquer certificado que faz esse tipo de assinatura. Você roda um sistema que vai fazer a leitura desse software e gerar um checksum, que é um valor de integridade daquele sistema, e isso é feito individualmente para cada arquivo que compõe o sistema. O sistema não é composto apenas do executável, ele pode conter uma série de bibliotecas complementares. Por exemplo, preciso de uma biblioteca para fazer o .zip [compactador de arquivos], então, em vez de criar o código na mão, que ninguém faz isso, você pega uma biblioteca pública que tenha o código do .zip e disponibiliza isso junto com o software no formato de uma DLL, que vai fazer esse complemento. Então quando passa a assinatura, você assina não só o .exe, não só o executável, mas também todas as DLLs necessárias praquele sistema funcionar.
Continuando, esse relatório apresenta uma série de gráficos, de alguns sistema de BI provavelmente, que eu não sei qual é, e fala sobre essas diferenças que foram encontradas entre urnas com versões entre 2009 a 2015 e a 2020, onde as urnas mais antigas apresentariam resultados muito superiores, coisa de 10 a 15% a mais da quantidade de votos, para um candidato e tem alguns gráficos de como é essa distribuição estatística de comportamento das urnas. Eu não tenho como falar se está certo ou errado, não é a minha área de atuação, eu não sou estatístico, teria que pegar alguém que entenda disso para poder olhar. A minha parte é de software e de computação, o que eu posso dizer é que, nesse caso, o questionamento com relação às versões pode fazer um pouco de sentido, mas tem que entender isso com o TSE, se realmente existem versões para cada tipo de urna diferente ou se é um software só para todas. Eu não tenho como afirmar que é ou que não é, mas, de novo, o fato de não ter um autor nesse relatório e não ter as fontes dessas informações descredibiliza bastante o relatório. Pode até ser que tenha alguma coisa de consistente nele, mas acaba descredibilizando. Todos os relatórios que eu fiz até agora, por exemplo, e eu fiz três relatórios, eu protocolei na ouvidoria do TSE, eu coloquei meu nome e email, disponibilizei todos os códigos-fonte, todos os arquivos que eu utilizei, sejam os arquivos originais que vieram do TSE ou os arquivos que foram parseados posteriormente, assim fica mais completa a análise porque, se a equipe do TSE for olhar essas informações, eles conseguem exatamente as fontes de onde foram tiradas cada informação. Eu até fiz um vídeo, vou deixar o link no final, com a resposta do TSE para todos os relatórios que eu enviei, inclusive no primeiro, em que eu fiz a análise dos BUs, eles elogiaram a iniciativa e o relatório ficou bem completo, faltaram algumas pequenas coisinhas, que eu até falei no vídeo, mas chegou bem próximo da contabilização oficial. Muita gente me questionou por estar usando dados que já foram compartilhados pelo TSE, mas que poderiam acontecer outros tipos de problema e na época eu falei e continuo reafirmando: Eu não tenho como dar 100% de certeza porque eu não fiz a auditoria da votação. A única forma de fazer isso é indo ao Tribunal Superior Eleitoral, olhando os códigos-fonte do sistema para ver se está tudo 100% certo, mas até agora eu não recebi um convite para poder fazer isso, então não tem como eu falar sobre.
Voltando ao relatório, há um total de 70 páginas onde, no final, na página 65, ele acusa a existência de dois códigos-fonte e justifica apresentando um log de urna. Só para explicar como funciona esse log de urna, qualquer procedimento que é feito na urna gera um arquivo de log, arquivo que também é disponibilizado pelo TSE para qualquer pessoa interessada baixar. Inclusive eu estou baixando esses logs, porque nos BUs tem só um condensado, um sumário do que aconteceu durante a votação, já os logs tem muito mais informação. Os logs colocam cada etapa do processo, desde a hora que urna foi ligada, qual mesário ativou a urna, se foi usada biometria, e tudo mais. Como esses logs são muito mais ricos que os BUs, eu estou baixando esses arquivos para fazer uma análise mais completa do que a que eu fiz no primeiro turno. Mas, nesse relatório aqui, ele coloca o seguinte: “existem urnas com padrões diferentes de log, o que não poderia ser possível caso fosse o mesmo sistema.” Eu concordo plenamente que, se fosse o mesmo sistema, o log sairia exatamente igual. Mas quem fez o relatório não disponibilizou os arquivos de log que ele utilizou, nem o nome ou o número dos logs, se tivesse pelo menos especificado qual é o ID dos logs, eu conseguiria baixar direto do TSE e ver se o padrão difere, inclusive existem ferramentas para olhar essas diferenças entre a formatação de arquivos, mas, como não tem essa informação aqui, eu não consigo dizer se essa ponderação está correta com relação à formatação dos logs. De fato, o comportamento esperado de um sistema é que ele sempre gere o mesmo formato de resultado. Se você gerar 500 vezes o arquivo de log usando o mesmo sistema, o formato dos logs tem que ser exatamente iguais, não digo igual quanto ao número de votos, mas o rastreio que ele faz, etapa por etapa, segue uma sequência, não tem como computar voto antes de o mesário iniciar, por exemplo. Teria que dar uma olhada nesses arquivos que estão sendo apontados para ver se realmente existe uma diferença e isso poderia significar que existem softwares diferentes para versões diferentes de urna.
O que eu achei, honestamente, é que esse relatório tem bastantes coisas, mas que não têm como serem testadas e verificadas. Tem muitas fases de impacto ali no meio, muito blábláblá, e uma conclusão relativamente fraca. Com relação à quantidade de dados, prece muito com quando você faz um relatório de 300 páginas para protocolar em algum lugar, achando que ninguém vai olhar aquilo, só vai olhar a conclusão. Enfim, não tem como eu falar que se está certo ou está errado, porque, novamente, eu não tenho acesso aos dados que foram usados para gerar esse relatório, não consta nenhum tipo de contato para poder receber essas informações. Minha análise preliminar é que o relatório, do jeito que está aqui, não serve para muita coisa, não serve para nada, na verdade. Ele pode até levantar alguns questionamentos, mas não tem como garantir a veracidade das informações que tem nele. Meu conselho para quem fez esse relatório, se estiver lendo esse post, é: se você tem dados que realmente são incontestáveis, que são muito bem preparados, disponibilize em algum repositório público. Se você não quer se expor porque tem medo de represália ou qualquer coisa do tipo, pelo menos bote isso em algum lugar para que outras pessoas, como eu, possam baixar essas informações e dar um double check, entendeu? Minha análise é totalmente imparcial com relação às informações, mas se eu não tenho os dados, não tenho como atestar se isso é verídico ou não, a gente só vai ficar chovendo no molhado aqui e não vai chegar a conclusão nenhuma.
Mas, por enquanto é isso, eu estou baixando os boletins e os logs de urna, assim que der uma melhorada, eu vou olhar essas informações e fazer uma publicação do segundo turno, complementando aquele post que eu já fiz do primeiro turno. Assim ficar pronto, eu publico tudo.
Se você estiver gostando do conteúdo, se inscreva também no meu canal do YouTube e me siga no Twitter , a gente se vê numa próxima. Valeu!
O post sobre relatório que eu fiz sobre o primeiro turno das eleições pode ser encontrado aqui:
A resposta do TSE para este relatório pode ser vista aqui:
O conteúdo deste post foi retirado do vídeo “Analisei Um Relatório Sobre O Primeiro Turno, Veja O Resultado!”: