Depois da denúncia polêmica feita ao TSE, de que algumas rádios não estariam veiculando a propaganda eleitoral obrigatória, eu me propus o desafio de criar um sistema para monitorar rádios do Brasil inteiro, usando o streaming dessas rádios na internet. Foi mais fácil do que eu havia imaginado e eu consegui fazer com que esse conteúdo de áudio das rádios fosse transformado em texto para poder ser analisado, e eu vou mostrar o resultado pra vocês.
Eu comecei pensando que seria um processo super difícil, como fazer para monitorar se as rádios estão passando determinada programação, mas eu resolvi pesquisar ferramentas que já existem que transformam áudio em texto [analisar texto é muito mais simples]. Eu vou mostrar pra vocês a ferramenta que eu utilizei, e em questão de 20 minutos eu já tinha conseguido fazer o sistema funcionar. Eu comecei com um sistema chamado Deepgram, ele é um sistema pago, mas você consegue pegar um período gratuito de teste e consegue acesso à API, e ele transforma áudio em texto em vários idiomas. Então a ideia era conseguir plugar a stream de uma rádio pela internet e transformar em texto esses dados. Então agora eu precisava pegar essas rádios e, bem rapidinho numa busca pelo Google, eu encontrei um site chamado TuneIn, nesse site eu posso colocar o nome de uma cidade qualquer e ele vai me retornar várias rádios da região, inclusive dá pra filtrar por países, estados, e tudo mais. Por exemplo, eu posso pegar o estado de Pernambuco, e ele mostrar pra mim: Clube AM de Recife, Clube FM Recife, Jovem Pan Recife, e por aí vai. Dando uma olhada no código do site, eu vi como ele faz para linkar todas as rádios com uma requisição para “\Tune.ashx”, e nessa requisição ele retorna um body que tem o link da stream. Com essa informação em mãos, eu peguei a própria documentação do Deepgram e fiz um script muito simples, que eu disponibilizei também no meu, GitHub , e qualquer pessoa pode baixar, fazer a API e testar, é muito maneiro.
Então eu fiz esse código que usa a API do Deepgram, e aí eu recebo o áudio que está vindo dessa transmissão de streaming e converto esse áudio em texto .txt, colocando a data e hora que essa informação foi coletada, para poder fazer um processamento desse material. Com esses logs eu posso analisar qual o horário que foi veiculada determinada campanha eleitoral ou outra campanha qualquer. Obviamente, como o Deepgram é uma ferramenta paga, ela vai ficando mais cara a medida que mais rádios são acrescentadas. Por enquanto eu fiz um cadastro simples, com apenas algumas rádios para teste, mas existe possibilidade, da forma como eu organizei aqui, de cadastrar quantas rádios forem necessárias. Com isso a gente conseguiria pegar esses dados e transformar num relatório falando datas e horários das propagandas eleitorais do candidato X ou do candidato Y.
Como a gente está a 5 dias das eleições, não vai dar tempo de refinar esse código, e também teria que colocar uma grana no Deepgram para conseguir pegar uma quantidade grande de rádios, mas se você está vendo esse post e conhece alguém relacionado às campanhas eleitorais que tem interesse, entre em contato. Se precisar de algum tipo de suporte, pode enviar no meu email, [email protected], que eu ajudo fazer um sistema de monitoramento maior, para conseguir validar essas denúncias que estão sendo feitas, porque se, de fato, existir essa diferença de veiculações das propagandas eleitorais, pode ser prejudicial para a campanha de um candidato, e a gente está aqui para ajudar a encontrar esses problemas.
Diferentemente do que eu imaginava, foi extremamente simples de fazer esse sistema, não há nenhum motivo sólido para a gente falar que é impossível, porque isso foi um código feito em 20 minutos de pesquisa na internet, que tem a possibilidade de abranger todas as rádios do Brasil, se for necessário. Obviamente não tenho como fazer essa análise completa em 5 dias, eu teria que trabalhar as transcrições, até existe uma ferramenta muito boa do Google, chamado Google Natural Language AI, que faz a análise semântica e textual, e daria para fazer uma análise de tudo que falado, separar o que é música, o que é a campanha eleitoral efetivamente, e ver quais foram os horários e em quais rádios foram veiculados esses anúncios, pra gente conseguir gerar um relatório completo. Se eu fosse listar todas as rádios aqui, eu precisaria fazer um crowler para pegar todos os links cadastradas no TuneIn, então ficaria um pouquinho mais complexo. Eu não sei se eu vou fazer isso porque eu tenho outras tarefas, mas achei uma solução simples para fazer essa auditoria e tivesse um pouco mais de tempo disponível, eu faria um relatório igual eu fiz dos BUs, mas como está bem em cima da hora, eu não sei se eu vou conseguir. Se eu tiver tempo, obviamente eu vou fazer um post aqui e mostrar os resultados do que for encontrado, para ver se procede ou não a denúncia feita ao TSE.
Se você estiver gostando do conteúdo, compartilhe com seus amigos e me siga também no Twitter. Eu vou ficando por aqui, valeu!
Se você ainda não viu o resultado da auditoria que eu fiz nos BUs do primeiro turno da eleição, acesse:
Este post é baseado no conteúdo do vídeo “Fiz Um Sistema Para Monitorar Propaganda Eleitoral Nas Rádios”: