A inteligência artificial está ajudando no combate à corrupção no Brasil
A Inteligência Artificial (IA) é o assunto do momento entre os mamutes tecnológicos. Apple, Facebook, Google, IBM, Microsoft e outros estão investindo pesado para vender a ideia de que redes de computadores poderão sozinhas entender nossas preferências e necessidades no mundo digital.
Por enquanto, há um foco muito grande em aplicações comerciais. Mas e se essa mesma tecnologia fosse empregada no mundo político, para detectar funcionários públicos propensos à corrupção? Para o pavor de agentes da política nacional, projetos do tipo já estão em curso – e isso pode abrir caminho para detectar políticos corruptos também.
No Ministério da Transparência (antiga Controladoria Geral da União, ou CGU), um sistema de IA já consegue mapear o risco de servidores públicos federais se envolverem em casos de corrupção. O projeto da Diretoria de Pesquisas e Informações Estratégicas (DIE), que conta com a participação da Coordenação-Geral do Observatório da Despesa Pública e da Coordenação-Geral de Informações Estratégicas, tem um índice de acerto altíssimo.
Nos testes, os pesquisadores forneceram dados de servidores já expulsos da administração pública por corrupção. A ideia era saber se a IA conseguiria identificar aquilo que os olhos humanos já sabiam se tratar de laranjas podres na administração pública. O resultado é promissor: a máquina já é capaz de identificar 90% desses casos. Ou seja, de cada 10 servidores já flagrados como corruptos, a IA foi capaz de dizer que 9 deles tinham boas chances de serem corruptos mesmo. Conforme os ajustes são feitos, é possível que essa taxa de acerto continue subindo.
“Enquanto as grandes empresas de tecnologia estão preocupadas em descobrir o máximo possível sobre o gosto e o perfil de cada usuário para poder fornecer a melhor experiência possível e direcionar suas atividades de marketing, no Ministério da Transparência (CGU) buscamos conhecer o perfil dos servidores públicos que foram expulsos por corrupção para tentar prever quais, daqueles que estão na ativa, possuem um maior risco de se envolverem em corrupção, ou seja, quais possuem perfil semelhante àqueles dos servidores expulsos por corrupção”, explica Rommel Novaes Carvalho, coordenador-Geral do Observatório da Despesa Pública (ODP), ao Gizmodo Brasil.
A analogia mais comum para entender como funciona o projeto é lembrar das dolorosas vezes em que você teve que negociar o seguro de carro. Uma série de atributos, como idade, profissão e bairro de residência, fazem diferença no preço final. Assim, as seguradoras se baseiam em estatísticas na hora de cobrar pela proteção. Se você é universitário, molecão maroto, que deixa o carro na rua, vai sair mais caro. O número de batidas com pessoas do sexo masculino em idade baixa é alto.
No projeto da ODP, 18 bancos de dados fornecem 4,4 mil atributos únicos sobre os funcionários públicos. Quando combinadas, essas informações geram mais de 60 mil atributos, que são analisados, baseados em perfis já existentes, e determinam as chances de alguém se meter em falcatrua.
Seria impossível que apenas olhos humanos conseguissem sozinhos manter a vigilância com toda essa numeralha. Por isso, o projeto utiliza técnicas que são feijão com arroz para o Google e seus concorrentes. As palavrinhas estão na moda: big data, mineração de dados e “machine learning” (ou aprendizado de máquina).
Isso significa que um algoritmo vai analisar um gigantesco volume de dados e aprender, com base nos dados históricos e uso de estatística, quais são as características que aumentam ou diminuem a chance de uma pessoa ser expulsa da Administração Pública por motivos de corrupção. No final, há uma fórmula, com pesos diferentes para cada característica, que pode ser usada para calcular o risco de corrupção de qualquer servidor público.
Atualmente, os 18 bancos de dados somam juntos 500 GB, e, conforme mais informações ficam disponíveis, é possível que o número continue crescendo. Para processar tudo isso, a CGU montou um laboratório de Big Data com cinco servidores de 512 GB de RAM e 40 núcleos cada. O passo foi gigante: nos primeiros passos do projeto com automação, em 2013, era utilizado um desktop comum para dar conta de todos esses dados.
Os atributos utilizados para descobrir possíveis malandrões são mantidos em segredo, mas um deles é filiação partidária. Antes de continuar, um pequeno alerta: o modelo não leva em conta o histórico do partido. Então, Lava-Jato, roubo de merenda e outros esquemas não pesam. O que conta aqui é ser afiliado ou não a um partido – qualquer que seja – e o tempo de filiação partidária.