Como identificar os bots de fake news

Veja como os robôs de fake news operam e como podem ser descobertos a partir da análise comportamental.

Ter a informação certa na hora certa pode torná-lo rico ou salvar sua vida, mas na realidade caótica de hoje, a mídia em todo o mundo está contaminada por notícias falsas. Atualmente, as pessoas ganham a vida fabricando dados falsos e os publicando online, mas mesmo essa produção de conteúdo não é suficiente, já que a indústria também usa milhares de bots nas mídias sociais para multiplicar o efeito e alcance. Pesquisadores do Recorded Future deram uma palestra sobre este fenômeno na Security Analyst Summit deste ano.

Por que os bots de notícias falsas ainda estão sendo utilizados?

Ninguém gosta de bots, mas no caso das empresas de mídias sociais é ainda pior, pois reduzem a atratividade de suas páginas. Por exemplo, o Twitter identifica um grande número de contas de bots e as suspende (o que gera reclamações de usuários e como resultado, perdem seguidores). Ou seja, as plataformas de redes sociais têm seus próprios métodos para detectar bots, mas não são totalmente eficazes.

Elas não divulgam seus algoritmos, mas podemos dizer que se concentram na detecção de comportamentos incomuns, como, por exemplo, uma conta que tenta fazer mais de cem publicações por minuto ou outra que só retuitou e não publica conteúdo “autoral”. Sem dúvida, é um bot.

Mas os desenvolvedores conseguem modificar seus bots e fazê-los evitar as estratégias de verificação das mídias sociais. Além disso, esses serviços não podem gerar muitos falsos positivos, pois, se suspenderem muitas contas por engano, os usuários poderão se indignar. Esta é a principal razão pela qual existem tantos bots não detectados.

Para investigar o comportamento dos bots, o Recorded Future decidiu focar em um recurso particular para destacar um determinado grupo de bots que, neste caso, disseminava informações sobre ataques terroristas apenas no Twitter. Se você encontrar uma conta com um comportamento semelhante, provavelmente é um bot (ou uma conta que retuita um bot). Mas o que elas têm em comum?

Como os bots de fake news se comportam?

Em primeiro lugar, esses ataques terroristas realmente aconteceram. Sites respeitáveis​​ também reproduziram essas notícias. O problema é que os eventos ocorreram há anos e nenhuma dessas contas faz essa especificação, por isso, ao fazerem menção a perfis com certa credibilidade, os algoritmos de detecção do Twitter não suspeitam de nada.

Em segundo lugar, nesse caso específico das redes de bots, os proprietários das contas fingiam estar nos Estados Unidos, mas reproduziam notícias especialmente sobre os países europeus. Com essas informações, a Recorded Future conseguiu identificar mais de 200 contas com essas especificações, para depois conseguirem encontrar novas semelhanças e conexões entre elas.

Por exemplo, os pesquisadores projetaram um padrão de atividade e perceberam que muitos bots estavam ativos apenas durante o mesmo período de tempo. O Twitter suspendeu algumas dessas contas em maio, mas novas surgiram com o mesmo comportamento e até hoje continuam em operação.

Outro ponto em comum é que todas as contas usavam os mesmos encurtadores de URL para publicar as notícias, pois essas ferramentas eram usadas para oferecer aos cibercriminosos um relatório com, por exemplo, o número de cliques no link. Não eram as plataformas que usamos como t.co ou goo.gl, mas outras que não são públicas e criadas com o único propósito de coletar dados. Inclusive, todas têm um design minimalista em laranja e branco, e seu uso também poderia ligar as contas associadas.

Os dados do WHOIS dos sites desses encurtadores mostram que todos estão hospedados no Microsoft Azure e registrados anonimamente. Coincidência? Certamente não. Existem mais semelhanças entre contas, embora, obviamente, as campanhas variem. Mas, em geral, analisar uma conta, descobrir suas peculiaridades e procurar semelhanças é um método muito eficiente para detectar redes de bots.

As características dos bots de fake news

Preparamos uma pequena lista com as características típicas dos bots, já que as contas que são usadas em uma rede ou campanha têm em comum muitas dessas peculiaridades. Portanto, perfis na mesma mídia social provavelmente são bots se:

  • Têm pseudônimos ou nomes semelhantes;
  • Foram criados no mesmo dia;
  • As publicações reproduzidas são dos mesmos sites;
  • Possuem o mesmo estilo;
  • Cometem os mesmos erros de ortografia;
  • Seguem entre si ou a mesma conta;
  • Usam as mesmas ferramentas para encurtar URLs;
  • Estão ativos apenas durante o mesmo período;
  • As descrições de seus perfis são semelhantes;
  • Utilizam imagens genéricas ou de outras pessoas (encontradas facilmente no Google) como foto da conta.

Obviamente, isso não significa que, se várias contas têm algo em comum, devem ser consideradas bots. Mas se houver mais de uma semelhança (ou mais de quatro ou cinco para evitar falsos positivos), é muito provável que seja uma rede de bots em plataformas de redes sociais.

Mantenha a guarda alta

A pesquisa da equipe do Recorded Future mostra que uma análise comportamental ainda ajuda a detectar bots. Os pesquisadores encontram um par deles, percebem algo especial em seu comportamento e, em seguida, procuram outras contas com padrões semelhantes. Isso ajuda a identificar outros robôs e a encontrar mais semelhanças que eles podem adicionar aos critérios de pesquisa para mapear outras contas usadas em campanhas adjacentes.

Todos os dias novos bots surgem com diferentes critérios comportamentais, por isso é um trabalho contínuo (e provavelmente infinito). Nem todos podem ser identificados apenas com um conjunto de padrões de comportamento, mas podemos usá-los para ajudar a mapear os envolvidos de determinadas redes de bots e oferecer suporte aos serviços de mídias sociais que podem desmantelá-las, tornando o mundo digital bem mais agradável.

Por último, é fundamental que todos os usuários de mídias sociais conheçam a existência dos bots e desconfiem deles.

Dicas