Empresa

Operações de informação no Twitter: princípios, processo e divulgação

Por Yoel Roth
Quinta-feira, 13 Junho 2019

Em outubro de 2018, divulgamos o primeiro arquivo compilado de Tweets e mídias associado a operações de informação pública apoiada por Estados no Twitter. Desde a divulgação, milhares de pesquisadores de todo o mundo baixaram os dados, com mais de 30 milhões de Tweets e mais de 1 terabyte de mídias, usando nosso arquivo para conduzir suas próprias investigações e compartilhar suas percepções e análises com o mundo. Hoje, estamos adicionando seis novos conjuntos de dados ao nosso arquivo, abrangendo atividades coordenadas e apoiadas por Estados com origem em quatro jurisdições. Todas as contas foram removidas do Twitter.

Acreditamos que pessoas e organizações com as vantagens do poder institucional e que conscientemente abusam do nosso serviço não estão ajudando a avançar uma conversa saudável, mas trabalhando ativamente para enfraquecê-la. Ao tornar esses dados abertos e acessíveis, procuramos empoderar pesquisadores, jornalistas, governos e o público para aprofundar a compreensão de questões importantes que afetam a integridade da conversa pública no meio digital, especialmente em torno das eleições. Essa transparência é fundamental para nossa missão.

Anúncios de hoje

Irã (4.779 contas)
Os grupos de contas abaixo foram todos originados no Irã, e acreditamos que estão associados - ou diretamente apoiados - pelo governo iraniano. No entanto, os sinais e comportamentos de cada conjunto foram diferentes. Nós os dividimos da seguinte forma:

  • Grupo um (1.666 contas): removemos mais de 1.600 contas originárias do Irã. No total, essas contas Tweetaram quase 2 milhões de vezes. Foram Tweetados conteúdos de notícias globais, muitas vezes com um ângulo que beneficiou as visões diplomáticas e geoestratégicas do Estado iraniano. A manipulação da plataforma é uma violação das regras do Twitter.
  • Grupo dois (248 contas): além das 1.600 contas listadas acima, agimos em um segundo conjunto de mais de 200 contas originárias do Irã que estavam mais diretamente envolvidas em discussões relacionadas especificamente a Israel.
  • Grupo três (2.865 contas): recentemente, falamos sobre a ação para remoção de mais de 2.800 contas originadas no Irã. Essas contas se utilizaram de uma série de personas falsas para direcionar conversas sobre questões políticas e sociais no Irã e globalmente.

Rússia (4 contas)
Como parte de nossas investigações em andamento sobre atividades relacionadas à Agência de Pesquisa da Internet Russa (IRA), removemos quatro contas que acreditamos estarem associadas ao IRA. Essas remoções são resultado do maior compartilhamento de informação entre a indústria e da aplicação da lei. Para mais informações sobre a remoção de contas específicas do IRA em torno das eleições presidenciais dos EUA de 2016, clique aqui.

Espanha (130 contas)
No início deste ano, suspendemos 130 contas falsas originárias da Espanha. Estas contas foram diretamente associadas ao movimento de Independência Catalão, especificamente à Esquerda Republicana da Catalunha (partido político). Eles estavam envolvidos principalmente na divulgação de conteúdo sobre o Referendo Catalão. A rede inclui contas falsas que parecem ter sido criadas com a intenção de influenciar inorganicamente a conversa de maneiras politicamente vantajosas. Criar contas falsas é uma violação das Regras do Twitter.

Venezuela (33 contas)

Além de um conjunto de contas focado no mercado nacional anteriormente divulgado, essa é a segunda vez em que identificamos contas originárias da Venezuela que estavam envolvidas em manipulação da plataforma voltada para fora do país. Este grupo é composto por 33 contas adicionais diretamente relacionadas ao conjunto anterior, de 764 contas (publicadas no arquivo em janeiro). Embora houvesse indícios iniciais de que essas contas estavam associadas ao IRA, nossa análise posterior sugere que elas foram operadas por uma entidade comercial originária da Venezuela. Compartilharemos mais dados sobre esse grupo para atualizar o público sobre nossos esforços na atribuição das contas.

Também queremos aproveitar esta oportunidade para compartilhar nossos princípios e processos para futuras divulgações de arquivos. Abaixo estão as respostas para algumas das perguntas mais comuns que recebemos sobre como lidamos com as operações de informação no Twitter.

Quais são os princípios que orientam o Twitter neste trabalho?
Acreditamos que o Twitter tem a responsabilidade de proteger a integridade da conversa pública - incluindo a divulgação de informações sobre tentativas de manipular o Twitter para influenciar eleições e outras conversas cívicas de entidades apoiadas por Estados, nacionais ou estrangeiras. Acreditamos que o público e a comunidade de pesquisa são melhores informados por meio da transparência.

Como fazem isso?
Nossa equipe de Integridade do Site dedica-se a identificar e investigar a suspeita de manipulação da plataforma no Twitter, incluindo a potencial atividade apoiada pelo Estado. Em parceria com equipes de toda a empresa, utilizamos uma série de sinais e ferramentas proprietárias de código aberto para identificar quando a tentativa de manipulação coordenada pode estar ocorrendo, bem como os atores responsáveis por ela. Também trabalhamos com governos, autoridades e empresas parceiras para melhorar nossa compreensão dos envolvidos nas operações de informação e desenvolver uma estratégia holística para endereçar essa questão.

Como faço para acessar o arquivo completo de conteúdo e Tweets?
O arquivo público completo de conteúdo e Tweets está disponível em nossa Central de Integridade das Eleições.

Quem faz parte da equipe do Twitter que está trabalhando nessas questões?
Diversas equipes da empresa contribuem para nossos esforços de pesquisa, análise e investigação relacionados a operações de informação. Essas equipes incluem cientistas de dados, linguistas, analistas de políticas, cientistas políticos e especialistas técnicos em questões de abuso e antispam.

Quais políticas vocês aplicam e como reduzem o risco de suprimir a fala legítima dos partidos políticos?
Nossas políticas são focadas em comportamentos enganosos e de spam, e visam especificamente diferenciá-los entre comportamento manipulador coordenado e discurso legítimo de indivíduos e partidos políticos. As políticas que reforçamos com mais frequência neste contexto incluem:

  • Manipulação de plataforma e spam
  • Atividade coordenada
  • Contas falsas
  • Atividade atribuída
  • Distribuição de materiais hackeados
  • Evasão de suspensão

Aplicamos nossas políticas independentemente de quais sejam as organizações por trás das contas. Contudo, como abordamos abaixo, nossa decisão de divulgar conjuntos de dados relacionados a essas atividades depende da nossa capacidade de atribuí-las de forma definitiva.

Quais são os padrões para a divulgação?
Primeiro, como mencionado acima, apenas divulgamos conjuntos de dados associados a atividades mal-intencionadas coordenadas que podemos associar de forma confiável a atores estatais ou apoiados por Estados. Por questões de privacidade e segurança, não divulgamos informações sobre pessoas ou contas não associadas a um autor estadual.

Em segundo lugar, dados os desafios da atribuição, exigimos associações claras e verificáveis entre as contas que identificamos e os atores estatais ou apoiados por Estados. Embora nossas regras sejam aplicadas de maneira proativa e em grande escala, a divulgação de conjuntos de dados exige evidências adicionais de atividades coordenadas e apoiadas por Estados.

Finalmente, verificamos rigorosamente a qualidade dos conjuntos de dados na tentativa de eliminar possíveis falsos positivos causados por comprometimentos de contas ou erros analíticos. Erros podem acontecer, e fazemos o melhor possível para evitar isso em todas as etapas de nossas investigações. Esse processo leva tempo.

Como o Twitter decide o momento de divulgar os conjuntos de dados?
O tempo varia. Se - e quando - identificarmos atividades maliciosas no Twitter, a prioridade é aplicar nossas regras e remover contas envolvidas em tentativas de manipular a conversa pública. Após essas ações, realizamos investigações minuciosas das contas e indivíduos envolvidos. Essa análise pode levar dias ou meses - e, em alguns casos, aplicações subsequentes das regras podem nos permitir fazer a atribuição de atividades que sancionamos no passado. Apenas divulgamos conjuntos de dados depois de determinarmos a atribuição das contas e de concluir todas as investigações aplicáveis. Nós também notificamos proativamente as autoridades, nossos parceiros e outras agências estatais relevantes.

Por que o foco apenas em atores afiliados a Estados?
Quando temos evidências significativas para indicar que as entidades afiliadas ao Estado estão conscientemente tentando manipular e distorcer a conversa pública, acreditamos que ela deve ser divulgada por uma questão de interesse público. Pessoas e organizações com as vantagens do poder institucional e que conscientemente abusam do nosso serviço não fazem avançar uma conversa pública saudável, mas sim trabalhando ativamente para enfraquecê-la. Isso é uma violação dos princípios, políticas e da missão da nossa empresa para servir ao discurso público.

Vocês desafiam milhares de contas por semana pelo engajamento na manipulação da plataforma. Por que não divulgar informações sobre eles?

Nós divulgamos. Duas vezes por ano, compartilhamos informações sobre nossas ações para detectar e impedir a manipulação da plataforma e spam no Relatório de Transparência do Twitter. Nosso objetivo ao divulgar conjuntos de dados adicionais relacionados a atividades maliciosas apoiadas pelo Estado no Twitter é especificamente permitir que sejam feitas pesquisas que melhorem o entendimento público das operações de informação. Embora outras formas de manipulação de plataforma e spam possam eventualmente ser envolvidas nessas operações, não divulgamos dados específicos (como Tweets) sobre essas atividades, a menos que eles sejam diretamente associados por indicadores técnicos e claros a uma campanha específica atribuída por um ator do Estado. No entanto, temos uma API pública que permite aos pesquisadores investigar um pequeno subconjunto de Tweets para aumentar a conscientização pública sobre a conversa no Twitter.

E pesquisas que vejo sobre o Twitter e "bots"?
Pesquisas que usam nossa API pública e não são revisadas por pares podem, com frequência, ser profundamente falhas. Vemos muitas pesquisas comercialmente orientadas e não revisadas por pares que fazem avaliações abrangentes de comportamentos de contas usando apenas sinais públicos, como localização (se citada), conteúdo da conta, com que frequência uma conta Tweeta e as contas que ela segue. Para sermos claros: nenhum desses indicadores é suficiente para determinar definitivamente a atribuição a uma entidade estatal. Procurar por contas semelhantes às divulgadas em nossos arquivos é uma abordagem igualmente equivocada, considerando que muitos dos maus atores imitam contas legítimas para parecerem críveis. Essa abordagem muitas vezes captura erroneamente vozes legítimas que compartilham um ponto de vista político específico com o qual alguém pode não concordar.

Trabalhamos com milhares de sinais e comportamentos para conduzir nossa análise e investigação. Além disso, nenhum dos nossos trabalhos preventivos para desafiar contas de manipulação da plataforma (até 8, 10 milhões de contas por semana) é visível na pequena amostra disponível em nossa API pública. Antes de se envolver neste tipo de pesquisa e fazer essas reivindicações, normas éticas devem ser consideradas. Fazer o contrário não aumenta o conhecimento público, mas arrisca a minar profundamente a confiança no debate e na conversa pública.

Para mais informações sobre nosso arquivo de operações de informação, visite nosso site de Integridade das Eleições e acompanhe as conversas em @Policy e @TwitterSafety.

Este Tweet está indisponível
Este Tweet está indisponível.
@yoyoel‎

Yoel Roth

‎@yoyoel‎‎ verified

Head of Site Integrity

Só no Twitter