Empresa

Ampliando o acesso a dados além das operações de informação

Por e
quinta-feira, 2 dezembro 2021

Nota editorial: este blog foi publicado pela primeira vez em 2 de dezembro de 2021 e atualizado mais recentemente em 23 de agosto de 2022 para incluir mais informações sobre nossa abordagem.

Em outubro de 2018, publicamos o primeiro arquivo público abrangente de dados relacionados a operações de informação apoiadas pelo Estado. Desde então, compartilhamos 37 conjuntos de dados de campanhas de manipulação de plataforma provenientes de 17 países, abrangendo mais de 200 milhões de Tweets e nove terabytes de mídia. Mais de 26 mil pesquisadores acessaram esses conjuntos de dados, empoderando um nível sem precedentes de pesquisa empírica sobre ataques apoiados por Estados à integridade da conversa no Twitter.

Nos esforçamos para fornecer atualizações em momentos oportunos e dados abrangentes, sempre que nossas equipes identificam e removem essas campanhas. Neste ano, no entanto, devido a problemas técnicos e riscos significativos à segurança física de nossos funcionários por conta de determinadas divulgações, fornecemos apenas uma atualização. Durante esse período, trabalhamos para identificar um novo caminho sustentável a seguir, sem comprometer nossos objetivos de fornecer transparência.

Hoje, além de divulgar oito conjuntos de dados adicionais em nosso arquivo, estamos compartilhando uma atualização sobre o que aprendemos com esses esforços e como pretendemos promover a transparência orientada por dados a partir de 2022.

O que aprendemos até agora

  • Transparência significativa começa com o acesso aos dados. Os dados que publicamos sobre as operações de informação permitem que os pesquisadores entendam não apenas que uma campanha de manipulação da plataforma ocorreu e que o Twitter a removeu – mas precisamente quais narrativas essa campanha pretendia emplacar e quão amplamente elas se espalharam no Twitter. O acesso ao conteúdo bruto, em vez de amostras limitadas e informações agregadas, é importante.
  • Dados brutos não são acessíveis a todos. Muitos dos conjuntos de dados que lançamos incluem centenas de milhares de Tweets e gigabytes de mídia. O processamento dessas informações geralmente requer ferramentas e recursos avançados. Acadêmicos, pesquisadores independentes, ONGs e jornalistas de dados desempenham um papel fundamental na tradução de dados brutos em percepções significativas, além de fornecer um contexto crítico para entender como os maus atores operam. Parcerias com o Stanford Internet Observatory e o Australia Strategic Policy Institute ajudaram a colocar esses conjuntos de dados em um contexto analítico e narrativo, juntamente com uma conferência dedicada ao estudo desses dados que realizamos em conjunto com o Carnegie Institute.
  • Atribuir campanhas a Estados de forma confiável nem sempre é possível. Nossa abordagem de transparência se concentrou em atividades que podemos atribuir com certeza a um ator estatal. Comportamentos emergentes, incluindo o uso de fornecedores de desinformação contratados e aumento da segurança operacional, às vezes impossibilitam a atribuição confiável de uma campanha apoiada por Estados com base apenas nos próprios dados do Twitter. Isso não torna a análise da atividade em questão menos importante, mas nossas políticas atualmente impedem a divulgação do conjunto de dados nesses casos. Além disso, o acesso a esses dados, sem atribuição, pode permitir que especialistas reúnam operações em várias plataformas e serviços além de apenas uma empresa.
  • Operações de informação são apenas uma área de interesse público. Fornecemos um nível de transparência sem precedentes sobre as operações de informações apoiadas pelo Estado devido ao seu grave impacto no discurso público em todo o mundo. Como Camille François e Evelyn Douek apontaram, outros domínios de moderação de conteúdo de igual interesse público não recebem o mesmo tratamento.

Para onde vamos em 2022

Com essas lições em mente, bem como os riscos emergentes que vemos para a segurança física de nossos funcionários vinculados a possíveis divulgações em todo o mundo, estamos mudando nossa abordagem como parte de um esforço para continuar a fornecer maior transparência sobre nossas ações de moderação de conteúdo. Nos próximos meses, você verá:

No início de 2022, lançaremos o Consórcio de Pesquisa e Moderação do Twitter (TMRC) — um grupo global de especialistas da academia, sociedade civil, ONGs e jornalismo que estudam questões de governança da plataforma.

  • A adesão ao Consórcio será concedida a grupos ou indivíduos com:

- Histórico comprovado de pesquisa sobre temas de moderação e integridade de conteúdo (ou afiliação a um grupo que faz essa pesquisa, como uma universidade, laboratório de pesquisa ou jornal).

- Planos e sistemas adequados para proteger a privacidade e a segurança dos dados fornecidos pelo Consórcio.

  • Seremos totalmente transparentes sobre os padrões usados para determinar a participação no Consórcio e iremos buscar inclusão e acessibilidade, particularmente para pesquisadores emergentes e pesquisadores de comunidades e partes do mundo historicamente sub-representadas.
  • O Twitter não exercerá nenhum controle ou julgamento sobre as descobertas ou áreas de foco das pesquisas produzidas pelos membros do Consórcio usando esses dados.
  • Os mais de 200 pesquisadores em todo o mundo com acesso atual aos nossos conjuntos de dados de operações de informações serão convidados a participar do Consórcio por meio de um processo acelerado. Outras pessoas e instituições qualificadas podem se inscrever. Compartilharemos detalhes adicionais sobre esse processo no início de 2022 antes de qualquer divulgação ao Consórcio.
  • Forneceremos dados abrangentes sobre campanhas de manipulação de plataforma atribuídas aos membros do Consórcio, que podem optar de forma independente por publicar suas descobertas com base nos dados que compartilhamos e em suas próprias pesquisas. Sob esse modelo, também começaremos a compartilhar dados sobre campanhas de manipulação de plataforma para as quais não conseguimos chegar a uma atribuição confiável a um ator estatal e campanhas em que não podemos fornecer acesso amplo devido a preocupações com a segurança dos funcionários.

No final de 2022, compartilharemos, pela primeira vez, dados igualmente abrangentes sobre outras áreas de políticas, incluindo informações enganosas, atividade prejudicial coordenada e segurança.

Como parte dessa mudança, descontinuaremos nossos lançamentos de conjuntos de dados totalmente públicos, priorizando o lançamento para o Consórcio. Os conjuntos de dados existentes continuarão disponíveis para download indefinidamente — e nossas ofertas de dados públicos, incluindo acesso gratuito às nossas APIs (incluindo o arquivo completo de Tweets), permanecem disponíveis.

Nossos esforços neste âmbito são sustentados por nossa Política de Privacidade, que há muito informa as pessoas sobre como podemos usar os dados que elas compartilham conosco. Isso inclui compartilhar ou divulgar informações se acreditarmos que é razoavelmente necessário para proteger a segurança ou a integridade de nossa plataforma, inclusive para ajudar a evitar spam, abuso ou agentes mal-intencionados, ou para explicar por que removemos conteúdo ou contas de nossos serviços. Conforme destacamos em nosso documento de posicionamento estabelecendo princípios para formuladores de políticas que elaboram novas regulações, pedimos aos formuladores de políticas que incluam proteções para esse tipo de compartilhamento de dados nas leis que regem a privacidade.

A transparência é fundamental para a nossa missão. Nosso objetivo com essas mudanças é fornecer mais transparência sobre mais assuntos, enquanto lidamos com os consideráveis desafios de segurança, proteção e integridade neste espaço. Continuaremos aprendendo e repetindo nossa abordagem ao longo do tempo e compartilhando essas descobertas publicamente ao longo do caminho.

7 de junho de 2022: Hoje, estamos abrindo o Consórcio de Pesquisa e Moderação do Twitter para um grupo limitado de pesquisadores. Usaremos esse período inicial para coletar aprendizados e fazer ajustes no programa, conforme necessário, antes de nosso próximo lançamento público. O feedback desses pesquisadores ajudará a moldar e dar mais informações sobre nosso trabalho.

Durante esse período, serão aceitos candidatos que tiveram acesso aos nossos conjuntos de dados de operação de informações durante as divulgações anteriores. Pesquisadores com acesso prévio poderão se candidatar novamente ao Consórcio durante esta fase, e serão avaliados de acordo com os critérios atualizados abaixo:

  • Mantenha uma afiliação institucional primária com uma organização de pesquisa acadêmica, jornalística, sem fins lucrativos ou da sociedade civil. Se forem alunos, devem ser de mestrado ou doutorado; estudantes de graduação são inelegíveis neste momento.
  • Ter experiência anterior e habilidades relevantes para análise orientada a dados. Os conjuntos de dados do Consórcio são compartilhados principalmente como arquivos JSON e exigem habilidades técnicas para serem analisados.
  • Demonstrar um caso de uso específico de pesquisa de interesse público para os dados fornecidos pelo Consórcio. (“Caso de uso de pesquisa de interesse público” significa pesquisa não comercial para fins jornalísticos, acadêmicos ou sem fins lucrativos / de interesse da sociedade civil).
  • Equipado com planos e sistemas padrão do setor para proteger a privacidade e a segurança dos dados fornecidos pelo Consórcio. Os membros deverão assinar um contrato de uso de dados.

Ainda neste ano, abriremos inscrições para participação no Consórcio para o público em geral e compartilharemos os principais aprendizados do período experimental. Como dissemos anteriormente, a transparência é fundamental para o nosso trabalho. Por meio dessa abordagem atualizada, pretendemos compartilhar mais sobre o que estamos vendo no Twitter, ao mesmo tempo em que abordamos os desafios de segurança, proteção e integridade que acompanham essas divulgações. No futuro, divulgaremos dados sobre outras áreas de políticas públicas, incluindo informações enganosas, atividades prejudiciais coordenadas e segurança. Em breve, mais atualizações.

23 de agosto de 2022: Estamos compartilhando uma atualização em nosso Consórcio de Pesquisa e Moderação do Twitter (TMRC). Nos próximos dias, nossos parceiros globais do TMRC – Stanford Internet Observatory, Australian Strategic Policy Institute e Cazadores de Fake News – publicarão pesquisas independentes sobre os mais recentes conjuntos de dados de operações de informação do Twitter. Esses 15 conjuntos de dados incluem campanhas de manipulação de plataforma com origem nas Américas, Ásia-Pacífico (APAC), Europa, Oriente Médio e Norte da África (EMEA) e África Subsaariana (SSA).

Conforme observamos no ano passado (veja acima), agora priorizaremos o compartilhamento de dados de operações de informação com o Consórcio. Embora continuemos a compartilhar dados com pesquisadores sobre as redes que removemos, incluindo informações técnicas sobre o suposto país de origem das operações de informação, não forneceremos mais informações de atribuição específicas – ou seja, não divulgaremos publicamente se uma operação de informação foi realizada por um ator estatal específico ou outro ator. Nosso objetivo é permanecermos transparentes sobre as atividades que identificamos no Twitter, ao mesmo tempo em que abordamos os desafios consideráveis ​​de segurança, proteção e integridade que acompanham divulgações desse tipo. As operações de informação também estão cada vez mais difíceis de atribuir a atores específicos – essa mudança nos permite divulgar dados de um conjunto mais amplo de campanhas coordenadas. Além disso, essa mudança permitirá que os pesquisadores reúnam operações em várias plataformas e serviços, além do que é possível com apenas uma plataforma.

Continuamos a extrair aprendizados do período inicial de acesso antecipado. Estamos focados no desenvolvimento de um grupo global de membros do Consórcio e, até o momento, aceitamos inscrições de pesquisadores de todo o mundo. Ainda este ano, abriremos o processo de inscrição no TMRC para um grupo mais amplo de pesquisadores.

No futuro, pretendemos compartilhar dados sobre uma gama mais ampla de áreas das políticas de Segurança e Integridade.

Este Tweet está indisponível
Este Tweet está indisponível.