Ampliando el acceso más allá de las operaciones de información

Por y
jueves, 2 diciembre 2021

En octubre de 2018, publicamos el primer archivo público completo de datos relacionados con operaciones de información respaldadas por  Estados. Desde entonces, hemos compartido 37 sets de datos de campañas de manipulación en la plataforma atribuidas a Estados que se han originado en 17 países, abarcan más de 200 millones de Tweets y nueve terabytes de contenido multimedia. Más de 26.000 investigadores han accedido a estos sets de datos, lo que ha permitido un nivel sin precedentes de investigación empírica sobre los ataques a la integridad de la conversación en Twitter respaldados por Estados.

Siempre que nuestros equipos identifican y eliminan estas campañas; nos esforzamos por proporcionar actualizaciones oportunas, junto con datos completos, sin embargo, este año, debido a problemas técnicos y riesgos importantes en la seguridad física de nuestros empleados que plantean ciertas divulgaciones, solo hemos proporcionado una actualización. Durante este tiempo, hemos estado trabajando para identificar un camino sostenible, sin comprometer nuestro objetivo de brindar una transparencia significativa.

Hoy, además de divulgar ocho conjuntos de datos adicionales en nuestro archivo, compartimos una actualización sobre lo que hemos aprendido de estos esfuerzos y cómo buscaremos promover la transparencia basada en datos en 2022 y años posteriores.

Lo que hemos aprendido hasta ahora

  • La transparencia significativa comienza con el acceso a los datos. Los datos que publicamos sobre las operaciones de información permiten a los investigadores comprender no solo que se llevó a cabo una campaña de manipulación de la plataforma y que Twitter la eliminó, sino también qué narrativas pretendían promover esa campaña y cuán ampliamente se difundieron en Twitter. El acceso a contenido en bruto, en lugar de muestras limitadas e información agregada, es de suma importancia.
  • Los datos sin procesar no son accesibles para todos. Muchos de los sets de datos que publicamos incluyen cientos de miles de Tweets y gigabytes de contenido multimedia. Procesar esta información a menudo requiere herramientas y capacidades avanzadas. Los académicos, los investigadores independientes, las ONGs y los periodistas de datos desempeñan un papel clave en la traducción de datos sin procesar para traducirlos en información significativa, además de proporcionar un contexto crítico para comprender cómo operan los malos actores. Las asociaciones del Stanford Internet Observatory y el Australian Strategic Policy Institute han ayudado a poner estos conjuntos de datos en un contexto analítico y narrativo, junto con una conferencia dedicada al estudio de estos datos que desarrollamos junto con el Instituto Carnegie.
  • La atribución segura no siempre es posible. Nuestro enfoque de transparencia se ha centrado en la actividad que podemos atribuir con seguridad a un actor estatal. Los comportamientos emergentes, incluyendo el uso de proveedores de desinformación contratados y el aumento de la seguridad operativa, a veces hacen que tener seguridad en las atribuciones basándose únicamente en los propios datos de Twitter sea imposible. Esto no hace que la actividad en cuestión sea menos importante de analizar, pero nuestras políticas actualmente impiden la divulgación de conjuntos de datos en estos casos. Además, el acceso a estos datos, sin atribución, puede permitir a los expertos reconstruir operaciones en múltiples plataformas y servicios que no es posible hacer por una sola empresa.
  • Las operaciones de información son solo un área de interés público. Hemos proporcionado un nivel de transparencia sin precedentes sobre las operaciones de información respaldadas por Estados, dado su severo impacto en el discurso público en todo el mundo. Como han señalado Camille François y evelyn douek, otros dominios de moderación de contenido de igual interés público no reciben el mismo tratamiento.

Hacia dónde nos dirigimos en 2022

Con estas lecciones en mente, así como riesgos vinculados a estas divulgaciones que vemos para la seguridad física de nuestros empleados en todo el mundo, estamos cambiando nuestro enfoque para proveer una transparencia ampliada sobre nuestras acciones de moderación de contenido. Esto es lo que verán en los próximos meses:

A principios de 2022, lanzaremos el Consorcio de Investigación de Moderación de Twitter (TMRC), un grupo global de expertos académicos, de sociedad civil, ONGs y de periodismo de todo el mundo, enfocados en temas de gobernanza de plataformas.

  • La membresía en el consorcio se otorgará a grupos o individuos con:

– Antecedentes comprobados de investigación sobre temas de moderación de contenido e integridad (o afiliación con un grupo que realiza dicha investigación, como una universidad, un laboratorio de investigación o un periódico)

– Planes y sistemas adecuados para salvaguardar la privacidad y seguridad de los datos proporcionados por el Consorcio.

  • Seremos completamente públicos sobre los estándares utilizados para determinar la membresía en el Consorcio, y tendremos un sesgo hacia la inclusión y el acceso, particularmente para investigadores emergentes e investigadores de comunidades y partes del mundo históricamente subrepresentadas.
  • Twitter no ejercerá ningún control o juicio sobre los hallazgos o áreas de enfoque de la investigación producida con estos datos por los miembros del Consorcio.
  • Los más de 200 investigadores de todo el mundo con acceso existente a nuestros sets de datos de operaciones de información sin filtros serán invitados a unirse al consorcio a través de un proceso acelerado. Otras personas e instituciones que califiquen pueden postularse. Compartiremos detalles adicionales sobre este proceso a principios de 2022 antes de cualquier divulgación al consorcio.
  • Proporcionaremos datos comprensibles sobre las campañas de manipulación de plataformas atribuidas a los miembros del Consorcio, quienes pueden optar independientemente por publicar sus hallazgos sobre la base de los datos que compartimos y de su propia investigación. Bajo este modelo, también comenzaremos a compartir datos sobre campañas de manipulación de plataforma para las cuales no hemos podido llegar a una atribución confiable a un actor Estatal, y campañas en las que no podemos brindar un acceso amplio debido a preocupaciones de seguridad de los empleados.

Más adelante, en 2022, compartiremos por primera vez datos  en otras áreas, incluyendo  desinformación, actividad dañina coordinada y seguridad.

Como parte de este cambio, descontinuaremos nuestras publicaciones de conjuntos de datos totalmente públicos, dando prioridad de entrega al Consorcio. Los conjuntos de datos existentes seguirán estando disponibles para su descarga de forma indefinida, y la disponibilidad de datos públicos, incluyendo el acceso gratuito a nuestra API (que incluye el archivo completo de Tweets), permanecerán disponibles.

Nuestros esfuerzos en este espacio están respaldados por nuestra Política de privacidad, que durante mucho tiempo ha informado a las personas cómo podemos usar los datos que comparten con nosotros. Esto incluye compartir o divulgar información si creemos que es razonablemente necesaria para proteger la seguridad o la integridad de nuestra plataforma, incluso para ayudar a prevenir el spam, el abuso o los actores maliciosos, o para explicar por qué hemos eliminado contenido o cuentas de nuestros servicios. Instamos a los responsables de políticas a incorporar protecciones para este tipo de intercambio de datos en las leyes que rigen la privacidad de los datos.

La transparencia es fundamental para nuestra misión. Nuestro objetivo con estos cambios es brindar más transparencia sobre más problemas, mientras lidiamos con los considerables desafíos de seguridad e integridad en este espacio. Continuaremos aprendiendo e iterando sobre nuestro enfoque a lo largo del tiempo y compartiremos esos hallazgos públicamente a lo largo del camino.

Este Tweet no está disponible
Este Tweet no está disponible.