Ampliando el acceso más allá de las operaciones de información

Por y
jueves, 2 diciembre 2021

Nota: Este blog se publicó originalmente el 2 de diciembre de 2021 y se actualizó por última vez el 24 de agosto de 2022 para incluir la información más reciente sobre nuestro enfoque.

En octubre de 2018, publicamos el primer archivo público completo de datos relacionados con operaciones de información respaldadas por  Estados. Desde entonces, hemos compartido 37 sets de datos de campañas de manipulación en la plataforma atribuidas a Estados que se han originado en 17 países, abarcan más de 200 millones de Tweets y nueve terabytes de contenido multimedia. Más de 26.000 investigadores han accedido a estos sets de datos, lo que ha permitido un nivel sin precedentes de investigación empírica sobre los ataques a la integridad de la conversación en Twitter respaldados por Estados.

Siempre que nuestros equipos identifican y eliminan estas campañas; nos esforzamos por proporcionar actualizaciones oportunas, junto con datos completos, sin embargo, este año, debido a problemas técnicos y riesgos importantes en la seguridad física de nuestros empleados que plantean ciertas divulgaciones, solo hemos proporcionado una actualización. Durante este tiempo, hemos estado trabajando para identificar un camino sostenible, sin comprometer nuestro objetivo de brindar una transparencia significativa.

Hoy, además de divulgar ocho conjuntos de datos adicionales en nuestro archivo, compartimos una actualización sobre lo que hemos aprendido de estos esfuerzos y cómo buscaremos promover la transparencia basada en datos en 2022 y años posteriores.

Lo que hemos aprendido hasta ahora

  • La transparencia significativa comienza con el acceso a los datos. Los datos que publicamos sobre las operaciones de información permiten a los investigadores comprender no solo que se llevó a cabo una campaña de manipulación de la plataforma y que Twitter la eliminó, sino también qué narrativas pretendían promover esa campaña y cuán ampliamente se difundieron en Twitter. El acceso a contenido en bruto, en lugar de muestras limitadas e información agregada, es de suma importancia.
  • Los datos sin procesar no son accesibles para todos. Muchos de los sets de datos que publicamos incluyen cientos de miles de Tweets y gigabytes de contenido multimedia. Procesar esta información a menudo requiere herramientas y capacidades avanzadas. Los académicos, los investigadores independientes, las ONGs y los periodistas de datos desempeñan un papel clave en la traducción de datos sin procesar para traducirlos en información significativa, además de proporcionar un contexto crítico para comprender cómo operan los malos actores. Las asociaciones del Stanford Internet Observatory y el Australian Strategic Policy Institute han ayudado a poner estos conjuntos de datos en un contexto analítico y narrativo, junto con una conferencia dedicada al estudio de estos datos que desarrollamos junto con el Instituto Carnegie.
  • La atribución segura no siempre es posible. Nuestro enfoque de transparencia se ha centrado en la actividad que podemos atribuir con seguridad a un actor estatal. Los comportamientos emergentes, incluyendo el uso de proveedores de desinformación contratados y el aumento de la seguridad operativa, a veces hacen que tener seguridad en las atribuciones basándose únicamente en los propios datos de Twitter sea imposible. Esto no hace que la actividad en cuestión sea menos importante de analizar, pero nuestras políticas actualmente impiden la divulgación de conjuntos de datos en estos casos. Además, el acceso a estos datos, sin atribución, puede permitir a los expertos reconstruir operaciones en múltiples plataformas y servicios que no es posible hacer por una sola empresa.
  • Las operaciones de información son solo un área de interés público. Hemos proporcionado un nivel de transparencia sin precedentes sobre las operaciones de información respaldadas por Estados, dado su severo impacto en el discurso público en todo el mundo. Como han señalado Camille François y evelyn douek, otros dominios de moderación de contenido de igual interés público no reciben el mismo tratamiento.

Hacia dónde nos dirigimos en 2022

Con estas lecciones en mente, así como riesgos vinculados a estas divulgaciones que vemos para la seguridad física de nuestros empleados en todo el mundo, estamos cambiando nuestro enfoque para proveer una transparencia ampliada sobre nuestras acciones de moderación de contenido. Esto es lo que verán en los próximos meses:

A principios de 2022, lanzaremos el Consorcio de Investigación de Moderación de Twitter (TMRC), un grupo global de expertos académicos, de sociedad civil, ONGs y de periodismo de todo el mundo, enfocados en temas de gobernanza de plataformas.

  • La membresía en el consorcio se otorgará a grupos o individuos con:

– Antecedentes comprobados de investigación sobre temas de moderación de contenido e integridad (o afiliación con un grupo que realiza dicha investigación, como una universidad, un laboratorio de investigación o un periódico)

– Planes y sistemas adecuados para salvaguardar la privacidad y seguridad de los datos proporcionados por el Consorcio.

  • Seremos completamente públicos sobre los estándares utilizados para determinar la membresía en el Consorcio, y tendremos un sesgo hacia la inclusión y el acceso, particularmente para investigadores emergentes e investigadores de comunidades y partes del mundo históricamente subrepresentadas.
  • Twitter no ejercerá ningún control o juicio sobre los hallazgos o áreas de enfoque de la investigación producida con estos datos por los miembros del Consorcio.
  • Los más de 200 investigadores de todo el mundo con acceso existente a nuestros sets de datos de operaciones de información sin filtros serán invitados a unirse al consorcio a través de un proceso acelerado. Otras personas e instituciones que califiquen pueden postularse. Compartiremos detalles adicionales sobre este proceso a principios de 2022 antes de cualquier divulgación al consorcio.
  • Proporcionaremos datos comprensibles sobre las campañas de manipulación de plataformas atribuidas a los miembros del Consorcio, quienes pueden optar independientemente por publicar sus hallazgos sobre la base de los datos que compartimos y de su propia investigación. Bajo este modelo, también comenzaremos a compartir datos sobre campañas de manipulación de plataforma para las cuales no hemos podido llegar a una atribución confiable a un actor Estatal, y campañas en las que no podemos brindar un acceso amplio debido a preocupaciones de seguridad de los empleados.

Más adelante, en 2022, compartiremos por primera vez datos  en otras áreas, incluyendo  desinformación, actividad dañina coordinada y seguridad.

Como parte de este cambio, descontinuaremos nuestras publicaciones de conjuntos de datos totalmente públicos, dando prioridad de entrega al Consorcio. Los conjuntos de datos existentes seguirán estando disponibles para su descarga de forma indefinida, y la disponibilidad de datos públicos, incluyendo el acceso gratuito a nuestra API (que incluye el archivo completo de Tweets), permanecerán disponibles.

Nuestros esfuerzos en este espacio están respaldados por nuestra Política de privacidad, que durante mucho tiempo ha informado a las personas cómo podemos usar los datos que comparten con nosotros. Esto incluye compartir o divulgar información si creemos que es razonablemente necesaria para proteger la seguridad o la integridad de nuestra plataforma, incluso para ayudar a prevenir el spam, el abuso o los actores maliciosos, o para explicar por qué hemos eliminado contenido o cuentas de nuestros servicios. Instamos a los responsables de políticas a incorporar protecciones para este tipo de intercambio de datos en las leyes que rigen la privacidad de los datos.

La transparencia es fundamental para nuestra misión. Nuestro objetivo con estos cambios es brindar más transparencia sobre más problemas, mientras lidiamos con los considerables desafíos de seguridad e integridad en este espacio. Continuaremos aprendiendo e iterando sobre nuestro enfoque a lo largo del tiempo y compartiremos esos hallazgos públicamente a lo largo del camino.

Este Tweet no está disponible
Este Tweet no está disponible.

7 de junio, 2022

Este día, inauguramos el Consorcio de Investigación de Moderación de Twitter a un grupo limitado de investigadores. Usaremos este período inicial para recopilar aprendizajes y ajustar el diseño del programa, cuando se requiera, previo a nuestro próximo lanzamiento al público en general. Los comentarios de estos investigadores ayudarán a dar forma e informar sobre nuestra labor.

Durante este período, la membresía estará abierta a los solicitantes que se les haya  otorgado acceso a nuestros conjuntos de datos de operaciones de información durante divulgaciones anteriores. Los investigadores con acceso previo pueden postularse nuevamente al Consorcio durante esta etapa y serán evaluados de acuerdo con los siguientes criterios actualizados:

  • Contar con una afiliación institucional principal a una organización de investigación académica, periodística, sin fines de lucro o de la sociedad civil. Si son estudiantes, deben ser estudiantes de nivel de maestría o doctorado; los estudiantes de pregrado no son elegibles en este momento.
  • Tener experiencia previa y habilidades relevantes para el análisis basado en datos. Los conjuntos de datos del consorcio se comparten principalmente como archivos JSON y requieren habilidades técnicas para ser analizados.
  • Demostrar un caso de uso de investigación de interés público específico para los datos proporcionados por el Consorcio. (“Caso de uso de investigación de interés público”, lo cual significa una investigación no comercial con fines periodísticos, académicos o sin fines de lucro/sociedad civil).
  • Estar dotado de planes y sistemas que cumplan con los estándares de la industria para salvaguardar la privacidad y seguridad de los datos proporcionados por el Consorcio. Los miembros del consorcio deben firmar un acuerdo de uso de datos.

Más adelante este año, abriremos la postulación de membresía del Consorcio al público en general y compartiremos los aprendizajes clave obtenidos durante el período beta.

Como hemos dicho anteriormente, la transparencia es fundamental para nuestro trabajo. A través de este enfoque actualizado, nuestro objetivo es compartir más sobre lo que estamos viendo en el servicio de Twitter, mientras abordamos los desafíos de seguridad e integridad que acompañan a estas divulgaciones. Más adelante, compartiremos información sobre otras áreas de la política, incluida la desinformación, la actividad dañina coordinada y la seguridad. Hay más por venir.

Este Tweet no está disponible
Este Tweet no está disponible.

24 de agosto, 2022

Compartimos una actualización más de nuestro programa del Consorcio de Investigación de Moderación de Twitter (TMRC, por sus siglas en inglés). En los próximos días, nuestros socios globales de TMRC (el Observatorio de Internet de Stanford, el Instituto Australiano de Política Estratégica y Cazadores de Fake News) publicarán una investigación independiente sobre los últimos conjuntos de datos de operaciones de información de Twitter. Estos 15 conjuntos de datos incluyen campañas de manipulación de la plataforma que se originan en las Américas, Asia Pacífico (APAC), Europa, Medio Oriente y África del Norte (EMEA) y África Subsahariana (SSA).

Como señalamos el año anterior (líneas más arriba), a partir de ahora, daremos prioridad a compartir información de operaciones de datos con el Consorcio. Mientras continuamos compartiendo datos con investigadores sobre las redes que eliminamos, incluida la evaluación de Twitter del presunto país de origen, según las señales técnicas que observamos, ya no proporcionaremos información de atribución específica. Es decir, no divulgaremos públicamente si una operación de información fue realizada por un actor estatal específico u otro actor.

Nuestro objetivo es mantener la transparencia sobre la actividad que identificamos en Twitter, al mismo tiempo que abordamos desafíos de seguridad e integridad, dignos de consideración, los cuales conllevan las divulgaciones de este tipo. Las operaciones de información también son cada vez más difíciles de atribuir a actores específicos: este cambio nos permite divulgar datos de un conjunto más amplio de campañas coordinadas. Además, este cambio permitirá a los investigadores unir operaciones en múltiples plataformas y servicios, más allá de lo que es posible con una sola plataforma.

Continuamos teniendo aprendizajes de la primera fase del acceso anticipado. Estamos enfocados en desarrollar un grupo global de miembros del Consorcio y, hasta la fecha, hemos aceptado solicitudes de investigadores de todo el mundo. Más adelante, abriremos el proceso de solicitud de TMRC a un grupo todavía más amplio de investigadores este mismo año.

En el futuro, tenemos la intención de compartir datos sobre una gama más amplia de áreas de políticas de Seguridad e Integridad.

Este Tweet no está disponible
Este Tweet no está disponible.