“Tuvimos que leer y etiquetar 100.000 tuits sobre agresiones sexuales que eran aterradores”

Fernando Cucchietti, doctor en física y analista de datos

“Tuvimos que leer y etiquetar 100.000 tuits sobre agresiones sexuales que eran aterradores”

Bajo el hashtag #Cuéntalo, cerca de 790.000 mujeres compartieron sus historias de agresiones sexuales en Twitter a mediados de año.

Cuéntalo

Cuando el pasado 26 de abril se dio a conocer la sentencia del juicio de la Manada, un clamor popular de queja y de dolor llenó las calles del país e inundó las redes sociales. En Twitter, la periodista Cristina Fallarás lanzó la iniciativa #Cuéntalo y animó al resto de mujeres a denunciar las violaciones, agresiones y el acoso que habían sufrido.

El objetivo de este hashtag era demostrar que las agresiones sexuales son frecuentes y alentar a las mujeres a alzar la voz contra la violencia machista. Durante catorce días, casi 800.000 mujeres rompieron su silencio y llenaron la plataforma de testimonios.

Para que todos esos relatos no quedaran olvidados, un equipo de expertos de distintas disciplinas decidió recopilarlos y clasificarlos. Fernando Cucchietti, doctor en Física Cuántica e investigador del Centro de Supercomputación de Barcelona, es la persona que ha liderado el grupo encargado de recoger, limpiar y analizar los casi tres millones de tuits que se publicaron entre el 26 de abril y el 9 de mayo.

fercook_2

Fernando Cucchietti

¿Cuándo pasaste a formar parte de este proyecto?

Primero, Cristina Fallarás, los archivadores y el resto de personas que impulsaron la iniciativa recopilaron la mayor parte de las narraciones personales de las mujeres en Twitter. A mí me llamaron antes del verano para echarles una mano, porque ellos no disponían de la tecnología para tratar esos datos. Yo acepté de inmediato porque que quería que se perdieran todos esos testimonios de agresiones y abuso, que son una radiografía de lo que sufren las mujeres en algunas partes del mundo.

En total, eran 13 gigabytes de información, más de dos millones de tuits que, sobre papel, llenarían unos 100 libros. Los tuits vienen no solo con texto, sino también con 37 campos de metadatos (como usuario, localización, hora de creación, información sobre la usuaria), y el trabajo de mi equipo de diez personas era trasladar eso a bases de datos más estructuradas para poder hacer esquemas más sencillos.

¿Qué fue lo que más costó?

La geolocalización llevó mucho trabajo. Hay mucha gente que no la tiene activada en su cuenta, entonces la información sobre el lugar de origen de los tuits era muy poca. Así que tuve que desarrollar unas técnicas para identificar, a partir de lo que la gente escribe y cómo lo escribe, la región de origen. Un 30% eran ilocalizables y un 20% confusos, pero ese 50% restante era representativo de cómo se comportó el movimiento viral de país en país.

“En total, eran 13 gigabytes de información, más de dos millones de tuits que, sobre papel, llenarían unos 100 libros”, dice Cucchietti

Para clasificar los datos habéis desarrollado una herramienta propia.

Sí, primero empezamos a trabajar primero las estadísticas básicas (países, horas a las que habían escrito, cantidades y tipos de tuits), pero luego, para analizar los textos, desarrollamos una red neuronal a mano. Fue una tarea complicada porque tuvimos que leer y etiquetar manualmente unos 100.000 tuits de relatos sobre acoso y violaciones que eran aterradores, uno a uno, hasta que el algoritmo alcanzó una precisión respetable. En total fueron entre 100 y 120 horas de trabajo.

El problema fue que con el tiempo que teníamos y los datos que podíamos clasificar a mano, no podíamos distinguir con precisión la relación entre la víctima y el agresor, si eran parientes cercanos o un amigo o un desconocido. Tampoco podíamos discriminar entre diferentes tipos de agresiones sexuales. Así que terminamos con tres categorías automáticas: agresión física, agresión no física (como las verbales) y otros. Asimismo, otras categorías analizaban si se trataba de un testimonio o una expresión de apoyo con una barra de error bastante pequeña.

¿Cuál era el objetivo final?

Hacer una visualización de datos que tenía que cumplir unos requerimientos. Primero, que representase la magnitud del movimiento. Segundo, que #Cuéntalo fuese un espacio seguro donde las mujeres podían contar algo que quizás no se habían atrevido a hacer porque tienen miedo. Por último, que se pudiese acceder a cada historia de manera individual para no sepultar los relatos personales con cifras y estadísticas. Con esas ideas hicimos muchas pruebas y fue un trabajo muy intenso, al final logramos crear una página web y estamos bastante orgullosos.

Has comentado que etiquetasteis 10.000 tuits a mano, pero cada uno de ellos era un relato estremecedor.

Por eso fue durísimo hacerlo. Yo he realizado a lo largo de mi carrera muchos trabajos de limpieza de datos o etiquetación automática y, en general, uno logra abstraerse a un estado de zombi en el cual trabaja de manera automática. En este caso eso era imposible porque cada historia era desgarradora y leías tuits muy fuertes. Eran mujeres abriéndose por completo para contar lo más duro que han vivido nunca. En mi caso, yo leí unos 400 tuits pero algunos de mis compañeros leyeron más de 1.200.

Testimonios publicados en Twitter bajo el hashtag #Cuéntalo

Todos los del equipo de #Cuéntalo trabajaron durante meses y de forma voluntaria. ¿Lo compaginabas con tu empleo en el CSB?

Como tengo un horario flexible en el CSB me las arreglaba para dedicarle horas extras al proyecto. Nos veíamos después de la jornada para debatir sobre los aspectos técnicos. Fueron unas semanas sin parar.

¿Para qué se pueden emplear ahora estos datos analizados?

El propósito es que sirvan para cambiar ciertas cosas. Uno de los problemas es que muchas de las agresiones y las formas de acoso están normalizadas. Hay mujeres que no contaron nunca qué les había pasado porque se les decía que era normal o que ellas eran las culpables, que se lo habían buscado. Eso está muy enraizado. Se necesitan datos para que se vea que una mitad de la sociedad vive una realidad distinta a la de la otra mitad.

Nosotros ya no podemos continuar con el proyecto porque no podemos seguir dedicándole tantas horas de forma voluntaria. Pero vamos a cederle los datos a la Administración Pública porque les pueden ayudar contra la violencia machista.

“Hay mujeres que no contaron nunca qué les había pasado porque se les decía que era normal o que ellas eran las culpables”, sostiene el investigador

Según las cifras, un 3% de los tuits que se publicaron aquellos días en respuesta a los relatos desacreditaban a las víctimas y tachaban sus narraciones de falsas. ¿Cómo responderías a quienes dicen que estas historias no son verídicas?

Yo lo que me pregunto es por qué alguien se inventaría algo así. Las mujeres se ponen en una tesitura muy complicada al hacer público su dolor. Muchas de las mujeres luego borraron estos tuits porque empezaron a tener que dar explicaciones a sus amigos, en su trabajo… ¿Quién iba a querer mentir y decir que la han violado, agredido, maltratado, con el dolor y la vergüenza que eso acarrea? No son famosas, son personas con vidas normales, con familias. Nadie quiere fama por ser una mujer agredida o violada.

¿Y si las mujeres que luego borraron esos tuits quieren que se elimine sus historias de la web?

Queremos montar un mecanismo para que la gente que no quiere aparecer nos lo haga saber y podamos borramos. Porque es cierto que hay muchas personas que hablan en una red social y se creen que están en un espacio seguro, pero en realidad desconocen que estas redes sociales están monitoreadas y que todo lo que ahí vuelcan alguien lo guarda. Aunque no se pueda borrar el rastro en Twitter queremos que aquí sea posible.

¿Cómo pueden ayudar las redes sociales en la lucha contra la violencia machista?

Las redes sociales facilitan que todo el mundo pueda expresarse. Son herramientas muy potentes para armar movimientos sociales. Una comunicación instantánea, gratuita y global donde las mujeres pueden alzar la voz o encontrar testimonios donde verse reflejadas.

Los datos de #Cuéntalo

Los resultados, tras siete meses de trabajo voluntario de todos ellos, resultan abrumadores e inéditos. Estos son:

Estadísticas:

– 2.75 millones de tuits.

– 790 mil usuarias únicas.

– 160 mil tuits originales: aproximadamente 1 de cada 3 tuits es un testimonio (más de 50.000).

De estos testimonios:

– En 1 de cada 10 se relata un asesinato (9,8%).

– En 1 de cada 7 se relata una violación (14%).

– En 3 de cada 10 se relata agresión sexual (28%).

– En 1 de cada 6 se relata algo de maltrato (15,7%).

– En 1 de cada 3 se habla de acoso (35,5%)
– En 1 de cada 3 se menciona el miedo a salir, a andar sola, etc (29,5%).
– Se relataron más de 3.500 violaciones o agresiones sexuales a menores de 18 años.
– Se relataron más de 1.000 a menores de 12 años. Muchas de estas se relataron por primera vez.

Geográfico:

– 34% de los testimonios se escribieron desde España.

– 32% desde Argentina.

– 8% de Colombia.

– 5% de Chile y México

Fuente: SINC

Más información