Ciberacoso en redes sociales: avances y retos para predecirlo mediante deep learning

 15-07-2019
Belem Ruiz
   
Portada | Internacional
Foto: Foto: Pixabay

Foto: Foto: Pixabay

Antes de la llegada de la era de las redes sociales, las interacciones sociales se daban dentro de pequeños límites culturales, incluidas las ubicaciones geoespaciales; ahora, gracias a Facebook, YouTube, Twitter y demás plataformas similares, las limitaciones temporales y espaciales de las comunicaciones han sido superadas. Rápidamente las redes sociales se convirtieron en populares medios para difundir información, mas hoy día también son indebidamente usadas como una herramientas de ciberacoso. Investigadores de diferentes partes del mundo, vía aprendizaje automático (deep learning), trabajan en el desarrollo de soluciones encaminadas a erradicar este tipo de ciberviolencia.

Un grupo internacional de 10 investigadores adscritos a diversas instituciones (Universidad de Malaya, Malasia; Universidad Rey Khalid Abha, Arabia Saudita: Universidad Sukkur IBA, Pakistán; Colegio Federal de Educación, Nigeria; Universidad Comsats Islamabad, Pakistán) realizó un estudio sobre los avances en el desarrollo de algoritmos de deep learning orientados a predecir el ciberacoso en redes sociales mediante el análisis de macrodatos; además identificaron los principales problemas relacionados con la construcción de modelos de predicción del ciberacoso en tales plataformas digitales. De acuerdo con los especialistas, estos son los problemas que presentan los avances para predecir el ciberacoso mediante tecnologías cognitivas:

1. La definición de ciberacoso. No es fácil para los algoritmos determinar si una publicación encaja o no en la actual definición de ciberacoso; ¿cómo medir el "comportamiento agresivo reiterado a través del tiempo"?, ¿cómo medir el desequilibrio de poder y el que "una víctima no pueda defenderse a sí misma"?

2. La recolección de datos. Muchos de los algoritmos se basan en un filtrado por palabras introducidas por los programadores, pero esto introduce complejos sesgos en el entrenamiento del programa, se dejan fuera casos de ciberacoso; debe garantizarse la recolección de una muestra representativa.

3. La ingeniería de características. Los avances hasta ahora realizados han omitido importantes características esenciales del ciberacoso, como el dinamismo en el uso de las palabras por parte de los ciberacosadores en las diversas redes sociales, en adición a otros comportamientos tanto de víctimas como de victimarios.

4. La selección de algoritmos de aprendizaje profundo. Es difícil decidir qué clasificador funciona mejor para un conjunto de datos específico a la hora de entrenar los algoritmos; estos son entrenados con base en un conjunto de características propuestas, ¿cómo determinar las mejores para cada caso en particular?

5. La desequilibrada distribución de clases. Si se asume que las publicaciones de ciberacoso serán minoría y en consecuencia se alimenta al algoritmo con menos ejemplos de este tipo, puede prevenir la posterior correcta clasificación de la naturaleza de los contenidos analizados.

6. La selección de la métrica de evaluación. La selección se basa en la naturaleza de datos etiquetados manualmente; una métrica de evaluación inadecuada puede aparentar un mejor desempeño según la métrica de evaluación seleccionada, los resultados pueden ser contradictorios y no reflejar la realidad estudiada.

Por otro lado, señalan los autores, los retos a superar por el deep learning orientado a detectar publicaciones de ciberacoso en redes sociales no son menos difíciles de abordar: características de los datos humanos (¿cómo superar la subjetividad?), efecto de la cultura (el concepto de ciberacoso está en constante evolución), dinámicas lingüísticas (jergas, abreviaciones y otros recursos), predicción de cuán grave es el ciberacoso (implicaciones sociales y psicológicas entran en juego), aprendizaje automático no supervisado (sigue siendo difícil encontrar patrones entre dos clases utilizando agrupaciones no supervisadas). "Los algoritmos de aprendizaje automático tradicionales carecen de la capacidad para manejar los macrodatos del ciberacoso", concluyen los especialistas.




DESCARGA LA NOTA  SÍGUENOS EN GOOGLE NEWS