El último robo-nag de Twitter marcará el lenguaje “dañino” antes de publicar

Un bocadillo de diálogo de dibujos animados lleno de malas palabras indistintas se ha difuminado junto a un pájaro cantor muy pequeño.
Agrandar / Antes de tuitear, es posible que te pregunten si pretendías ser tan grosero.

¿Quiere saber exactamente qué define como “malo” la flota de Twitter de robots de análisis de diccionarios y peinadores de texto? A partir de ahora, tendrá acceso instantáneo a esos datos, al menos, siempre que un moderador automático severo diga que no está twitteando cortésmente.

El miércoles, los miembros del equipo de diseño de productos de Twitter confirmaron que un nuevo aviso automático comenzará a implementarse para todos los usuarios de Twitter, independientemente de la plataforma y el dispositivo, que se activa cuando el lenguaje de una publicación cruza el umbral de Twitter de “lenguaje potencialmente dañino u ofensivo”. Esto sigue una serie de pruebas de usuario limitadas de los avisos a partir de mayo del año pasado. Pronto, cualquier tweet moderado por robo será interrumpido con un aviso que preguntará: “¿Quieres revisar esto antes de tuitear?”

Una muestra de captura de pantalla de cómo se verá el aviso en acción.  La función parece apuntar específicamente a las respuestas en el sitio.
Agrandar / Una muestra de captura de pantalla de cómo se verá el aviso en acción. La función parece apuntar específicamente a las respuestas en el sitio.

Las pruebas anteriores de esta función, como era de esperar, tuvieron su parte de problemas. “Los algoritmos que impulsan [warning] los mensajes tuvieron dificultades para captar los matices en muchas conversaciones y, a menudo, no diferenciaban entre lenguaje potencialmente ofensivo, sarcasmo y bromas amistosas “, afirma el anuncio de Twitter. La publicación de noticias aclara que los sistemas de Twitter ahora dan cuenta, entre otras cosas, de la frecuencia con la que dos cuentas interactuar entre sí, es decir, probablemente recibiré una bandera por enviar malas palabras e insultos a una celebridad con la que nunca hablo en Twitter, pero probablemente estaría libre de enviar esas mismas frases a través de Twitter a amigos o colegas de Ars.

Además, Twitter admite que sus sistemas anteriormente necesitaban actualizaciones para “tener en cuenta situaciones en las que el lenguaje puede ser reclamado por comunidades subrepresentadas y utilizado de manera no dañina”. Esperamos que los puntos de datos utilizados para hacer esas determinaciones no lleguen tan lejos como para verificar la foto de perfil de una cuenta de Twitter, especialmente porque las cuentas de trolls generalmente usan imágenes falsas o robadas. (Twitter aún tiene que aclarar cómo toma decisiones para estas “situaciones” antes mencionadas).

En el momento de la publicación, Twitter no proporciona un diccionario útil para que los usuarios lo examinen detenidamente, ni escribe mal sus insultos y maldiciones favoritos para ocultarlos de las herramientas de moderación automática de Twitter.

Entonces, ¿dos tercios lo mantuvieron real, entonces?

Para vender esta noticia molesta a los usuarios, Twitter se da palmaditas en la espalda en forma de datos, pero no es del todo convincente.

Durante la fase de prueba del aviso de bondad, Twitter dice que un tercio de los usuarios eligieron reformular sus publicaciones marcadas o eliminarlas, mientras que cualquiera que fuera marcado comenzó a publicar un 11 por ciento menos de publicaciones y respuestas “ofensivas”, como promedio. (Es decir, algunos usuarios pueden haberse vuelto más amables, mientras que otros podrían haberse vuelto más decididos en su discurso armado). Todo eso suena como una gran mayoría de usuarios que permanecen firmes en su búsqueda personal para decir las cosas como son.

El dato más extraño de Twitter es que cualquier persona que recibió una bandera tenía “menos probabilidades de recibir respuestas ofensivas y dañinas”. No está claro qué punto está tratando de hacer Twitter con esos datos: ¿por qué debería recaer la responsabilidad de la cortesía en aquellos que recibir tweets desagradables?

Esto sigue a otra iniciativa de aviso molesto de Twitter, lanzada a fines de 2020, para animar a los usuarios a “leer” un artículo vinculado por otro usuario de Twitter antes de “re-twittearlo”. En otras palabras: si ves un título jugoso y presionas el botón RT, podrías compartir sin darte cuenta algo con lo que quizás no estés de acuerdo. Sin embargo, este cambio parece un vendaje insuficiente para un problema más grande de Twitter: cómo el servicio incentiva el uso desenfrenado y oportuno del servicio en una búsqueda de me gusta e interacciones, al diablo con la honestidad y la cortesía.

Y ningún aviso molesto probablemente solucionará los problemas de Twitter con la forma en que los actores y trolls no auténticos continúan engañando al sistema y envenenando el discurso del sitio. El ejemplo más grande sigue siendo un problema que se encuentra al hacer clic en publicaciones con muchos “me gusta” y respuestas, generalmente de cuentas de alto perfil o “verificadas”. Por lo general, Twitter coloca las publicaciones de autos en la parte superior de las respuestas de estos hilos, a menudo de cuentas con actividad sospechosa y falta de interacciones orgánicas.

Quizás Twitter podría tomar en serio las lecciones de este aviso molesto, en particular sobre las interacciones de ponderación basadas en una relación confirmada de ida y vuelta entre cuentas. O la empresa podría deshacerse de toda la ponderación de publicaciones impulsada por algoritmos, especialmente aquellas que llevan contenido no seguido al feed de un usuario y volver a los mejores días del contenido puramente cronológico, para que podamos encogernos de hombros más fácilmente ante el BS.

Leave a Reply

Your email address will not be published. Required fields are marked *