Todos somos trabajadores de datos gratuitos de AI

Todos somos trabajadores de datos gratuitos de AI

Chandhiramowuli me cuenta un caso en el que un anotador de datos en la India tuvo que diferenciar entre imágenes de botellas de refresco y elegir las que se parecían a Dr. Pepper. Pero Dr. Pepper no es un producto que se vende en la India, y el anotador de datos tenía la responsabilidad de averiguarlo.

La expectativa es que los anotadores descubran los valores que son importantes para la empresa, dice Chandhiramowuli. “No solo están aprendiendo estas cosas lejanas que no tienen ningún significado para ellos, sino que también están descubriendo no solo cuáles son esos otros contextos, sino cuáles son las prioridades del sistema que están construyendo”, dice ella.

De hecho, todos somos trabajadores de datos para las grandes empresas de tecnología, seamos conscientes de ello o no.

argumentan investigadores de la Universidad de California, Berkeley, la Universidad de California, Davis, la Universidad de Minnesota y la Universidad Northwestern en un nuevo papel presentado en FAccT.

Los modelos de IA de texto e imagen se entrenan utilizando grandes conjuntos de datos que se han extraído de Internet. Esto incluye nuestros datos personales y las obras con derechos de autor de los artistas, y esos datos que hemos creado ahora forman parte para siempre de un modelo de IA creado para generar dinero para una empresa. Sin darnos cuenta, contribuimos con nuestro trabajo de forma gratuita al cargar nuestras fotos en sitios públicos, votar comentarios en Reddit, etiquetar imágenes en reCAPTCHA o realizar búsquedas en línea.

Por el momento, el desequilibrio de poder está fuertemente sesgado a favor de algunas de las empresas de tecnología más grandes del mundo.

Para cambiar eso, necesitamos nada menos que una revolución de datos y una regulación. Los investigadores argumentan que una forma en que las personas pueden recuperar el control de su existencia en línea es abogar por la transparencia sobre cómo se utilizan los datos y encontrar formas de otorgarles a las personas el derecho de ofrecer comentarios y compartir los ingresos del uso de sus datos.

Aunque este trabajo de datos constituye la columna vertebral de la IA moderna, el trabajo de datos sigue siendo crónicamente subestimado e invisible en todo el mundo, y los salarios siguen siendo bajos para los anotadores.

“No hay absolutamente ningún reconocimiento de cuál es la contribución del trabajo de datos”, dice Chandhiramowuli.

Leave a Reply

Your email address will not be published. Required fields are marked *