OpenAI sostiene que es “imposible” entrenar ChatGPT sin un trabajo protegido por derechos de autor

OpenAI sostiene que es “imposible” entrenar ChatGPT sin un trabajo protegido por derechos de autor

2023 marcó el auge de la IA generativa y 2024 bien podría ser el año en que sus creadores tengan en cuenta las consecuencias de la tecnología en la carrera armamentista en toda la industria. Actualmente, OpenAI está rechazando agresivamente las afirmaciones de demandas recientes de que sus productos, incluido ChatGPT, están entrenados ilegalmente en textos protegidos por derechos de autor. Es más, la empresa está haciendo algunas afirmaciones legales audaces sobre por qué sus programas deberían tener acceso al trabajo de otras personas.

[Related: Generative AI could face its biggest legal tests in 2024.]

en un entrada en el blog publicado el 8 de enero, OpenAI acusó Los New York Times de “no contar la historia completa” en el discurso de la empresa de medios importante demanda por derechos de autor

presentado a finales del mes pasado. En cambio, OpenAI argumenta que su extracción de trabajos en línea cae dentro del ámbito del “uso justo”. La empresa afirma además que actualmente colabora con varias organizaciones de noticias (excluyendo, entre otras, Los tiempos) sobre asociaciones de conjuntos de datos, y descarta cualquier “regurgitación” de material externo protegido por derechos de autor como un “error raro” que están trabajando p ara eliminar. Esto se atribuye a problemas de “memorización” que pueden ser más comunes cuando el contenido aparece varias veces dentro de los datos de entrenamiento, como si se puede encontrar en “muchos sitios web públicos diferentes”.

“El principio de que el entrenamiento de modelos de IA está permitido como uso legítimo está respaldado por una amplia gama de [people and organizations]”, escribieron representantes de OpenAI en la publicación del lunes, vinculando comentarios enviados recientemente por varios académicos, nuevas empresas y creadores de contenido a la Oficina de Derechos de Autor de EE. UU.

en un carta de apoyo Por ejemplo, en una presentación presentada por Duolingo, la empresa de software para el aprendizaje de idiomas escribió que cree que “la producción generada por una IA entrenada con materiales protegidos por derechos de autor no debería considerarse automáticamente infractora, del mismo modo que una obra de un autor humano no se consideraría infractor simplemente porque el El autor humano había aprendido a escribir leyendo obras protegidas por derechos de autor”. (El lunes, Duolingo confirmó a Bloomberg ha despedido aproximadamente al 10 por ciento de sus contratistas, citando su mayor dependencia de la IA).

El 27 de diciembre Los New York Times demandó tanto a OpenAI como a Microsoft, que actualmente utiliza el GPT del primero en productos como Bing, por infracción de derechos de autor. Documentos judiciales presentados por Los tiempos Afirma que OpenAI entrenó su tecnología generativa en millones de artículos de la publicación sin permiso ni compensación. Productos como ChatGPT ahora supuestamente se utilizan en lugar de su material original en detrimento de la empresa de medios. Más lectores que opten por resúmenes de noticias de IA presumiblemente significan menos lectores suscritos a los medios de comunicación, argumenta Los tiempos.

Los New York Times La demanda es sólo la última de una serie de presentaciones similares que alegan infracción de derechos de autor, incluida una en nombre de escritores notables, así como otra para artistas visuales.

Mientras tanto, OpenAI está presionando a los reguladores gubernamentales sobre su acceso a material protegido por derechos de autor. De acuerdo a El Telégrafo El 7 de enero, una carta reciente enviada por OpenAI a la Cámara de los Lores del Reino Unido en materia de comunicaciones y medios digitales sostiene que el acceso a materiales protegidos por derechos de autor es vital para el éxito de la empresa y la relevancia del producto.

“Debido a que los derechos de autor cubren hoy prácticamente todo tipo de expresión humana, incluidas publicaciones de blogs, fotografías, publicaciones en foros, fragmentos de código de software y documentos gubernamentales, sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor”, escribió OpenAI en el La carta, al tiempo que sostiene que limitar los datos de capacitación al trabajo de dominio público, “podría producir un experimento interesante, pero no proporcionaría sistemas de IA que satisfagan las necesidades de los ciudadanos de hoy”. La carta afirma que es parte de la “misión de OpenAI de garantizar que la inteligencia artificial general beneficie a toda la humanidad”.

Mientras tanto, algunos críticos rápidamente se burlaron de la afirmación de OpenAI de que la existencia de su programa requiere el uso del trabajo de otros protegido por derechos de autor. En la plataforma de redes sociales Bluesky, historiador y autor Kevin Kruse comparó la estrategia de OpenAI con la venta de artículos obtenidos ilegalmente en una casa de empeño.

“Traducción aproximada: No acertaremos fabulosamente si no nos dejas robar, ¡así que por favor no conviertas el robo en un delito!” El experto en IA Gary Marcus también publicado en X los lunes.

Leave a Reply

Your email address will not be published. Required fields are marked *