Por qué es tan difícil detectar texto generado por IA (y qué hacer al respecto)

Esta herramienta es la respuesta de OpenAI al calor que ha recibido de educadores, periodistas y otros por lanzar ChatGPT sin ninguna forma de detectar el texto que ha generado. Sin embargo, todavía es un trabajo en progreso, y es lamentablemente poco confiable. OpenAI dice que su detector de texto AI identifica correctamente el 26% del texto escrito por AI como “probablemente escrito por AI”.

Si bien OpenAI claramente tiene mucho más trabajo por hacer para refinar su herramienta, hay un límite para lo bueno que puede hacerlo. Es muy poco probable que alguna vez obtengamos una herramienta que pueda detectar texto generado por IA con un 100% de certeza. Es realmente difícil detectar texto generado por IA porque el objetivo de los modelos de lenguaje de IA es generar texto fluido y de apariencia humana, y el modelo imita el texto creado por humanos, dice Muhammad Abdul-Mageed, profesor que supervisa la investigación en natural. -procesamiento del lenguaje y aprendizaje automático en la Universidad de British Columbia

Estamos en una carrera armamentista para construir métodos de detección que puedan igualar los modelos más recientes y potentes, agrega Abdul-Mageed. Los nuevos modelos de lenguaje de IA son más potentes y mejores para generar un lenguaje aún más fluido, lo que rápidamente hace que nuestro conjunto de herramientas de detección existente quede obsoleto.

OpenAI construyó su detector mediante la creación de un modelo de lenguaje de IA completamente nuevo similar a ChatGPT que está específicamente capacitado para detectar salidas de modelos como él. Aunque los detalles son escasos, la compañía aparentemente entrenó el modelo con ejemplos de texto generado por IA y ejemplos de texto generado por humanos, y luego le pidió que detectara el texto generado por IA. Pedimos más información, pero OpenAI no respondió.

El mes pasado, escribí sobre otro método para detectar texto generado por una IA: marcas de agua. Estos actúan como una especie de señal secreta en el texto producido por IA que permite que los programas de computadora lo detecten como tal.

Investigadores de la Universidad de Maryland han desarrollado una forma ordenada de aplicar marcas de agua al texto generado por modelos de lenguaje de IA, y la han hecho disponible gratuitamente. Estas marcas de agua nos permitirían saber con casi total certeza cuándo se ha utilizado texto generado por IA.

El problema es que este método requiere que las empresas de IA incorporen marcas de agua en sus chatbots desde el principio. OpenAI está desarrollando estos sistemas, pero aún tiene que implementarlos en ninguno de sus productos. ¿Por qué la demora? Una razón podría ser que no siempre es deseable tener una marca de agua en el texto generado por IA.

Una de las formas más prometedoras en que ChatGPT podría integrarse en los productos es como una herramienta para ayudar a las personas a escribir correos electrónicos o como un corrector ortográfico mejorado en un procesador de textos. Eso no es exactamente hacer trampa. Pero poner una marca de agua en todo el texto generado por IA marcaría automáticamente estos resultados y podría dar lugar a acusaciones injustas.

Leave a Reply Cancel reply