¿Wikipedia + IA = verdad? DuckDuckGo espera que sí con el nuevo answerbot

Una imagen generada por IA de un pato cyborg.
Agrandar / Una imagen generada por IA de un pato cyborg.

Ars Technica

Para no quedarse fuera de la prisa por integrar la IA generativa en la búsqueda, el miércoles DuckDuckGo anunció PatoAssist, un servicio de resumen fáctico impulsado por IA impulsado por tecnología de Anthropic y Op enAI. Está disponible de forma gratuita hoy como una prueba beta amplia para los usuarios de las extensiones de navegador y las aplicaciones de navegación de DuckDuckGo. Al estar impulsada por un modelo de IA, la compañía admite que DuckAssist podría inventar cosas, pero espera que suceda rara vez.

Así es como funciona: si un usuario de DuckDuckGo busca una pregunta que puede ser respondida por Wikipedia, DuckAssist puede aparecer y usar la tecnología de lenguaje natural de IA para generar un breve resumen de lo que encuentra en Wikipedia, con los enlaces de origen enumerados a continuación. El resumen aparece encima de los resultados de búsqueda habituales de DuckDuckGo en un cuadro especial.

La empresa posiciona a DuckAssist como una nueva forma de “Respuesta instantánea”, una función que evita que los usuarios tengan que buscar en los resultados de búsqueda web para encontrar información rápida sobre temas como noticias, mapas y clima. En su lugar, el motor de búsqueda presenta los resultados de Respuesta instantánea encima de la lista habitual de sitios web.

Una captura de pantalla de demostración de DuckAssist en acción.
Agrandar / Una captura de pantalla de demostración de DuckAssist en acción.

Pato Pato a ganar

DuckDuckGo no dice qué modelo de lenguaje grande (LLM) o modelos usa para generar DuckAssist, aunque parece probable alguna forma de API OpenAI. Ars Technica se ha comunicado con los representantes de DuckDuckGo para obtener aclaraciones. Pero el CEO de DuckDuckGo, Gabriel Weinberg, explica cómo utiliza el abastecimiento en un entrada de blog de la empresa

:

DuckAssist responde a las preguntas escaneando un conjunto específico de fuentes (por ahora, por lo general, Wikipedia y, en ocasiones, sitios relacionados como Britannica) utilizando la in dexación activa de DuckDuckGo. Debido a que usamos tecnología de lenguaje natural de OpenAI y Anthropic para resumir lo que encontramos en Wikipedia, estas respuestas deberían responder más directamente a su pregunta real que los resultados de búsqueda tradicionales u otras Respuestas instantáneas.

Dado que el principal punto de venta de DuckDuckGo es la privacidad, la compañía dice que DuckAssist es “anónimo” y enfatiza que no comparte el historial de búsqueda o navegación con nadie. “También mantenemos su historial de búsqueda y navegación anónimo para nuestros socios de contenido de búsqueda”, escribe Weinberg, “en este caso, OpenAI y Anthropic, utilizados para resumir las oraciones de Wikipedia que identificamos”.

Si DuckDuckGo está utilizando la API GPT-3 o ChatGPT de OpenAI, uno podría preocuparse de que el sitio pueda enviar la consulta de cada usuario a OpenAI cada vez que se invoque. Pero leyendo entre líneas, parece que solo el artículo de Wikipedia (o un extracto de uno) se envía a OpenAI para su resumen, no la búsqueda del usuario en sí. También nos hemos comunicado con DuckDuckGo para obtener aclaraciones sobre este punto.

DuckDuckGo llama a DuckAssist “la primera de una serie de funciones generativas asistidas por IA que esperamos implementar en los próximos meses”. Si el lanzamiento va bien, y nadie lo interrumpe con avisos contradictorios, DuckDuckGo planea implementar la función para todos los usuarios de búsqueda “en las próximas semanas”.

DuckDuckGo: riesgo de alucinaciones “muy disminuido”

Como hemos cubierto anteriormente en Ars, los LLM tienen una tendencia a producir resultados erróneos convincentes, que los investigadores de IA llaman “alucinaciones” como un termino de arte en el campo de la IA. Las alucinaciones pueden ser difíciles de detectar a menos que conozca el material al que se hace referencia, y se producen en parte porque los LLM estilo GPT de OpenAI no distinguen entre realidad y ficción en sus conjuntos de datos. Además, los modelos pueden hacer inferencias falsas basadas en datos que de otro modo serían precisos.

En este punto, DuckDuckGo espera evitar las alucinaciones apoyándose en gran medida en Wikipedia como fuente: “pidiéndole a DuckAssist que solo resuma la información de Wikipedia y fuentes relacionadas”, Weinberg escribe“la probabilidad de que “alucine”, es decir, invente algo, se reduce considerablemente”.

Si bien depender de una fuente de información de calidad puede reducir los errores de información falsa en el conjunto de datos de la IA, es posible que no reduzca las inferencias falsas. Y DuckDuckGo pone la carga de la verificación de hechos en el usuario, proporcionando un enlace de origen debajo del resultado generado por IA que se puede usar para examinar su precisión. Pero no será perfecto, y el CEO Weinberg lo admite: “Sin embargo, DuckAssist no generará respuestas precisas todo el tiempo. Esperamos que cometa errores”.

A medida que más empresas implementan tecnología LLM que puede desinformar fácilmente, puede tomar algún tiempo y un uso generalizado antes de que las empresas y los clientes decidan qué nivel de alucinación es tolerable en un producto impulsado por IA que está diseñado para informar a las personas de manera objetiva.

Leave a Reply

Your email address will not be published. Required fields are marked *