ChatGPT obtiene “ojos y oídos” con complementos que pueden interactuar con la IA con el mundo

ChatGPT obtiene “ojos y oídos” con complementos que pueden interactuar con la IA con el mundo
Una ilustración de un globo ocular

Aurich Lawson | imágenes falsas

El jueves, OpenAI Anunciado un sistema de complementos para su asistente ChatGPT AI. Los complementos le dan a ChatGPT la capacidad de interactuar con el mundo en general a través de Internet, lo que incluye reservar vuelos, pedir alimentos, navegar por la web y más. Los complementos son fragmentos de código que le indican a ChatGPT cómo usar un recurso externo en Internet.

Básicamente, si un desarrollador quiere darle a ChatGPT la capacidad de acceder a cualquier servicio de red (por ejemplo: “buscar los precios actuales de las acciones”) o realizar cualquier tarea controlada por un servicio de red (por ejemplo: “pedir pizza a través de Internet”), ahora es posible, siempre que no vaya en contra de las reglas de OpenAI.

Convencionalmente, la mayoría de los modelos de lenguaje grande (LLM) como ChatGPT se han limitado a una burbuja, por así decirlo, solo pueden interactuar con el mundo a través de conversaciones de texto con un usuario. Como escribe OpenAI en su introducción entrada en el blog en los complementos de ChatGPT, “lo único que los modelos de lenguaje pueden hacer de manera inmediata es emitir texto”.

Bing Chat ha llevado este paradigma más allá al permitirle buscar en la web información más reciente, pero hasta ahora ChatGPT ha estado aislado del resto del mundo. Mientras está cerrado de esta manera, ChatGPT solo puede extraer datos de su conjunto de entrenamiento (limitado a 2021 y antes) y cualquier información proporcionada por un usuario durante la conversación. Además, ChatGPT puede ser propenso a cometer errores y errores de hecho (lo que los investigadores de IA llaman “alucinaciones”).

Para sortear estas limitaciones, OpenAI ha reventado la burbuja y ha creado un Interfaz del complemento ChatGPT (lo que OpenAI llama los “ojos y oídos” de ChatGPT) que permite a los desarrolladores crear nuevos componentes que se “conectan” a ChatGPT y permiten que el modelo de IA interactúe con otros servicios en Internet. Estos servicios pueden realizar cálculos y hacer referencia a información fáctica para reducir las alucinaciones, y también pueden interactuar potencialmente con cualquier otro servicio de software en Internet, si los desarrolladores crean un complemento para esa tarea.

¿De qué tipo de complementos estamos hablando?

El ChatGPT
Agrandar / La “tienda de complementos” de ChatGPT permite a los usuarios seleccionar los complementos que desean “instalar” en su sesión de ChatGPT.

En el caso de ChatGPT, OpenAI permitirá a los usuarios seleccionar de una lista de complementos antes de iniciar una sesión de ChatGPT. Se presentan casi como aplicaciones en una tienda de aplicaciones, cada complemento tiene su propio icono y descripción.

OpenAI dice que las siguientes empresas han creado una primera ronda de complementos:

  • Expedia (para la planificación de viajes)
  • nota fiscal (para datos de mercado en tiempo real)
  • Instacart (para pedidos de comestibles)
  • Kayak (búsqueda de vuelos y coches de alquiler)
  • Klarna (para compras de comparación de precios)
  • Milo (un asistente para padres impulsado por IA)
  • OpenTable (para recomendaciones de restaurantes y reservas)
  • Shopify (para comprar en ese sitio)
  • Slack (para comunicaciones)
  • Hablar (para tutoría de idiomas impulsada por IA)
  • wolframio (para computación y datos en tiempo real)
  • Zapier (una plataforma de automatización)

En particular, el complemento Zapier parece especialmente poderoso ya que otorga acceso a ChatGPT a un sistema de automatización de software existente. o como Zapier dice: “Puede pedirle a ChatGPT que ejecute cualquiera de las 50 000 acciones de Zapier (incluidas la búsqueda, la actualización y la escritura) con las más de 5000 aplicaciones compatibles de Zapier, convirtiendo el chat en acción. Puede escribir un correo electrónico y luego enviárselo por usted. O buscar contactos en un CRM, luego actualícelos directamente. O agregue filas a una hoja de cálculo, luego envíelas como un mensaje de Slack. Las posibilidades son infinitas”.

OpenAI también aloja tres complementos, un navegador web (que puede obtener información de la web de una manera similar a Bing Chat), un intérprete de código para ejecutar programas de Python (en una caja de arena) y una herramienta de recuperación que permite el acceso a ” fuentes de información personales u organizacionales alojadas en otro lugar (básicamente, obtener información de documentos).

Leave a Reply

Your email address will not be published. Required fields are marked *