Chat GPT tuvo actualización: ¿preocupa su capacidad de razonamiento?
La compañía OpenAI lanzó GPT-4, una actualización de su modelo anterior que puede analizar imágenes y tiene una mayor capacidad de procesamiento.
La start-up OpenAI presentó esta semana GPT-4, una nueva versión de la tecnología de inteligencia artificial generativa que lanzó con gran éxito a finales de 2022: ChatGPT.
Gracias por ser nuestro usuario. Apreciado lector, te invitamos a suscribirte a uno de nuestros planes para continuar disfrutando de este contenido exclusivo.El Espectador, el valor de la información.
La start-up OpenAI presentó esta semana GPT-4, una nueva versión de la tecnología de inteligencia artificial generativa que lanzó con gran éxito a finales de 2022: ChatGPT.
Se trata de GPT-4, un modelo multimedia que según la compañía es “menos hábil que los humanos en muchos escenarios de la vida real, pero tan bueno como los humanos en muchos contextos profesionales y académicos”. De hecho, esta versión superaría a ChatGPT en sus capacidades de procesamiento avanzadas.
Por ejemplo, la nueva herramienta puede procesar preguntas y órdenes así como generar respuestas más largas, de hasta 25.000 palabras, ocho veces más que la primera versión de ChatGPT. Además, está en capacidad de crear una página web, editar y repetir tareas con los usuarios (como componer canciones o guiones, aprendiendo su estilo) o incluso de resolver preguntas complejas relacionadas con la declaración de impuestos, entre otros temas.
Le puede interesar: ¿Por qué a veces los chatbots actúan de manera extraña y dicen tonterías?
“GPT no es un profesional de impuestos certificado, ni yo tampoco, por lo que siempre debe consultar con su asesor fiscal. Pero puede ser útil comprender un contenido complejo y poder empoderarse para poder resolver problemas”, explicó Greg Brockman, presidente y cofundador de OpenAI, quien insistió en que no es una herramienta perfecta y por supuesto hay posibilidad de errores.
Una de las novedades más importantes es la capacidad de describir, analizar y entender imágenes a través de a “Be My Eyes”. De acuerdo con Jesper Hvirring Henriksen, CTO de Be My Eyes, la diferencia entre GPT-4 y otros modelos de lenguaje y aprendizaje automático radica tanto en la capacidad de tener una conversación como en el mayor grado de destreza analítica que ofrece la tecnología: “Las aplicaciones básicas de reconocimiento de imágenes solo te dicen lo que tienes delante. No pueden tener una discusión para entender si los fideos tienen el tipo correcto de ingredientes o si el objeto en el suelo no es solo una pelota, sino un peligro de tropiezo, y comunicarlo”.
Para explicar este punto, Brockman preguntó a GPT-4 por qué era gracioso un dibujo de una sonriente ardilla sacando fotos y el chatbot le contestó: “La imagen es graciosa porque muestra a una ardilla sosteniendo una cámara y fotografiando a una nuez como si fuera un fotógrafo profesional. Es una situación graciosa porque las ardillas generalmente comen nueces y no esperamos que usen una cámara o actúen como humanos”.
Lea más: ¿Una nueva era para el ciberdelito?: ChatGPT puede ser usado con fines maliciosos
El nuevo modelo está disponible para el público en general a través de ChatGPT Plus, la suscripción mensual de ChatGPT de US$20 de OpenAI y es la herramienta que está detrás del chatbot de Microsoft, Bing.
“GPT-4 es un gran modelo multimedia, menos hábil que los humanos en muchos escenarios de la vida real, pero tan bueno como los humanos en muchos contextos profesionales y académicos (...) Por ejemplo, aprobó el examen para convertirse en abogado con una puntuación tan buena como el 10% superior. La versión anterior, GPT 3.5, estaba al nivel del 10 % de los menos buenos”, agregó la empresa.
Capacidad de razonamiento
El motor que impulsa a ChatGPT, y otros programas similares, es algo llamado un modelo de lenguaje. Eso se traduce en que la maquina funciona recolectando datos con los que se entrena: libros, resúmenes de libros, entradas de Wikipedia, artículos científicos, noticias. Los modelos lingüísticos forman parte de un campo conocido como IA generativa que también incluye la capacidad de ejecutar imágenes, diseños o código de programación de forma casi instantánea a partir de una simple petición. El problema está precisamente en que echa mano de toda la información disponible en internet, incluyendo también la falsa.
Esta nueva versión, al parecer, mejora la capacidad de razonamiento de ChatGPT debido a que han empleado más comentarios de humano para su entrenamiento, incluso aquellos compartidos de ChatGPT.
Pero aunque la compañía ha destacado que las respuestas que ofrece GPT 4 son más seguras y son el resultado del trabajo con expertos, de la aplicación de casos de uso del mundo real y sus propias capacidades avanzadas de razonamiento y seguimiento de instrucciones para afinar su entrenamiento, también ha señalado que aún tiene “limitaciones similares” a las de sus predecesores. “Todavía no es completamente confiable (inventa hechos y comete errores de razonamiento)”.
La compañía anunció que ha contratado a más de 50 expertos para evaluar los nuevos peligros que podrían surgir, por ejemplo para la ciberseguridad, además de los ya conocidos (generación de consejos peligrosos, código informático defectuoso, información falsa, etc.).
OpenAI y Microsoft limitan estrictamente el acceso a la tecnología que hay detrás de sus chatbots, lo que ha suscitado críticas de que están prefiriendo los potenciales beneficios a mejorar la tecnología más rápidamente para la sociedad.
Ernie Bot, la competencia china
Baidu, el gigante chino de las búsquedas en Internet, presentó este jueves a Ernie Bot que se basa en el modelo de aprendizaje profundo impulsado por la inteligencia artificial Ernie - siglas en inglés de “Representación mejorada a través de la integración del conocimiento” - que Baidu lanzó en 2019 y cuya tercera versión se publicó en mayo de 2020.
Dentro de la demostración, Ernie Bot contestó preguntas sobre la popular novela china de ciencia ficción “El problema de los tres cuerpos”, compuso un poema titulado “La flor y el viento” y creó un vídeo y una imagen siguiendo unas instrucciones.
Baidu tiene previsto usar Ernie Bot para transformar su motor de búsqueda, con mucha diferencia el más usado en China, así como para incrementar la eficiencia en la nube, los vehículos y electrodomésticos inteligentes, entre otros negocios principales.
Los gastos en investigación y desarrollo de Baidu en 2022 ascendieron a 21.400 millones de yuanes (3.100 millones de dólares, 2.917 millones de euros), lo que representa el 22 % de sus ingresos.
La explosión de la IA generativa llega en un momento por demás sombrío para el sector tecnológico, con decenas de miles de despidos en cascada en las compañías más grandes del mundo, así como en otras más pequeñas que luchan por sobrevivir.
“Mientras que otras categorías (de empresas) se enfrentan a una contracción de sus valoraciones y buscan capital, las compañías de IA generativa no lo hacen”, explicó recientemente Shernaz Daver de la empresa de inversiones Khosla, con sede en California.