OpenAI lanzó su primer modelo de IA con capacidades avanzadas de razonamiento
El creador de ChatGPT anunció el lanzamiento de su modelo de inteligencia generativo OpenAI o1, entrenado para responder preguntas complejas y más rápido que un humano.
OpenAI lanzó su nuevo desarrollo o1, el primer modelo de inteligencia artificial de la compañía con capacidades de razonamiento, el cual, según explicó a través de un comunicado, dedica “más tiempo a pensar antes de responder” al momento de resolver tareas complejas e instrucciones más difíciles que los modelos anteriores, especialmente en materias como ciencia, programación y matemáticas.
La empresa comandada por Sam Altman sigue trabajando en nuevos desarrollos en materia de inteligencia artificial. Con la presentación del nuevo lenguaje, la compañía se enfocó en buscar que sean más capaces y tengan la habilidad de evaluar sus respuestas antes de presentarlas al usuario, similar a como razonaría un humano ante una pregunta.
Para OpenAI, o1 representa un paso hacia el objetivo empresarial más amplio de inteligencia artificial similar a la humana. En términos más prácticos, hace un mejor trabajo al escribir código y resolver problemas de varios pasos que los modelos anteriores, pero también es más costoso y más lento de usar que GPT-4o, el cual está disponible de forma limitada en para todo los usuarios de ChatGPT. OpenAI considera este modelo como una “vista previa” para enfatizar que aún sigue en desarrollo.
Los usuarios de ChatGPT Plus y Team recibieron acceso tanto a la vista previa de o1 y de o1-mini, una versión más pequeña y económica, a partir del 12 de septiembre. Las cuentas de Enterprise y Edu tendrán acceso a partir de la próxima semana, según informó OpenAI en el comunicado. Asimismo, la empresa aseguró que planea brindar acceso a o1-mini a todos los usuarios gratuitos de ChatGPT, pero aún no ha establecido una fecha de lanzamiento.
Las nuevas capacidades de razonamiento del modelo o1 vienen con un costo económico significativo. En la API, tiene un valor de USD $15 por un millón de tokens de entrada o fragmentos de textos analizados y USD $60 por la misma cantidad de salida. A modo de comparación, GPT-4o cuesta USD $5 por 1 millón de tokens de entrada y $15 por 1 millón de salidas.
Un token en inteligencia artificial es la unidad más pequeña en la que se puede dividir una palabra o frase. Puede ser una palabra completa, un signo de puntuación o incluso un carácter especial. Para que la IA generativa pueda entender la solicitud y responder de manera adecuada, necesita descomponerla en partes más pequeñas que sea capaz de procesar.
De acuerdo a Jerry Tworek, líder de investigación de OpenAI, la compañía realizó un entrenamiento especializado, diferente a los de los modelos anteriores “ha sido entrenado utilizando un algoritmo de optimización completamente nuevo y un nuevo conjunto de datos de entrenamiento específicamente diseñado para él”, declaró para el medio The Verge.
Le recomendamos leer: Huawei lanzó su nuevo plegable con tres pantallas, el primero en el mundo
En versiones anteriores, la empresa trabajó los modelos GPT para imitar patrones observados en los datos de entrenamiento. Sin embargo, con el modelo o1, introdujeron una técnica diferente llamada aprendizaje por refuerzo, en la que el sistema aprende a resolver problemas de manera autónoma mediante recompensas y penalizaciones. Además, emplea una estrategia llamada “cadena de pensamiento”, que le permite procesar consultas de forma más lógica y estructurada.
Gracias a la nueva metodología de entrenamiento, Tworek aseguró que el modelo debería ofrecer mayor precisión “hemos observado que este modelo comete menos errores de interpretación”. Sin embargo, reconoció que el problema no está completamente eliminado “No podemos afirmar que hayamos resuelto por completo las alucinaciones”, agregó el representante de OpenAI.
En un video publicado en YouTube, realizaron una demostración de cómo funciona la vista previa del o1 en comparación con GPT 4o. Le preguntaron a ChatGPT cuantas “r” tiene la palabra Strawberry, el modelo más rápido contestó que dos, mientras que con el otro se tomó más tiempo para pensar y dar la respuesta correcta, que son tres.
En el canal hay más ejemplos de razonamiento en otras áreas como ciencia, matemáticas, lógica, física cuántica y creación de código.
No obstante, el modelo o1 no tiene el mismo nivel de capacidades que GPT-4 en varios aspectos. Su desempeño es inferior cuando se trata de conocimientos precisos sobre el mundo y, además, carece de la capacidad de navegar por la web o procesar archivos e imágenes.
Le podría interesar: Keylogging: ¿qué es y cómo funciona esta modalidad de ciberataque?
A pesar de las limitaciones que presenta el nuevo producto, la compañía considera que o1 representa una nueva generación de capacidades tecnológicas. El nombre “o1″ se eligió para simbolizar un “reinicio” en el desarrollo de estos modelos.
Este aparente cambio de enfoque de uno de los líderes en inteligencia artificial generativa sugiere que la prioridad será mejorar la calidad y precisión de las respuestas, antes que centrarse en aumentar la velocidad o añadir funciones de búsqueda. “o1 avanza significativamente en el estado del arte del razonamiento de IA. Tenemos previsto publicar versiones mejoradas de este modelo a medida que sigamos trabajando. Esperamos que estas nuevas capacidades de razonamiento mejoren nuestra capacidad de alinear los modelos con los valores y principios humanos en función de facilitar el trabajo diario”.
👽👽👽 ¿Ya está enterado de las últimas noticias de tecnología? Lo invitamos a visitar nuestra sección en El Espectador.
OpenAI lanzó su nuevo desarrollo o1, el primer modelo de inteligencia artificial de la compañía con capacidades de razonamiento, el cual, según explicó a través de un comunicado, dedica “más tiempo a pensar antes de responder” al momento de resolver tareas complejas e instrucciones más difíciles que los modelos anteriores, especialmente en materias como ciencia, programación y matemáticas.
La empresa comandada por Sam Altman sigue trabajando en nuevos desarrollos en materia de inteligencia artificial. Con la presentación del nuevo lenguaje, la compañía se enfocó en buscar que sean más capaces y tengan la habilidad de evaluar sus respuestas antes de presentarlas al usuario, similar a como razonaría un humano ante una pregunta.
Para OpenAI, o1 representa un paso hacia el objetivo empresarial más amplio de inteligencia artificial similar a la humana. En términos más prácticos, hace un mejor trabajo al escribir código y resolver problemas de varios pasos que los modelos anteriores, pero también es más costoso y más lento de usar que GPT-4o, el cual está disponible de forma limitada en para todo los usuarios de ChatGPT. OpenAI considera este modelo como una “vista previa” para enfatizar que aún sigue en desarrollo.
Los usuarios de ChatGPT Plus y Team recibieron acceso tanto a la vista previa de o1 y de o1-mini, una versión más pequeña y económica, a partir del 12 de septiembre. Las cuentas de Enterprise y Edu tendrán acceso a partir de la próxima semana, según informó OpenAI en el comunicado. Asimismo, la empresa aseguró que planea brindar acceso a o1-mini a todos los usuarios gratuitos de ChatGPT, pero aún no ha establecido una fecha de lanzamiento.
Las nuevas capacidades de razonamiento del modelo o1 vienen con un costo económico significativo. En la API, tiene un valor de USD $15 por un millón de tokens de entrada o fragmentos de textos analizados y USD $60 por la misma cantidad de salida. A modo de comparación, GPT-4o cuesta USD $5 por 1 millón de tokens de entrada y $15 por 1 millón de salidas.
Un token en inteligencia artificial es la unidad más pequeña en la que se puede dividir una palabra o frase. Puede ser una palabra completa, un signo de puntuación o incluso un carácter especial. Para que la IA generativa pueda entender la solicitud y responder de manera adecuada, necesita descomponerla en partes más pequeñas que sea capaz de procesar.
De acuerdo a Jerry Tworek, líder de investigación de OpenAI, la compañía realizó un entrenamiento especializado, diferente a los de los modelos anteriores “ha sido entrenado utilizando un algoritmo de optimización completamente nuevo y un nuevo conjunto de datos de entrenamiento específicamente diseñado para él”, declaró para el medio The Verge.
Le recomendamos leer: Huawei lanzó su nuevo plegable con tres pantallas, el primero en el mundo
En versiones anteriores, la empresa trabajó los modelos GPT para imitar patrones observados en los datos de entrenamiento. Sin embargo, con el modelo o1, introdujeron una técnica diferente llamada aprendizaje por refuerzo, en la que el sistema aprende a resolver problemas de manera autónoma mediante recompensas y penalizaciones. Además, emplea una estrategia llamada “cadena de pensamiento”, que le permite procesar consultas de forma más lógica y estructurada.
Gracias a la nueva metodología de entrenamiento, Tworek aseguró que el modelo debería ofrecer mayor precisión “hemos observado que este modelo comete menos errores de interpretación”. Sin embargo, reconoció que el problema no está completamente eliminado “No podemos afirmar que hayamos resuelto por completo las alucinaciones”, agregó el representante de OpenAI.
En un video publicado en YouTube, realizaron una demostración de cómo funciona la vista previa del o1 en comparación con GPT 4o. Le preguntaron a ChatGPT cuantas “r” tiene la palabra Strawberry, el modelo más rápido contestó que dos, mientras que con el otro se tomó más tiempo para pensar y dar la respuesta correcta, que son tres.
En el canal hay más ejemplos de razonamiento en otras áreas como ciencia, matemáticas, lógica, física cuántica y creación de código.
No obstante, el modelo o1 no tiene el mismo nivel de capacidades que GPT-4 en varios aspectos. Su desempeño es inferior cuando se trata de conocimientos precisos sobre el mundo y, además, carece de la capacidad de navegar por la web o procesar archivos e imágenes.
Le podría interesar: Keylogging: ¿qué es y cómo funciona esta modalidad de ciberataque?
A pesar de las limitaciones que presenta el nuevo producto, la compañía considera que o1 representa una nueva generación de capacidades tecnológicas. El nombre “o1″ se eligió para simbolizar un “reinicio” en el desarrollo de estos modelos.
Este aparente cambio de enfoque de uno de los líderes en inteligencia artificial generativa sugiere que la prioridad será mejorar la calidad y precisión de las respuestas, antes que centrarse en aumentar la velocidad o añadir funciones de búsqueda. “o1 avanza significativamente en el estado del arte del razonamiento de IA. Tenemos previsto publicar versiones mejoradas de este modelo a medida que sigamos trabajando. Esperamos que estas nuevas capacidades de razonamiento mejoren nuestra capacidad de alinear los modelos con los valores y principios humanos en función de facilitar el trabajo diario”.
👽👽👽 ¿Ya está enterado de las últimas noticias de tecnología? Lo invitamos a visitar nuestra sección en El Espectador.