gpt title

La última iteración de esta inteligencia artificial ahora puede razonar y entregar respuestas a preguntas y problemas más complicados en ámbitos como la física y la química. Este es un gran salto a las versiones anteriores, que buscaban entregar respuestas rápidas a preguntas simples con la información que encontraban en internet.

Hace pocas semanas, OpenAI, la empresa detrás de ChatGPT, lanzó su nuevo modelo de Inteligencia Artificial llamado “o1”. A diferencia de los modelos anteriores, este chatbot tiene la capacidad de “pensar” o “razonar” antes de responder, lo que lo hace más eficiente para tareas complejas de razonamiento. Por ello, se considera una herramienta ideal para la investigación, la ciencia y la programación.

Un grupo de investigadores probó este nuevo modelo, conocido como OpenAI o1, y quedaron impresionados no solo por sus capacidades para facilitar trabajos y dar respuestas más precisas, sino también por los riesgos que podría implicar, especialmente para usuarios sin experiencia que podrían no distinguir entre una alucinación de la IA y una respuesta correcta.

 

¿Qué es OpenAI o1?

OpenAI o1 es un modelo mucho más avanzado que sus predecesores como GPT-3.5 o GPT-4. La diferencia clave es que o1 “razona” antes de dar una respuesta. Mientras que los chatbots anteriores respondían lo más rápido posible con la información disponible, OpenAI o1 toma más tiempo para generar una respuesta más compleja y sólida. Según OpenAI, este modelo sigue una lógica llamada “cadena de pensamiento”, en la cual se explica a sí mismo una serie de pasos para resolver un problema y se corrige durante el proceso.

Impacto en la ciencia

El físico cuántico Mario Krenn, del Instituto Max Planck, fue uno de los científicos que probó la versión de prueba de o1 y afirmó que las respuestas en su campo eran “significativamente más detalladas y coherentes” en comparación con versiones anteriores. De manera similar, Andrew White, químico de Future House, una organización que aplica IA en biología molecular, comentó que la serie o1 les permitió superar las limitaciones de ChatGPT previas.

En una prueba de preguntas y respuestas de nivel doctoral, o1 logró superar a los mejores humanos, obteniendo un 78% en total y un 93% en física, un resultado notablemente superior a cualquier otro chatbot hasta la fecha. También se evaluó su desempeño en un examen de la Olimpiada Internacional de Matemáticas, donde o1 resolvió correctamente el 83% de los problemas, en comparación con el 13% alcanzado por ChatGPT-4.

Investigadores como Krenn también han comenzado a incorporar o1 en herramientas de investigación, destacando su capacidad para generar ideas innovadoras. Otro ejemplo es el científico de datos Kyle Kabasares, quien utilizó o1 para replicar un código de su proyecto de doctorado, obteniendo en una hora lo que él tardó meses en desarrollar.

Además, o1 está siendo implementado en otros campos, como la medicina. La genetista Catherine Brownstein, del Boston Children’s Hospital, mencionó que esta IA está ayudando a conectar pacientes con ciertos genes para detectar enfermedades raras de manera más rápida y precisa.

gpt 2

Preocupaciones sobre los riesgos de OpenAI o1

A pesar de sus avances, o1 también presenta ciertos riesgos. La misma empresa OpenAI ha señalado que este modelo “alucina” o inventa respuestas incorrectas con mayor frecuencia que GPT-4, lo que podría ser peligroso, sobre todo en situaciones donde la seguridad está en juego. Los investigadores que probaron o1 también mencionaron que el modelo no siempre destaca los peligros asociados a ciertas respuestas, como en casos de explosivos o contención química, lo que sugiere que no es adecuado para tareas de alto riesgo.

El químico White advirtió que o1 no es completamente confiable y que, aunque es muy útil para expertos, puede ser peligroso para novatos que no tienen la experiencia para verificar sus respuestas. Esto podría exponer a los usuarios sin conocimientos especializados a riesgos que los expertos podrían evitar de inmediato.

Por ahora, la prueba de OpenAI o1 está disponible para clientes de pago y desarrolladores, junto con una versión más pequeña y accesible llamada o1-mini.

gpt 3