Opadai anunció hoy que está lanzando una nueva familia de inteligencia artificial Los modelos optimizados para sobresalir en la codificación, ya que aumenta los esfuerzos para defender la competencia cada vez más dura de compañías como Google y Anthrope. Los modelos están disponibles para los desarrolladores a través de la interfaz de programación de aplicaciones (API) de OpenAI.
Openai está liberando tres tamaños de modelos: GPT 4.1, GPT 4.1 Mini y GPT 4.1 Nano. Kevin Weil, director de productos de OpenAi, dijo en una transmisión en vivo que los nuevos modelos son mejores que el modelo más utilizado de OpenAI, GPT-4O, y mejor que su modelo más grande y poderoso, GPT-4.5, de alguna manera.
GPT-4.1 obtuvo un puntaje del 55 por ciento en el banco SWE, un punto de referencia ampliamente utilizado para medir la destreza de los modelos de codificación. El puntaje es varios puntos porcentuales por encima del de otros modelos Operai. Los nuevos modelos son “excelentes para la codificación, son excelentes en la instrucción compleja que sigue, son fantásticos para los agentes de construcción”, dijo Weil.
La capacidad de los modelos de IA para escribir y editar el código ha mejorado significativamente en los últimos meses, permitiendo formas más automatizadas de prototipos de software y mejorando las habilidades de las llamadas Agentes de IA. En los últimos meses, a rivales como Antrópico y Google tienen ambos modelos introducidos que son especialmente buenos para escribir código.
La llegada de GPT-4.1 ha sido ampliamente rumoreada en las últimas semanas. Operai aparentemente probó el modelo en algunas tablas de clasificación populares bajo el seudónimo Alpha Quasar, dicen las fuentes. Algunos usuarios del modelo de “sigilo” reportado Impresionantes habilidades de codificación. “Quasar solucionó todos los problemas abiertos que tuve con otro código genado [sic] a través de LLMS que estaba incompleto ”, escribió una persona en Reddit.
“Los desarrolladores se preocupan mucho por la codificación, y hemos mejorado la capacidad de nuestro modelo para escribir código funcional”, dijo Michelle Pokrass, quien trabaja en post-entrenamiento en OpenAI, durante la transmisión en vivo del lunes. “Hemos estado trabajando para hacer que sigan diferentes formatos y explorar mejor los repositorios, ejecutar pruebas unitarias y escribir código que compile”.
Todos los nuevos modelos pueden analizar ocho veces más código a la vez, lo que mejora su capacidad para hacer mejoras y solucionar errores. Los nuevos modelos también son mejores para seguir las instrucciones dadas por los usuarios, reduciendo la necesidad de repetir los comandos de diferentes maneras para obtener el resultado deseado. Operai mostró demostraciones de GPT-4.1 creando diferentes aplicaciones que incluyen una aplicación Flashcard para el aprendizaje de idiomas.
GPT-4.1 es un 40 por ciento más rápido que GPT.4O, el modelo más utilizado de Openai para desarrolladores. El costo de los usuarios que ingresan consultas se ha reducido en un 80 por ciento en esta última versión, dice OpenAI.
En la transmisión en vivo de hoy, Varun Mohan, CEO de Windsurf, una herramienta popular para la codificación de IA, dijo que la compañía había estado probando GPT-4.1 y descubrió que el nuevo modelo era “60 por ciento” mejor que GPT-4O según sus propios puntos de referencia. “Descubrimos que GPT-4.1 tiene sustancialmente menos casos de comportamiento degenerado”, dijo Mohan, y señaló que el nuevo modelo pasa menos tiempo leyendo y editando archivos irrelevantes por error.
En los últimos años, OpenAi ha convertido el interés febril en Chatgptun notable chatbot Primero presentado a finales de 2022en un negocio creciente que vende acceso a chatbots y modelos de IA más avanzados. En una entrevista de TED la semana pasada, Altman dijo que Operai tenía 500 millones de usuarios activos semanales, y que el uso estaba “creciendo muy rápidamente”.