Genie, un programador de IA lanzado por Cosine, obtuvo una puntuación de 30.08% en la plataforma de pruebas autorizada SWE-Bench, superando ampliamente a Devin (13.8%) y Swe-agent+GPT-4 (12.47%), y se le considera el programador de IA más potente del mundo en la actualidad.

El nacimiento de Genie no fue un proceso inmediato. Ya en diciembre de 2022, Alistair Pullen, cofundador de Cosine, presentó un prototipo de Genie en una presentación en la Universidad de Londres. Su objetivo inicial era desarrollar un robot de IA capaz de ejecutar la codificación y la optimización de forma automática y completa, sin necesidad de intervención humana.

image.png

La considerable ventaja de Genie sobre otros productos conocidos se debe a sus datos y métodos de entrenamiento únicos. El entrenamiento de Genie no depende del ajuste fino de modelos grandes convencionales, sino que utiliza un conjunto de datos especial que incluye el proceso de razonamiento de programadores humanos, como la transmisión completa de información, el descubrimiento gradual de conocimientos y los pasos de toma de decisiones basados en casos reales.

QQ截图20240813103417.jpg

Genie empleó un exclusivo "mecanismo de automejora" durante su entrenamiento. El entrenamiento inicial se realizó con una gran cantidad de datos de alta calidad, logrando que el modelo alcanzara un estado "perfecto". Posteriormente, los desarrolladores utilizaron datos sintéticos generados por Genie e inyectados en el entrenamiento posterior del modelo para enriquecer los errores y las situaciones complejas. Este proceso es similar a como una madre enseña a su hijo a caminar: cada vez que Genie se cae o su postura es incorrecta, recibe una corrección inmediata.

QQ截图20240813103503.jpg

Las funciones de Genie abarcan el desarrollo de funciones, la corrección de errores, la refactorización de código, las pequeñas modificaciones de código, las pruebas de código, la documentación de código y las actualizaciones. Es compatible con docenas de lenguajes de programación principales, como JavaScript, Python, Java, C#, C++, cubriendo prácticamente todas las necesidades del ámbito de la programación.

El reconocido desarrollador McKay ha expresado su gran interés en Genie y su deseo de probar el producto lo antes posible. Actualmente, tiene acceso a Devin, lo que le permitirá evaluar fácilmente el rendimiento de Genie.

Aunque Genie aún se encuentra en fase de solicitud de prueba, Alistair ha anunciado que ya se aceptan registros y que los permisos de prueba se otorgarán en las próximas 2-3 semanas, añadiendo algunas funciones sorpresa en el lanzamiento.

Dirección para probar: https://cosine.sh/register