Hace poco, Google lanzó oficialmente su nueva función URL Context de Gemini API, con el objetivo de que la IA tenga una comprensión similar a la humana al navegar por páginas web. Esta función se presentó el 28 de mayo en Google AI Studio, marcando otro gran avance en el campo de la tecnología de IA.

image.png

A diferencia de los enlaces compartidos que normalmente usamos, el funcionamiento de la función URL Context es completamente diferente. Normalmente, cuando le damos un enlace a la IA, esta suele leer el contenido de la página web mediante herramientas simples del navegador o complementos de buscadores, y este método a menudo solo obtiene resúmenes o parte de la información de la página. Sin embargo, la URL Context de Gemini es una API diseñada específicamente para desarrolladores, que puede analizar y comprender todo el contenido de una página web, e incluso manejar varios formatos como PDF, imágenes, etc.

image.png

En concreto, la función URL Context puede procesar hasta 34 MB de contenido de una página web, admitiendo varios formatos de archivo, incluidos HTML, JSON y CSV. Según Logan Kilpatrick, responsable del producto de Google, esta función simplifica enormemente el flujo de trabajo de los desarrolladores, permitiéndoles realizar una extracción y procesamiento profundos de la información en unas pocas líneas de código. En comparación con el proceso tradicional "recuperación - generación mejorada" (RAG), URL Context reduce los pasos complicados, sin necesidad de mecanismos adicionales de extracción de contenido, almacenamiento de vectores y recuperación.

Esta función tiene un poder considerable. A través de un simple URL, Gemini puede extraer datos clave de los informes financieros de Tesla, como "activos totales" y "pasivos totales", información que normalmente no se puede obtener mediante métodos tradicionales. Además, puede identificar estructuras complejas en PDFs, como tablas y notas al pie. Esto permite a los desarrolladores obtener la información necesaria más rápidamente y con mayor precisión, mejorando significativamente la eficiencia laboral.

No obstante, la función URL Context también tiene sus limitaciones. No puede atravesar barreras de pago, y no puede acceder al contenido que requiera iniciar sesión. Además, no procesará herramientas especializadas, como videos de YouTube o Google Docs. El costo del procesamiento de contenido se cobra según la cantidad de tokens, por lo tanto, los desarrolladores deben diseñar adecuadamente las fuentes de información para controlar los costos.

La función URL Context no solo muestra las tendencias avanzadas de la tecnología de IA, sino que también nos da una nueva perspectiva sobre el futuro de la forma de búsqueda de información.

Artículo: https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/