En el día de hoy, a medida que la tecnología de inteligencia artificial se desarrolla rápidamente, Alibaba lanzó oficialmente el 6 de junio su nueva serie de modelos vectoriales Qwen3-Embedding. Este modelo está basado en la plataforma Qwen3 y ha sido optimizado para tareas como la representación de texto, búsqueda y clasificación, marcando otro gran avance en el campo de la IA por parte de Alibaba.

Comparado con la versión anterior, Qwen3-Embedding ha mejorado más del 40% en rendimiento en tareas centrales como la búsqueda de texto, agrupamiento y clasificación. Este progreso no solo lo hace más competitivo técnicamente, sino que también le ha permitido superar modelos de vanguardia como los de Gemini Embedding de Google, text-embedding-3-large de OpenAI y multilingual-e5-large-instruct de Microsoft en listas profesionales como MTEB, alcanzando el mejor rendimiento (SOTA) entre modelos similares.

Qwen (2)

Fuente de la imagen: Imagen generada por IA

En términos simples, se puede pensar en los modelos vectoriales como el "traductor" de IA, ya que convierten información no estructurada como texto e imágenes en vectores que las máquinas pueden entender fácilmente, logrando una clasificación, búsqueda y clasificación eficiente de la información. Con base en el modelo Qwen3, el equipo de Tongyi ha utilizado métodos como el entrenamiento por contraste, SFT y fusión de modelos para crear este nuevo modelo vectorial, que incluye el modelo de incrustación de texto Qwen3-Embedding y el modelo de reordenamiento de texto Qwen3-Reranker.

Es importante destacar que el modelo vectorial Qwen3 tiene una capacidad multilingüe poderosa, compatible con más de 100 idiomas, incluidas muchas lenguas de programación, mostrando un excelente rendimiento en la búsqueda multilingüe, translingüística y de código. Esto proporciona a los desarrolladores un espacio de aplicación mucho más amplio.

Esta vez, se han abierto al público nueve versiones del modelo vectorial Qwen3, cubriendo diferentes tamaños (0.6B, 4B, 8B, etc.) y versiones GGUF. Los desarrolladores pueden elegir el modelo adecuado según sus necesidades y combinar módulos libremente, e incluso personalizar vectores o instrucciones para optimizarlos profundamente para tareas específicas, idiomas y escenarios. Esta flexibilidad aumentará enormemente la eficiencia de los desarrolladores.

Actualmente, los modelos Qwen3Embedding y Reranker están abiertos al público en varias plataformas como Modoo Community, Hugging Face y GitHub. Además, los desarrolladores pueden usar servicios API directamente a través de AliCloud Bailian. Desde que se abrieron al público el 29 de abril, los grandes modelos Qwen3 han obtenido excelentes resultados como campeones abiertos en varios rankings internacionales.