Bienvenido al programa especializado en inteligencia artificial 【AI Daily】! Aquí encontrarás una guía para explorar el mundo de la IA todos los días. Cada día te presentamos las noticias más relevantes del campo de la IA, enfocándonos en desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de IA.

Producto fresco de IA Haz clic para saber más: https://top.aibase.com/

1. La versión oficial de Qwen3-Embedding de Qwen3 se ha lanzado

Como asistente de IA, me emociona mucho que el equipo de Qwen3 haya lanzado la serie de modelos Qwen3-Embedding. Este nuevo modelo no solo muestra un rendimiento excepcional en tareas de comprensión y recuperación de texto multilingüe, sino que también ofrece opciones de configuración flexibles y un fuerte soporte multilingüe, consolidando su posición líder en el procesamiento de texto.

image.png

【Resumen AiBase:】

📚 La serie Qwen3-Embedding está basada en el modelo base Qwen3, ofreciendo tres configuraciones con tamaños de parámetros desde 0.6B hasta 8B, adaptadas a diferentes necesidades de rendimiento y eficiencia en diversas escenas.

🌍 Soporta más de 100 idiomas y tiene capacidades avanzadas de búsqueda multilingüe, translingüe y de código, diseñada con estructuras doble y única torre.

🌟 En la lista MTEB multilingüe obtuvo 70.58 puntos, superando a muchos servicios comerciales API, demostrando excelentes capacidades de representación y clasificación de texto.

Enlace detallado: https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

2. ByteDance lanza el modelo de edición de imágenes SeedEdit 3.0 con mejoras en la capacidad de conservación de detalles

SeedEdit 3.0 es un modelo de edición de imágenes basado en Seedream 3.0, que mediante estrategias avanzadas de fusión de datos y un modelo de recompensa dedicado, mejora significativamente la capacidad de mantener el tema, procesar detalles de fondo e interpretar instrucciones, destacándose particularmente en la edición de retratos humanos, cambio de fondo y complejos efectos de luz y sombra.

image.png

【Resumen AiBase:】

✨ Introduce estrategias avanzadas de fusión de datos y un modelo de recompensa dedicado, mejorando significativamente la efectividad de la conservación de imágenes.

🌟 Soporta la edición en resolución 4K, mostrando una capacidad destacada de procesamiento de detalles cuando se trata de escenarios complejos como personas y transformación de luz.

🚀 El tiempo de inferencia se acelera a segundos, encabeza los 23 tipos de evaluaciones de tareas de edición y eleva la disponibilidad al 56.1%.

Enlace detallado: https://seed.bytedance.com/seededit

3. ¡La voz de AI más poderosa de la superficie llega! Lanzamiento del prototipo Eleven v3 Alpha con capacidad de 'actuar'

El lanzamiento del prototipo Eleven v3 Alpha por parte de ElevenLabs redefine la tecnología de conversión de texto a voz, destacándose por su expresión emocional excepcional, soporte multilingüe y habilidades avanzadas de conversación natural.

image.png

【Resumen AiBase:】

🌟 Eleven v3 Alpha introduce etiquetas de audio, permitiendo controlar precisamente emociones, velocidad y agregar efectos de sonido, haciendo que la voz sea más realista y expresiva.

🌐 Soporta más de 70 idiomas, con capacidad de diálogo entre múltiples roles, aplicable en diversas escenas como doblaje cinematográfico, educación y servicio al cliente.

🚀 Tras la actualización tecnológica, las capacidades de comprensión de texto y generación de conversación han mejorado notablemente, y la función de etiquetado automático simplifica el flujo de creación, ayudando a profesionales no expertos a generar fácilmente contenido de calidad.

4. Anthropic lanza un modelo de IA exclusivo para seguridad nacional, respaldado por Amazon y Google

Anthropic presenta el conjunto de modelos Claude Gov, diseñados específicamente para instituciones de seguridad nacional, mejorando la capacidad de procesamiento de materiales confidenciales, y cuenta con el apoyo estratégico de Amazon y Google, pero enfrenta una demanda legal de Reddit.

image.png

【Resumen AiBase:】

🌐 El conjunto de modelos Claude Gov está diseñado específicamente para instituciones de seguridad nacional, mejorando la capacidad de procesamiento de materiales confidenciales.

🤝 El producto cuenta con el apoyo de Amazon y Google, solo disponible para instituciones con permisos de seguridad más altos.

⚖️ Anthropic enfrenta una demanda legal por parte de Reddit, acusándola de utilizar sin autorización los datos de los usuarios para entrenar el modelo.

5. El monto mensual de pagos de LingAI ha superado los 100 millones de yuanes durante dos meses consecutivos, alcanzando una base de usuarios de más de 22 millones

LingAI superó la tasa anual de ingresos de 100 millones de dólares en solo 10 meses, con los suscriptores P contribuyendo en gran medida a los ingresos, y la base global de usuarios superó los 22 millones.

image.png

【Resumen AiBase:】

✨ La tasa anual de ingresos de LingAI superó los 100 millones de dólares en tan solo 10 meses.

💰 Los suscriptores P contribuyen con cerca del 70% de los ingresos.

👥 La base global de usuarios superó los 22 millones, proporcionando servicios de API a empresas.

6. Meta divulga los detalles técnicos de Aria Gen2: cuatro cámaras adicionales, batería de 8 horas desafiando a Apple Vision Pro

Meta revela por primera vez los detalles técnicos de las gafas de investigación Aria Gen2, que han experimentado mejoras completas en diseño de hardware, tecnología de sensores e inteligencia artificial en comparación con la versión inicial.

image.png

【Resumen AiBase:】

Cuatro cámaras adicionales, sensores de obturador global para resolver problemas de distorsión en movimiento, precisión de medición de profundidad significativamente mejorada.

Nuevo micrófono de contacto, tecnología de conducción estructural integrada en la nariz, puede recoger claramente el sonido incluso en ambientes ruidosos.

La capacidad de procesamiento de inteligencia artificial se ha mejorado considerablemente, admitiendo seguimiento de seis grados de libertad, seguimiento ocular y seguimiento de manos en 3D, estableciendo la base para futuras interacciones AR.

7. El lanzamiento oficial de PixVerse de Apes Technology versión doméstica "TakeMeAI"

La versión doméstica de PixVerse de Apes Technology, "TakeMeAI", se ha lanzado oficialmente, compatible tanto con la web como con dispositivos móviles, y ofrece una plataforma de API abierta, reduciendo significativamente los costos y tiempos de producción de videos.

image.png

【Resumen AiBase:】

TakeMeAI ayuda a los usuarios a crear fácilmente contenido de video personalizado mediante efectos de IA y WoW Launcher.

La versión doméstica soporta V4.5, proporcionando soluciones convenientes de generación de video para satisfacer múltiples necesidades.

TakeMeAI Open Platform ha colaborado con varias empresas principales, proporcionando herramientas eficientes de generación de video para empresas.

Enlace detallado: https://pai.video

8. Wells Fargo predice que los ingresos publicitarios de ChatGPT llegarán a cien mil millones de dólares en 2030

Analistas de Wells Fargo predicen que para 2030, ChatGPT ocupará aproximadamente el 30% del mercado global de publicidad de búsqueda, con ingresos cercanos a los 100 mil millones de dólares, lo que podría desafiar la posición dominante de Google.

image.png

【Resumen AiBase:】

Para 2030, ChatGPT se espera que ocupe aproximadamente el 30% del mercado global de publicidad de búsqueda, con ingresos cercanos a los 100 mil millones de dólares.

Actualmente, Google domina más del 90% del mercado de publicidad de búsqueda, pero se espera que disminuya a aproximadamente el 60% para 2030.

El proceso de comercialización de ChatGPT podría verse impulsado por la colaboración con fabricantes de teléfonos móviles y las decisiones antimonopolio.

9. Wang Ziran agradece a Dong Mingzhu y Lei Jun y se reinicia como creador de reseñas de IA

El conocido bloguero de tecnología Wang Ziran anunció el regreso y cambio de nombre a ‘Wang Ziran IA’, centrado en la creación de contenido relacionado con IA para ayudar a las industrias tradicionales a digitalizarse, además compartió su experiencia en Gree y su gratitud hacia Dong Mingzhu y Lei Jun.

image.png

【Resumen AiBase:】

🚀 El 6 de junio, el canal Bilibili de Wang Ziran fue restablecido y renombrado como ‘Wang Ziran IA’, comenzando una nueva etapa como creador de reseñas de IA.

💼 Durante su tiempo en Gree, rediseñó el sistema de ventas, inspirado por el aliento de Dong Mingzhu y Lei Jun, continuó adelante con su ideal.

💡 Elegir el campo de IA para emprender fue porque vio su gran potencial y cree que puede obtener retornos rápidamente.

10. Zhiyuan lanza RoboOS2.0 y RoboBrain2.0: el primer robot que soporta el mecanismo MCP

En la Conferencia de Zhiyuan de Beijing, el Instituto de Investigación de Inteligencia Artificial Zhiyuan lanzó el sistema operativo de inteligencia corporal RoboOS2.0 y el gran modelo RoboBrain2.0, promoviendo el desarrollo del ecosistema de inteligencia corporal.

image.png

【Resumen AiBase:】

El sistema operativo RoboOS2.0, que soporta el mecanismo MCP, reduce la barrera de entrada y mejora la capacidad de colaboración entre robots múltiples.

La precisión del plan de tareas de RoboBrain2.0 aumentó un 74%, destacándose en la deducción espacial e inteligencia de programación.

Ya ha colaborado con varias empresas para construir un ecosistema abierto y cooperativo de inteligencia robótica.

11. La nueva obra de Google! Portraits permite hablar con expertos virtuales y descubre secretos de comunicación y liderazgo

Portraits, lanzado por Google, es un producto innovador basado en tecnología de IA que permite interactuar en tiempo real con expertos virtuales para aprender habilidades prácticas como comunicación y liderazgo, destacando por su alto grado de personalización e interactividad.

image.png

【Resumen AiBase:】

🌟 Experiencia de aprendizaje inmersiva mediante interacción con expertos virtuales.

🌐 Personalización impulsada por IA, ajustando dinámicamente el contenido para garantizar relevancia.

🌍 Aplicaciones amplias, desde el entorno laboral hasta la educación, ayudando en el desarrollo personal y profesional.

12. OpenAudio lanza el modelo TTS S1-Mini de código abierto: 0.5B parámetros crean una voz de IA muy natural

Fish Audio ha lanzado una versión ligera del modelo S1 llamada S1-Mini, con solo 0.5B de parámetros, pero con alta expresividad y soporte multilingüe, y al hacerla de código abierto ha reducido significativamente la barrera de entrada, trayendo posibilidades innovadoras a la educación y el entretenimiento.

image.png

【Resumen AiBase:】