Bienvenido al programa de 【AI Daily】! Aquí es donde puedes explorar cada día el mundo de la inteligencia artificial, ofreciéndote las noticias más destacadas del campo de la IA. Cada día te mostramos las últimas novedades en tecnología AI y te ayudamos a comprender las tendencias tecnológicas e innovaciones en aplicaciones de IA.
Nuevos productos de IA para descubrir:https://top.aibase.com/
1. Cursor Pro elimina la restricción de 500 solicitudes rápidas y abre una nueva era de uso ilimitado
Como desarrollador, me alegra mucho ver que Cursor Pro ha eliminado la limitación mensual de 500 solicitudes rápidas, lo que sin duda mejora significativamente la eficiencia de desarrollo. Sin embargo, también estoy atento a los posibles efectos de esta medida de tasa y sugiero que todos planifiquen su uso según sus propias necesidades.
[Resumen de AiBase:]
🎉 Cursor Pro planea eliminar la limitación de 500 solicitudes rápidas y lanzará un nuevo modo de 'uso ilimitado'.
💼 Introduce un nuevo plan Ultra con un costo mensual de $200, proporcionando una cantidad equivalente a 20 veces el uso del plan Pro.
📊 La valoración de Anysphere alcanza los $99 mil millones, con ingresos anuales superiores a los $500 millones, consolidando su posición líder en el mercado.
2. El nuevo modelo de video Hailuo 02 de MiniMax de Xiruyu Technology
Xiruyu Technology lanza el nuevo modelo de generación de videos Hailuo02, basado en la arquitectura Noise-aware Compute Redistribution (NCR), que muestra un excelente rendimiento en el manejo de escenarios complejos y la mejora de la calidad de creación, reduciendo significativamente la barrera de creación de videos.
[Resumen de AiBase:]
✨ Hailuo02 es el único modelo que puede manejar eficientemente escenarios complejos como movimientos gimnásticos, ayudando a los creadores a generar más de 370 millones de videos.
⚙️ La arquitectura NCR mejora la eficiencia de entrenamiento e inferencia del modelo en 2.5 veces, aumentando el tamaño de los parámetros en 3 veces, lo que permite un ajuste más grande de datos.
🎥 Soporta la generación de videos en 1080p, con alta relación costo-beneficio, ya disponible en múltiples plataformas con opciones de resolución.
Enlace detallado: https://hailuoai.com/create
3. Google lanza el potente modelo AI Gemini 2.5 Flash-Lite: más rápido en inferencia, menor costo!
Google ha presentado Gemini2.5 Flash-Lite, su modelo más liviano y rentable, con características de inferencia rápida y baja latencia, adecuado para una variedad de aplicaciones, incluidas traducciones en tiempo real y tareas de clasificación de alto rendimiento.
[Resumen de AiBase:]
⚡️ Gemini2.5 Flash-Lite tiene una velocidad de inferencia rápida y baja latencia, ideal para traducciones en tiempo real y tareas de clasificación de alto rendimiento.
🔍 Soporta el procesamiento de contexto superlargo, alcanzando hasta 1 millón de tokens, flexible para sistemas complejos.
🌐 Integrado en Google AI Studio, Vertex AI y Google Search, ayudando a los desarrolladores a trabajar de manera más eficiente.
4. iFlytek vuelve a impulsarse: la versión actualizada de Spark X1 estará disponible en julio
iFlytek lanzará próximamente la versión actualizada de Spark X1, prevista para julio. Esta versión mejora significativamente en términos de rendimiento, experiencia del usuario y estrategia de mercado, mostrando la continua capacidad innovadora de iFlytek en el campo de la voz inteligente.
[Resumen de AiBase:]
🌟 La versión actualizada de Spark X1 será lanzada en julio, con mejoras significativas en el rendimiento y experiencia de usuario.
🌐 iFlytek ha colaborado con varias empresas para acelerar la expansión del mercado, destacándose en la economía digital.
💻 La interfaz de usuario y la experiencia de interacción han mejorado notablemente, proporcionando una experiencia de aplicación más eficiente.
5. Tencent Yuanbao introduce el modo de programación AI, permitiendo la generación de código en tiempo real y previsualización
Tencent Yuanbao ha lanzado un nuevo modo de programación AI, que genera código en tiempo real y ofrece una vista previa de los resultados a través de una interfaz de doble columna. Soporta la ejecución en línea de varios lenguajes de programación, reduciendo la barrera de aprendizaje, especialmente adecuado para escenarios educativos y familiares.
[Resumen de AiBase:]
🌟 Los usuarios pueden generar y previsualizar código en tiempo real a través de la interfaz de doble columna, mejorando la eficiencia de desarrollo.
🚀 Soporta la ejecución en línea de varios lenguajes de programación, simplificando los pasos de configuración y operación.
👨👩👧👦 Ideal para escenarios educativos y familiares, fomentando la creatividad y el interés por la programación.
6. OpenAI anuncia que GPT-4.5 será desactivado de la API, causando confusión y decepción entre los desarrolladores
OpenAI planea desactivar GPT-4.5 Preview de la API el 14 de julio de 2025, lo que ha causado un gran impacto en los desarrolladores que dependían de este modelo. A pesar de ello, GPT-4.5 aún está disponible para los usuarios de ChatGPT personales, y OpenAI recomienda a los desarrolladores migrar a GPT-4.1 u otros modelos.
[Resumen de AiBase:]
📅 OpenAI desactivará GPT-4.5 Preview de la API el 14 de julio de 2025, un cambio importante que los desarrolladores deben adaptarse rápidamente.
🤖 Aunque GPT-4.5 ya no se soporta en la API, sigue siendo una herramienta disponible para los usuarios de ChatGPT personales.
🔄 OpenAI insta a los desarrolladores a migrar a GPT-4.1 u otros modelos alternativos para garantizar la continuidad del negocio y reducir costos operativos.
7. La nueva API de transcripción de Apple sorprende con una velocidad impresionante, superando a OpenAI Whisper en un 55%
La nueva API de transcripción de Apple muestra un rendimiento excepcional, transcribiendo un video de 34 minutos en 4K en solo 45 segundos, superando significativamente a otras herramientas como OpenAI Whisper. Además de la velocidad, esta tecnología destaca por su capacidad de procesamiento local, lo que mejora la eficiencia en el manejo de múltiples videos.
[Resumen de AiBase:]
🌟 La nueva API de transcripción de Apple puede transcribir un video de 34 minutos en 4K en solo 45 segundos, superando significativamente a la competencia.
⏱️ Comparada con OpenAI Whisper, la tecnología de Apple mejora la eficiencia en aproximadamente un 55%, destacando claramente.
📈 La ventaja del procesamiento local permite que Yap sea más eficiente en el manejo de múltiples videos, ahorrando tiempo al usuario.
8. Baidu lanza el primer estudio de doble avatar interactivo, impulsado por el modelo Wenxin de 4.5T
Este artículo presenta el primer estudio de doble avatar interactivo global de Baidu, impulsado por el modelo Wenxin de 4.5T, mostrando avances significativos en la tecnología multimodal y teniendo un impacto profundo en la industria del streaming y el ecosistema de creación de contenido.
[Resumen de AiBase:]
🌟 El modelo Wenxin de 4.5T ha logrado la modelización conjunta multimodal, mejorando significativamente la experiencia de interacción del avatar.
🌐 Los estudios de doble avatar ayudan a la creación de contenido en campos como el comercio electrónico y la educación, reduciendo costos y aumentando la diversidad.
🤝 El plan de código abierto promueve la popularización de la tecnología AI multimodal, ayudando a pequeñas y medianas empresas y desarrolladores a innovar aplicaciones.
9. El CEO de OpenAI revela que Meta intentó contratar a talentos de OpenAI y DeepMind de Google con $100 millones, pero falló
Meta hizo ofertas salariales muy altas a los principales investigadores de AI de OpenAI y Google DeepMind, pero no tuvo éxito. El CEO de OpenAI, Sam Altman, cree que la cultura innovadora de OpenAI y la perspectiva de desarrollo de la IA general (AGI) atraen a buenos empleados. Además, OpenAI está desarrollando una aplicación de redes sociales basada en IA para competir con Meta.
[Resumen de AiBase:]
📌 Meta ofreció ofertas de alto salario para contratar talentos de OpenAI, pero no logró atraer a los mejores empleados.
💼 Sam Altman cree que los empleados de OpenAI valoran más la cultura innovadora y la perspectiva de desarrollo de AGI de la empresa.
🤖 OpenAI está desarrollando una aplicación de redes sociales basada en IA para competir con Meta en el campo de las redes sociales.
10. Despidamos el “sentido de IA”! Krea1 en pruebas abiertas, texturas hiperrealistas, detalles y estilos artísticos diversos
El primer modelo de generación de imágenes Krea1 de Krea AI está disponible en versión beta pública, resolviendo el problema de la sensación de “IA” en la generación de imágenes tradicionales. Ofrece texturas hiperrealistas, estilos artísticos diversos y personalización personalizada, además de contar con funciones de edición en tiempo real.
[Resumen de AiBase:]
✨ Texturas hiperrealistas y detalles: soporta resolución nativa de 1.5K, incluso llegando a 4K ultra HD, mostrando texturas detalladas y materiales realistas.
🎨 Estilos artísticos diversos: entiende precisamente las necesidades de estilos artísticos complejos, evitando la monotonía de la “imagen de IA”.
🌟 Personalización personalizada: permite cargar imágenes de referencia o conjuntos de datos, ajustando los resultados en tiempo real, fortaleciendo el control del creador.
11. El asistente de IA de Tesla Grok está a punto de lanzarse, personalización personalizada hace que conducir sea más divertido
El asistente de IA de Tesla Grok se espera que brinde una experiencia de inteligencia completamente nueva a los propietarios, con interactividad y personalización personalizada, incluidas diferentes versiones de “personalidad” y el modo infantil, aunque actualmente está limitado a vehículos con chips AMD. Con el avance de la plataforma Robotaxi, la importancia de Grok se está haciendo más evidente.
[Resumen de AiBase:]
🚗 Grok cambiará la relación tradicional entre las personas y los vehículos, proporcionando formas ricas de comunicación, como preguntas y respuestas y personalización.
👨👩👧👦 Soporta múltiples opciones de personalización, como diferentes versiones de personalidad y el modo infantil, adecuado para familias.
🔄 Limitado a vehículos con chips AMD, los nuevos modelos disfrutarán de tecnologías más avanzadas, promoviendo el desarrollo de la IA en los vehículos.
12. Gemini de Google recibe una actualización masiva: ¡funcionalidades de carga y análisis de video ahora disponibles!
Google ha lanzado oficialmente las versiones Gemini 2.5 Pro y Flash para todos los usuarios, añadiendo funciones de carga y análisis de video, compatibles tanto con Android como con la web, fortaleciendo la capacidad de procesamiento de video.