Boletín diario de IA: ChatGPT admite MCP y función de transcripción de reuniones; Se lanza la versión 1.0 de Cursor; La función de video de Midjourney estará disponible este mes

Bienvenido al programa de noticias de IA! Aquí encontrarás una guía para explorar el mundo de la inteligencia artificial cada día. Presentamos las noticias más destacadas del sector de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de la IA.

Productos de IA frescos: ¡Haz clic para conocerlos!https://top.aibase.com/

1. OpenAI anuncia el lanzamiento de MCP y función de transcripción de reuniones en ChatGPT

Como asistente de IA, me emociona mucho estos nuevos avances de OpenAI. La compatibilidad con MCP permite que ChatGPT se conecte sin problemas a los datos internos de la empresa, mientras que el modo de transcripción de reuniones mejora significativamente la eficiencia de la colaboración en equipo. Esto no solo aumenta la utilidad de ChatGPT, sino que también brinda un gran impulso a la transformación digital de las empresas.

[Resumen de AiBase:]

✅ Soporte para Model Context Protocol (MCP), logrando una búsqueda e inteligencia analítica de conocimiento privado.

🎙️ Nueva función de modo de transcripción, que convierte automáticamente el contenido de las reuniones en puntos clave y acciones.

🔒 En colaboración con Microsoft Azure, se potencia la seguridad y escalabilidad en escenarios empresariales.

2. Cursor 1.0 se lanza oficialmente: nueva función de BugBot, revisión y corrección de código

Cursor 1.0 ha llegado con funciones como BugBot, Background Agent, soporte para Jupyter y Memories, mejorando significativamente la eficiencia de desarrollo. Integrando profundamente la tecnología de IA, optimiza la revisión de código, el desarrollo remoto y la gestión de proyectos.

[Resumen de AiBase:]

🤖 BugBot automatiza la revisión y corrección de código, reduciendo el tiempo de revisión manual y mejorando la eficiencia de colaboración del equipo.

💻 Background Agent ofrece una experiencia fluida de codificación remota, optimizando la consistencia del desarrollo multiplataforma.

📊 Se añade soporte para Jupyter y Memories, ayudando a la ciencia de datos y la gestión de proyectos.

Enlace detallado: https://www.cursor.com/changelog

3. ¡Llegan los videos de Midjourney! V8 está a punto de salir, ¡una nueva era creativa impulsada por IA está por comenzar!

Midjourney está a punto de lanzar su función de video, mientras que el desarrollo de los modelos V7.1 y V8 también está acelerándose. El artículo analiza en detalle los últimos movimientos de Midjourney, incluida la ruptura en la función de video, la actualización de servidores, la optimización de referencias de estilo y los planes futuros del modelo.

[Resumen de AiBase:]

🌟 La función de video estará disponible pronto, inicialmente solo apoyará la conversión de imagen a video, con precios accesibles y usuarios con suscripción anual tendrán acceso prioritario.

⚙️ La expansión de servidores acelera, apoyando la generación de video y la optimización del modelo, asegurando una experiencia de usuario fluida.

🎨 La función de referencia de estilo se actualiza, mejorando la precisión y añadiendo generación de estilos aleatorios, ofreciendo más opciones creativas.

4. Secret Tower AI Search agrega la función de exportación de PPT en la página de explicación de "Hoy aprendo algo"

La plataforma “Hoy aprendo algo” de Secret Tower AI Search ha respondido a las necesidades de los usuarios, agregando la función de exportación de PPT, que permite descargar la presentación completa de la explicación, incluidos gráficos, voz y transcripción literal. Sin embargo, esta función consume recursos de cómputo y actualmente ofrece una experiencia gratuita limitada.

[Resumen de AiBase:]

🎉 Los usuarios pueden hacer clic en el botón 'Exportar PPT' en la página de explicación para descargar una presentación completa con gráficos, voz y transcripción literal.

📚 Debido a las limitaciones de capacidad computacional, la función de exportación será gratuita durante los primeros tres días, después de lo cual se necesitará consumir créditos de cálculo, los usuarios registrados tienen un crédito inicial gratuito.

💬 Esta función fue lanzada debido a las sugerencias de los usuarios, lo que refleja la atención de la plataforma a las necesidades de los usuarios y su capacidad de respuesta rápida.

5. Llega la función de video generado por texto, Manus desafía a Sora de OpenAI

La startup de IA Manus lanzó la función de 'video generado por texto', permitiendo a los usuarios generar videos mediante instrucciones de texto, en competencia con Sora de OpenAI.

[Resumen de AiBase:]

🚀 Manus lanza la función de 'video generado por texto', con miembros Basic, Plus y Pro que experimentan primero.

🤝 Similar a Sora de OpenAI, Manus ofrece un sistema flexible de membresías, con tarifas máximas aproximadamente de 1431 yuanes chinos para la membresía Pro.

🌟 Promueve la popularización de la creación de video por IA, proporcionando herramientas eficientes para creadores de contenido, acelerando la innovación y desarrollo de la industria.

6. Mistral, el gigante francés de la IA, lanza un asistente de codificación empresarial, desafiando la posición dominante de GitHub Copilot

Mistral AI lanza su asistente de codificación empresarial Mistral Code, desafiando la posición dominante de GitHub Copilot en el mercado. El producto combina los últimos modelos de IA con complementos IDE, proporcionando soluciones integradas verticales que resuelven los principales obstáculos para que las empresas adopten asistentes de codificación basados en IA.

[Resumen de AiBase:]

✨ Proporciona capacidad de implementación local y personalización profunda, asegurando que el código permanezca dentro del servidor de la empresa.

🔍 Resuelve los cuatro principales obstáculos para la adopción de asistentes de codificación empresarial mediante productos integrados verticales, ofreciendo soporte integral.

🌟 Modelo Devstral de código abierto, con un rendimiento sobresaliente y adecuado para los requisitos de privacidad de datos empresariales.

7. NVIDIA lanza Llama Nemotron Nano VL AI: encabeza OCRBench, solución avanzada de procesamiento de documentos

NVIDIA presenta Llama Nemotron Nano VL, un compacto modelo visual-lenguaje basado en la arquitectura Llama3.1, optimizado específicamente para el procesamiento inteligente de documentos, que se destaca en OCR Bench v2, con soporte para múltiples modalidades de entrada y despliegues flexibles.

[Resumen de AiBase:]

✨ Con solo 8B parámetros pero con un rendimiento excelente, soporta múltiples páginas, tablas, gráficos y otros escenarios complejos.

🏆 En la prueba OCRBench v2, encabeza la clasificación, mostrando alta precisión y capacidad de generalización.

🚀 Despliegue flexible, compatible desde la nube hasta dispositivos de borde, abierto y compatible con varios marcos.

Enlace detallado: https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1

8. Tencent Charity introduce grandes modelos de IA, mejorando la experiencia interactiva de los proyectos caritativos

Tencent Charity lanza la función "Pregunta a IA", utilizando modelos de inteligencia artificial de gran tamaño para mejorar la interacción entre el público y las organizaciones benéficas, además de expandir los recursos educativos a través de cursos de IA de divulgación.

[Resumen de AiBase:]

🌟 Los usuarios pueden obtener información instantánea sobre los proyectos de caridad de Tencent a través de la función "Pregunta a IA", aumentando la participación.

📚 Tencent y Tsinghua University han lanzado cursos de divulgación de IA que benefician a más de 7000 estudiantes.

🌐 Con la ayuda de la tecnología IA, la eficiencia de los proyectos de caridad mejora, ampliando las rutas futuras de innovación.

9. ¡Se lanza el API de búsqueda de Firecrawl! ¡Una vez y listo, busca y extrae, entra en una nueva era de procesamiento de datos de IA!

El API de búsqueda de Firecrawl simplifica enormemente el proceso de obtención de datos al realizar una sola llamada API para realizar búsquedas web y extracción de contenido, compatible con múltiples formatos de salida y completamente operado en el backend, ideal para desarrolladores de IA.

[Resumen de AiBase:]

🔥 Búsqueda y extracción en una sola llamada: sin necesidad de analizar manualmente resultados de búsqueda complejos, obtén rápidamente el contenido completo de la web.

🌐 Formatos de salida múltiples: compatible con Markdown, HTML, puras URLs y capturas de pantalla, satisfaciendo las necesidades de diferentes modelos de IA.

🌟 Comunidad impulsada: herramienta de código abierto, con más de 10K estrellas en GitHub, proporciona SDKs para Python y Node.js, reduciendo la barrera de desarrollo.

Enlace detallado: https://github.com/mendableai/firesearch

10. ¡El descubrimiento definitivo en IA de voz! Bland TTS clona cualquier voz con un solo clic, tan realista que da miedo.

Bland AI ha lanzado el nuevo motor de síntesis de voz Bland TTS, realizando un gran avance en la inteligencia artificial de voz, incluyendo la clonación de voz con un solo clic, aprendizaje contextual y generación de efectos de sonido, revolucionando el campo de la síntesis de voz.

[Resumen de AiBase:]

🌟 Solo necesita un breve audio para clonar cualquier voz con precisión, reduciendo significativamente la barrera técnica.

📚 Introduce aprendizaje contextual, ajustando dinámicamente el tono y las emociones según el significado, mejorando la naturalidad.

🎶 Soporta la generación de efectos de sonido, extendiéndose a la creación multidimensional de sonido, mejorando la experiencia inmersiva.

Enlace detallado: https://bland.com/enterprise

11. El último informe de Mary Meeker: el costo de entrenamiento de IA alcanza los miles de millones de dólares, el costo de inferencia cae un 99%

El último informe de Mary Meeker, una conocida inversora, revela las contradicciones estructurales del costo en la industria de la IA. El costo de entrenamiento sigue aumentando exponencialmente hasta niveles de miles de millones, mientras que el costo de inferencia ha caído drásticamente un 99% debido a los avances en hardware y algoritmos, lo que está reconfigurando el paisaje comercial de la industria de la IA.

[Resumen de AiBase:]

El costo de entrenamiento aumenta exponencialmente, formando una carrera de armamentos que solo los jugadores de cabeza pueden participar, excluyendo a muchas pequeñas y medianas empresas del mercado.

El costo de inferencia cae abruptamente debido a la iteración de hardware, promoviendo la popularización masiva de aplicaciones de IA y reduciendo la barrera para la innovación de los desarrolladores.

La industria de la IA enfrenta el desafío de equilibrar el gasto y construir un muro tecnológico, donde las redes de efectos son cruciales para la rentabilidad sostenible.

12. ¡Jaaz, un Agente de Diseño de IA de código abierto, surge en escena! Genera imágenes por lotes con un solo clic, ¡la producción creativa despega!

Jazz es un agente de diseño de IA de código abierto que permite generar imágenes por lotes a través de simples configuraciones de API, proporcionando una solución eficiente para creadores profesionales y equipos.

[Resumen de AiBase:]

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

Boletín diario de IA: ChatGPT admite MCP y función de transcripción de reuniones; Se lanza la versión 1.0 de Cursor; La función de video de Midjourney estará disponible este mes

站长之家

Este artículo proviene de AIbase Daily