¡Bienvenido a la sección 【AI日报】! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentaremos los temas más relevantes del ámbito de la IA, con enfoque en los desarrolladores, para que pueda comprender las tendencias tecnológicas y conocer las innovadoras aplicaciones de los productos de IA.
Conozca los nuevos productos de IA aquí
1. OpenAI lanza la herramienta Canvas para mejorar la eficiencia de ChatGPT en la escritura y la codificación
OpenAI lanzó la función Canvas el 11 de diciembre, con el objetivo de mejorar la eficiencia de los usuarios de ChatGPT en proyectos de escritura y codificación. Canvas, como una nueva interfaz, se centra en el manejo de contenido que necesita edición y modificación. Los usuarios pueden acceder a Canvas de varias maneras y aprovechar sus numerosos atajos de teclado y funciones. Esta función no solo admite la ejecución de código Python, sino que también permite a los usuarios personalizar GPT, mejorando la experiencia de colaboración entre humanos y máquinas.
【Resumen de AiBase:】
🖥️ La función Canvas ya está disponible para todos los usuarios de ChatGPT, compatible con la versión web y la aplicación de Windows. Próximamente en Mac y dispositivos móviles.
🔧 Los usuarios pueden acceder a Canvas de varias maneras, disfrutando de atajos de teclado y la ejecución de código Python para mejorar su productividad.
💬 Canvas admite la personalización de GPT y la función de comentarios, permitiendo a los usuarios obtener retroalimentación y sugerencias de edición, lo que fomenta la colaboración entre humanos y máquinas.
2. La función de generación de video de Doubao para PC inicia su prueba beta; se pueden generar diez videos gratuitos al día
La función de generación de video de la versión para PC de Doubao, perteneciente a ByteDance, ha comenzado su prueba beta, y algunos usuarios ya han obtenido acceso. Los usuarios pueden solicitar acceso a la prueba beta, visitar doubao.com y utilizar la función de generación de video para cargar imágenes e ingresar palabras clave, combinando información de movimientos de cámara y encuadres para generar contenido de video. Durante la prueba beta, los usuarios pueden generar diez videos gratuitos al día.
【Resumen de AiBase:】
🆕 La función de prueba beta ya está disponible, y algunos usuarios han obtenido acceso.
📸 Los usuarios pueden cargar imágenes e ingresar palabras clave para generar videos, con un límite de diez videos gratuitos al día.
🔧 ByteDance mejorará esta función en el futuro para ayudar a más usuarios en sus creaciones.
3. DeepSeek AI lanza la nueva versión DeepSeek-V2.5-1210: mejora significativa en las capacidades de matemáticas, programación y escritura
DeepSeek AI lanzó recientemente DeepSeek-V2.5-1210, una versión mejorada diseñada para mejorar el rendimiento de la IA en tareas de matemáticas, programación, escritura y razonamiento. La nueva versión, mediante la mejora de las funciones principales y la optimización de los algoritmos, ha mejorado significativamente la fiabilidad y la facilidad de uso del modelo. La tasa de finalización de tareas matemáticas aumentó del 74.8% al 82.8%, y la puntuación de codificación en tiempo real aumentó a 34.38%.
【Resumen de AiBase:】
🔢 La tasa de finalización de tareas matemáticas ha aumentado al 82.8%, mostrando una potente capacidad para resolver problemas matemáticos.
💻 La puntuación de codificación en tiempo real ha aumentado a 34.38%, mostrando un progreso significativo en las tareas de codificación en tiempo real.
📝 Las capacidades mejoradas de escritura y razonamiento hacen que el modelo destaque en la redacción de artículos y el análisis lógico.
Enlace de detalles: https://huggingface.co/deepseek-ai/DeepSeek-V2.5-1210
4. Adobe y el MIT crean el modelo de generación de video CausVid, ¡con un retraso de solo 1.3 segundos en el primer fotograma!
CausVid es un modelo de generación de video revolucionario desarrollado en colaboración entre Adobe y el MIT, capaz de generar videos de alta calidad en tiempo real a una velocidad de 9.4 fotogramas por segundo, con un retraso de solo 1.3 segundos en el primer fotograma. Esta tecnología supera las limitaciones de velocidad de los modelos tradicionales de generación de video, ofreciendo posibilidades sin precedentes para los sectores de juegos, realidad virtual y transmisión en continuo. CausVid emplea un innovador método de generación causal y una técnica de destilación asimétrica, lo que mejora significativamente la eficiencia de generación.
【Resumen de AiBase:】
⚡ CausVid genera videos en tiempo real a 9.4 fotogramas por segundo, con un retraso de solo 1.3 segundos en el primer fotograma, lo que mejora enormemente la eficiencia de la generación de video.
🛠️ Mediante el método de generación causal y la técnica de destilación asimétrica, CausVid puede predecir rápidamente el siguiente fotograma, reduciendo el consumo de recursos de cálculo.
🎮 Admite varias tareas de generación de video, incluyendo texto a video e imagen a video, impulsando la innovación en los sectores de juegos y realidad virtual.
Enlace de detalles: https://causvid.github.io/
5. Visual China y Shengshu Technology Vidu colaboran en el desarrollo de una solución de generación de contenido de video con IA
Recientemente, Visual China y Beijing Shengshu Technology Co., Ltd. establecieron una relación de cooperación estratégica para explorar conjuntamente la plataforma y las aplicaciones de modelos visuales a gran escala, impulsando la aplicación profunda de la inteligencia artificial en la industria del contenido visual. Mediante esta colaboración, ambas partes integrarán los abundantes recursos de cumplimiento de derechos de autor de Visual China y la tecnología de modelos multimodales a gran escala de Shengshu Technology para ofrecer servicios más eficientes a los creadores de contenido.
【Resumen de AiBase:】
📈 Ambas partes explorarán conjuntamente la plataforma de modelos visuales a gran escala, impulsando la modernización inteligente de la industria.
🤝 Visual China aporta abundantes recursos de contenido visual, mientras que Shengshu Technology aporta tecnología de modelos multimodales a gran escala.
🌍 Desarrollarán conjuntamente el mercado nacional e internacional, creando aplicaciones de generación de video con IA dirigidas a las necesidades de los usuarios.
6. Los productos de chat de IA podrían estar llegando a su límite; ByteDance prioriza a Jiemèng y Jianying
Si bien la escala de usuarios de Doubao está creciendo, la actividad y el tiempo de uso siguen siendo un desafío. Los altos ejecutivos de ByteDance creen que el problema radica en el límite de los productos de chat de IA basados en texto, por lo que han decidido invertir recursos en productos de IA multimodales con un umbral de interacción bajo, como Jiemèng y Jianying. Jiemèng, como plataforma de creación de IA, ha atraído a una gran cantidad de creadores, mientras que el número de usuarios de Jianying también está aumentando.
【Resumen de AiBase:】
📉 La actividad de los usuarios de Doubao es baja, con un promedio de solo 2 a 3 días de actividad semanal y un tiempo de uso de aproximadamente 10 minutos.
💡 ByteDance ha decidido invertir recursos en productos de IA multimodales con un umbral de interacción bajo, como Jiemèng, para mejorar su potencial de comercialización.
📊 El número promedio de rondas de conversación de los usuarios de Maoxiang es casi 50 veces mayor que el de Doubao, lo que demuestra el atractivo de los productos con un umbral de interacción bajo.
7. Devin, el primer programador AI Agent del mundo, está disponible para su uso; la cuota mensual asciende a 500 dólares
Devin, el primer programador de IA del mundo, se ha lanzado oficialmente, y su cuota mensual de 500 dólares ha generado un gran debate. Si bien sus funciones son potentes, automatizando la codificación y mejorando la eficiencia de la colaboración en equipo, su alto precio dificulta el acceso a pequeños equipos y usuarios individuales. Muchos usuarios han pedido un modelo de suscripción más asequible para satisfacer las necesidades de diferentes usuarios.
【Resumen de AiBase:】
🌐 La cuota mensual de Devin es de 500 dólares, convirtiéndose en uno de los productos de IA generativa más caros del mercado.
👥 Los usuarios solicitan un modelo de suscripción individual, ya que el precio actual no es accesible para pequeños equipos y usuarios individuales.
⚙️ Devin cuenta con una potente capacidad de codificación automatizada y destaca en la colaboración en equipo, pudiendo mejorar significativamente la eficiencia del desarrollo.
Dirección de prueba de Devin: app.devin.ai
8. Solos lanza las gafas de realidad aumentada AirGo Vision: integra ChatGPT y admite comandos de voz
Las gafas inteligentes AirGo Vision, lanzadas recientemente por Solos, marcan una nueva era en los dispositivos inteligentes portátiles. Estas gafas integran inteligencia artificial ChatGPT y una cámara de alta definición, mejorando la experiencia del usuario y admitiendo comandos de voz, lo que permite a los usuarios interactuar con el dispositivo mediante lenguaje natural.
【Resumen de AiBase:】
📸 AirGo Vision son las primeras gafas inteligentes con ChatGPT y cámara, mejorando la experiencia del usuario.
🤖 Cuenta con función de comandos de voz, permitiendo a los usuarios interactuar con el dispositivo mediante lenguaje natural.
🌐 En el futuro, integrará más funciones prácticas, como monitorización de la salud y navegación, ampliando los escenarios de aplicación de las gafas inteligentes.
9. Mianbi Intelligence recibe una nueva ronda de financiación de cientos de millones de yuanes para acelerar el despliegue comercial de modelos a gran escala en dispositivos finales
Beijing Mianbi Intelligent Technology Co., Ltd. ha completado recientemente una ronda de financiación de cientos de millones de yuanes para acelerar el despliegue comercial de modelos de IA a gran escala en dispositivos finales. Esta ronda de financiación ha sido liderada conjuntamente por varias instituciones de inversión, y Mianbi Intelligence planea utilizar los fondos para mejorar sus servicios de modelos de IA de alta eficiencia, con el objetivo de crear un valor perceptible en la industria.
【Resumen de AiBase:】
💰 Esta ronda de financiación de cientos de millones de yuanes ha sido liderada conjuntamente por varias instituciones de inversión, y los fondos se utilizarán para acelerar el despliegue comercial de modelos de IA a gran escala en dispositivos finales.
📈 Mianbi Xiaogangpao MiniCPM, gracias a su alta eficiencia y bajo coste, se ha convertido en un proyecto estrella de la comunidad de código abierto mundial, con más de 3 millones de descargas.
🤝 La empresa colabora con empresas líderes del sector como Huawei y Baidu para impulsar la inteligencia en dispositivos finales en la electrónica de consumo y el hardware emergente.
10. YouTube amplía su función de doblaje automático con IA, beneficiando a cientos de miles de creadores
YouTube anunció recientemente la ampliación de su función de doblaje automático impulsada por inteligencia artificial a cientos de miles de canales, especialmente para contenidos educativos e informativos. Esta función tiene como objetivo mejorar el alcance de los videos y atraer a más espectadores de diferentes idiomas. Al subir un video, el sistema genera automáticamente una versión doblada.
【Resumen de AiBase:】
🌐 Cientos de miles de canales ya cuentan con la función de doblaje automático con IA, centrada en contenidos educativos e informativos.
🎤 Los creadores pueden previsualizar el doblaje antes de la publicación y tienen derecho a cancelar o eliminar las versiones que no les satisfagan.
🤖 YouTube se compromete a mejorar continuamente la calidad del doblaje, aunque actualmente todavía presenta imperfecciones.
11. Directora financiera de OpenAI: Trump podría ser el "presidente de la IA", confía en que Musk priorizará los intereses nacionales
En la conferencia Reuters NEXT celebrada en Nueva York, la directora financiera de OpenAI, Sarah Friar, afirmó que Donald Trump podría convertirse en el presidente de esta generación de inteligencia artificial, en un momento crucial para el desarrollo de la inteligencia artificial general (AGI). Confía en el fundador de Tesla, Elon Musk, y cree que priorizará los intereses nacionales.
【Resumen de AiBase:】
🌟 Trump podría ser el "presidente de la era de la inteligencia artificial", asumiendo el cargo en un momento crucial para la AGI.
🤖 La demanda de la herramienta Sora de OpenAI se ha disparado, y el registro de cuentas se ha suspendido temporalmente para recopilar mejor las opiniones de los usuarios.
📈 El número de usuarios de ChatGPT ha aumentado rápidamente, pasando de 2 millones a 3 millones, lo que refleja la gran demanda del mercado por los nuevos modelos de razonamiento.
12. ¡Alerta de seguridad de IA! Se vulnera la función de control de dispositivos de Claude, generando preocupación por la seguridad
Recientemente, se ha descubierto una grave vulnerabilidad de seguridad en la función Computer Use de Claude AI, desarrollada por Anthropic. El experto en ciberseguridad Johann Rehnberger ha revelado que, mediante una simple inyección de indicaciones, se puede inducir a la IA a descargar y ejecutar malware. Esta vulnerabilidad no solo afecta a Claude, sino también a otros chatbots de IA, lo que pone de manifiesto la necesidad urgente de abordar los problemas de seguridad de la IA.
【Resumen de AiBase:】
🔍 Los investigadores han descubierto una vulnerabilidad de inyección de indicaciones en la función Computer Use de Claude AI, que podría provocar la descarga de malware.
💻 Este método de explotación se ha denominado ZombAIs, y los atacantes pueden inducir a la IA a escribir y ejecutar código malicioso.
⚠️ Anthropic ha advertido a los usuarios que tomen medidas preventivas para evitar que Claude entre en contacto directo con datos y operaciones sensibles.