LPM1.0模型发布,能通过单张参考图实时生成人物说话、聆听及唱歌视频。其核心突破在于多模态处理,可同步整合文本、音频与图像,生成唇形精准同步、表情细腻且情绪过渡自然的动态画面。该模型支持接入ChatGPT等主流语音AI,将传统语音对话升级为具备视觉反馈的实时交互。
上汽通用与火山引擎合作,将豆包大模型引入别克至境E7,推动智能座舱从“指令交互”升级为“语义理解”。新系统能识别20多种情绪,通过语调、语速感知用户心情,实现从“执行工具”到“理解者”的转变。
京东AI布局从“单点突破”转向“全线爆发”,公布AI研发与应用进展,涵盖基础大模型、数字人、具身智能及智能体生态,旨在将AI深度植入供应链与电商场景。其中,京东首次开源基础大模型JoyAI,调用量环比暴增4.55倍。
埃隆·马斯克宣布,xAI与特斯拉合作推出AI项目“Macrohard”或“Digital Optimus”。该项目是一个能实时监控用户屏幕及键盘鼠标操作(最近5秒内容)的数字机器人,采用双脑架构:xAI的Grok模型负责决策,特斯拉的FSD系统处理视觉信息,旨在实现类人快速反应。
数字绘画行为的人工智能模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
Baidu
128
$2
$20
SadraCoding
SDXL-Deepfake-Detector 是一款精准检测 AI 生成人脸的工具,专注于维护数字世界的真实性,为抵御视觉虚假信息提供隐私保护且开源的解决方案。该模型通过微调预训练模型实现轻量级且高准确率的检测。
impresso-project
Impresso NER模型是一个专门用于历史文档处理的多语言命名实体识别模型。基于堆叠式Transformer架构,能够识别数字化历史文本中的细粒度和粗粒度实体类型,包括人名、头衔、地点等。该模型针对历史文档中的OCR噪声、拼写变化和非标准语言用法进行了优化。
starsfriday
这是一个基于 Qwen/Qwen-Image 训练的人像生成模型,专门用于生成中国古风风格的动漫图片。该模型通过 LoRA 技术微调,能够生成具有传统东方美学特征的数字艺术作品。
Phonepadith
这是一个专门针对老挝语优化的摘要生成模型,基于Google Gemma-3-4B-Instruct模型微调,使用超过5000个高质量老挝语输入-输出对进行训练,主要聚焦人工智能与数字内容(AIDC)主题。
dh-unibe
适用于16至18世纪德语手写文本识别模型,由伯尔尼大学数字人文中心开发。