2025光明科学城论坛在深圳举行,聚焦智能算力与大模型智能体。鹏城实验室等机构发布四项重要成果:鹏城脑海2.1开源多模态模型及配套数据集与工具链;国产万卡推理引擎FenixCOS首次亮相,支持大规模并行与高效切换;气象智能体“阿福”接入鹏城云脑Ⅲ,将服务第十五届全国运动会。
腾讯混元发布开源文生图模型“混元图像2.1”,支持原生2K分辨率图像生成,为中英文输入提供高质量复杂语义文本生成能力,为设计师和视觉创作者提供更高效便捷的创作工具。
腾讯元宝接入DeepSeek V3.1,显著提升响应速度和智能助手能力,为用户带来更高效、更智能的服务体验。
可灵AI发布2.1模型首尾帧功能,实现235%效果提升,解决了AI视频生成的随机性问题,使精准可控的视频创作成为现实,标志着AI视频技术的重要突破。
Wan 2.1 AI 是一款将文本和图像转化为高质量视频的先进 AI 视频生成模型。
Wan2.1 是一款开源的先进大规模视频生成模型,支持多种视频生成任务。
Wan2.1-T2V-14B 是一款高性能的文本到视频生成模型,支持多种视频生成任务。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
sd2-community
Stable Diffusion v2-1-unclip是基于Stable Diffusion 2.1微调的扩散模型,能够接受文本提示和CLIP图像嵌入,用于创建图像变体或与文本到图像的CLIP先验结合使用。
hunyuanvideo-community
混元图像2.1是基于diffusers库的文生图模型,能够根据文本描述生成高质量的图像,支持中英双语输入,为用户提供便捷的图像生成体验。
QuantStack
万2.1文本到视频模型的GGUF格式转换版本,支持文本到视频、图像到视频和视频到视频的转换,经过量化处理以提高运行效率。
ggml-org
Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型,专注于高效处理语音转写任务。
wan-community
万2.1是一套全面开放的视频基础模型,具备顶尖性能、支持消费级GPU、多任务支持、视觉文本生成和高效视频VAE等特点。
万2.1是一套全面开放的视频基础模型,具有顶尖性能、支持消费级GPU、多任务支持、视觉文本生成和高效视频VAE等特点。
万2.1是一个开放且先进的大规模视频生成模型,具备顶尖性能,支持消费级GPU运行,并在多任务处理中表现卓越。
grnr9730
万2.1是一套全面开放的视频基础模型,具有顶尖性能,支持消费级GPU,多任务支持,视觉文本生成和高效视频VAE。
Melvin56
Kanana Nano 2.1B Instruct 是一个由 Kakao 开发的 21 亿参数指令微调语言模型,支持英语和韩语文本生成任务。
Isi99999
万2.1版是一个开放且先进的大规模视频生成模型,支持文本生成视频、图像生成视频等多种任务,适配消费级显卡。
Wan-AI
万2.1是一套全面开放的视频基础模型,旨在突破视频生成的边界,支持中英文文本生成视频、图像生成视频等多种任务。
万2.1是一套全面开放的视频基础模型,旨在突破视频生成的边界,支持中英双语文本生成视频、图像生成视频等多种任务。
kakaocorp
Kanana是由Kakao开发的双语大语言模型系列,在韩语任务上表现卓越,同时在英语任务上保持竞争力。2.1b版本是该系列的轻量级基础模型。
Kanana是由Kakao开发的双语(韩语/英语)语言模型系列,该2.1B参数版本在韩语表现上超越同类模型,同时保持高效计算成本。
万2.1是一套全面开放的视频基础模型,旨在突破视频生成的边界,支持文本生成视频、图像生成视频等多种任务。
万2.1是一套综合性开源视频基础模型,具备文本生成视频、图像生成视频、视频编辑、文本生成图像及视频生成音频等多任务能力,支持中英双语文本生成。
apple
SAM 2.1 Tiny 是 Facebook AI Research (FAIR) 推出的轻量级图像与视频通用分割模型,支持基于提示的可控视觉分割。
SAM 2.1 Large 是FAIR推出的通用分割模型,适用于图像与视频中的可提示视觉分割任务。
SAM 2.1 BasePlus 是FAIR推出的通用分割模型Core ML版本,支持图像和视频中的可提示视觉分割任务。
LibSQL模型上下文协议服务器是一个基于Deno 2.1构建的服务应用,用于连接LibSQL数据库,提供模式信息并支持表查询。它通过模型上下文协议(MCP)处理资源列表、模式读取、提示补全和SQL查询等请求,支持带认证或无认证的数据库访问,兼顾灵活性与安全性。