在Microsoft AI Tour年度盛会上,豆神教育推出全新“豆神AI短剧平台”,基于多模态AI架构,融合文本理解、图像生成、视频生成及智能配音技术,涵盖剧本创作、分镜拆解到角色设定等功能,标志着AI在内容创作领域的重大突破。
抖音生活服务平台发布《AIGC创作规范》,核心要求创作者对AI生成或合成内容主动清晰标注,保障用户知情权;同时严打侵权搬运,保护原创视听素材的版权与人格权,强调内容必须合法、可追溯。
爱奇艺推出“AI艺人库”,艺人可授权创建数字虚拟形象,已有部分一线演员入驻。该技术将艺人形象数据化,在保护肖像权前提下,用于短剧、互动视频等制作。
在第十六届北京国际电影节上,影视飓风创始人Tim分享了团队使用AI进行影像创作的经历。他们曾花费大量时间生成500多个AI镜头,但在视频中主动标注“AI生成”后,却收到大量负面评论。Tim指出,团队在无人机测评中特意使用AI技术以突显产品特点。
强大AI图像与视频生成平台,先进技术助您快速创造惊艳视觉作品
Brainrot.mov:用AI创作病毒式脑电波视频,快速简易
免费试用,支持图像、视频AI转换,用GPT Image 2生成4K内容。
Ella是创作者的一体化AI视频平台,提供AI工具、编辑器和云存储。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
$2
$20
$8
$240
52
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
citizenplain
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务。该模型使用AI Toolkit训练,为视频生成应用提供支持。
hyperchainsad
这是一个基于Wan2.2-T2V-A14B基础模型训练的文本到视频LoRA模型,使用AI Toolkit工具包进行训练,专门用于增强文本到视频的转换能力。
synap5e
这是一个基于AI Toolkit by Ostris训练的文本到视频LoRA模型,使用Wan2.2-T2V-A14B作为基础模型,支持文本到视频的转换任务,为相关领域的应用提供了强大的支持。
zambawi
joywan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频和图像生成任务,需要配合基础模型Wan-AI/Wan2.1-T2V-14B-Diffusers使用。
spamnco
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务,为图像生成提供增强功能。该模型使用AI Toolkit训练,需要特定的触发词'diddly'来激活图像生成。
BarleyFarmer
natalie_wan_2.2-lora 是基于 AI Toolkit by Ostris 训练的 LoRA 模型,专门用于文本到视频转换任务,能够有效提升图像生成的质量和效果。
MartinSSSTSGH
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频的图像生成任务,使用触发词'Lilly'来生成特定风格的图像内容。
Mark111111111
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频转换,为图像生成带来新的体验。该模型需要配合基础模型Wan2.2-T2V-A14B使用。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
LL1999
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频转换任务。模型采用Safetensors格式,支持在ComfyUI、AUTOMATIC1111等多种平台使用。
LiseTY
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频转换任务。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种AI工具和框架。
Isshywondertwin
Alexis_Noir_Wan2.2-lora 是使用 AI Toolkit by Ostris 训练的 LoRA 模型,专门用于图像到视频转换任务。该模型基于 Wan2.2-I2V-A14B 基础模型,支持高分辨率图像生成。
bigdoinks420518
这是一个使用AI Toolkit by Ostris训练的LoRA模型,基于Wan-AI/Wan2.1-T2V-14B-Diffusers基础模型,主要用于文本到视频生成,在图像生成领域有独特应用价值。
EightiesPower
bl00dsqibWan22-lora是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于图像到视频处理任务,为图像和视频处理领域提供了新的解决方案。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
jude1903
AJWWan22-lora 是一个基于文本生成视频的LoRA模型,通过AI Toolkit进行训练,专门用于图像生成任务。该模型需要特定的触发词来激活生成功能。
fraemwerk
这是一个基于Wan2.1-T2V-14B模型的文本到视频LoRA适配器,使用AI Toolkit训练,专注于图像生成任务,需要特定触发词'fraemwerk'来激活生成功能。
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频的转换任务。模型基于Wan2.2-T2V-A14B架构,支持高分辨率图像生成。
xreborn
ohwx2_wan-lora是一个基于文本生成视频的LoRA模型,使用AI Toolkit训练,专门用于图像生成任务,需要特定触发词'ohwx girl'来激活生成效果。
adb-mcp是一个概念验证项目,旨在通过MCP协议为LLM提供接口,创建控制Adobe工具(如Photoshop和Premiere)的AI代理。该项目包含MCP服务器、Node命令代理服务器和Adobe应用插件,支持自然语言指令操作Adobe软件,适用于图像和视频编辑自动化。
YouTube MCP服务器是一个标准化接口实现,允许AI语言模型通过协议与YouTube内容进行交互,提供视频信息获取、字幕管理、频道和播放列表管理等功能。
OpenCV MCP Server是一个基于Python的计算机视觉服务,通过Model Context Protocol (MCP)提供OpenCV的图像和视频处理能力。它为AI助手和语言模型提供从基础图像处理到高级对象检测的全套计算机视觉工具,包括图像处理、边缘检测、人脸识别、视频分析和实时对象跟踪等功能。
AI视频生成MCP服务器,支持文本和图像输入生成动态视频,提供多种参数控制和模型选择。
一个AI驱动的视频编码辅助工具,通过MCP服务器连接Claude AI,提供智能错误解析、实时监控和自动化解决方案。
YouTube视频分析MCP服务,提供转录提取、内容摘要和AI查询功能
MCP Kling是首个且唯一完整的Kling AI MCP服务器,提供13种创意工具,支持视频生成、图像处理、唇形同步及虚拟试衣等功能,实现与Claude的无缝集成,适用于内容创作者和开发者。
TikTok MCP是一个集成TikTok访问功能的工具,通过TikNeuron为Claude AI等应用提供视频内容分析、字幕获取和帖子详情查询服务。
Shaka Packager MCP服务器是一个实验性项目,将Shaka Packager视频处理工具与Claude AI应用集成,提供视频转码、封装和分析功能。通过MCP协议与文件系统服务器配合,使Claude能访问和处理本地视频文件。
一个AI驱动的视频编码辅助工具,通过MCP服务器连接Claude AI与编码工作流,提供智能错误解析、实时分析和自动化解决方案,减少人工干预。
剪映视频制作MCP服务器是一个基于Model Context Protocol的自动化工具,让AI助手能够通过自然语言创建专业的视频内容,支持自动创建剪映草稿、添加素材、应用特效和导出项目文件。
一个基于Model Context Protocol的服务器工具,用于从YouTube视频中提取字幕文本,支持与Cursor和Claude Desktop集成,方便AI直接分析视频内容。
YouTube MCP服务器是一个工具,用于从YouTube视频中获取和提取字幕,使AI语言模型能够访问和处理视频内容。
360 AI 云盘 MCP 服务实现,允许 AI 模型通过标准协议与云盘交互,提供文件管理、上传下载、视频处理等智能操作能力。
一个基于Google Gemini和Vertex AI的AI视觉分析MCP服务器,支持图像和视频的多模态分析,提供对象检测、图像比较等功能,可集成到多种MCP客户端中。
YouTube MCP是一个基于AI的解决方案,旨在通过机器学习技术提升YouTube内容交互体验,支持视频搜索、字幕获取及语义搜索等功能,无需官方API。
一个基于Google Gemini AI的MCP服务器,提供图像、音频和视频识别功能,支持多种传输方式和客户端集成。
AI驱动的YouTube视频上传工具,支持OAuth2认证和多频道管理,无需CLI或YouTube Studio,且不共享用户数据。
基于Go开发的MCP服务器,支持SSE和stdio运行方式,提供B站个人信息查询、最新关注及视频搜索功能,助力AI个性化视频内容选择。
Media Gen MCP 是一个严格遵循TypeScript和MCP规范的服务器,专注于使用OpenAI和Google的AI模型生成和编辑图像与视频。它提供了一系列工具,包括图像生成/编辑、视频创建/混音、文件获取与处理,并支持智能资源链接和内联输出,适用于各种MCP兼容客户端。