昆仑万维天工AI大模型SkyReels V4在文生视频赛道全球夺冠,性能超越Kling、Google Veo等主流模型。其核心突破在于采用强化学习与逻辑推理技术,有效解决了视频生成的一致性与叙事逻辑难题,成为当前全球视频生成能力最强的AI模型。
DeepSeek V4虽未正式发布,但最新招聘信息已透露其研发重点。官方正集中招募Agent算法、数据评测及基础设施工程师等核心人才。岗位要求显示,团队不仅关注传统算法能力,更重视应聘者对Claude Code、Cursor等前沿开发工具的熟练度,预示新模型将在智能体与代码能力方面重点进化。
DeepSeek V4与姚顺雨新混元模型将于2026年4月发布。DeepSeek V4由梁文锋主导,是多模态大模型,在代码能力和长期记忆方面有显著提升,专注于视觉内容处理和AI搜索能力,并探索“条件记忆”机制。
DeepSeek V4Lite作为V4先行版,以2000亿参数和100万token上下文能力引发关注。经过持续升级,其性能已媲美顶级闭源模型,在多项基准测试中表现突出,展现了强大的竞争力。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
strangervisionhf
这是一个基于DeepSeek-OCR的图像文本识别模型,专门解决了在最新版本transformers库中的兼容性问题,使模型能够在transformers v4.57.1等最新版本中顺利运行。
Clemylia
Lam-2是基于自定义架构Aricate V4开发的第二代小型语言模型(SLM),在问答任务中表现出色,具有卓越的语言连贯性和创造力。相比前代产品,Lam-2在语法正确性和文本生成质量上有显著提升。
rtr46
meiki.text.detect.v0.1是专门针对视频游戏和漫画文本检测的高精度、低延迟OCR模型,在日语相关内容上表现优异。该模型基于D-FINE检测器架构,采用MobileNet v4 small作为骨干网络,提供两种分辨率变体以适应不同应用场景。
bartowski
这是TheDrummer的Cydonia - R1 - 24B - v4.1模型的量化版本,使用llama.cpp工具进行多种精度量化处理,可在不同硬件条件下高效运行,为用户提供更多选择。
jinaai
Jina Embeddings v4 是一款专为多模态和多语言检索设计的通用嵌入模型,特别适用于复杂文档的检索,包括包含图表、表格和插图的视觉丰富文档。
Trendyol
Trendyol LLM v4.1.0 是一款基于 Trendyol LLM base v4.0(在130亿token上继续预训练的Qwen2.5 7B版本)的生成模型,专注于电商领域和土耳其语理解。
yukiarimo
Yuna Ai V4是一款基于LLaMA 3.1 8B架构的多语言文本生成模型,专注于提供智能对话和知识问答体验。经过3B+令牌训练,具备量子思维等先进特性,在对话能力和创造力方面表现突出。
hum-ma
CyberRealistic XL v4 是一个高质量的文本生成图像模型,专注于生成逼真的图像。
Undi95
Lumimaid与Magnum v4合并的12B参数大语言模型,采用DELLA合并方法并加入针对Claude输入优化的Nemo模型
strangerzonehf
基于LoRA技术的NFT数字艺术生成模型,专为V4版本NFT设计优化
backyardai
马格南V4 72B是基于Qwen打造的模型系列中的一员,旨在复刻Claude 3系列模型的散文质量,适用于本地AI聊天应用。
anthracite-org
马格南v4-22B是基于Mistral-Small-Instruct-2409微调的大型语言模型,专门致力于复刻Claude 3系列模型(尤其是Sonnet和Opus)的文本质量。该模型提供了GGUF量化版本,支持32K上下文长度,在多个高质量数据集上进行训练。
fluently
Fluently XL V4 是一款高性能的文本生成图像模型,在imgsys.org竞技场排名第四,以其精准的人体结构和艺术与写实兼备的特点著称。
Fluently V4.0-LCM 是一个全能任务模型,通过融合多模型和LCM技术实现极速图像生成,具备精准解剖结构和高艺术表现力。
Fluently V4-inpainting 是一个通过融合多个检查点和LoRA技术打造的多功能图像处理模型,特别擅长图像修复和扩展任务。
TheBloke
Athena v4是一个实验性的大型语言模型,适用于角色扮演、情感角色扮演及通用场景。使用Alpaca格式提示模板。
CobraMamba
Mamba - GPT - 3B - V4是一款性能卓越的3B参数语言模型,在Open LLM排行榜上表现优异,超越dolly - v2 - 12b,提供高质量的语言处理能力。
shibal1
Anything V4 是一个为二次元爱好者准备的潜在扩散模型,旨在通过简单的提示生成高质量、高细节的动漫风格图像。
xyn-ai
Anything V4 是一款面向动漫爱好者的潜在扩散模型,能够根据少量提示词生成高质量、高细节的动漫风格图像。
prompthero
基于12.4万张Midjourney v4图像训练的文本生成图像模型,使用Stable Diffusion v1.5框架训练
这是一个为NovelAI图像生成API提供支持的MCP服务器,支持最新V4.5模型、多种传输模式和中文优化,方便集成到Claude、LobeChat等AI助手。