DeepSeek于4月24日发布新一代大模型DeepSeek-V4,性能比肩顶级闭源模型,成为开源AI里程碑。它支持100万tokens超长上下文,适用于长文档分析、代码生成和多轮任务。同时推出轻量版Flash和标准版,分别满足快速迭代与深度应用需求。
爱奇艺宣布,国内首部全AI生成长篇电影《灵魂摆渡·浮生梦》定档2026年暑期。影片基于经典IP《灵魂摆渡》,由郭靖宇监制,原班编剧导演参与,全程运用生成式AI技术构建角色、场景与叙事,标志着AI在影视创作中从辅助工具迈向全流程应用。
蚂蚁灵光App升级推出“灵光圈”,打造消费级Coding Agent。在“30秒生应用”基础上,强化多智能体协作、全模态生成及移动端集成,成为首个支持用户用自然语言在手机端创建、分发、使用、迭代AI应用的平台,实现0代码、0部署、0门槛创作。目前用户已创建超3000万个闪应用。
OpenAI推出生命科学AI模型GPT-Rosalind,以DNA结构发现者命名,旨在加速药物研发。该模型通过分析生化数据,协助科研人员进行证据合成、假设生成、实验规划和蛋白质工程分析,提升实验室研究效率,推动医疗应用转化。
AI驱动的应用想法生成器,基于个人技能生成个性化盈利应用创意。
Zoer是AI Web应用生成器,描述想法,AI构建全栈应用,无需代码
一个开源的全栈 AI 网页应用生成器,帮助您构建自己的平台。
Noiz AI提供自然流畅的语音合成服务,应用场景丰富,生成高效。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
citizenplain
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务。该模型使用AI Toolkit训练,为视频生成应用提供支持。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
bigdoinks420518
这是一个使用AI Toolkit by Ostris训练的LoRA模型,基于Wan-AI/Wan2.1-T2V-14B-Diffusers基础模型,主要用于文本到视频生成,在图像生成领域有独特应用价值。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
deepseek-community
DeepSeek-VL是由DeepSeek AI团队开发的开源视觉语言模型,能够同时处理文本和图像信息,生成上下文相关的回复。该模型采用混合视觉编码器,支持高分辨率图像处理,在真实世界的视觉语言理解应用中表现出色。
zai-org
GLM-4-9B-0414是智谱AI推出的90亿参数大语言模型,在文本生成领域表现优异。该模型在15T高质量数据上进行预训练,具备强大的文本生成能力,可应用于代码编写、故事创作、报告生成等多种场景,在效率和效果之间取得了出色平衡。
aiwithoutborders-xyz
这是一个在法医应用中检测AI生成图像的视觉Transformer模型,训练于迄今为止最大的数据集。
buildborderless
这是一个基于视觉Transformer架构的图像分类模型,专门用于检测AI生成的图像,为法医应用提供支持。模型在包含270万张图像的大规模数据集上训练,涵盖15+个生成器和4600+个模型。
Kortix
FastApply-7B-v1.0是一个专为即时代码应用设计的70亿参数模型,能够生成完整文件编辑,为SoftGen AI提供核心支持。
FastApply-1.5B-v1.0 是一个1.5B参数的模型,专为即时代码应用设计,能够生成完整的文件编辑,为SoftGen AI提供支持。
blazerye
DrugAssist是一个专门用于分子优化的大语言模型,专注于药物发现和分子生成等科学领域的研究,为AI在科学领域的应用提供有力支持。
njwright92
ComicBot是一款基于Mistral 7B v2微调的喜剧内容生成与分析AI模型,专为Humor Hub应用设计,能够创作笑话、优化笑点并提供喜剧内容推荐。
HelpingAI
PixelGen是由HelpingAI开发的先进文本到图像生成模型,拥有34.7亿参数,能够根据文本描述生成高质量的视觉图像,为创意设计和实际应用提供强大的AI工具。
FFusion
FFUSION AI是一款基于Stable Diffusion 2.1技术开发的潜在扩散模型,专注于文本到图像生成。该模型通过先进的扩散技术将文本提示转化为生动的艺术作品,支持多种创意和研究应用场景。
AWS MCP Servers是一套基于Model Context Protocol的专用服务器,提供多种AWS相关功能,包括文档检索、知识库查询、CDK最佳实践、成本分析、图像生成等,旨在通过标准化协议增强AI应用与AWS服务的集成。
Mapbox MCP服务器是一个Node.js实现的模型上下文协议服务器,为AI应用提供Mapbox地理空间API的访问能力,包括地理编码、兴趣点搜索、路线规划、等时线分析和静态地图生成等功能。
MCP Appium是一个基于模型上下文协议的智能移动自动化服务器,为AI助手提供跨平台移动应用测试工具,支持iOS和Android平台,具备智能元素定位、会话管理和自动化测试生成等功能。
一个专注于探索和应用生成式AI(GenAI)的仓库,旨在通过实际案例和资源分享,帮助用户学习和实验GenAI在日常任务中的应用,包括写作、编程、图像生成等。
B12的AI网站生成模型协议服务器,支持通过Claude桌面应用调用
一个基于OpenBB widgets.json规范的MCP服务器,将各种小部件类型、参数和配置示例映射为结构化工具,方便开发者和AI助手直接查询并生成合规的OpenBB应用JSON配置。
Outsource MCP是一个支持多AI模型提供商的统一接口服务,通过MCP协议让AI应用能便捷调用不同厂商的文本和图像生成能力。
LetzAI MCP是一个基于Node.js的图像生成工具,通过Claude桌面应用集成LetzAI API实现AI图像生成与处理。
MCP URL2SNAP是一个轻量级的Model Context Protocol (MCP)服务器,允许LLM通过指定URL捕获网页截图并返回图像访问链接。该项目简化了网页快照的生成和共享过程,适合集成到Claude Desktop等AI应用或自动化工作流中。
Gemini MCP服务器是一个为Claude桌面应用设计的中间件,通过Google Gemini AI模型实现图像生成功能。该项目提供便捷的安装配置向导,支持Docker容器化部署,并允许用户自定义生成参数。
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。
FortunaMCP是一个基于硬件熵的高性能随机数生成服务器,通过多种统计分布模型为AI应用提供真实不可预测的随机值,适用于模拟仿真和游戏场景。
多提供商AI图像生成服务器,支持Google、ZHIPU AI和阿里云百炼,提供文本生成图像和图像转换功能,兼容MCP客户端应用。
FortunaMCP是一个高级MCP服务器,专注于生成高质量随机值,适用于AI应用中的模拟、建模和游戏机制等场景。
ARC MCP服务器是一个创新平台,通过AI模型与ARC企业应用框架的无缝集成,提供文档辅助、API集成、项目生成和部署支持等工具,加速企业级云原生应用的开发。
B12的AI网站生成器MCP服务,通过Claude桌面应用调用实现AI建站功能
Test Genie MCP是一个AI驱动的多平台应用测试自动化MCP服务器,支持iOS、Android、Flutter、React Native和Web应用,提供从场景生成、测试执行、问题检测到修复建议和自动修复的完整测试流程。
Stellify MCP服务器是一个AI原生代码生成平台,允许AI助手通过结构化JSON操作与Stellify项目交互,实现Laravel和Vue.js应用程序的增量构建,支持代码解析、依赖自动解析和全局库安装。
Thoth MCP服务器是一个为Thoth内容创作平台设计的Model Context Protocol(MCP)服务器,允许AI助手通过API创建和管理多平台社交媒体内容,支持Twitter、Instagram、LinkedIn等平台,提供品牌风格应用、AI内容增强、图片生成和定时发布功能。
该项目通过ChatGPT测试LLM在信息检索、API集成(如IGN的APICARTO和GéoPlateforme服务)以及代码生成方面的能力,包括地理编码、邮政编码查询等功能,并探索AI在技术评估和开发辅助中的应用。