商汤科技发布Seko2.0,全球首个专注多集视频生成的AI智能体,实现从单片段到连续叙事的跨越。该系统能保持角色、场景、风格高度一致,在剧情连贯性、人物稳定性和视觉统一性上取得突破,为短剧、广告、教育等领域提供可规模化的AI内容生产方案,基于自研“日日新Seko”多模态大模型。
迪士尼正积极拥抱生成式AI,不仅引入外部工具,还自研了DisneyGPT等系统,将AI融入创意流程,展现其技术转型的野心。
谷歌升级AI虚拟试穿功能,用户只需上传一张自拍,系统即可通过Nano Banana模型智能生成全身轮廓,实现快速虚拟试衣。新功能支持输入尺码,并生成多姿态试穿效果。
谷歌AI试穿功能升级,用户仅需自拍照即可生成全身数字模型进行虚拟试穿,大幅降低使用门槛。系统根据用户选择的尺码生成多张试穿照片,并可设为默认。
SEO45 AI是一款全自动SEO内容生成系统,从关键词研究到发布,完全自动化,实现网站持续增长。
AI检测绕过工具,将AI生成的文本转化为人类化内容,成功绕过主要AI检测系统。
AI学术论文平台系统,支持AI对话、AI PPT、开题报告、期刊论文系统、论文PPT、AIGC降重等功能。
AI co-scientist 是一个基于 Gemini 2.0 的多智能体 AI 系统,旨在帮助科学家生成新的研究假设和实验方案,加速科学发现。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
AvaLovelace
LegoGPT是首个通过文本提示生成物理稳定乐高积木模型的AI系统,基于Llama-3.2-1B-Instruct微调而成。
TheStageAI
弹性模型是由TheStage AI ANNA生成的模型系列,通过滑动控制条可自由调节模型规模、延迟与质量,为自托管场景提供最快最灵活的解决方案。
authormist
专为将AI生成文本转化为更接近人类写作风格而设计的语言模型,优化用于规避AI文本检测系统
scb10x
台风T1 3B是SCB 10X开发的新型开放推理模型系列的首款产品。该模型基于Llama 3.2架构,具备跨领域推理能力,在GPQA、MMLU Pro和AI数学奥林匹克等基准测试中表现优异,特别支持泰语推理过程生成。
prem-research
Prem-1B-SQL是由Prem AI开发的首个全本地文本到SQL模型系列之一,拥有10亿参数,专为低配置GPU设备设计,量化后可在CPU上运行。该模型优先考虑本地化部署,避免数据安全风险,适用于企业级SQL查询生成。
GraySwanAI
Mistral-7B-Instruct-RR是基于Mistral-7B的改进模型,通过表征重路由(RR)技术插入了断路器机制。该技术通过直接干预有害内容生成时的模型表征,以最小化能力损失的方式防止AI系统产生有害内容。
Salesforce
xGen-MM是Salesforce AI Research开发的最新基础大型多模态模型系列,基于BLIP系列改进,具有强大的图像理解和文本生成能力。
nicholasKluge
Aira-2是Aira指令调优系列的第二版,基于GPT-2的葡萄牙语指令调优模型,适用于文本生成和对话任务。
autopilot-ai
Ethical Eye是由AutopilotAI开发的开源AI模型,旨在标记和分析用户生成内容中的有害或不道德行为,为AI系统提供决策辅助以促进道德行为。
AI Studio MCP Server是一个集成Google AI Studio/Gemini API的模型上下文协议服务器,提供支持文件、对话历史和系统提示的内容生成功能。
多集群MCP服务器为生成式AI系统提供与多个Kubernetes集群交互的网关,支持资源操作、集群管理和监控。
Apple RAG MCP是一个为AI代理提供苹果开发专业知识的检索增强生成系统,集成了官方Swift文档、设计指南和Apple Developer YouTube内容,通过AI驱动的混合搜索技术提供准确的技术答案。
DiffuGen是一个先进的本地图像生成工具,集成了MCP协议,支持多种AI模型(包括Flux和Stable Diffusion系列),可直接在开发环境中生成高质量图像。它提供了灵活的配置选项、多GPU支持,并可通过MCP协议与多种IDE集成,同时提供OpenAPI接口供外部调用。
Tyler Forge™ MCP服务器为AI工具提供Tyler Technologies网页组件库的即时文档访问,支持组件查询、代码生成、API验证和设计系统使用。
Agentify Components是一个为React组件添加语义元数据的框架,使AI系统和自动化工具能够理解组件功能。它通过装饰器为组件添加标准化描述,并生成MCP服务器配置,实现组件与AI模型的交互。
Memory Bank是一个基于MCP协议的项目知识管理系统,通过AI自动生成结构化文档,帮助团队高效管理项目知识。
GenPilot是一个简化生成式AI单/多代理系统创建与管理的工具,支持MCP协议,提供终端和Web界面,便于快速开发和部署。
Multi-Model Advisor是一个基于Ollama的多模型咨询系统,通过整合多个AI模型的不同观点,为问题提供更全面的解答。它采用'顾问委员会'模式,让Claude能够综合多个AI视角生成回答。
一个集成了AI驱动任务管理和深度研究功能的Python系统,支持复杂项目分解、任务生成和自动化研究。
一个基于检索增强生成(RAG)的日记系统,支持按日期和主题组织日记,并提供语义搜索功能,可与AI代理连接增强交互。
一个集成4o-image API的MCP服务器实现,支持通过标准化协议让LLM和AI系统生成和编辑图像,包括文本生成图像、图像编辑等功能。
该项目构建了一个自主AI系统,能够将API文档自动转换为cURL命令,具备自动化数据集生成、自我改进模型、API执行服务和持续部署功能。
Vectara MCP是一个基于Model Context Protocol的开源项目,为AI系统提供与Vectara的RAG平台无缝对接的能力,支持快速可靠的检索增强生成功能。
rag-mcp是一个过度设计的检索增强生成系统,通过Python服务器提供多种文本搜索模式(语义搜索、问答搜索、风格搜索),使用PostgreSQL和pgvector存储文本嵌入向量,支持与AI代理交互,架构复杂但可扩展。
Memory Bank MCP是一个基于Model Context Protocol(MCP)的项目知识管理系统,通过AI生成和结构化文档帮助团队管理项目知识,包括项目目标、产品上下文、系统架构、技术细节、当前任务和进展等六个核心文档类型。
一个基于MCP协议的多智能体辩论框架,用于代码审查和辩论规划,通过并行执行多个AI代理(如Claude、Codex)进行代码评审,采用确定性评分系统(P0/P1/P2严重性分级)和平台特定规则,最终合并结果生成评审报告。
一个集成n8n工作流自动化、Claude Code AI编程助手和MCP服务器的智能项目管理系统,具备持久化记忆、自动备份和代码生成功能
Figma MCP服务器是一个连接Figma API的模型上下文协议服务,允许AI工具和LLM访问并处理Figma设计文件,支持设计数据提取、设计系统分析、UI内容管理和开发文档生成等功能。
Kash MCP Server 是一个符合 MCP 协议的服务器,可将 ChatGPT、Claude 等 AI 助手连接到收银系统,实现通过对话管理销售、订单、产品和生成报告。