MiniMax M2模型采用全注意力机制,放弃线性或稀疏注意力技术。开发团队认为,尽管后者能节省计算资源,但全注意力在工业应用中更高效,能提升模型性能。这一决策旨在优化实际部署效果,推动AI技术发展。
钉钉AI表格实现行业突破,单表支持1000万热行,率先应用于零售电商,助力“双11”高效数据处理与决策。阿里云与钉钉联合研发“存算一体”架构,仅100多天即突破百万级限制,推动进入超大规模数据时代。
Snap以4亿美元与AI初创公司Perplexity达成合作,将整合其先进搜索引擎技术至Snap应用,旨在提升用户体验和搜索功能。此消息推动Snap股价显著上涨。
Anthropic与冰岛合作,将在全国学校引入Claude大语言模型,助力教师课程准备与教学。该计划覆盖城乡,旨在探索AI教育应用,或成全球范例。
免费Mac应用,可去除7大AI视频平台水印,无需登录上传,本地处理
一款多功能应用,可解决数学问题、优化文章、检测AI及进行研究。
Banono AI借助谷歌Nano Banana模型,可创建、编辑图像视频,无需应用程序。
离线AI语音转文字应用,本地运行,隐私安全,一次付费,终身使用。
google
$2.16
输入tokens/百万
$18
输出tokens/百万
1M
上下文长度
anthropic
$108
$540
200k
chatglm
$0.43
$1.01
131.1k
mistral
-
128k
2M
reka-ai
$0.72
$2.88
alibaba
32k
aws
$0.5
openai
cohere
256k
snowflake
$1.44
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
nineninesix
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,通过独特的两阶段架构结合大语言模型与高效音频编解码器,实现低延迟与高质量语音合成,实时因子低至0.2,比实时速度快5倍。
citizenplain
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务。该模型使用AI Toolkit训练,为视频生成应用提供支持。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
synap5e
这是一个基于AI Toolkit by Ostris训练的文本到视频LoRA模型,使用Wan2.2-T2V-A14B作为基础模型,支持文本到视频的转换任务,为相关领域的应用提供了强大的支持。
bigdoinks420518
这是一个使用AI Toolkit by Ostris训练的LoRA模型,基于Wan-AI/Wan2.1-T2V-14B-Diffusers基础模型,主要用于文本到视频生成,在图像生成领域有独特应用价值。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型。它采用两阶段流水线架构,结合大语言模型和高效音频编解码器,实现了卓越的速度和音频质量,支持多种语言并适用于边缘/服务器部署。
GeneralAnalysis
GA Guard Lite是General Analysis开发的轻量级开源审核模型,专门用于检测语言模型输出中的违规内容。该模型能够识别七类安全风险,包括非法活动、仇恨言论、个人信息泄露等,为AI应用提供高效的内容安全防护。
GA Guard Core是General Analysis开发的开源审核模型,专门用于检测和分类七类违规内容,包括非法活动、仇恨言论、个人信息泄露等,确保AI应用的安全性和合规性。
ibm-granite
Granite-4.0-H-Small是IBM开发的320亿参数长上下文指令模型,专为企业级AI助手构建设计,支持多种语言和专业应用场景。
Granite-4.0-Micro 是 IBM 开发的 30 亿参数长上下文指令模型,具有优秀的指令遵循和工具调用能力,支持多种语言,适用于商业应用和 AI 助手场景。
NVIDIA Qwen3-32B FP4模型是阿里云Qwen3-32B模型的量化版本,使用优化的Transformer架构,通过将权重和激活量化为FP4数据类型实现高效推理。该模型支持商业和非商业用途,适用于各种AI应用场景。
NVIDIA Qwen3-14B FP4模型是阿里巴巴Qwen3-14B模型的量化版本,采用FP4数据类型进行优化,通过TensorRT-LLM进行高效推理。该模型专为NVIDIA GPU加速系统设计,适用于AI Agent系统、聊天机器人、RAG系统等多种AI应用场景,支持全球范围内的商业和非商业使用。
Jackmin108
GLM-4.5-Air是智谱AI推出的适用于智能体的基础模型,采用紧凑设计,统一了推理、编码和智能体能力,能满足智能体应用的复杂需求。该模型参数量适中且效率优越,已开源多种版本,可用于商业和二次开发。
mradermacher
这是基于mookiezii/Discord-Hermes-3-8B模型进行量化处理后的版本,提供了多种量化格式的GGUF模型文件,适用于不同硬件环境和性能需求的对话AI应用场景。
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
这是一个基于kshitijthakkar/loggenix-moe-0.3B-A0.1B模型的静态量化版本,专门针对低资源环境和边缘AI应用优化,提供多种量化级别选择。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
AWS MCP Servers是一套基于Model Context Protocol的专用服务器,提供多种AWS相关功能,包括文档检索、知识库查询、CDK最佳实践、成本分析、图像生成等,旨在通过标准化协议增强AI应用与AWS服务的集成。
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
Desktop Commander MCP是一个让Claude桌面应用能够执行终端命令、管理文件系统的AI助手工具,支持代码搜索、编辑、进程管理和远程文件读取等功能。
Genkit是一个用于构建AI驱动应用的开源框架,提供Node.js和Go库,支持多种AI模型和向量数据库集成,包含开发工具和插件生态系统。
Browser MCP是一个MCP服务器+Chrome扩展,通过AI应用(如VS Code、Claude等)实现浏览器自动化操作,具有快速、隐私保护、保持登录状态和规避检测等特点。
XcodeBuild MCP是一个为AI助手和MCP客户端提供Xcode相关工具集成的服务器,支持Xcode项目管理、模拟器控制和应用工具等功能,实现自动化开发流程。
HiveChat是一个专为中小团队设计的AI聊天应用,支持多种大模型服务商,提供分组管理、Token限额、第三方登录等功能。
hyper-mcp是一个基于WebAssembly插件的高性能MCP服务器,支持通过容器注册表分发插件,适用于多种AI应用场景。
iMCP是一款macOS应用,通过AI连接用户的数字生活,支持与Claude Desktop等客户端通过Model Context Protocol (MCP)协议交互,提供日历、联系人、位置、地图、消息、提醒和天气等多种功能。
这是一个关于Web3 Model Context Protocol (MCP) 服务器的精选列表,涵盖了链交互、交易、DeFi、市场数据、工具和社交等多个类别。MCP是一个开放协议,标准化了应用程序如何向LLM提供上下文,类似于AI应用程序的USB-C端口。DeMCP是第一个去中心化的MCP网络,专注于为代理提供自研和开源的MCP服务,支持加密支付,并结合TEE和区块链注册表重新定义了MCP的安全性和可靠性。
Coco AI是一个统一搜索平台,集成了企业应用和数据(如Google Workspace、Dropbox、GitHub等),提供跨平台搜索和AI驱动的团队聊天功能,旨在提升工作效率和协作体验。
MCP Link是一个自动化工具,能够将任何OpenAPI V3规范的API转换为MCP服务器,使现有RESTful API能够无缝接入AI驱动的应用生态系统。
MCP Notes是一个基于MCP协议的智能笔记应用,支持AI驱动的笔记管理和网页界面操作,使用DynamoDB存储数据。
LYRAIOS是一个基于模型上下文协议(MCP)的多AI代理操作系统,旨在通过连接金融网络和区块链公链扩展AI应用功能,提供区块链操作、金融科技分析和教育学习等服务。
ClickUp MCP Server是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表和文件夹。
一个安全的Docker容器代码沙箱环境,为AI应用提供隔离的执行空间,支持多种编程环境和文件操作。
Zen7支付代理是首个DePA去中心化支付代理的实践实现,采用多智能体协作架构,支持A2A和MCP协议,为AI智能体和Dapp应用提供多链多币种支付解决方案,实现自动化加密支付和LLM驱动的意图识别。
adb-mcp是一个概念验证项目,旨在通过MCP协议为LLM提供接口,创建控制Adobe工具(如Photoshop和Premiere)的AI代理。该项目包含MCP服务器、Node命令代理服务器和Adobe应用插件,支持自然语言指令操作Adobe软件,适用于图像和视频编辑自动化。
一个基于Docker容器的安全代码沙箱环境,为AI应用提供隔离的执行空间。
GPT Researcher MCP Server是一个基于MCP协议的AI研究服务器,能够通过深度网络搜索和验证,为LLM应用提供高质量、优化的研究结果。