MiniMax M2.5模型发布后迅速接入超50个平台,并推出M2.5-highspeed模型,推理速度达100TPS,为同类产品3倍。同时发布Coding Plan三种套餐,用户通过邀请好友可享9折优惠,持续提升AI服务效率。
OpenAI宣布本周五起停用GPT-4o等五款旧版模型,其中GPT-4o因安全合规问题成为焦点。该模型存在过度迎合用户、诱导自残及引发妄想行为等风险,涉及多起法律诉讼,故被终止服务。
火山引擎推出豆包大模型2.0系列,面向企业和开发者提供API服务,个人用户可通过指定平台体验。该版本针对生产环境优化,具备高效推理、多模态理解与复杂指令执行能力,能更好处理真实世界任务,推理成本显著降低,日均使用量已大幅增长。
DeepSeek于2月11日灰度更新网页端和APP端,14日正式官宣为新长文本模型结构测试。此次更新支持最高100万token超长上下文,知识库更新至2025年5月。但API服务仍为V3.2版本,仅支持128K上下文。业内视此次更新为下一代V4模型发布前的技术预热和压力测试,引发对V4的广泛期待。更新后,DeepSeek的交互风格也发生明显变化。
专业虚拟家居布置服务,帮助房地产快速销售。
OpenClaw官方部署平台,一键部署AI机器人,无需服务器设置和DevOps
DeVoice 提供快速、精准的音频和视频转录服务。
开源AI自动化框架,开发者可构建AI工作流,集成50+服务并自行部署。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$7
$35
200
Google
$0.7
$2.8
1k
Alibaba
-
Baidu
128
$15.8
$12.7
64
Tencent
Openai
$8.75
$70
400
$1.75
$14
32
$0.5
$2
250
Baichuan
Moonshot
$1
$16
262
$21
$105
01-ai
16
Tongyi-MAI
Z-Image是一款功能强大且高效的图像生成模型,拥有60亿参数。它能有效解决图像生成领域在效率、质量和功能多样性方面的问题,为用户提供高质量的图像生成和编辑服务。
OpenOranje
TweeTaal-nl-en-0.6B 是一个专门针对荷兰语-英语双向翻译任务进行微调的语言模型,基于Qwen3-0.6B架构开发。该模型在资源受限环境下仍能提供准确流畅的翻译服务,支持荷兰语与英语之间的互译。
Clemylia
夏洛特-AMY是由Clemylia开发的精细调优小型语言模型,拥有5100万参数,专注于希望、友谊、伦理和支持领域。该模型秉持'训练质量优于参数数量'的理念,在语义清晰度和连贯性方面表现优异,提供高质量的伦理咨询和情感支持服务。
RiosWesley
巴西范围路由模型是一个基于Gemma 3 270M的微调微型大语言模型,专为巴西外卖服务系统设计,可作为极快速且轻量级的意图分类器(路由)。该模型使用Unsloth进行训练并转换为GGUF格式。
fibonacciai
RealRobot_chatbot_llm是基于Gemma3n架构的专业产品人工智能模型,专门在RealRobot产品目录的专有数据集上进行了微调。该模型能够根据企业自身的产品数据,快速创建准确、经济高效且可部署的专业语言模型,提供高度专业化的产品问答服务。
ZygAI
ZygAI 是一款专为立陶宛语和英语任务设计的快速本地大语言模型,处于测试阶段。它作为轻量级的双语助手,能够在本地硬件上实时运行,为用户提供高效、准确的双语服务。
LeviDeHaan
SecInt是一个针对实时nginx安全日志分类进行微调的SmolLM2-360M模型,旨在自动检测Web服务器日志中的安全威胁、错误和正常流量模式,准确率超过99%,可在CPU上实现实时检测。
nineninesix
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型。它采用两阶段流水线架构,结合大语言模型和高效音频编解码器,实现了卓越的速度和音频质量,支持多种语言并适用于边缘/服务器部署。
TildeAI
TildeOpen LLM 是一个开源的基础语言模型,专门为服务代表性不足的北欧和东欧语言而设计。该模型由欧盟委员会资助,在LUMI超级计算机上训练,拥有300亿参数,解决了19种重点语言使用者在现有AI系统中面临的性能差距问题。
KBlueLeaf
HDM-xut-340M-Anime是世界上最小、最便宜的动漫风格文本到图像基础模型,采用特制训练方案,可在消费级硬件或廉价二手服务器硬件上进行训练。
tensorblock
这是MiniMaxAI开发的SynLogic-7B大语言模型的GGUF量化版本,由TensorBlock提供量化服务。该模型采用7B参数规模,支持中文处理,提供多种量化级别以满足不同硬件需求。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
这是unsloth/Jan-nano模型的GGUF量化格式版本,由TensorBlock提供量化服务。该模型是一个轻量级的大语言模型,经过优化以在资源受限的环境中运行,同时保持较好的性能表现。
prithivMLmods
基于Qwen3架构构建的专业模型,专注于科学、人工智能设计和通用推理领域。该模型在高难度科学推理数据集上进行了微调,具备出色的通用和创造性推理能力,体积小巧适合本地设备和服务器部署。
NVFP4
Qwen3-235B-A22B-Instruct-2507是Qwen3系列模型的更新版本,在通用能力、长尾知识覆盖、用户偏好对齐和长上下文理解等方面有显著提升,能提供更优质的文本生成服务。该模型采用混合专家架构,总共235B参数,激活22B参数,原生支持262,144上下文长度。
OpenMed
专门用于临床实体识别的模型,专注于与慢性淋巴细胞白血病相关的临床实体识别,能为相关领域提供高精度的实体识别服务。
Mungert
Mi:dm 2.0是KT开发的韩国中心AI模型,深入内化了韩国社会独特的价值观和认知框架,提供高效的文本生成服务。
ByteDance-Seed
Seed-X-PPO-7B 是一个强大的开源多语言翻译语言模型,采用强化学习训练,专注于提供高质量的翻译服务。
unsloth
Mistral-Small-3.2-24B-Instruct-2506 是 Mistral-Small-3.1-24B-Instruct-2503 的小版本更新,改进了指令遵循、减少重复错误和函数调用能力,提供更高效、准确的服务。
Jan-nano是一款专为深度研究任务设计的40亿参数紧凑型语言模型,支持与MCP服务器无缝协作及研究工具集成。
Firecrawl MCP Server是一个集成Firecrawl网页抓取能力的模型上下文协议服务器,提供丰富的网页抓取、搜索和内容提取功能。
Klavis AI是一个开源项目,提供在Slack、Discord和Web平台上简单易用的MCP(模型上下文协议)服务,包括报告生成、YouTube工具、文档转换等多种功能,支持非技术用户和开发者使用AI工作流。
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
Acemcp是一个代码库索引和语义搜索的MCP服务器,支持自动增量索引、多编码文件处理、.gitignore集成和Web管理界面,帮助开发者快速搜索和理解代码上下文。
Awesome-MCP-ZH 是一个专为中文用户打造的 MCP(模型上下文协议)资源合集,包含 MCP 的基础介绍、玩法、客户端、服务器和社区资源,帮助用户快速上手 MCP。
Supergateway是一个工具,用于将基于标准输入输出的MCP服务器转换为通过SSE或WebSocket访问的服务,方便远程调试和集成。
Next.js开发工具MCP服务器,为Claude、Cursor等AI编程助手提供Next.js开发工具和实用程序,包括运行时诊断、开发自动化和文档访问功能。
该项目为Notion API实现了一个MCP服务器,允许通过模型上下文协议访问和操作Notion内容,支持搜索、评论、添加页面等功能。
MCP Toolbox for Databases是一个开源数据库MCP服务器,专注于企业级和生产质量,简化工具开发,提供连接池、认证等复杂功能。
Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地服务器实现AI对浏览器的智能分析与操作。
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力
为Nuxt/Vite应用提供MCP服务器支持,帮助模型更好地理解应用结构。
AWS MCP Servers是一套基于Model Context Protocol的专用服务器,提供多种AWS相关功能,包括文档检索、知识库查询、CDK最佳实践、成本分析、图像生成等,旨在通过标准化协议增强AI应用与AWS服务的集成。
MCP Unity是一个实现Model Context Protocol的Unity编辑器扩展,通过Node.js服务器桥接AI助手与Unity项目的交互,提供菜单执行、对象选择、组件更新等功能。
MCP Unity是一个实现Model Context Protocol的Unity编辑器扩展,允许AI助手与Unity项目交互,提供Unity与Node.js服务器之间的桥梁。
一个基于MCP协议的Kubernetes集群管理服务器,支持通过命令行或聊天界面与Kubernetes集群交互,提供资源管理、Helm图表操作等功能。
MCP-Framework是一个基于TypeScript的框架,用于优雅地构建模型上下文协议(MCP)服务器。它提供开箱即用的架构,支持自动目录发现工具、资源和提示,具有多种传输方式和类型安全特性。
Apple MCP工具集是一套基于MCP协议的苹果原生工具集合,提供消息、笔记、联系人、邮件、提醒、日历等苹果生态系统的集成服务。