可灵AI 3.0版本发布,核心升级视频与图片生成能力,聚焦叙事、画面可控及多模态协同。新增“智能分镜”功能,旨在提升创作体验。
微软公布Visual Studio 2026二月路线图,重点提升AI功能可靠性,解决开发者实际痛点。新版本将优化智能体编程,增强故障处理与自愈能力,避免开发会话因任务失败中断。
西门子已秘密完成对法国AI初创公司Canopus AI的收购,交易金额约1.5亿至3亿欧元。此举旨在为旗下Calibre晶圆制造软件引入前沿计算量测技术,强化AI能力,提升半导体制造竞争力。
上海人工智能实验室发布并开源万亿参数科学多模态大模型“书生 Intern-S1-Pro”,基于“通专融合”架构 SAGE 打造,刷新开源社区参数规模纪录,在多项科学能力上实现突破,综合学科评测稳居 AI4S 领域国际前列。
一站式AI创作平台,融合视觉、视频、工具等多种创作能力
前沿AI图像生成器,结合双技术,有卓越文本渲染能力。
Google DeepMind旗舰多模态AI,1M上下文,具备博士级推理与高级编码能力
Google基于Gemini 3 Pro的AI图像编辑器,推理强,生成编辑能力出色
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Openai
-
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
$2
$20
Bytedance
$1.2
$3.6
4
EssentialAI
Rnj-1-instruct 是由 Essential AI 从头开始训练的 80 亿参数开放权重密集模型,针对代码、STEM 领域、智能体能力和工具调用进行了优化。它在多种编程语言中表现出色,同时在数学和科学领域也展现出强大实力,能力与最先进的开放权重模型相当。
RinggAI
这是一个专为通话记录分析打造的混合语言AI模型,能够处理印地语、英语和混合印地英语的通话转录内容。模型基于Qwen2.5-1.5B-Instruct进行微调,具备强大的多语言理解和信息提取能力。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
allenai
Olmo-3-7B-Think-DPO是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现出色。该模型经过监督微调、直接偏好优化和基于可验证奖励的强化学习等多阶段训练,专为研究和教育用途设计。
Olmo 3 7B RL-Zero Math是Allen AI开发的专为数学推理任务优化的70亿参数语言模型,采用RL-Zero强化学习方法在数学数据集上进行训练,能有效提升数学推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI开发的7B参数规模的语言模型,属于Olmo 3系列。该模型在Dolma 3数据集上进行预训练,在Dolci数据集上进行后训练,并通过强化学习优化数学、编码和推理能力。
Olmo-3-32B-Think-DPO是Allen AI开发的32B参数语言模型,采用直接偏好优化(DPO)训练,具备长链式思维推理能力,在数学、编码等复杂推理任务上表现优异。
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
pnnbao-ump
VieNeu-TTS是首个可在个人设备上运行的越南语文本转语音模型,具备即时语音克隆能力。基于NeuTTS Air微调,能够生成自然逼真的越南语语音,在CPU上具备实时性能。
LiquidAI
LFM2-VL-3B是Liquid AI开发的多模态视觉语言模型,基于LFM2骨干架构构建,具备强大的视觉理解和推理能力,特别在细粒度感知任务上表现出色。该模型能够高效处理文本和图像输入,支持高达512×512分辨率的原生图像处理。
Olmo-3-7B-Think-SFT是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现优异。该模型基于Dolma 3数据集预训练,并在Dolci数据集上进行了后续训练。
hyperchainsad
这是一个基于Wan2.2-T2V-A14B基础模型训练的文本到视频LoRA模型,使用AI Toolkit工具包进行训练,专门用于增强文本到视频的转换能力。
mrgant
lans_v1 - lora是基于Qwen/Qwen-Image模型使用AI Toolkit by Ostris训练的文本到图像转换模型,采用LoRA技术进行优化,具备良好的图像生成能力。
cyburn
qwen_edit_photo_restore_v1-lora是一个基于Qwen-Image-Edit模型训练的LoRA适配器,专门用于图像编辑和修复任务。该模型使用AI Toolkit by Ostris进行训练,支持多种主流AI平台,提供高质量的图像处理能力。
Granite-4.0-Micro是IBM开发的具有30亿参数的长上下文指令模型,基于Granite-4.0-Micro-Base微调而来。该模型使用了开源指令数据集和内部合成数据集,具备增强的指令遵循和工具调用能力,支持多语言任务,可作为各领域AI助手的基础模型。
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个方面有显著改进,包括更长的上下文窗口、更优的编码性能和更强的推理能力。该模型在多个公开基准测试中表现出色,与国内外领先模型相比具有竞争优势。
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
zai-org
GLM-4.6是智谱AI推出的新一代文本生成模型,相比GLM-4.5在上下文处理、编码性能、推理能力等方面实现显著提升,支持200K上下文长度,具备更强的智能体能力和精致的写作能力。
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
Mapbox MCP服务器是一个Node.js实现的模型上下文协议服务器,为AI应用提供Mapbox地理空间API的访问能力,包括地理编码、兴趣点搜索、路线规划、等时线分析和静态地图生成等功能。
一个用于集成微软Bing搜索API的MCP服务器,支持网页、新闻和图片搜索功能,为AI助手提供网络搜索能力。
K8M是一款AI驱动的轻量级Kubernetes控制台工具,集成大模型能力,支持多集群管理和MCP服务。
Crawl4AI RAG MCP Server是一个集成网络爬虫和RAG功能的AI代理服务,支持智能URL检测、递归爬取、并行处理和向量搜索,旨在为AI编码助手提供强大的知识获取和检索能力。
一个基于Playwright的Node.js工具,能够绕过搜索引擎反爬机制执行Google搜索并提取结果,可作为命令行工具或MCP服务器为AI助手提供实时搜索能力。
基于MaaFramework的MCP服务器,为AI助手提供Android设备和Windows桌面自动化能力,支持OCR识别、点击、滑动、文本输入等操作,并能将操作流程转换为可复用的Pipeline。
DB MCP Server是一个支持多数据库的服务器,实现了模型上下文协议(MCP),为AI助手提供结构化访问数据库的能力。它支持MySQL和PostgreSQL,可同时连接多个数据库,自动生成专用工具,并遵循清晰架构设计。
DB MCP Server是一个实现模型上下文协议(MCP)的多数据库服务器,为AI助手提供结构化访问多种数据库的能力。
一个基于MCP协议的Word文档操作服务器,为AI助手提供创建、编辑和管理Microsoft Word文档的能力。
MCP橡皮鸭是一个基于模型上下文协议(MCP)的服务器,作为桥梁查询多个兼容OpenAI的LLM。它像橡皮鸭调试法一样,允许用户向不同的AI“鸭子”解释问题并获得多元视角。支持多种AI提供商,提供对话管理、多模型比较、共识投票、辩论和迭代优化等高级工具,并可通过MCP桥接功能连接其他MCP服务器以扩展能力。
一个基于向量搜索的文档检索MCP服务,为AI助手提供相关文档上下文增强回答能力
Peekaboo MCP是一个macOS工具,能够快速截取屏幕截图并通过AI分析内容,为AI助手提供视觉能力。
HiMarket是一个开箱即用的企业级AI开放平台解决方案,提供管理后台、开发者门户和AI网关三大核心组件,支持将模型服务、MCP Server等AI能力打包成标准化API产品并发布。
Obsidian的MCP工具插件,为AI应用提供安全访问知识库的能力
一个MCP服务器,通过向量嵌入和语义相似性为任何AI模型提供智能搜索Claude Agent Skills的能力,实现渐进式技能发现和跨平台技能共享
Axone的MCP服务器是一个轻量级实现,通过标准化的模型上下文协议(MCP)暴露Axone的能力,作为AI工具访问数据宇宙的网关。
FastApply MCP Server是一个企业级代码智能平台,通过本地AI模型、AST语义搜索、安全扫描和智能模式识别,提供全面的代码分析、搜索和重构能力,支持多语言开发和大规模代码库处理。
Jina AI MCP服务器是一个提供语义搜索、图像搜索和跨模态搜索功能的模型上下文协议服务,支持与Jina AI神经搜索能力无缝集成。
InsightFlow是一个结合实时数据处理与AI智能分析的先进分析平台,通过Model Context Protocol(MCP)实现高级AI能力,并与Claude AI无缝集成,提供智能数据分析和决策支持。