亚马逊在英国推出AI驱动的升级版Proteus仓储机器人,作为其向欧洲配送网络投资100亿欧元计划的一部分。新款机器人可响应对话式指令,活动范围从旧版仅限仓库码头区域扩展至更广区域,而旧版目前仅在美国25个站点使用。
OpenAI对ChatGPT记忆功能进行重大升级,推出基于Dreaming V3机制的新系统。核心目标是解决记忆过时与准确性不足两大痛点,并提升大规模服务的扩展能力。新系统告别强提示模式,实现智能进化,不再完全依赖用户明确指令。
苹果公司近日批准第三方AI智能体Poke接入“苹果商务消息”平台,这是该平台首次开放给非官方AI。Poke由加州初创公司开发,能将AI助手融入iMessage聊天场景,使iMessage从单一通信工具向全能型任务入口扩展,标志着苹果开始调整企业客服通道,承载更主动的AI能力。
谷歌宣布“Ask Gemini in Drive”功能扩展至Gmail,帮助用户在海量邮件中快速查找特定信息。该功能于三月推出,现向符合条件的Google Workspace、AI Pro和Ultra用户开放。用户需在左侧选择Gmail为查询来源,点击“Ask Gemini”按钮即可使用。
Brik AI将创意愿景转化为可复用、可扩展的动态设计工具。
Astero是强大AI平台,助您轻松设计、推出和扩展高性能网站。
无需代码,构建原生应用,全球扩展,随时可上架应用商店。
SortFeed.io Chrome扩展,可排序TikTok、Instagram和Pinterest帖子并导出数据。
Openai
-
Input tokens/M
Output tokens/M
Context Length
Alibaba
$1
$4
1k
Google
$8.75
$70
Moonshot
$16
262
$3.5
$10.5
32
Mungert
MiroThinker v1.0是一个开源研究智能体,通过模型级别的交互式扩展提升工具增强推理和信息搜索能力。该模型在多个基准测试中表现出色,支持长上下文和深度多步分析。
DavidAU
这是一个增强版的多模态视觉语言模型,基于Qwen3-VL-8B-Thinking模型,通过Brainstorm 20x技术扩展至12B参数,采用NEO Imatrix增强的GGUF量化。模型具备强大的图像理解、文本生成和多模态推理能力,在视觉感知、文本质量和创意场景方面都有显著提升。
noctrex
本项目是对Qwen3-Coder-30B-A3B-Instruct模型进行MXFP4_MOE量化的成果,将上下文大小从256k扩展到1M,为代码生成和编程任务提供了更优化的模型版本,具有提升性能和节省资源的价值。
moonshotai
Kimi Linear是一种混合线性注意力架构,在各种场景下包括短、长上下文以及强化学习扩展机制中,均优于传统的全注意力方法。它能有效解决传统注意力机制在长上下文任务中效率低下的问题,为自然语言处理等领域带来更高效的解决方案。
ServiceNow-AI
Apriel-H1-15b-Thinker 是一款拥有150亿参数的混合推理模型,结合了Transformer注意力机制和Mamba状态空间层,在推理、数学和编码等方面表现出色,具备高效性和可扩展性。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微调版本,由 TheStage AI 针对多平台实时、低延迟和低功耗语音转文本推理进行优化。支持流式转录、单词时间戳和可扩展性能,适用于实时字幕、会议和设备端语音界面等场景。
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究代理模型,结合了AI反馈强化学习(RLAIF)和强大的推理框架,能够在工具增强的大语言模型中实现可靠、对齐和可扩展的研究级推理,适用于复杂的多步骤研究工作流程。
本项目是对Qwen3-VL-235B-A22B-Thinking模型进行MXFP4_MOE量化处理,旨在提供更高效的图像文本到文本转换能力。该版本来自unloth,已将上下文大小从256k扩展到1M,通过特定的量化技术优化模型在不同场景下的性能表现。
这是Qwen3-VL-235B-A22B-Thinking模型的MXFP4_MOE量化版本,专门用于图像文本到文本的转换任务。该模型基于unsloth扩展的1M上下文版本进行量化,保持了强大的多模态理解能力。
prithivMLmods
多拉多网络冲浪工具扩展版是基于通义千问3-4B微调的函数调用和智能推理模型,专为网络搜索编排、工具增强推理和动态问题解决而设计。它在智能决策、工具选择和结构化执行流程方面表现出色。
cpatonn
Qwen3-Next-80B-A3B-Instruct是通义千问团队开发的高效稀疏混合专家模型,总参数量80B,激活参数量仅3B。该模型采用创新的混合注意力机制和极低激活率的MoE架构,在保持强大性能的同时大幅提升推理效率,原生支持262K上下文长度并可扩展至1M令牌。
unsloth
Qwen3-Next-80B-A3B-Instruct是阿里巴巴通义千问团队开发的最新一代大型语言模型,采用创新的混合注意力机制和高稀疏专家混合架构,在保持80B总参数的同时仅激活3B参数,实现了高效的上下文建模和推理加速,原生支持262K上下文长度并可扩展至1M令牌。
Kwai-Keye
快手Keye-VL是由快手Keye团队打造的前沿多模态大语言模型,在视频理解、视觉感知和推理任务中表现卓越。1.5版本通过创新的快慢视频编码策略、LongCoT冷启动数据管道和强化学习训练策略,在视频理解、图像感知和推理能力上达到新高度,支持长达128k标记的扩展上下文长度。
yslan
STream3R是一种基于因果Transformer的可扩展序列3D重建模型,将点云图预测重新定义为仅解码器的Transformer问题。它引入流式处理框架,利用因果注意力高效处理图像序列,能够很好地泛化到各种具有挑战性的场景,包括传统方法经常失效的动态场景。
Qwen
Qwen3-235B-A22B-Thinking-2507是一款强大的大语言模型,在推理任务、通用能力和长上下文理解等方面有显著提升,适用于高度复杂的推理场景。该模型在过去三个月里持续扩展了思维能力,提升了推理的质量和深度。
ERNIE-4.5-300B-A47B 是一款文本 MoE 后训练模型,拥有 3000 亿的总参数,每个标记有 470 亿的激活参数。该模型具备多模态异构 MoE 预训练、高效扩展基础设施和特定模态后训练等先进技术,能在文本理解与生成、图像理解及跨模态推理等任务中表现出色。
yyfz233
π³是一种可扩展的排列等变视觉几何学习模型,革新了视觉几何重建方法。
DeSTA-ntu
DeSTA2.5-Audio是一个通用的大型音频语言模型,通过自生成的跨模态对齐技术,在无需特定任务指令调优数据的情况下实现高扩展性和效率,同时保留语言能力并避免灾难性遗忘。
CypressYang
SongBloom是一个创新的全长歌曲生成框架,采用自回归草图绘制和基于扩散的细化交错范式,结合了扩散模型的高保真度和语言模型的可扩展性,能够生成高质量的全长歌曲。
DeepSeek-R1-Llama-8B-F32-GGUF 是 DeepSeek-R1-Distill-Llama-8B 的量化版本,采用强化学习直接训练,具备自我验证、反思和生成扩展思维链等能力。
Aderyn是一个开源的Solidity智能合约静态分析工具,由Rust编写,帮助开发者和安全研究人员发现Solidity代码中的漏洞。它支持Foundry和Hardhat项目,可生成多种格式报告,并提供VSCode扩展。
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地服务器实现AI对浏览器的智能分析与操作。
MCP Unity是一个实现Model Context Protocol的Unity编辑器扩展,允许AI助手与Unity项目交互,提供Unity与Node.js服务器之间的桥梁。
MCP Unity是一个实现Model Context Protocol的Unity编辑器扩展,通过Node.js服务器桥接AI助手与Unity项目的交互,提供菜单执行、对象选择、组件更新等功能。
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
Browser MCP是一个MCP服务器+Chrome扩展,通过AI应用(如VS Code、Claude等)实现浏览器自动化操作,具有快速、隐私保护、保持登录状态和规避检测等特点。
OpenDia是一款开源浏览器扩展工具,允许AI模型直接控制用户浏览器,利用现有登录状态、书签等数据进行自动化操作,支持多种浏览器和AI模型,注重隐私保护。
MCP Go 是一个 Go 语言实现的模型上下文协议(MCP)服务端框架,用于连接 LLM 应用与外部数据源和工具。它提供了资源管理、工具调用、提示模板等核心功能,支持会话管理和中间件扩展。
Klavis AI是一个开源项目,提供在Slack、Discord和网页上使用的多功能计算平台(MCP),支持非技术用户轻松配置AI工作流,开发者可扩展构建。
Claude Debugs For You是一个VS Code扩展,通过MCP服务器实现与LLM(如Claude)的交互式代码调试。
pg-aiguide是一个AI优化的PostgreSQL知识库,为AI编程助手提供语义搜索官方文档、最佳实践技能和扩展生态文档,帮助生成更高质量的PostgreSQL代码。
LYRAIOS是一个基于模型上下文协议(MCP)的多AI代理操作系统,旨在通过连接金融网络和区块链公链扩展AI应用功能,提供区块链操作、金融科技分析和教育学习等服务。
JetBrains MCP服务器插件,实现LLM与IDE的无缝集成,提供自定义工具扩展点
MCP橡皮鸭是一个基于模型上下文协议(MCP)的服务器,作为桥梁查询多个兼容OpenAI的LLM。它像橡皮鸭调试法一样,允许用户向不同的AI“鸭子”解释问题并获得多元视角。支持多种AI提供商,提供对话管理、多模型比较、共识投票、辩论和迭代优化等高级工具,并可通过MCP桥接功能连接其他MCP服务器以扩展能力。
该项目通过MCP协议实现了类似Claude Code的功能,提供代码理解、修改、命令执行等工具,支持多模型和Jupyter笔记本操作,具备安全控制和开发扩展能力。
GhidrAssistMCP是一个强大的Ghidra扩展,通过实现模型上下文协议(MCP)服务器,使AI助手和其他工具能够通过标准化API与Ghidra的反向工程功能交互。
该项目提供了一系列基于Quarkus/Java的Model Context Protocol服务器,用于扩展支持MCP的LLM应用功能,包含JDBC数据库交互、JVM监控、文件系统操作等多种服务。
Figma MCP服务器项目,通过Claude等客户端实现与Figma API的集成,支持文件读取和设计系统管理功能,具备扩展架构但受限于API当前为只读状态。
Notebook Intelligence (NBI) 是一个为JupyterLab设计的AI编码助手和可扩展AI框架,支持GitHub Copilot及其他LLM提供商的模型,包括本地Ollama模型。它通过代码生成、自动补全和聊天界面等功能显著提升生产力,并支持Model Context Protocol (MCP) 服务集成。
该项目实现了一个可定制的MCP服务器,用于执行RTE协议,支持多种终端类型和SSL连接,提供Java工具类方便扩展功能。