OpenAI加速推进“去英伟达化”战略,于2026年2月12日发布首款基于Cerebras芯片的AI模型GPT-5.3-Codex-Spark。该模型专为软件工程师设计,提供更灵活的交互体验,支持即时中断与切换,使开发者能随时暂停冗长计算,快速处理其他紧急编码任务。
字节跳动正加速自研AI芯片“SeedChip”,计划今年量产至少10万颗,主要面向推理任务,以保障AI算力供应。尽管公司称相关报道“不准确”,但其今年AI采购预算已超1600亿元,半数仍用于购买英伟达芯片,反映出在推进大模型时面临的高推理成本压力。
美国国防部与OpenAI合作,将ChatGPT集成至其AI平台,面向300万人员开放,旨在提升任务效率和战备水平。
质变科技发布多模态记忆平台MemoryLake,推动AI基础设施从“以数据为中心”转向“以记忆为中心”。该平台旨在解决大模型在复杂任务中知识缺失、幻觉等问题,通过记忆机制提升AI的认知与决策能力,标志着AI向认知智能演进的关键一步。
开源个人AI助理,本地运行,保护隐私,可执行真实任务,超84K开发者信赖。
AI驱动的工作操作系统,按需付费,涵盖会议、任务管理和文档搜索。
开源个人AI助手,可跨多平台执行任务,有50+集成,隐私性强。
一款可以在多个平台上自动管理任务的个人 AI 助手。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
-
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
bartowski
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
mlx-community
本模型是 Mistral AI 发布的 Ministral-3-3B-Instruct-2512 指令微调模型的 MLX 格式转换版本。它是一个参数规模为 3B 的大型语言模型,专门针对遵循指令和对话任务进行了优化,并支持多种语言。MLX 格式使其能够在 Apple Silicon 设备上高效运行。
这是对ai-sage的GigaChat3-10B-A1.8B模型进行的量化处理版本,采用llama.cpp的imatrix量化技术,可在不同硬件条件下更高效地运行。模型支持俄语和英语,主要用于文本生成任务。
DevQuasar
这是 ai-sage/GigaChat3-702B-A36B-preview-bf16 模型的量化版本,旨在为大众提供免费的知识获取途径。该模型是一个大型语言模型,专注于文本生成任务。
allenai
Olmo 3是由Allen Institute for AI开发的新一代语言模型家族,包含7B和32B的指令和思维变体。该模型在长链式思维方面表现出色,能显著提升数学和编码等推理任务的性能。所有代码、检查点和训练细节都将公开,推动语言模型科学发展。
Olmo 3是由Allen Institute for AI开发的新一代语言模型系列,包含7B和32B两种规模,有指令和思考两种变体。该模型基于Dolma 3数据集进行预训练,在Dolci数据集上进行后训练,具备长链式思维能力,在数学和编码等推理任务上表现优异。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
Olmo 3是由Allen Institute for AI开发的一系列语言模型,包含7B和32B两种规模,具有指令式和思考式两种变体。该模型在长链式思维方面表现出色,能有效提升数学和编码等推理任务的性能。采用多阶段训练方式,包括有监督微调、直接偏好优化和可验证奖励的强化学习。
Olmo-3-7B-Think-DPO是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现出色。该模型经过监督微调、直接偏好优化和基于可验证奖励的强化学习等多阶段训练,专为研究和教育用途设计。
Olmo 3是由Allen Institute for AI (Ai2)开发的一系列语言模型,包含7B和32B两种规格,有Instruct和Think两种变体。该模型基于Transformer架构,具有长链思维能力,可有效提升数学和编码等推理任务的表现。
Olmo 3是由Allen Institute for AI开发的开源语言模型系列,包含7B和32B两种规格,分为指令(Instruct)和思考(Think)两种变体。该模型具有出色的长链思维能力,能够显著提升数学和编码等推理任务的表现。
Olmo 3 7B RL-Zero Math是Allen AI开发的专为数学推理任务优化的70亿参数语言模型,采用RL-Zero强化学习方法在数学数据集上进行训练,能有效提升数学推理能力。
Olmo 3是由Allen Institute for AI开发的全新语言模型家族,包含7B和32B两种规模,有指令(Instruct)和思维(Think)两种变体。该模型采用长链式思维提升数学和编码等推理任务表现,旨在推动语言模型科学发展。
Olmo-3-32B-Think-DPO是Allen AI开发的32B参数语言模型,采用直接偏好优化(DPO)训练,具备长链式思维推理能力,在数学、编码等复杂推理任务上表现优异。
EssentialAI
Rnj-1 是由 Essential AI 从头训练的一系列 80 亿参数、开放权重的密集模型。该模型针对代码和 STEM 领域进行了优化,在编程、数学推理、智能体任务和工具调用方面表现出色,能力与最先进的开放权重模型相当。
这是一个基于Moonshot AI技术的量化版本模型,专注于视觉语言理解与生成任务,致力于降低知识获取门槛,让知识为每个人所用。
ss-lab
EXAONE-4.0-1.2B 是一个由 LG AI Research 开发的文本生成模型。它基于 EXAONE-4.0-1.2B 基础模型,使用 tatsu-lab/alpaca 数据集进行了微调,支持英文和韩语两种语言的文本生成任务。模型已转换为 GGUF 格式,便于在本地部署和运行。
LiquidAI
LFM2-VL-3B是Liquid AI开发的多模态视觉语言模型,基于LFM2骨干架构构建,具备强大的视觉理解和推理能力,特别在细粒度感知任务上表现出色。该模型能够高效处理文本和图像输入,支持高达512×512分辨率的原生图像处理。
Olmo-3-7B-Think-SFT是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现优异。该模型基于Dolma 3数据集预训练,并在Dolci数据集上进行了后续训练。
citizenplain
这是一个基于Wan2.1-T2V-14B模型训练的LoRA适配器,专门用于文本到视频转换任务。该模型使用AI Toolkit训练,为视频生成应用提供支持。
Zen MCP是一个多模型AI协作开发服务器,为Claude和Gemini CLI等AI编码助手提供增强的工作流工具和跨模型上下文管理。它支持多种AI模型的无缝协作,实现代码审查、调试、重构等开发任务,并能保持对话上下文在不同工作流间的延续。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
Apify MCP服务器是一个实现Model Context Protocol(MCP)的服务,允许AI助手通过SSE或Stdio与Apify平台上的各种Actor交互,执行数据抓取、网页搜索等任务。
ClickUp MCP Server是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表和文件夹。
基于MCP协议的智能任务管理系统,提供AI代理的高效编程工作流框架,具备任务规划、分解、执行和记忆功能。
Aider MCP Server是一个实验性模型上下文协议服务器,用于将AI编码任务卸载到Aider,提高开发效率和灵活性。
ClickUp MCP服务器是一个用于将ClickUp任务与AI应用集成的模型上下文协议服务器,支持通过标准化协议管理任务、空间、列表、文件夹等,并提供时间跟踪、标签管理等功能。
IDA Pro MCP Server是一个插件,通过Model Context Protocol接口实现AI助手与IDA Pro的远程交互,支持二进制分析任务如反汇编、伪代码获取、函数查询等操作。
Swiss MCP是一个AI驱动的多步骤任务协调中心,能够整合多种AI工具完成复杂任务,如内容创作和全栈应用开发。
Orchestro是一个AI开发协调平台,连接产品经理、开发者和AI,将产品想法转化为生产代码。它通过任务分解、依赖跟踪、模式学习和实时进度可视化,协调整个开发流程,提供项目管理、任务执行、知识库和实时仪表板等功能。
Android-MCP是一个轻量级开源项目,作为AI代理与Android设备之间的桥梁,通过MCP服务器实现真实任务操作如应用导航、UI交互和自动化测试,无需依赖传统计算机视觉或预设脚本。
Ultimate MCP Server是一个基于模型上下文协议(MCP)的AI代理操作系统,提供数十种强大工具能力,包括智能任务委派、文档处理、浏览器自动化、Excel操作等,通过标准化MCP工具实现AI代理的认知增强和复杂任务编排。
该项目展示了Model Context Protocol(MCP)的示例实现,MCP是一种标准化协议,用于增强AI助手的能力,通过自定义工具和数据源扩展其功能。项目包含多个MCP服务器示例,如任务管理器、文件浏览器和天气服务,并提供了如何设置和使用这些服务器的指南。
gbox是一个开源的自托管沙箱项目,为MCP集成和其他AI代理用例提供安全环境。它包含终端、浏览器、文件编辑器等工具,支持本地任务执行和文件处理,并提供了Python和Typescript SDK。
一个专注于探索和应用生成式AI(GenAI)的仓库,旨在通过实际案例和资源分享,帮助用户学习和实验GenAI在日常任务中的应用,包括写作、编程、图像生成等。
Think MCP是一个实现MCP服务器的项目,提供'think'工具以支持AI代理在复杂任务中进行结构化推理,灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略,适用于工具输出分析、策略密集环境和顺序决策场景。
基于Model Context Protocol(MCP)的智能任务管理系统,为AI代理提供高效编程工作流框架,具备任务规划、分解、依赖管理、验证和记忆等功能。
这是一个用于SAP Commerce Cloud(Hybris)集成的MCP服务器,允许AI助手通过OCC API和HAC管理界面与Hybris实例进行交互,支持产品管理、订单查询、FlexibleSearch查询、Groovy脚本执行、ImpEx数据导入导出、定时任务管理和缓存清理等功能。
Webvizio MCP服务器是一个基于TypeScript的模型上下文协议服务器,提供对Webvizio API的安全结构化访问,可将网站反馈和错误报告自动转换为可执行的开发任务,供AI编码代理处理。
EspoCRM MCP服务器是一个全面的模型上下文协议服务器,提供与EspoCRM的无缝集成,支持47种工具进行完整的CRM操作,包括联系人、账户、机会、会议、用户、任务、线索管理以及团队、角色、实体关系等高级功能,并包含AI聊天机器人界面。