苹果CEO库克强调,尽管与谷歌在AI领域合作,但苹果的隐私保护规则不变,Apple Intelligence坚持“端侧+私有云”架构,确保用户数据安全。
阿里平头哥发布高端AI芯片“真武810E”,性能超越英伟达A800及主流国产GPU,与H20相当。该芯片采用自研架构和互联技术,标志着阿里AI战略“通云哥”正式成型。
2026年1月29日,阿里巴巴旗下平头哥半导体正式发布高端AI芯片“真武810E”,实现了从硬件架构到配套软件的全链路自主研发,标志着阿里AI“黄金三角”战略全面落地。该芯片已在阿里云内部实现万卡规模应用验证。
Meta CEO扎克伯格宣布,2026年将是公司AI蓝图全面落地之年。在完成2025年AI架构重组后,Meta将密集发布新AI模型与产品,重点推出“代理式商业”智能购物工具,AI智能体可深度理解用户需求,推动行业创新。
AI驱动,秒速生成专业软件架构、UML和流程图,无需拖拽
Pi是一款AI原生技术架构的智能演示文档生成工具,可快速生成专业、美观的演示文稿。
AI21 Jamba Large 1.6 是一款强大的混合 SSM-Transformer 架构基础模型,擅长长文本处理和高效推理。
DeepSeek-V3/R1 推理系统是一个高性能的分布式推理架构,专为大规模 AI 模型优化设计。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$4
$16
Baidu
128
$6
$24
256
$2
$20
Bytedance
$1.2
$3.6
4
ubergarm
这是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多种量化选项,从高精度的Q8_0到极度压缩的smol-IQ1_KT,满足不同硬件条件下的部署需求。该模型支持32K上下文长度,采用MLA架构,专为对话场景优化。
evilfreelancer
这是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,采用GGUF格式,需要特定的llama.cpp分支支持。模型采用混合专家架构,总参数量约118亿,其中激活参数量约18亿。
allenai
Olmo 3是由Allen Institute for AI (Ai2)开发的一系列语言模型,包含7B和32B两种规格,有Instruct和Think两种变体。该模型基于Transformer架构,具有长链思维能力,可有效提升数学和编码等推理任务的表现。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
DevQuasar
这是NVIDIA基于Qwen3架构开发的32B参数奖励模型,专门用于强化学习中的奖励评分和原则对齐,帮助训练更安全、更符合人类价值观的AI系统。
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一个基于Qwen2.5-3B Instruct架构微调的AI助手,采用1,103个精灵角色的定制示例进行训练,具备独特的语音和忠诚度模式,能够为用户提供别具一格的对话体验。
nineninesix
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,通过独特的两阶段架构结合大语言模型与高效音频编解码器,实现低延迟与高质量语音合成,实时因子低至0.2,比实时速度快5倍。
LiquidAI
LFM2-VL-3B是Liquid AI开发的多模态视觉语言模型,基于LFM2骨干架构构建,具备强大的视觉理解和推理能力,特别在细粒度感知任务上表现出色。该模型能够高效处理文本和图像输入,支持高达512×512分辨率的原生图像处理。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
bigdoinks420518
这是一个基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频的转换任务。模型基于Wan2.2-T2V-A14B架构,支持高分辨率图像生成。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型。它采用两阶段流水线架构,结合大语言模型和高效音频编解码器,实现了卓越的速度和音频质量,支持多种语言并适用于边缘/服务器部署。
Sunbird
Sunflower-32B是由Sunbird AI开发的多语言大语言模型,专门针对乌干达地区语言优化。基于Qwen 3-32B架构构建,支持31种乌干达语言及英语的翻译和文本生成任务,在乌干达语言翻译准确率方面表现优异。
Sunflower-14B是由Sunbird AI开发的多语言大语言模型,专门针对乌干达语言设计。该模型基于Qwen 3-14B架构构建,支持31种乌干达语言以及英语的翻译和文本生成任务,在多项评估中表现出色。
Mungert
LFM2是由Liquid AI开发的新一代混合模型,专为边缘AI和设备端部署而设计,在质量、速度和内存效率方面树立了新标准。该模型采用创新的混合Liquid架构,具有乘法门和短卷积,支持多语言处理。
mradermacher
ConfTuner-Ministral是基于Mistral架构的量化大语言模型,专门针对可信赖AI场景进行微调,支持文本生成和置信度估计功能。该模型提供了多种量化版本,适用于不同资源约束环境。
这是 liushiliushi/ConfTuner-Ministral 模型的静态量化版本,适用于文本生成和置信度估计任务。该模型基于 Mistral 架构,经过微调以提供可信赖的AI输出,支持多种量化级别以满足不同硬件需求。
ShantanuT01
基于BERT-tiny架构的轻量级AI生成文本检测模型,专门用于从RAID数据集中识别AI生成的文本内容。模型输出分数表示文本是人类生成的可能性。
Olmo 3是由Allen Institute for AI开发的全新7B参数语言模型系列,基于Transformer架构,在Dolma 3数据集上训练,旨在推动语言模型科学发展。模型提供Base、Instruct和Think等多种变体,支持最长65,536的上下文长度。
NVIDIA Qwen2.5-VL-7B-Instruct-FP4是阿里巴巴Qwen2.5-VL-7B-Instruct模型的量化版本,采用优化的Transformer架构,支持多模态输入(文本和图像),适用于多种AI应用场景。该模型通过TensorRT Model Optimizer进行FP4量化,在NVIDIA GPU上提供高效的推理性能。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
AI开发助手MCP服务器是一个基于AI的代码开发工具包,提供代码架构生成、UI截图分析和代码审查等功能,专为Cursor设计。
DB MCP Server是一个支持多数据库的服务器,实现了模型上下文协议(MCP),为AI助手提供结构化访问数据库的能力。它支持MySQL和PostgreSQL,可同时连接多个数据库,自动生成专用工具,并遵循清晰架构设计。
Zen7支付代理是首个DePA去中心化支付代理的实践实现,采用多智能体协作架构,支持A2A和MCP协议,为AI智能体和Dapp应用提供多链多币种支付解决方案,实现自动化加密支付和LLM驱动的意图识别。
一个用于开发自定义MCP服务器的基础项目,提供完整的架构模式、示例工具和开发基础设施,支持AI助手连接外部数据源或API。
一个即用型MCP服务器模板,提供快速搭建本地AI辅助开发环境的能力,内置多种技术文档工具和可扩展架构。
Mindpilot MCP是一个可视化代码分析工具,通过AI代理生成架构图、代码流程图等,帮助开发者理解复杂代码结构,支持本地处理和多客户端协作。
该项目展示了如何将AWS Bedrock的对话式AI能力通过MCP服务器架构与关系型数据库集成,实现自然语言查询数据库的功能。
Smart-Thinking是一个先进的MCP服务器,提供多维、自适应且可自验证的AI推理框架,采用基于图形的架构实现复杂思维连接,支持跨平台运行并与多种MCP客户端兼容。
该项目展示了一个基于LangGraph和MCP协议的实时多工具代理架构,通过解耦代理编排与工具执行,实现模块化、可扩展的AI系统。MCP服务支持多种传输协议(SSE/STDIO),允许AI代理动态调用远程工具,并具备跨语言、云部署能力。
Swarms API 是一个用于构建、部署和管理多智能体系统的REST API,支持多种AI模型和群架构,提供实时监控、批量处理和任务调度等功能。
openwrt-mcp-server是一个轻量级可扩展的MCP协议服务器,专为OpenWrt嵌入式设备设计,支持MQTT和HTTP双协议,实现设备与AI系统的双向JSON-RPC通信,具备安全认证和模块化架构。
Edit-MCP是一个与微软Edit工具集成的模型上下文协议服务器,为AI系统提供高级文件编辑功能,采用混合架构结合直接文件操作和Edit集成。
Octocode MCP是一款先进的AI代码助手,提供跨GitHub和npm生态系统的智能搜索与发现功能,帮助开发者快速理解代码库、分析项目架构、发现安全模式,并支持企业级安全与跨平台使用。
基于MCP协议的AI架构分析服务器,为AI助手提供智能架构决策分析和ADR管理功能,支持代码分析、安全检测和部署验证。
ToolBox是一个AI驱动的自动化工具开发平台,提供模块化架构、AI辅助工具生成、企业级服务集成和实时更新功能。
MCP Agile Flow是一个基于FastMCP的AI辅助敏捷开发工作流管理系统,提供RESTful API和资源优先架构,支持自然语言命令处理和多IDE集成。
MCP是一个基于客户端-服务器架构的AI聊天系统,支持通过多种专用服务器(文件系统、Slack、Brave搜索)扩展Claude AI的功能,使其能智能访问本地文件、Slack对话和实时网络信息。
一个基于MCP架构的浏览器自动化工具,结合网页抓取能力和LLM智能,支持Google搜索、智能网页内容提取及AI处理,适用于多种网站类型。
YaraFlux MCP Server是一个基于模型上下文协议(MCP)的YARA扫描服务器,为AI助手提供文件YARA规则分析能力。该项目采用模块化架构,集成了19个MCP工具,支持YARA规则管理、文件扫描、安全存储等功能,可无缝集成Claude Desktop等AI助手。