微软秘密启动“Project Strong ARMed”项目,旨在利用生成式AI技术,解决Windows应用从x64架构向ARM架构迁移的难题,以提升兼容性和运行效率。
近日,开源项目BrowserUse发布自研大语言模型BU-30B-A3B-Preview,被誉为网页代理领域新标杆。该模型采用混合专家(MoE)架构,总参数达300亿,但推理时仅激活部分参数,兼顾强大性能与轻量化运行,显著降低了AI浏览器操作的成本与门槛。
苹果AI负责人约翰・贾南德里亚将于2026年退休,期间转任顾问。他于2018年加入苹果,此前在谷歌负责AI业务。其离任被视为苹果在Siri升级受挫后对AI架构的重要调整。接任者阿马尔・苏布拉马尼亚曾任微软企业副总裁,主导过G项目。
现代汽车与英伟达深化合作,共建基于Blackwell架构的AI工厂。双方在CES上宣布联合开发自动驾驶、智能工厂及机器人技术项目,获韩国政府支持,并将在2025年APEC韩国峰会上详述。
GitSeek 是一款帮助用户从任何代码仓库中提取完整代码并快速集成到 AI 工具中的工具。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Alibaba
$4
$16
1k
$2
$20
-
Bytedance
$1.2
$3.6
4
256
Moonshot
$0.8
128
$10.5
Tencent
$1
32
Deepseek
$12
Openai
$0.4
$0.75
$8.75
$70
400
64
$0.63
$3.15
131
24
Chatglm
$8
mradermacher
本项目提供了Qwen-4B-Instruct-2507-Self-correct模型的静态量化版本,支持文本生成、偏差缓解、自我修正等任务。该模型基于Qwen-4B架构,经过指令微调和自我修正训练,提供多种量化版本以适应不同硬件需求。
noctrex
本项目是卡纳娜1.5-15.7B-A3B指令模型的MXFP4_MOE量化版本,可在特定场景下提升模型的运行效率。该模型基于kakaocorp/kanana-1.5-15.7b-a3b-instruct进行优化,采用混合专家架构和MXFP4量化技术。
QuantStack
本项目是基于Flux架构的文本到图像模型Nepotism的量化版本,采用SVDQuant技术进行优化。提供了INT4和FP4两种量化格式,分别适用于不同世代的GPU硬件,在保持图像生成质量的同时显著减少模型大小和内存占用。
HPLT
这是HPLT项目发布的第三个版本的单语编码器-解码器语言模型,专门为德语设计。基于去噪目标训练的文本到文本变换器模型,遵循NorT5架构设置,使用德语HPLT数据训练的分词器。
本项目提供了慧慧Qwen3-VL-30B-A3B-Instruct模型的量化版本,旨在提升模型在特定场景下的性能与效率。这是一个基于Qwen3-VL架构的视觉语言模型,支持图像和文本的多模态交互。
本项目是慧慧-Qwen3-VL-30B-A3B-Instruct-abliterated模型的MXFP4_MOE量化版本,专门用于文本生成任务。该模型基于Qwen3-VL架构,经过优化和量化处理,目前仍处于实验阶段。
DevQuasar
本项目提供了Huihui-Hunyuan-MT-7B-abliterated模型的量化版本,致力于让知识为每个人所用。这是一个基于Hunyuan架构的7B参数多语言文本生成模型。
te-sla
PiloT5是基于T5架构的塞尔维亚语文本摘要模型,拥有2.48亿参数,专门用于处理塞尔维亚语文本的自动摘要任务。该模型由TESLA项目开发,得到了塞尔维亚共和国科学基金的支持。
NexaAI
Kokoro是一款8200万参数的开源文本转语音模型,采用轻量级架构但能提供与大型模型相媲美的质量,具有速度快、成本低的优势,采用Apache许可证,适用于生产环境和个人项目
Tarek07
这是一个基于LLaMa-70B架构的多模型融合实验项目,采用DARE TIES融合方法,结合了6个不同版本的MO-MODEL模型。
ridger
根据提供的文档,此项目仅包含Apache-2.0许可证信息,缺少具体的模型描述、名称、架构和功能等关键信息。因此,无法提供准确的模型介绍。
BarraHome
Mistroll-7B-v2.2是一个基于Unsloth和Huggingface TRL库开发的文本生成模型,实现了2倍速训练。该模型是一个实验性项目,旨在测试和完善训练与评估管道研究框架,重点关注数据工程、架构效率和评估性能的优化。
HPLT项目发布的泰语单语BERT模型,基于LTG-BERT架构训练,适用于泰语文本处理任务。
HPLT项目发布的斯洛伐克语单语BERT模型,基于LTG-BERT架构训练,适用于掩码语言建模任务
hpcai-tech
VQVAE是基于VQ-VAE架构的视频生成模型,克隆自VideoGPT项目,旨在将模型转换为Hugging Face格式以便更便捷地加载。
norallm
NorMistral-7b-scratch是一个专门针对挪威语的大规模语言模型,由奥斯陆大学语言技术小组、HPLT项目、挪威国家图书馆和图尔库大学合作开发。该模型基于Mistral架构,拥有70亿参数,在2600亿子词标记的挪威语语料库上从头开始预训练,是NORA.LLM系列的重要组成部分。
llm-jp
LLM-jp项目开发的13亿参数日语大语言模型,基于Transformer架构,在日语、英语和代码数据集上进行了预训练,支持文本生成和自然语言理解任务
yahma
LLaMA是Meta AI开发的基于Transformer架构的自回归语言模型系列,包含7B、13B、33B和65B等不同参数规模版本。本项目为2023年4月8日转换的LLaMA-13B版本,解决了EOS令牌问题,可与HuggingFace Transformers配合使用。
OpenAssistant
基于Pythia 12B架构的英文监督微调模型,通过Open-Assistant项目的人类反馈数据训练,专注于对话生成任务。
MaCoCu
MaltBERTa是基于马耳他语文本大规模预训练的语言模型,采用RoBERTa架构,由MaCoCu项目开发。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
该项目是一个集成Sonar API的MCP服务器实现,为Claude提供实时网络搜索能力。包含系统架构、工具配置、Docker部署及多平台集成指南。
ATLAS是一个基于TypeScript和Neo4j构建的智能任务与知识管理系统,专为LLM代理设计,提供项目、任务和知识的三层管理架构。
Figma MCP服务器项目,通过Claude等客户端实现与Figma API的集成,支持文件读取和设计系统管理功能,具备扩展架构但受限于API当前为只读状态。
一个基于AWS Lambda、CloudFront和Cognito认证的无服务器MCP协议实现项目,提供完整的云端MCP服务器基础设施,支持OAuth 2.0认证、实时流传输和可扩展架构。
Nano Agent是一个实验性的小型工程代理MCP服务器,支持多提供商LLM模型,用于测试和比较云端与本地LLM在性能、速度和成本方面的代理能力。项目包含多模型评估系统、嵌套代理架构和统一工具接口,支持OpenAI、Anthropic和Ollama等提供商。
一个用于开发自定义MCP服务器的基础项目,提供完整的架构模式、示例工具和开发基础设施,支持AI助手连接外部数据源或API。
该项目展示了如何将AWS Bedrock的对话式AI能力通过MCP服务器架构与关系型数据库集成,实现自然语言查询数据库的功能。
该项目展示了基于NestJS的模型上下文协议(MCP)微服务架构实现,包含提供时间上下文功能的MCP服务器和集成LangChain.js的客户端,支持多服务器连接。
一个基于LLM CLI的MCP服务器模板项目,提供开发、测试和部署工具,支持架构设计反馈和本地调试。
该项目展示了一个基于LangGraph和MCP协议的实时多工具代理架构,通过解耦代理编排与工具执行,实现模块化、可扩展的AI系统。MCP服务支持多种传输协议(SSE/STDIO),允许AI代理动态调用远程工具,并具备跨语言、云部署能力。
Octocode MCP是一款先进的AI代码助手,提供跨GitHub和npm生态系统的智能搜索与发现功能,帮助开发者快速理解代码库、分析项目架构、发现安全模式,并支持企业级安全与跨平台使用。
SSW Clean Architecture 模板是一个基于清洁架构的项目模板,结合了SSW Rules和30多年的微软软件开发经验,提供快速启动新项目的工具和最佳实践。
YaraFlux MCP Server是一个基于模型上下文协议(MCP)的YARA扫描服务器,为AI助手提供文件YARA规则分析能力。该项目采用模块化架构,集成了19个MCP工具,支持YARA规则管理、文件扫描、安全存储等功能,可无缝集成Claude Desktop等AI助手。
该项目展示了一个基于Node.js的MCP服务架构,包含后端API服务、MCP服务器和客户端AI聊天机器人。MCP服务器标准化了API访问方式,客户端通过集成MCP能力实现了自定义数据存储功能。
该项目构建了一个基于自然语言的WhatsApp消息发送与调度系统,通过客户端-服务器架构实现。服务器利用Mistral的LLM解析用户意图,并调用Twilio的API发送WhatsApp消息。
AI专家工作流MCP是一个基于OpenRouter API的模型上下文协议服务器,通过产品经理、UX设计师和软件架构师三个AI专家角色,提供从产品规划到技术实现的完整工作流解决方案。项目支持独立生成PRD文档,也可与Task Master集成进行任务管理。
MCP Server Semgrep是一个符合Model Context Protocol标准的服务器,集成了Semgrep静态分析工具与AI助手,提供代码安全分析、质量改进和漏洞检测功能。项目简化了架构设计,支持多平台运行,可通过多种方式安装,并提供了丰富的代码分析功能。
该项目扩展了视频语音识别功能,从仅支持本地Whisper模型,新增支持简影和B站剪辑的在线语音识别服务,提供了灵活的多服务选择架构。
RevitMCP项目为Revit引入自然语言交互能力,通过MCP协议实现BIM建模自动化,采用分层架构设计,支持多轮对话与参数补全,显著提升建模效率。