国内首个全模态实时交互视觉语言模型VisualGPT在青岛发布,用户可上传图片视频并直接圈选提问,模型秒级返回答案、代码或3D场景,同步开放智能体训练平台及算力资源,推动AI交互进入视觉界面即时互动新阶段。
上海人工智能实验室联合浙江大学推出IVR-Bench基准测试,首次专门评估大语言模型将视频转化为交互式网页代码的能力。该测试通过观看记录用户操作流程的视频,要求模型重建动态网页,填补了AI前端开发领域动态交互评测的空白,推动多模态大语言模型在真实场景中的应用。
开源项目nanochat大幅降低AI模型训练门槛,仅需100美元即可构建功能完整的聊天AI系统。它提供从数据处理到部署的一键式流程,代码简洁易用,既是实用工具也是教学平台,帮助开发者深入理解大型语言模型训练全流程。
蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer,显著提升推理速度。基准测试显示,其比英伟达Fast-dLLM快10.7倍,在HumanEval代码生成任务中单次推理达每秒1011个Tokens,推动技术迈向实际应用。
AgentSphere是一个AI本地云基础设施,用于安全的LLM代码执行。
Radal是一个无代码平台,可使用您自己的数据微调小型语言模型。连接数据集,通过可视化配置训练,并在几分钟内部署模型。
Seed-Coder 是一个开源的 8B 代码大型语言模型系列。
基于LLM的代理框架,用于在代码库中执行大规模代码迁移。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
$8
$240
52
Bytedance
$1.2
$3.6
4
prithivMLmods
Olmo-3-Think是艾伦人工智能研究所推出的完全开源的语言模型系列,包含7B和32B两种规模。该模型经过专门训练,能够展现明确的推理链,支持透明的逐步推理和可检查的中间思维痕迹,在推理、数学和代码任务中表现出色。
Clemylia
Qsana-coder-base 是一个小型语言模型(SLM),专门为编码基础(Python、伪代码)的概念创意而设计。它不生成可执行的生产代码,而是为教育和快速原型设计场景生成编码逻辑片段,主要目标是激发初学者的逻辑思维和概念理解。
Intel
DeepMath是一个40亿参数的数学推理模型,基于Qwen3-4B Thinking构建,结合了微调的大语言模型与沙盒化Python执行器。它能够为计算步骤生成简洁的Python代码片段,显著减少错误并缩短输出长度。
allenai
Olmo 3是由Allen Institute for AI开发的新一代语言模型家族,包含7B和32B的指令和思维变体。该模型在长链式思维方面表现出色,能显著提升数学和编码等推理任务的性能。所有代码、检查点和训练细节都将公开,推动语言模型科学发展。
geoffmunn
这是Qwen/Qwen3-Coder-30B-A3B-Instruct语言模型的GGUF量化版本,专门针对代码生成和编程任务优化,采用FP32精度转换,适用于本地推理部署。
mradermacher
Lamapi/next-12b 是一个基于12B参数的大语言模型,通过多语言数据集进行微调,支持50多种语言,具备高效文本生成能力,适用于化学、代码、生物、金融、法律等多个领域的自然语言处理任务。
unsloth
Granite-4.0-H-350M-Base是IBM开发的轻量级仅解码器语言模型,专为资源受限设备设计,支持多语言文本生成和代码补全功能。
SamuelBang
AesCoder-4B是一个专注于提升代码美学质量的大语言模型,通过智能奖励反馈机制优化代码生成的美学表现,在网页设计、游戏开发等视觉编码任务中表现出色。
danielus
该模型是cerebras/Qwen3-Coder-REAP-25B-A3B的GGUF格式转换版本,使用llama.cpp工具进行格式转换和量化处理。原始模型是一个25B参数的大语言模型,专门针对代码生成任务进行优化。
EpistemeAI
这是第一代强大的vibe-code大语言模型,经过优化可直接根据结构松散的'氛围编码'提示生成自然语言和代码补全。相比早期模型,它具有更低的提示工程开销、更平滑的潜在空间插值,更容易引导生成可用代码。
ibm-granite
Granite-4.0-350M-Base是IBM开发的轻量级仅解码器语言模型,专为资源受限设备设计,支持多语言文本生成和代码补全功能。
Granite-4.0-1B-Base是IBM开发的轻量级仅解码器语言模型,专为资源受限设备设计,支持多语言文本生成和代码补全功能。
Granite-4.0-H-350M-Base是IBM开发的轻量级仅解码器语言模型,专门为资源受限设备设计,支持多语言文本生成和代码补全功能,可在智能手机或物联网设备上高效运行。
Granite-4.0-H-1B-Base是IBM开发的轻量级仅解码器语言模型,专为资源受限设备设计,支持多语言文本生成和代码补全功能。
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
JetBrains
Mellum-4b-dpo-all是JetBrains开发的专为代码生成和理解设计的40亿参数大语言模型。经过预训练、SFT和直接偏好优化(DPO)三阶段训练,能够生成高质量、可读性强的代码,支持多种编程语言。
这是Qwen/Qwen3-Coder-30B-A3B-Instruct语言模型的GGUF量化版本,专为本地推理优化,支持llama.cpp、LM Studio、OpenWebUI、GPT4All等框架。该模型是一个30B参数规模的代码生成和编程助手模型。
这是Qwen3-Coder-30B-A3B-Instruct语言模型的GGUF量化版本,专门针对代码生成和编程任务优化,支持多种量化级别以适应不同硬件需求。
Salesforce
CoDA是Salesforce AI Research研发的基于扩散模型的代码生成语言模型,具备双向上下文理解能力,专为强大的代码生成和补全任务而设计。该模型仅17亿参数,在保持低计算要求的同时实现了卓越的代码生成性能。
rodrigomt
这是基于Qwen3-Coder-30B模型的量化版本,专门针对代码生成任务优化的语言模型,提供了多种GGUF格式的量化文件,在保持模型质量的同时显著减小文件大小并提升推理速度
LLM Context是一个帮助开发者快速将代码/文本项目内容注入大型语言模型聊天界面的工具,支持智能文件选择和多种集成方式。
MCP2Lambda是一个将AWS Lambda函数作为大型语言模型(LLM)工具运行的MCP协议服务器,无需修改代码即可让AI模型调用Lambda函数访问私有资源和AWS服务。
MCP2Lambda是一个MCP服务器,允许将AWS Lambda函数作为大型语言模型(LLM)的工具使用,无需修改代码。它通过Model Context Protocol (MCP)在AI模型和Lambda函数之间建立桥梁,使模型能够访问私有资源和执行自定义操作。
一个基于模型上下文协议(MCP)的服务器,通过构建代码知识图谱为大型语言模型提供TypeScript代码库的深度上下文理解。它使用AST分析解析代码,在Neo4j中构建全面的图表示,并通过语义搜索和图遍历提供智能查询能力。
Code Merge MCP 是一个基于MCP协议的代码处理服务器,提供代码文件提取、合并和分析功能,助力大语言模型高效处理代码库。
这是一个基于MCP协议的代码执行服务器原型,结合大型语言模型的代码生成能力和MCP工具集成,使AI代理能够在隔离沙箱中运行Python代码并调用外部工具。
一个基于MCP协议的代码审查服务器,利用Repomix和大型语言模型对代码进行结构化分析并提供审查建议。
一个将OpenAPI规范转换为MCP服务器代码的命令行工具,用于在大型语言模型和API之间建立桥梁。
该项目是一个基于Model Context Protocol (MCP)标准的文档处理服务器,通过构建向量数据库和MCP接口,使AI助手能够访问外部文档资源,突破大语言模型的知识限制。项目包含文档处理流水线和MCP服务端两大组件,支持多种嵌入模型和文件格式,可应用于最新技术文档查询、私有代码库理解等场景。
一个基于语言服务器协议(LSP)和模型上下文协议(MCP)的无界面代码编辑器服务,提供语言智能支持和AI辅助代码操作功能。
apktool-mcp-server是一个基于Apktool的MCP服务器,集成了大型语言模型(如Claude),提供实时逆向工程支持,包括漏洞分析、清单解析和代码审查等功能。
Sandbox Fusion MCP服务器是一个为大型语言模型提供代码解释器功能的实现,支持多种编程语言的代码执行和Jupyter笔记本操作,通过stdio交互与客户端通信。
CTX是一款连接代码库与大型语言模型(LLM)的工具,通过自动化生成结构化上下文文件,解决AI开发中代码上下文传递效率低下的问题。支持从代码文件、Git仓库、网页等多种来源收集信息,并可通过MCP服务器直接为AI助手提供项目上下文。
MCP代码索引器是一个专为AI大语言模型设计的智能代码检索工具,通过语义理解和向量化索引提升代码处理效率和准确性,支持代码分析、质量评估和依赖管理等功能。
一个为大型语言模型提供文件系统上下文的MCP服务器,支持文件操作、代码分析和智能搜索。
Lucidity是一个模型上下文协议(MCP)服务器,旨在通过智能提示分析提升AI生成代码的质量。它提供结构化指导,帮助识别和解决代码质量问题,支持多种编程语言,并能与AI助手无缝集成。
一个基于大型语言模型的代码修改与生成服务
LSP-MCP是一个连接语言服务器协议(LSP)与模型上下文协议(MCP)的桥梁服务器,允许大语言模型通过标准接口查询代码悬停信息、补全建议等LSP功能。
Ant Design组件的MCP服务,为大型语言模型提供组件文档查询和代码生成支持
GoDevMCP是一个为Go语言开发提供便利工具的项目,集成了模型上下文协议(MCP),包含代码搜索、文档查看、项目导航等功能。