澳大利亚AI基建初创公司Firmus Technologies获黑石集团领投100亿美元债务融资,创该国私有信贷纪录。资金将用于“南门项目”,计划到2028年在全澳建设超大规模AI中心,算力容量目标达1.6千兆瓦,标志着全球AI算力基建竞争加剧。
OpenAI研究副总裁Jerry Tworek宣布离职,结束近七年任职。作为“推理模型之父”,他曾主导GPT-4、Codex及O1/O3等关键项目。离职原因系希望探索公司当前难以支持的研究方向,他在社交平台分享了这一艰难决定,并回顾了在OpenAI的时光。
Tnkr平台旨在解决机器人研发碎片化问题,通过整合硬件、软件、数据与AI模型于统一开源生态,让开发者能协作共建实体机器人项目,改变传统开发中需在不同工具间切换的“拼图游戏”模式。
育碧推出首个可玩生成式AI项目“Teammates”,结合实时语音指令提升FPS游戏体验。玩家在反乌托邦未来扮演抵抗组织成员,潜入敌方基地寻找失踪队友。AI助手Jaspar通过自然语音交互,增强游戏沉浸感与互动性。
基于Kokoro和ONNX运行时的文本到语音(TTS)项目。
利用AI生成ThreeJS项目资产
NextStarterAI:一站式开发套件,用于您的下一个项目。包括Next.js、Tailwind CSS、Supabase、Stripe、Lemon Squeezy等。
Flowty的TripoSR用户界面改进项目
Alibaba
$4
输入tokens/百万
$16
输出tokens/百万
1k
上下文长度
$2
$20
-
$6
$24
256
Bytedance
$1.2
$3.6
4
Tencent
$1
32
Baidu
$0.8
$8
128
$0.7
$1.95
16
$3.5
$12
bartowski
本项目是TheDrummer的Cydonia-24B-v4.3模型的量化版本,使用llama.cpp进行量化处理,旨在提供不同量化类型的模型文件,以满足不同硬件和性能需求。它是一个24B参数的大语言模型,主要用于文本生成任务。
magiccodingman
这是一个基于Qwen3-4B-Thinking-2507的密集模型实验性量化版本。它采用了创新的MXFP4混合量化技术,旨在探索通过组合不同精度的权重(如MXFP4与Q8_0、Q6_K等),在显著减小模型文件大小、提升推理速度(TPS)的同时,尽可能保持接近原始F16模型的精度。该项目展示了混合量化方法的潜力,但已被作者更新的版本所取代。
mradermacher
本项目是TECHNOPRAVIN01/Qwen2.5-14B-Valor模型的量化版本,提供了多种量化格式的模型文件,包括IQ1_S、IQ2_XS、IQ3_M、Q4_K_S、Q5_K_M等多种量化类型,方便不同场景下的使用。
本项目是基于TECHNOPRAVIN01/Qwen2.5-14B-Valor模型的静态量化版本,提供多种量化类型以满足不同硬件条件下的使用需求。该模型通过量化技术减小了模型大小,同时保持了较好的性能表现。
这是一个基于TheDrummer的Behemoth-X-123B-v2.1模型进行量化处理的项目,使用llama.cpp工具和特定数据集生成了多种量化类型的模型文件,适用于不同硬件条件下的推理需求。
lichorosario
这是一个基于Qwen-Image模型训练的LoRA(Low-Rank Adaptation)模型,专门用于文本到图像的生成任务。该项目使用AI Toolkit训练,能够将文本描述转化为高质量的图像,支持在多种图像生成工具中使用。
Tesslate
WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型,能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练,采用监督微调方法,使用 GPT-OSS-120B 生成的数据集进行训练。
julien8082
这是一个基于文本生成图像的项目,使用了LoRA和Diffusers技术,基于tencent/SRPO模型,可通过特定触发词'hannah'生成相关图像。
te-sla
PiloT5是基于T5架构的塞尔维亚语文本摘要模型,拥有2.48亿参数,专门用于处理塞尔维亚语文本的自动摘要任务。该模型由TESLA项目开发,得到了塞尔维亚共和国科学基金的支持。
zelk12
本项目使用mergekit和DARE TIES方法合并了soob3123/amoral-gemma3-12B-v2和IlyaGusev/saiga_gemma3_12b两个模型,旨在提供更强大的语言处理能力。
Tarek07
这是一个基于LLaMa-70B架构的多模型融合实验项目,采用DARE TIES融合方法,结合了6个不同版本的MO-MODEL模型。
rhysjones
该模型源自karpathy的llm.c项目,为研究bfloat16性能而转换为HuggingFace格式,训练过程消耗了1500亿token。
codewithdark
DiffusionLLM是基于扩散模型的文本生成项目,使用wikitext-103-v1数据集训练,专注于高质量文本生成任务。该项目采用transformers库和PyTorch框架,通过BLEU指标评估性能,遵循MIT开源许可证。
RefalMachine
本项目是对T-lite-it-1.0模型进行俄语适配,通过更换分词器、在俄语语料库上继续预训练以及应用LEP技术,提升了俄语文本的生成速度。
Iamsylvain
Teenz是一个基于FLUX.1-dev模型训练的LoRA项目,通过特定触发词实现文本到图像的生成功能,主要面向非商业用途的图像创作。
onnx-community
本项目将 OpenAI 的 Whisper-small 语音识别模型转换为 ONNX 格式,使其能够与 Transformers.js 库兼容,从而实现在 Web 浏览器或 Node.js 环境中直接运行,无需依赖 Python 后端。
BarraHome
Mistroll-7B-v2.2是一个基于Unsloth和Huggingface TRL库开发的文本生成模型,实现了2倍速训练。该模型是一个实验性项目,旨在测试和完善训练与评估管道研究框架,重点关注数据工程、架构效率和评估性能的优化。
CompendiumLabs
该项目提供了以GGUF格式存储的BGE嵌入模型,适用于与llama.cpp配合使用,提供比transformers更好的性能表现。
talkbank
CHATUtterance是TalkBank项目开发的基于BERT的衍生模型,专门用于话语分割任务。该模型在密歇根学术英语口语语料库上进行训练,能够识别话语的开始、结束和中断位置,支持多种结束标点类型的识别。
llm-jp
LLM-jp项目开发的13亿参数日语大语言模型,基于Transformer架构,在日语、英语和代码数据集上进行了预训练,支持文本生成和自然语言理解任务
Tripo MCP Server是一个连接AI助手与Tripo AI的接口项目,支持通过自然语言生成3D资产并导入Blender。
一个MCP服务器项目,允许客户端通过Claude与Twitter进行交互,支持发推和搜索功能。
DevOps AI Toolkit是一个基于AI的平台工程和DevOps自动化工具,通过智能Kubernetes操作和对话式工作流,为团队提供资源部署推荐、问题修复、项目治理和共享提示库等功能,使复杂的云原生操作可通过自然语言交互实现。
Claude Talk to Figma MCP是一个基于Model Context Protocol的插件,允许Claude Desktop等AI工具直接与Figma交互,实现AI辅助设计功能。项目通过WebSocket服务器连接AI客户端和Figma插件,支持文档分析、元素创建修改、文本处理等设计操作。
ATLAS是一个基于TypeScript和Neo4j构建的智能任务与知识管理系统,专为LLM代理设计,提供项目、任务和知识的三层管理架构。
FileScopeMCP是一个基于TypeScript的代码分析工具,通过计算文件重要性评分、追踪依赖关系、生成可视化图表和添加文件摘要,帮助开发者快速理解代码库结构。支持多语言项目分析,提供Mermaid图表生成和持久化存储功能,可与Cursor的模型上下文协议集成。
MCP Server Notifier 是一个轻量级通知服务,与模型上下文协议(MCP)集成,可在AI代理完成任务时发送Webhook通知。支持多种Webhook提供商(如Discord、Slack、Teams等),提供图像支持、多项目管理、自定义消息等功能,易于与AI工具(如Cursor)集成。
一个用于快速搭建MCP服务器项目的CLI工具,提供完整的项目结构、可选Web API/WebSocket/数据库集成,支持TypeScript和现代化开发流程。
该项目实现了一个基于SSE传输层和Durable Objects的MCP服务器,支持与ModelContextProtocol TypeScript SDK集成,并提供了端到端的运行步骤。
一个基于Tavily API的MCP服务器项目,用于执行网络搜索并返回结果,支持Claude Desktop和Cursor等客户端集成。
KiMCP是一个基于Model Context Protocol (MCP)的服务器项目,旨在整合韩国本地API(如Naver、Kakao、TMAP等)到LLM应用中,提供包括博客搜索、新闻检索、地图导航等多种服务功能。
该项目是一个基于TMDB API的电影信息MCP服务器,提供电影搜索、推荐、热门电影查询等功能,可与Claude桌面应用集成使用。
Maven Tools MCP Server是一个基于Spring Boot的MCP协议服务器,为JVM构建工具(Maven、Gradle、SBT、Mill等)提供Maven中央仓库依赖智能分析服务。它通过直接读取Maven Central的元数据文件,提供快速、准确的依赖版本查询、批量分析、版本比较和项目健康评估等功能,并集成了Context7文档服务。
一个通过Telegram实现用户交互的MCP服务器,提供问答、通知、文件传输和项目打包功能
一个基于TypeScript的Model Context Protocol (MCP)服务器模板项目,提供结构化、可维护和可扩展的框架,包含工具、资源和提示的实现示例,支持配置管理、日志记录、错误处理和容器化部署。
Think MCP是一个实现MCP服务器的项目,提供'think'工具以支持AI代理在复杂任务中进行结构化推理,灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略,适用于工具输出分析、策略密集环境和顺序决策场景。
gbox是一个开源的自托管沙箱项目,为MCP集成和其他AI代理用例提供安全环境。它包含终端、浏览器、文件编辑器等工具,支持本地任务执行和文件处理,并提供了Python和Typescript SDK。
Things MCP服务器是一个基于Model Context Protocol的项目,它允许用户通过Claude Desktop与Things任务管理应用进行交互,实现自然语言创建任务、智能分析项目等功能。
godoc-mcp是一个高效的Go文档访问工具,通过MCP协议为LLM提供结构化、低token消耗的Go项目文档访问服务,支持本地和远程包文档查询。
MCP_Agent:RE是一个用于从TAPD平台获取需求和缺陷数据并生成质量分析报告的Python项目,提供数据获取、预处理、向量化、智能搜索和报告生成等完整工具链,支持AI驱动的测试管理。