腾讯 Robotics X 与混元团队联合开源HY-Embodied-0.5-X多模态大模型,专为机器人具身任务优化。该模型基于MoT-2B架构,强化“看懂、想清、做到”能力,在精细操作、空间推理、动作预测和风险判断上表现突出。系列包含MoT-2B和MoE-32B两个版本,旨在提升机器人在真实环境的智能交互水平。
月之暗面创始人杨植麟在英伟达GTC2026大会上首次系统披露Kimi K2.5模型技术路线图,强调大模型发展已进入“后Scaling时代”,需重构底层逻辑,而非单纯堆砌算力。他指出,突破智能上限关键在于优化器、注意力机制及残差连接等核心技术的革新。
京东开源大模型JoyAI-LLM-Flash,参数48亿,激活参数3亿,经20万亿文本预训练,具备前沿知识理解、推理和编程能力。采用FiberPO优化框架,结合纤维丛理论与强化学习,使用Muon优化器和稠密多Token预测技术,解决了模型规模扩展的不稳定问题。
DeepSeek发布实验模型V3.2-exp,采用创新的“稀疏注意力”机制显著降低长上下文推理成本。该模型已在Hugging Face和GitHub同步上线,核心是通过“闪电索引器”和注意力机制优化处理效率。这一突破性技术有望推动AI在长文本处理领域的发展。
免费AI简历生成器与ATS检查器,快速打造专业优化简历。
ListifyAI是由AI驱动的Etsy列表优化器,可秒速生成SEO标题、描述和标签。
Banana Pro提供AI图像与视频生成,无水印,含提示优化器
为Firefox浏览器翻译功能优化的CPU加速神经机器翻译模型。
Google
$0.49
Input tokens/M
$2.1
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
$0.7
$2.8
Alibaba
-
Moonshot
$4
$16
256
Baidu
32
Tencent
$1
Openai
$8.75
$70
400
$0.35
$0.63
$3.15
131
$15
Huawei
Bytedance
$0.8
$8
Deepseek
Iflytek
$2
128
$0.3
8
lightx2v
本仓库包含为HunyuanVideo-1.5优化的4步蒸馏模型,能够在不使用CFG(无分类器指导)的情况下实现超快速的4步推理,显著减少生成时间,同时保持高质量的视频输出。
amd
Llama-3.1-8B-onnx-ryzenai-npu是由AMD基于Meta的Llama-3.1-8B模型开发的优化版本,专门针对AMD Ryzen AI NPU进行优化部署。该模型通过Quark量化、OGA模型构建器和NPU专用后处理技术,在保持高质量文本生成能力的同时,显著提升了在AMD硬件上的推理效率。
Jackmin108
Moonlight是基于Muon优化器训练的16B总参数、3B激活参数的混合专家(MoE)模型,使用5.7T标记进行训练。该模型改进了当前的帕累托前沿,以更少的训练FLOP实现了更好的性能,在多个基准测试中表现优异。
minpeter
这是一个基于🤗 Transformers库构建的专门用于检测kozistr/pytorch_optimizer中Muon实现错误的训练模型。该模型能够识别和定位优化器实现中的潜在问题,帮助开发者改进代码质量。
yjoonjang
预排序器是一种基于交叉编码器的文本排序模型,旨在优化大语言模型的函数调用流程,通过缩小可用工具的语料库来提高效率。
John6666
基于Stable Diffusion XL优化的高质量动漫风格文本生成图像模型,支持V预测调度器
tim1900
基于BertForTokenClassification的文本分块器,适用于结构化和非结构化文本,特别优化用于RAG场景
本项目基于Meta-Llama-3-8B模型,采用Quark量化技术,结合OGA模型构建器,并进行后处理以适配NPU部署,可用于文本生成任务。该模型专为AMD NPU硬件优化,支持高效的推理部署。
meta-llama
基于Llama-3.2-11B微调的多模态内容安全分类器,专为检测图文混合有害内容优化
cl-nagoya
瑠璃重排序器是一个基于Transformer架构的日语文本重排序模型,专门用于优化检索结果的排序质量。
kenhktsui
基于FastText的轻量级分类器,用于评估网页内容的教育价值,优化CPU处理速度
Moritz-Pfeifer
专为中央银行通讯优化的微调大型语言模型,包含经济主体分类器和情感分类器
stabilityai
SD-XL 1.0优化器模型是Stability AI开发的图像生成模型,专为提升SDXL基础模型生成的图像质量而设计,特别擅长最终去噪步骤处理。
ibm-research
Re2G-NQ重排器是IBM开发的神经信息检索组件,专门用于对检索结果进行重排优化。该模型基于BERT-base架构,在MSMARCO数据集上训练,能够显著提升初始检索结果的质量,并支持合并来自不同检索方法(如DPR和BM25)的不可比分数结果,为自然语言生成系统提供更好的输入素材。
kinit
这是一个基于SlovakBERT的情感分析分类器,专为斯洛伐克语推文优化,可区分负面、中性和积极三种情感级别。
digitalepidemiologylab
基于BERT的零样本分类器,专门针对COVID-19相关推特内容分析而优化
M-FAC
该模型是基于BERT-tiny架构,在SST-2数据集上使用M-FAC二阶优化器进行微调的文本分类模型。
该模型是基于BERT-mini架构,在MNLI数据集上使用M-FAC二阶优化器进行微调的文本分类模型。
该模型是在SST-2数据集上采用M-FAC二阶优化器微调的BERT-mini模型,用于文本分类任务。
该模型是在QNLI数据集上使用M-FAC二阶优化器微调的BERT-tiny模型,相比传统Adam优化器展现出更好的性能表现。
MCP推理器是为Claude Desktop设计的增强推理能力的工具,提供波束搜索和蒙特卡洛树搜索两种算法,并新增实验性策略模拟层以优化复杂问题解决。
Gemini CLI编排器是一个基于Google Gemini AI的多步骤代码分析工具,通过结构化工作流引导开发者进行系统化分析,而非替代人工思考。它提供四大核心功能:分析规划、提示词优化、迭代分析和结果合成,适用于安全审计、性能优化等复杂场景。
USolver是一个模型上下文协议服务器,提供组合优化、凸优化、整数规划和非线性优化问题的求解工具,支持多种求解器如highs、ortools、cvxpy和z3。
一个通用的模型上下文协议(MCP)服务器,用于解决具有逻辑和数值约束的组合优化问题,支持多种求解器并提供统一的AI助手接口。