小米宣布将自研大模型MiMo-V2-Flash的公测限免期延长20天,至2026年1月20日。该模型参数量达3090亿,激活参数150亿,在推理和代码生成方面表现优异。此举旨在为用户提供更长的体验时间,并展现小米在AI领域的持续投入与信心。
YuanLab.ai发布开源多模态大模型Yuan3.0Flash,参数规模达40B,采用稀疏混合专家架构,推理时仅激活约3.7B参数,显著提升效率。模型提供16bit与4bit权重、技术报告及训练方法,支持二次开发和行业定制,推动AI技术普及。
夸克AI眼镜于12月31日完成首次OTA升级,新增录音纪要、图文备忘录、多意图理解与执行、蓝环支付及社区服务五大功能,并对翻译、行程查询等既有功能进行优化。通过自研语音增强模型与硬件配置,其录音功能现支持十米范围清晰收音与有效降噪。
腾讯混元团队开源HY-Motion1.0模型,基于DiT架构与流匹配技术,通过文本描述即可生成高质量3D骨骼动画,兼容主流3D工具,大幅降低动画制作门槛。该模型采用全阶段训练策略,利用超3000小时动作数据优化生成效果。
基于 Diffusion Transformer 架构的十亿参数文生 3D 动作模型。
免费在线音频转文本,无需注册,支持1GB文件,高精度多语言
TurboDiffusion: 视频生成加速框架,速度提升 100-200 倍。
全球领先的图像到图像AI平台,有100种AI特效,免费试用。
Openai
$7.7
输入tokens/百万
$30.8
输出tokens/百万
200
上下文长度
Alibaba
$4
$16
1k
$2
$20
-
256
Bytedance
$0.8
128
$0.15
$1.5
Xai
$1.4
$10.5
Tencent
$1
32
$8
64
$0.63
$3.15
131
Huawei
Deepseek
Iflytek
noctrex
INTELLECT-3 是一个由 Prime Intellect 开发的、参数规模达 106B(激活参数 12B)的混合专家(MoE)推理模型。它基于 GLM-4.5-Air-Base 进行监督微调,并经过大规模强化学习训练,在数学、编码和推理任务上表现优异。
redis
这是一个由Redis开发的、针对LangCache语义缓存任务进行微调的CrossEncoder模型。它基于成熟的`cross-encoder/ms-marco-MiniLM-L6-v2`模型,在超过100万对LangCache句子对数据集上训练,专门用于计算两个文本之间的语义相关性得分,以优化缓存命中率。
ai-sage
GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型,基于混合专家(MoE)架构,拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力(MLA)和多令牌预测(MTP)技术,旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练,支持包括中文在内的 10 种语言,适用于需要快速响应的对话场景。
hitonet
Hito 1.7B 是一个专为 llama.cpp、Ollama、LM Studio 等工具优化的 GGUF 量化版本模型,具备 17 亿参数,采用嵌套认知推理(NCR)方法,能够实现结构化、自我纠错的思维模式,提升推理准确性与透明度。
AlekseyCalvin
这是一个针对 Z-Image Turbo DiT 模型的低秩适配器(LoRA),专门用于生成具有历史照片风格的图像。该模型基于 1900-1910 年代摄影师 Sergey Prokudin-Gorsky 的 150 张彩色照片训练而成,能够为现代图像生成注入独特的早期彩色摄影美学,如暖色调光晕和特定色彩质感。
drbaph
Z-Image(造相)是一个拥有60亿参数的高效图像生成基础模型,专门解决图像生成领域的效率和质量问题。其蒸馏版本Z-Image-Turbo仅需8次函数评估就能达到或超越领先竞品,在企业级H800 GPU上可实现亚秒级推理延迟,并能在16G VRAM的消费级设备上运行。
PrimeIntellect
INTELLECT-3是一个拥有1060亿参数的混合专家(MoE)模型,通过大规模强化学习训练而成。在数学、编码和推理基准测试中展现出卓越性能,模型、训练框架和环境均以宽松许可协议开源。
Shawon16
这是一个基于VideoMAE-base架构在未知数据集上微调的视频理解模型,专门用于手语识别任务。模型在20个训练周期后达到了18.64%的准确率。
Arko007
Zenyx_114M-Tiny-Edu-Instruct 是一个实验性的小型指令微调语言模型,拥有约1.14亿参数。它基于TinyEdu-50M基础模型构建,在FineWeb-Edu数据集上预训练,并在OpenHermes-2.5和CodeFeedback-Filtered混合数据集上进行了指令微调。该模型旨在探索极小架构下指令微调的极限,验证损失收敛至约1.04。
ExaltedSlayer
Gemma 3是谷歌推出的轻量级开源多模态模型,本版本为12B参数的指令调优量化感知训练模型,已转换为MLX框架的MXFP4格式,支持文本和图像输入并生成文本输出,具有128K上下文窗口和140+语言支持。
这是基于MCG-NJU/videomae-base模型在未知数据集上微调的视频理解模型,经过20个epoch的训练,在评估集上达到13.31%的准确率。该模型专门针对视频分析任务进行优化。
jayn7
腾讯混元视频1.5模型的量化GGUF版本,专门用于文本到视频生成任务,支持720P高清视频生成,提供多种量化精度版本以优化使用效率。
本项目提供腾讯混元视频1.5文本到视频模型的量化GGUF版本,支持480P视频生成任务,包含蒸馏模型和完整模型两个版本,可与ComfyUI-GGUF等工具配合使用。
腾讯混元视频1.5模型的量化GGUF版本,专门用于图像转视频和视频生成任务。提供480P分辨率的蒸馏模型和标准模型,支持多种量化精度,包括Q4_K_S、Q8_0和FP16等。
DreadPoor
Strawberry_Smoothie-TEST 是一个使用 mergekit 工具合并三个12B参数模型得到的混合模型,结合了Unity-12B、Chaos-Unknown-12b和Smoothie-12B-Model_Stock的优势,旨在提供更好的文本生成和对话能力
evilfreelancer
这是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,采用GGUF格式,需要特定的llama.cpp分支支持。模型采用混合专家架构,总参数量约118亿,其中激活参数量约18亿。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15亿参数密集语言模型,基于Qwen2.5-Math-1.5B微调,专门针对数学和算法编码问题设计。采用'频谱到信号原理'框架训练,在多个数学竞赛测试中超越规模更大的模型,训练成本约7800美元,支持最长约40k词元的输出。
GigaChat3-10B-A1.8B是GigaChat系列的对话模型,基于混合专家(MoE)架构,共有100亿参数,其中18亿为活跃参数。该模型采用多头潜在注意力和多令牌预测技术,支持25.6万令牌的长上下文,在多语言对话和推理任务中表现出色。
kayte0342
ChronoEdit-14B是NVIDIA开发的一款具备时间推理能力的图像编辑和世界模拟模型,拥有140亿参数。它通过两阶段推理过程实现物理感知的图像编辑和基于动作条件的世界模拟,从预训练视频生成模型中提炼先验知识。
mlx-community
VibeThinker-1.5B的4位量化版本,基于MLX框架针对苹果芯片优化,是一个拥有15亿参数的密集语言模型,专门用于数学推理和算法编码问题
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
MCP-PostgreSQL-Ops是一个专业的PostgreSQL数据库操作和监控MCP服务器,支持PostgreSQL 12-17版本,提供全面的数据库分析、性能监控和智能维护建议,通过自然语言查询实现数据库管理。
1Panel MCP Server是为1Panel设计的模型上下文协议服务器实现,支持多种安装和运行方式。
Smart Tree是一个基于Rust开发的超快速目录可视化工具,比传统tree命令快10-24倍,具有AI优化输出、量子压缩和智能搜索等功能,同时注重环保节能。
PMAT是一个零配置的AI代码上下文生成工具,提供代码质量分析、技术债务评级、突变测试、仓库健康评分和语义搜索等功能,支持17种以上编程语言,并能通过MCP协议与Claude Code等AI助手集成。
1Panel MCP Server是为1Panel设计的模型上下文协议服务器实现。
MCP Kling是首个且唯一完整的Kling AI MCP服务器,提供13种创意工具,支持视频生成、图像处理、唇形同步及虚拟试衣等功能,实现与Claude的无缝集成,适用于内容创作者和开发者。
英雄联盟模拟对战预测器,提供基于历史数据的召唤师分析和AI驱动的10阶段对战模拟,支持多语言和性能比较。
Ludus FastMCP是一个基于Model Context Protocol(MCP)的Python服务器,用于通过AI助手自动化管理Ludus网络靶场环境。它提供157个工具,涵盖靶场生命周期管理、场景部署、模板创建、Ansible角色管理和安全监控集成等功能,支持通过自然语言命令控制网络靶场。
一个基于Model Context Protocol的OpenAPI文档搜索服务器,提供加载、解析和查询API规范的功能,支持JSON和YAML格式,包含10个查询工具,便于AI助手访问API文档。
1MCP是一个统一的多MCP服务器聚合解决方案,旨在简化AI助手与外部工具的交互管理。
CCXT MCP Server是一个通过Model Context Protocol (MCP)让AI模型与加密货币交易所API交互的服务器,使用CCXT库支持100多家交易所的交易功能。
非官方的BioOntology MCP服务器,提供全面的生物本体API访问,支持1200多个生物本体的搜索、注释和探索功能。
Pulse CN MCP Server是一个实时获取中国互联网热门内容的MCP协议服务器,支持微博、今日头条等18个平台的热搜数据,为AI模型提供最新中文趋势信息。
MCP字符工具是一个为大型语言模型提供字符级文本分析能力的服务器,解决LLM因分词而难以处理单个字符的问题,提供14+种字符计数、拼写分析和文本比较工具。
一个实时监控Hyperliquid平台上大额交易(超过100万美元)的MCP服务器,提供鲸鱼交易警报和数据分析功能。
一个基于TypeScript的F1赛车数据MCP服务器,提供实时和历史F1赛事数据访问。
Cocos Creator MCP Server Plugin 是一个为Cocos Creator 3.8+设计的全面MCP服务器插件,通过标准化协议实现AI助手与编辑器的交互,提供一键安装和151种工具支持,覆盖98%的编辑器控制功能。
DeFi Trading Agent MCP Server是一个将AI助手转变为自主加密货币交易代理的工具,支持实时市场分析、投资组合管理和跨17+区块链的无缝交易执行。
工业物联网与边缘计算的MCP服务器,通过HTTP端点提供11种工具,实现AI驱动的工业自动化、预测性维护和智能工厂操作,支持MQTT、Modbus等多种协议。