腾讯自研大模型混元2.0(Tencent HY2.0)正式发布,与此同时,DeepSeek V3.2也逐步接入腾讯生态。目前,这两大模型已在元宝、ima等腾讯AI原生应用中率先上线,腾讯云也同步开放了相关模型的API及平台服务。 全新发布的Tencent HY2.0采用混合专家(MoE)架构,总参数量高达4
生数科技发布Vidu Q2版本“生图全家桶”,集成参考生图、文生图与图像编辑三大功能。新版本上线首日使用量突破50万次,显示用户需求旺盛。Vidu Q2增强了图像生成控制力,支持精准指定画面位置、动作与构图,并输出4K画质。新增图像编辑功能包括局部重绘和材质替换,在国际评测中表现优异。
哈佛大学青年民调显示,59%的美国年轻人(18-29岁)担忧AI影响就业前景,其中26%认为威胁严重,仅23%完全不担心。相比外包(48%)和移民,年轻人对AI的就业冲击更为忧虑。
OpenAI以全股票形式收购波兰初创公司Neptune,交易金额低于4亿美元。这是OpenAI 2025年第四次收购,旨在将Neptune的模型监控与调试能力整合进GPT训练基础设施。Neptune服务将于2026年第一季度前逐步关停,团队整体加入OpenAI。
Seedream 4.5可创建4K视觉效果,支持多语言文本,适用于专业创作。
ByteDance的Seedream 4.5 AI可提供4K电影级视觉效果,适用于电商和广告设计。
Runway Gen 4.5 AI可生成1080p电影级视频,具备导演模式和物理模拟
Gen-4.5是先进AI视频生成平台,可将文本和图像转为专业视频
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Xai
$1.4
$3.5
2k
Anthropic
$7
$35
200
$21
$105
Bytedance
-
$0.8
$2
128
Alibaba
$0.4
$0.35
400
64
$525
Huawei
32
Chatglm
$8
$16
$1.8
$5.4
16
Tencent
John1604
Qwen3 VL 4B Thinking 是一个支持图像到文本以及文本到文本转换的多模态模型,具有4B参数规模,能够满足多种图文交互需求。
lightx2v
本仓库包含为HunyuanVideo-1.5优化的4步蒸馏模型,能够在不使用CFG(无分类器指导)的情况下实现超快速的4步推理,显著减少生成时间,同时保持高质量的视频输出。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40亿参数视觉语言模型,基于Qwen3架构开发,支持多模态理解和对话任务。该模型具备强大的图像理解和文本生成能力,能够处理复杂的视觉语言交互场景。
jayn7
本项目提供腾讯混元视频1.5文本到视频模型的量化GGUF版本,支持480P视频生成任务,包含蒸馏模型和完整模型两个版本,可与ComfyUI-GGUF等工具配合使用。
腾讯混元视频1.5模型的量化GGUF版本,专门用于图像转视频和视频生成任务。提供480P分辨率的蒸馏模型和标准模型,支持多种量化精度,包括Q4_K_S、Q8_0和FP16等。
Owen777
UltraFlux是一款基于Flux的扩散变换器,专门用于原生4K文本到图像生成。它通过数据、架构和损失的协同设计,能够在各种不同纵横比下保持一致的图像质量。
MaziyarPanahi
本项目提供了Qwen3-4B-Thinking-2507模型的GGUF格式文件,这是一个具有思维链推理能力的4B参数大语言模型,支持多种量化版本,便于在各种硬件上部署运行。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15亿参数密集语言模型,基于Qwen2.5-Math-1.5B微调,专门针对数学和算法编码问题设计。采用'频谱到信号原理'框架训练,在多个数学竞赛测试中超越规模更大的模型,训练成本约7800美元,支持最长约40k词元的输出。
Intel
DeepMath是一个40亿参数的数学推理模型,基于Qwen3-4B Thinking构建,结合了微调的大语言模型与沙盒化Python执行器。它能够为计算步骤生成简洁的Python代码片段,显著减少错误并缩短输出长度。
Nanbeige
楠米色4-3B-思维-2511是楠米色系列的最新增强版本,通过先进的蒸馏技术和强化学习优化,在紧凑的3B参数规模下实现了强大的推理能力。该模型在Arena-Hard-V2和BFCL-V4等基准测试中,在参数小于32B的模型中取得了最先进(SOTA)成果。
mlx-community
VibeThinker-1.5B的4位量化版本,基于MLX框架针对苹果芯片优化,是一个拥有15亿参数的密集语言模型,专门用于数学推理和算法编码问题
bartowski
这是一个基于REAP方法对MiniMax-M2中40%专家进行均匀剪枝得到的139B参数大语言模型,采用GLM架构和专家混合(MoE)技术,通过llama.cpp进行多种量化处理,适用于文本生成任务。
这是p-e-w/gpt-oss-20b-heretic模型的量化版本,使用llama.cpp的imatrix技术进行量化处理。该模型是一个200亿参数的大语言模型,提供了多种量化选项,从高质量到低质量不等,文件大小从41.86GB到11.52GB,适用于不同硬件条件。
hum-ma
Wan2.2-TI2V-5B-Turbo-GGUF是基于quanhaol/Wan2.2-TI2V-5B-Turbo基础模型转换而来的图像转视频模型,经过优化可在4GB GPU上运行,具有出色的通用性和高效推理能力。
TeichAI
这是一个基于Claude Sonnet 4.5推理数据集训练的30B参数大语言模型,专门针对高难度推理任务进行优化,在编码和科学领域表现出色。
这是一个基于Qwen3 30B A3B模型,在Claude Sonnet 4.5高推理难度数据集上训练的蒸馏模型。该模型专门针对复杂推理任务进行优化,在编码和科学领域表现出色,具备较强的逻辑推理能力。
ilyasaqit
这是Helsinki-NLP/opus-mt-en-ber模型的微调版本,专门用于英语到阿特拉斯塔马齐格语的翻译。模型基于MarianMT架构,使用48.6万对合成句子对进行训练,支持塔马齐格语、塔什利特语和中阿特拉斯塔马齐格语的翻译任务。
magiccodingman
这是一个基于Qwen3 4B Instruct模型的混合量化版本,采用MXFP4和混合权重技术,在保持近乎无损精度的同时实现了更小的文件大小和更高的推理速度。
这是一个基于Qwen3 4B模型的混合量化版本,采用MXFP4_MOE混合权重技术,在保持近乎无损精度的同时实现了更小的文件大小和更高的推理速度。该模型通过精心组合MXFP4和高精度嵌入/输出权重,达到了接近Q8量化的精度水平,同时具备Q4-Q6级别的吞吐量。
FastVideo
FastVideo团队推出的图像转视频模型,属于CausalWan2.2 I2V A14B系列,支持8步推理,能适配从H100到4090等多种GPU,也支持Mac用户使用。
n8n是一个面向技术团队的工作流自动化平台,结合了代码灵活性和无代码速度,提供400+集成、原生AI功能和公平代码许可,支持自托管或云端部署。
MCP Connect 4是一个通过MCP技术实现人机交互的井字棋游戏项目,允许用户与AI助手对弈,并自动记录游戏状态。
这是一个为Google Analytics 4提供MCP服务的服务器项目,包含数据获取、资源查询和数据分析等功能,需通过Google服务账号认证使用。
设置4K YouTube视频的MCP复制FLUX服务
pyResToolbox MCP服务器是一个生产就绪的AI工具,将石油工程计算库pyResToolbox的47个工具通过Model Context Protocol集成到Claude等AI助手中,支持PVT分析、井性能计算、油藏模拟等专业计算。
Cinema4D MCP Server是一个连接Cinema 4D与Claude的桥梁,通过提示词辅助进行3D场景操作和建模。
一个包含MCP客户端插件的Godot 4示例项目,用于演示在游戏运行时通过Claude等AI工具实时查看、修改场景节点属性及调用方法,实现AI辅助调试与开发。
3xpl API的MCP服务器实现,允许LLM通过JSON API与48条区块链数据交互,提供多种区块链查询和聚合工具。
设置4K YouTube视频的教程
1000 Genomes Project数据集MCP服务器,提供对Dnaerys变异存储中3202个样本、1.38亿个变异和约4420亿个基因型的实时自然语言访问,支持基于坐标、注释和遗传模式的筛选分析。
GLM-4.6 MCP服务器是一个企业级架构咨询协议桥接服务,通过模型上下文协议连接Claude 4.5 Sonnet和GLM-4.6,提供系统设计、可扩展性模式和技术决策支持,支持代码架构分析、系统架构设计和决策审查等功能。
基于Rust的《女神异闻录4黄金版》内存修改工具,可实时修改游戏内金钱数值
TurboVault是一个生产级的MCP服务器,将Obsidian知识库转换为由AI驱动的智能知识系统,提供44个专业工具用于笔记的读写、搜索、分析和管理,具有亚100毫秒的性能表现。
一个基于Model Context Protocol的Google Analytics 4数据访问服务器,提供页面浏览、用户活跃度、事件分析和用户行为等数据查询功能。
Unsloth MCP Server是一个用于高效微调大语言模型的服务器,通过优化算法和4位量化技术,实现2倍训练速度提升和80%显存节省,支持多种主流模型。
一个集成4o-image API的MCP服务器,支持通过文本生成和编辑图像。
NewsNow的官方MCP服务器,提供40多个新闻源
Carla MCP服务器是一个专业的音频制作AI控制平台,通过45个工具提供完整的音频插件宿主控制,支持自然语言操作专业音频工作流程
一个集成4o-image API的MCP服务器实现,支持通过标准化协议让LLM和AI系统生成和编辑图像,包括文本生成图像、图像编辑等功能。
一个用于将Tailwind组件转换为NativeWind 4的MCP服务工具