百度发布文心大模型衍生模型PaddleOCR-VL-1.6,在OmniDocBench v1.6评测中以96.33%准确率超越Gemini-3-Pro、GPT-5.2等主流模型,刷新SOTA,综合性能全球第一。该模型标志着多模态大模型在复杂文档理解与真实场景解析上的重大突破,支持超100种语言识别,用户覆盖广泛。
马斯克旗下xAI公司于2026年6月1日公开招聘中文AI训练师,以优化Grok大模型的语音互动和多语言能力。该岗位时薪35至45美元(约237-304元人民币),支持全职、兼职或合作模式,工作灵活,旨在推动多模态语音技术发展。
GitHub昨日将AI编程工具Copilot转为按使用量计费,告别低价无限包月模式,改为基于模型和Token消耗扣除“GitHub AI点数”。新方案中,10美元/月的Pro套餐含1500点,39美元/月的Pro+含7000点,100美元/月的Copilot Max含20000点,核心代码生成按点数计费。
OpenAI于6月1日对ChatGPT移动端和网页端进行重大升级,新增隐蔽手势交互(如长按发送箭)、长对话目录功能,并深度重构默认模型的输出风格,显著提升用户体验。
免费AI图像生成器,含100积分,无需信用卡,支持多模型
OfoxAI统一大模型API网关,一个API接入100+模型,低延迟易集成。
NottoAI支持16+AI模型,一键切换,节省订阅费用,免费试用。
LPM 1.0是17B参数模型,实时生成全双工AI视频,低延迟身份一致。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
redis
这是一个由Redis开发的、针对LangCache语义缓存任务进行微调的CrossEncoder模型。它基于成熟的`cross-encoder/ms-marco-MiniLM-L6-v2`模型,在超过100万对LangCache句子对数据集上训练,专门用于计算两个文本之间的语义相关性得分,以优化缓存命中率。
ai-sage
GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型,基于混合专家(MoE)架构,拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力(MLA)和多令牌预测(MTP)技术,旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练,支持包括中文在内的 10 种语言,适用于需要快速响应的对话场景。
hitonet
Hito 1.7B 是一个专为 llama.cpp、Ollama、LM Studio 等工具优化的 GGUF 量化版本模型,具备 17 亿参数,采用嵌套认知推理(NCR)方法,能够实现结构化、自我纠错的思维模式,提升推理准确性与透明度。
AlekseyCalvin
这是一个针对 Z-Image Turbo DiT 模型的低秩适配器(LoRA),专门用于生成具有历史照片风格的图像。该模型基于 1900-1910 年代摄影师 Sergey Prokudin-Gorsky 的 150 张彩色照片训练而成,能够为现代图像生成注入独特的早期彩色摄影美学,如暖色调光晕和特定色彩质感。
drbaph
Z-Image(造相)是一个拥有60亿参数的高效图像生成基础模型,专门解决图像生成领域的效率和质量问题。其蒸馏版本Z-Image-Turbo仅需8次函数评估就能达到或超越领先竞品,在企业级H800 GPU上可实现亚秒级推理延迟,并能在16G VRAM的消费级设备上运行。
PrimeIntellect
INTELLECT-3是一个拥有1060亿参数的混合专家(MoE)模型,通过大规模强化学习训练而成。在数学、编码和推理基准测试中展现出卓越性能,模型、训练框架和环境均以宽松许可协议开源。
Shawon16
这是一个基于VideoMAE-base架构在未知数据集上微调的视频理解模型,专门用于手语识别任务。模型在20个训练周期后达到了18.64%的准确率。
Arko007
Zenyx_114M-Tiny-Edu-Instruct 是一个实验性的小型指令微调语言模型,拥有约1.14亿参数。它基于TinyEdu-50M基础模型构建,在FineWeb-Edu数据集上预训练,并在OpenHermes-2.5和CodeFeedback-Filtered混合数据集上进行了指令微调。该模型旨在探索极小架构下指令微调的极限,验证损失收敛至约1.04。
ExaltedSlayer
Gemma 3是谷歌推出的轻量级开源多模态模型,本版本为12B参数的指令调优量化感知训练模型,已转换为MLX框架的MXFP4格式,支持文本和图像输入并生成文本输出,具有128K上下文窗口和140+语言支持。
这是基于MCG-NJU/videomae-base模型在未知数据集上微调的视频理解模型,经过20个epoch的训练,在评估集上达到13.31%的准确率。该模型专门针对视频分析任务进行优化。
jayn7
腾讯混元视频1.5模型的量化GGUF版本,专门用于文本到视频生成任务,支持720P高清视频生成,提供多种量化精度版本以优化使用效率。
本项目提供腾讯混元视频1.5文本到视频模型的量化GGUF版本,支持480P视频生成任务,包含蒸馏模型和完整模型两个版本,可与ComfyUI-GGUF等工具配合使用。
腾讯混元视频1.5模型的量化GGUF版本,专门用于图像转视频和视频生成任务。提供480P分辨率的蒸馏模型和标准模型,支持多种量化精度,包括Q4_K_S、Q8_0和FP16等。
DreadPoor
Strawberry_Smoothie-TEST 是一个使用 mergekit 工具合并三个12B参数模型得到的混合模型,结合了Unity-12B、Chaos-Unknown-12b和Smoothie-12B-Model_Stock的优势,旨在提供更好的文本生成和对话能力
evilfreelancer
这是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,采用GGUF格式,需要特定的llama.cpp分支支持。模型采用混合专家架构,总参数量约118亿,其中激活参数量约18亿。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15亿参数密集语言模型,基于Qwen2.5-Math-1.5B微调,专门针对数学和算法编码问题设计。采用'频谱到信号原理'框架训练,在多个数学竞赛测试中超越规模更大的模型,训练成本约7800美元,支持最长约40k词元的输出。
GigaChat3-10B-A1.8B是GigaChat系列的对话模型,基于混合专家(MoE)架构,共有100亿参数,其中18亿为活跃参数。该模型采用多头潜在注意力和多令牌预测技术,支持25.6万令牌的长上下文,在多语言对话和推理任务中表现出色。
kayte0342
ChronoEdit-14B是NVIDIA开发的一款具备时间推理能力的图像编辑和世界模拟模型,拥有140亿参数。它通过两阶段推理过程实现物理感知的图像编辑和基于动作条件的世界模拟,从预训练视频生成模型中提炼先验知识。
mlx-community
VibeThinker-1.5B的4位量化版本,基于MLX框架针对苹果芯片优化,是一个拥有15亿参数的密集语言模型,专门用于数学推理和算法编码问题
GigaChat3-10B-A1.8B-base是GigaChat系列的基础预训练模型,采用混合专家(MoE)架构,总参数100亿,活跃参数18亿。模型集成了多头潜在注意力(MLA)和多令牌预测(MTP)技术,在推理时具备高吞吐量优势。
1Panel MCP Server是为1Panel设计的模型上下文协议服务器实现,支持多种安装和运行方式。
1Panel MCP Server是为1Panel设计的模型上下文协议服务器实现。
这是一个用于Autodesk Revit的MCP服务器,通过自然语言控制实现AI代理与Revit软件的交互,提供超过100个API工具,支持文档管理、模型创建、视图操作等功能。
CCXT MCP Server是一个通过Model Context Protocol (MCP)让AI模型与加密货币交易所API交互的服务器,使用CCXT库支持100多家交易所的交易功能。
Forge MCP服务器是一个通过32个并行AI代理将PyTorch模型自动优化为高性能CUDA/Triton内核的工具,可将推理速度提升高达14倍,支持多种MCP兼容的AI编程助手。
MCP字符工具是一个为大型语言模型提供字符级文本分析能力的服务器,解决LLM因分词而难以处理单个字符的问题,提供14+种字符计数、拼写分析和文本比较工具。
Adzuna Jobs MCP Server是一个基于模型上下文协议(MCP)的服务,提供对Adzuna招聘搜索API的访问,支持在12个国家搜索职位、分析薪资数据和调研雇主信息。
Pulse CN MCP Server是一个实时获取中国互联网热门内容的MCP协议服务器,支持微博、今日头条等18个平台的热搜数据,为AI模型提供最新中文趋势信息。
Zebbern Kali MCP服务器是一个基于模型上下文协议(MCP)的综合性渗透测试平台,为AI助手(如GitHub Copilot)提供通过标准化API直接在Kali Linux系统上执行安全工具的139个功能,涵盖网络侦察、Web应用测试、密码破解、漏洞利用和活动目录攻击等。
Prompt Decorators是一个标准化大型语言模型提示增强与转换的框架,提供规范定义和Python实现,包含140+预置装饰器,支持MCP协议集成。
YaraFlux MCP Server是一个基于模型上下文协议(MCP)的YARA扫描服务器,为AI助手提供文件YARA规则分析能力。该项目采用模块化架构,集成了19个MCP工具,支持YARA规则管理、文件扫描、安全存储等功能,可无缝集成Claude Desktop等AI助手。
RLM MCP服务器是一个基于递归语言模型模式的大规模上下文处理工具,允许Claude代码通过外部变量处理超过1000万token的文本,避免直接将海量内容输入提示词。它通过加载、分块、子查询和聚合的流程,支持自动分析和程序化执行,可连接Claude API或本地Ollama进行免费推理。
Code Graph RAG MCP是一个先进的模型上下文协议服务器,通过智能图表示和多语言代码分析能力,提供13种专业工具进行代码理解、关系映射和语义搜索。
一个连接大型语言模型与《卫报》自1999年以来所有文章档案的MCP服务器,提供实时新闻、新闻分析和历史研究功能。
DINO-X MCP是一个通过DINO-X和Grounding DINO 1.6 API赋能大型语言模型进行细粒度目标检测和图像理解的项目。它能够实现精确的对象定位、计数、属性分析以及场景理解,支持自然语言驱动的视觉任务和工作流集成。
MCP AI Hub是一个基于Model Context Protocol的服务器,通过LiteLM统一接口提供对100+AI模型(包括OpenAI、Anthropic、Google等)的访问,支持多种传输协议和灵活配置。
ImageGen MCP Server是一个支持多种AI图像生成模型(包括GPT-Image-1、Google Imagen 4、Flux 1.1等)的MCP服务器,提供灵活的图像生成、尺寸调整和输出格式选项,可无缝集成到各种MCP客户端中。
基于Google Gemini 1.5 Pro模型的内容智能摘要服务
Msty Admin MCP是一个为Msty Studio桌面版2.4.0+设计的AI驱动系统管理工具,通过Claude Desktop提供155个工具,实现数据库查询、配置管理、本地AI模型编排和分层AI工作流构建等功能。
Insights Knowledge Base (IKB) MCP Server 是一个即插即用的免费知识库,内置10,000+高质量洞察报告,支持本地安全存储和私有文档解析。项目优化了数据处理效率,提供每周报告更新,并计划未来集成嵌入模型和增强报告系统。