网易有道发布“子曰”大模型4.0,全面迈入全模态时代,实现文本、图片、音频高效融合交互。该版本以全量开源为核心,向开发者社区开放核心技术,旨在降低AI落地成本与门槛。核心突破包括全模态融合交互、深层重构等维度,推动AI生态发展。
字节跳动视觉技术前负责人王长虎创立爱诗科技,凭借高效团队和快速技术迭代,在六个月内获25亿元融资,公司估值达10亿美元,跻身独角兽行列。他带领团队在巨头林立的AI视频生成赛道中突围,展现了“速度与激情”式的创业精神,成为“字节系”创业者的领军人物。
阿里云在2026年5月20日峰会上宣布全面升级至“智能体时代”技术体系,重构芯片、云平台、模型到推理的完整链路,从服务人类转向支撑智能体全天候运行的“AI工厂”。核心底座包括平头哥真武M890芯片及超节点服务器,实现训推一体化,为海量智能体提供高效、持续的计算支持。
2026年阿里云峰会发布全新AI产品“千问云”官网,该平台专为Agent设计,整合超150款主流AI模型API,包括Qwen、GLM、Kimi等,旨在提升AI应用开发效率与便捷性。界面简洁直观,功能模块优化,支持用户灵活选择与调用模型。
腾讯推出的AI驱动智能设计工具,支持文生UI与图片转设计稿,实现高效团队协作。
构建实用的 AI 产品,助力个人与团队实现更高效的思考、记忆与执行。
集AI创作、高效剪辑与丰富素材于一体的专业级视频编辑软件。
新一代 AI 原生浏览器,支持多 AI 模型,免费下载开启高效浏览
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Openai
-
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
mlx-community
本模型是 Mistral AI 发布的 Ministral-3-3B-Instruct-2512 指令微调模型的 MLX 格式转换版本。它是一个参数规模为 3B 的大型语言模型,专门针对遵循指令和对话任务进行了优化,并支持多种语言。MLX 格式使其能够在 Apple Silicon 设备上高效运行。
bartowski
这是对ai-sage的GigaChat3-10B-A1.8B模型进行的量化处理版本,采用llama.cpp的imatrix量化技术,可在不同硬件条件下更高效地运行。模型支持俄语和英语,主要用于文本生成任务。
nineninesix
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,采用两阶段管道结合大型语言模型和高效音频编解码器,实现卓越的速度和音频质量。该模型支持西班牙语,具有4亿参数,采样率为22kHz。
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型,通过独特的两阶段架构结合大语言模型与高效音频编解码器,实现低延迟与高质量语音合成,实时因子低至0.2,比实时速度快5倍。
LiquidAI
LFM2-VL-3B是Liquid AI开发的多模态视觉语言模型,基于LFM2骨干架构构建,具备强大的视觉理解和推理能力,特别在细粒度感知任务上表现出色。该模型能够高效处理文本和图像输入,支持高达512×512分辨率的原生图像处理。
deepseek-ai
DeepSeek-OCR是DeepSeek AI开发的一款先进的光学字符识别模型,专注于探索视觉文本压缩的边界,能够高效地从图像中提取和转换文本内容。
KaniTTS是一款专为实时对话式AI应用优化的高速、高保真文本转语音模型。它采用两阶段流水线架构,结合大语言模型和高效音频编解码器,实现了卓越的速度和音频质量,支持多种语言并适用于边缘/服务器部署。
trinty2535425
这是一个基于Qwen/Qwen-Image基础模型训练的图像到视频LoRA模型,采用LoRA(Low-Rank Adaptation)技术实现高效微调,可用于AI图像生成等相关任务
GeneralAnalysis
GA Guard Lite是General Analysis开发的轻量级开源审核模型,专门用于检测语言模型输出中的违规内容。该模型能够识别七类安全风险,包括非法活动、仇恨言论、个人信息泄露等,为AI应用提供高效的内容安全防护。
nvidia
NVIDIA Qwen2.5-VL-7B-Instruct-FP4是阿里巴巴Qwen2.5-VL-7B-Instruct模型的量化版本,采用优化的Transformer架构,支持多模态输入(文本和图像),适用于多种AI应用场景。该模型通过TensorRT Model Optimizer进行FP4量化,在NVIDIA GPU上提供高效的推理性能。
NVIDIA Qwen3-32B FP4模型是阿里云Qwen3-32B模型的量化版本,使用优化的Transformer架构,通过将权重和激活量化为FP4数据类型实现高效推理。该模型支持商业和非商业用途,适用于各种AI应用场景。
NVIDIA Qwen3-14B FP4模型是阿里巴巴Qwen3-14B模型的量化版本,采用FP4数据类型进行优化,通过TensorRT-LLM进行高效推理。该模型专为NVIDIA GPU加速系统设计,适用于AI Agent系统、聊天机器人、RAG系统等多种AI应用场景,支持全球范围内的商业和非商业使用。
lmstudio-community
GLM 4.5 Air是由Zai-Org开发的高效文本生成模型,经过bartowski使用llama.cpp进行GGUF量化处理,在保持性能的同时显著降低了硬件需求,适合在消费级硬件上运行。
GLM-4.5-Air-2bit是基于智谱AI的GLM-4.5-Air模型转换而来的2位量化版本,采用MLX格式优化,可在Apple芯片设备上高效运行。该模型支持文本生成任务,具有轻量级和高效率的特点。
GLM-4.5-Air-6bit是基于智谱AI的GLM-4.5-Air模型转换而来的6位量化版本,专为MLX框架优化,提供高效的大语言模型推理能力。
GLM-4.5-Air-8bit是基于智谱AI的GLM-4.5-Air模型转换而来的8位量化版本,专门为MLX框架优化。该模型保持了原版强大的自然语言处理能力,同时通过量化技术减少了内存占用和计算需求,适合在Apple Silicon设备上高效运行。
Mungert
基于Meta Llama-3.3-70B-Instruct的大语言模型,经过多阶段训练优化,在推理、聊天等任务上表现出色,支持多种语言,适用于多种AI应用场景。采用神经架构搜索技术优化,能够在单个H100-80GB GPU上高效运行。
Mi:dm 2.0是KT开发的韩国中心AI模型,深入内化了韩国社会独特的价值观和认知框架,提供高效的文本生成服务。
这是AI21 Labs的Jamba-Mini-1.7模型的量化版本,使用llama.cpp的imatrix技术进行优化,为不同硬件配置提供了多种量化选择,支持高效推理。
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
Eino是一个专为Golang设计的LLM应用开发框架,旨在通过简洁、可扩展、可靠且高效的组件抽象和编排能力,简化AI应用开发流程。它提供丰富的组件库、强大的图形编排功能、完整的流处理支持以及高度可扩展的切面机制,覆盖从开发到部署的全周期工具链。
Inbox Zero是一款开源AI邮件助手和客户端,帮助用户高效管理邮件,实现收件箱清零。
基于MCP协议的智能任务管理系统,提供AI代理的高效编程工作流框架,具备任务规划、分解、执行和记忆功能。
sqlew是一个MCP服务器,为AI代理提供跨会话的共享SQL上下文存储库,通过记录决策原因和约束规则来防止上下文丢失和重复工作,实现高效的团队知识管理和代码一致性。
一个与HackerNews API集成的MCP服务器,提供搜索帖子、获取详情、用户分析、趋势追踪和评论分析等功能,帮助AI助手高效访问和理解HackerNews内容。
基于mcp-server的项目,支持AI大模型高效调用spinq的量子计算硬件资源,提供Windows和macOS的一键安装脚本,自动检测Python环境并安装依赖。
一个现代高效的CLI工具,可将任何输入文件转换为base64字符串,支持多种输出格式和双向转换,包含专为AI工作流优化的MCP服务器。
Ref MCP是一个ModelContextProtocol服务器,为AI编程工具或代理提供API、服务、库等文档的访问。它是一个一站式解决方案,以快速且令牌高效的方式保持代理对文档的更新。
该项目实现了一个基于Model Context Protocol (MCP)的文档检索服务器,能够为AI助手动态获取Python库的最新官方文档内容。支持LangChain、LlamaIndex和OpenAI等库,通过SERPER API进行高效搜索,并使用BeautifulSoup解析HTML内容。项目设计可扩展,便于添加更多库的支持。
CICADA是一个为AI代码助手提供结构化代码索引的MCP服务器,通过AST级索引、调用站点跟踪和语义搜索,为Elixir、Python和Erlang代码库提供高效的上下文压缩,减少令牌使用并提高代码理解质量。
高性能批量代码理解MCP工具包,专为Java优化,提供全景上下文、结构映射和精准定位功能,帮助AI智能体高效探索大型代码库。
一个专注于高效爬取和清理依赖文档的工具包,适用于人类阅读和AI处理。
一个用于可视化和分析目录结构的强大工具,支持AI助手高效导航项目文件。
Mapbox开发者MCP服务器,为AI助手提供直接访问Mapbox开发者API的能力,帮助开发者更高效地构建地图应用,支持样式管理、令牌管理、文档查询、地理数据处理等功能。
基于Model Context Protocol(MCP)的智能任务管理系统,为AI代理提供高效编程工作流框架,具备任务规划、分解、依赖管理、验证和记忆等功能。
该项目实现了一个针对Notion API的只读MCP服务器,专注于为AI助手提供高效的内容查询和检索功能。通过精简工具集、并行处理和自动内容探索等优化手段,显著提升了性能并解决了AI助手工具数量限制的问题。
Distri是一个基于Rust的可组合AI代理框架,支持通过MCP协议构建和组合智能代理能力,提供模块化设计和高效性能。
基于MCP协议的引力波信号检测与优化系统,专注于GW150914事件分析,通过AI智能探索参数空间实现高效信号检测
一个优化的MCP协议网页抓取服务器,通过服务器端HTML转Markdown和CSS选择器过滤,大幅减少AI处理的令牌使用量,提供高效的内容提取功能