中国第三代自主超导量子计算机“本源悟空”已初步具备搭载AI的运算能力,标志着国产量子算力开始系统性融入人工智能应用生态,开启“量子+AI”协同发展新篇章。该计算机于2024年1月投入运行,搭载72位自主超导量子芯片“悟空芯”,此次技术升级不仅是计算能力的提升,更是量子计算与人工智能融合的重要里程碑。
爱奇艺推出“AI艺人库”计划,利用自研平台创建艺人数字分身,旨在提升影视制作效率。但计划发布后,多位入驻艺人迅速发声否认参与,引发公众对AI技术应用边界和艺人权益保护的广泛讨论。
我国人工智能产业迎来爆发式增长,日均Token调用量突破140万亿次,较去年末增长超40%。这标志着AI技术正从实验阶段迈向规模化应用,行业渗透率快速提升。同时,全球科技巨头加大投入和硬件革新,正重塑产业格局。
星巴克测试新版应用,利用ChatGPT技术,通过用户输入的心情描述、简单提示或照片,提供个性化饮品推荐,旨在提升点餐体验的便捷性和创意性。
免费AI技术预览100种发型和颜色,即时预览完美发型,无需注册或应用程序。
AI技术应用于图像设计的未来,轻松提升设计水平。
使用AI技术提供的Monorepo工具包,帮助快速构建应用程序。
使用AI技术生成定制贴纸,适用于消息应用和社交媒体。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
$7.7
$30.8
200
-
Anthropic
$7
$35
Google
$2.1
$17.5
$21
$105
Alibaba
$8
$240
52
$3.9
$15.2
64
Bytedance
Baidu
32
Tencent
$0.4
128
$0.63
$3.15
131
$15
Sachin-0001
这是一个基于🤗 Transformers库的双向自回归Transformer模型,已上传至模型中心。模型卡片由系统自动生成,具体技术细节和应用信息需要进一步补充。
noctrex
这是对MiroThinker-v1.0-30B模型进行MXFP4_MOE imatrix量化的版本,基于mradermacher的imatrix实现。该量化模型保持了原模型的文本生成能力,同时通过量化技术提高了推理效率,适用于需要高效文本生成的各种应用场景。
Smith-3
这是一个专为圣西蒙大学科学与技术学院学生设计的微调AI模型,集成在TecnoTime应用程序中,帮助学生保持学习组织性、提高学术连续性,通过结构化通知和激励信息强化学习习惯。
nvidia
NVIDIA-Nemotron-Nano-VL-12B-V2-FP4-QAD 是 NVIDIA 推出的自回归视觉语言模型,基于优化的 Transformer 架构,能够同时处理图像和文本输入。该模型采用 FP4 量化技术,在保持性能的同时显著减少模型大小和推理成本,适用于多种多模态应用场景。
anikifoss
GLM-4.6的高质量量化版本,采用先进的量化技术在不使用imatrix的情况下实现,保持了良好的模型性能和兼容性,适用于对话等多种应用场景。
unsloth
Granite-4.0-H-Small是IBM开发的具有320亿参数的长上下文指令模型,基于Granite-4.0-H-Small-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术,在指令遵循和工具调用能力方面有显著提升,特别适合企业级应用。
Granite-4.0-H-Tiny是IBM开发的具有70亿参数的长上下文指令模型,基于Granite-4.0-H-Tiny-Base进行微调。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备增强的指令跟随和工具调用能力,特别适用于企业级应用。
Granite-4.0-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备增强的指令遵循和工具调用能力,特别适用于企业级应用。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
AdilZtn
SmolVLA是一款紧凑高效的视觉语言动作模型,能在降低计算成本的情况下取得有竞争力的性能,并可以部署在消费级硬件上。该模型使用LeRobot进行训练,专为机器人技术应用设计。
adityak74
MEDFIT-LLM-3B是一个专门针对医疗问答优化的语言模型,基于Meta的Llama-3.2-3B-Instruct进行微调。该模型通过LoRA技术在医疗数据集上训练,显著提升了医学领域理解和直接回答能力,适用于医疗聊天机器人、患者教育等应用场景。
NVIDIA Qwen3-8B FP4 模型是阿里巴巴Qwen3-8B模型的量化版本,采用优化的Transformer架构的自回归语言模型。该模型使用FP4量化技术,在保持性能的同时显著减少内存占用和计算需求,适用于AI智能体系统、聊天机器人、RAG系统等应用场景。
GeniusJunP
SmolVLA是一个紧凑高效的视觉-语言-动作模型,能在降低计算成本的情况下取得有竞争力的性能,可部署在消费级硬件上。该模型使用LeRobot框架训练,专为机器人技术应用设计。
OpenGVLab
InternVL3_5-38B是开源多模态模型InternVL3.5系列中的一员,在多功能性、推理能力和推理效率方面取得了显著进展。它支持多语言,可应用于图像文本到文本的任务,采用级联强化学习框架和视觉分辨率路由器技术优化性能。
lmstudio-community
这是OpenGVLab的InternVL3_5 14B模型的量化版本,支持图像文本到文本的转换任务,通过量化技术提升了模型运行效率,为相关应用提供了更高效的解决方案。
Mungert
基于Meta Llama-3.3-70B-Instruct的大语言模型,经过多阶段训练优化,在推理、聊天等任务上表现出色,支持多种语言,适用于多种AI应用场景。采用神经架构搜索技术优化,能够在单个H100-80GB GPU上高效运行。
rwkv7-7.2B-g0是基于RWKV7架构的72亿参数多语言文本生成模型,采用创新的量化优化技术,支持英语、中文、日语、韩语、法语、阿拉伯语、西班牙语和葡萄牙语等多种语言,具有高效的推理性能和广泛的应用场景。
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
macpaw-research
这是基于Ultralytics/YOLO11微调的计算机视觉模型,专门用于检测macOS应用程序截图中的UI元素,是Screen2AX项目的一部分,致力于利用计算机视觉技术生成无障碍元数据。
NVIDIA Qwen3-30B-A3B FP4是阿里巴巴Qwen3-30B-A3B模型的量化版本,采用优化的Transformer架构,通过FP4量化技术将模型大小减少约3.3倍,同时保持较好的性能表现。该模型支持商业和非商业用途,适用于AI代理系统、聊天机器人、RAG系统等应用场景。
该项目是一个基于Model Context Protocol (MCP)标准的文档处理服务器,通过构建向量数据库和MCP接口,使AI助手能够访问外部文档资源,突破大语言模型的知识限制。项目包含文档处理流水线和MCP服务端两大组件,支持多种嵌入模型和文件格式,可应用于最新技术文档查询、私有代码库理解等场景。
该项目提供了一系列使用AWS Model Context Protocol(MCP)的示例模块,涵盖了多种语言和技术栈,包括TypeScript、Python、Spring AI等,展示了MCP在客户端-服务器通信、ECS部署、RAG集成等场景下的应用。
Gaia-X是基于新一代AI范式的企业级AI应用平台,通过创新技术架构解决企业AI产品的核心痛点,提供多代理协作、自然语言RPA、MCP协议支持等核心功能。
这是一个MCP应用服务器,允许用户在MCP兼容主机中直接浏览和游玩来自archive.org的经典街机游戏。它通过严格的版权验证系统(包括许可名单和元数据检查)确保只加载拥有合法分发权限的游戏,并通过技术手段处理游戏嵌入页面以绕过浏览器安全限制。
本项目是基于MCP协议的Python服务器,提供水土保持技术规范查询及计算功能,包括曼宁系数、土压力系数、排水沟流速、边坡稳定等工程计算,以及台湾地区经纬度与UTM/TWD97坐标转换。适用于AI应用整合。
AutoPentest是一个基于MCP协议的自动化Web应用渗透测试服务器,集成了OWASP WSTG和PortSwigger攻击技术指南,通过角色化代理(侦察、分析、利用、报告)实现七阶段自动化测试,包含109项测试、31种攻击技术、27个安全工具和自适应WAF绕过能力,确保零误报和证据驱动的漏洞发现。
BurpMCP是一款Burp Suite扩展,通过集成现代AI技术增强应用安全测试能力,提供智能辅助测试功能。
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。
基于EdgeOne Pages Functions技术的智能聊天应用,实现完整的MCP协议工作流,包含交互式聊天界面、高性能边缘函数和OpenAI兼容API。
Hume MCP服务器是一个AI协作工具,允许用户通过MCP客户端应用(如Claude Desktop、Cursor等)使用Octave文本转语音技术,实现智能语音合成与交互。
一个包含多种AI代理和RAG技术的示例项目,涵盖Gemini应用、MCP服务、Flutter应用及Vertex AI集成,提供从基础到高级的AI开发示例。
EigenLayer-MCP是一个提供中间件服务的项目,旨在通过其独特的协议和技术支持,优化和扩展区块链的功能与应用。
该项目通过ChatGPT测试LLM在信息检索、API集成(如IGN的APICARTO和GéoPlateforme服务)以及代码生成方面的能力,包括地理编码、邮政编码查询等功能,并探索AI在技术评估和开发辅助中的应用。
基于T3技术栈的Next.js全栈应用模板,包含NextAuth、Prisma、Drizzle、Tailwind CSS和tRPC等现代技术
该项目包含MCP服务器和VSCode扩展,通过自然语言提示生成HTML、CSS和JavaScript应用,利用Google LLM技术实现AI代码生成。
A2A-MCP官方网站展示多智能体协作协议的技术愿景、核心优势和应用场景,采用现代化前端技术栈构建。
这是一个包含多个开源AI项目的列表,涵盖了从自动化代理、大语言模型、图像生成到AI开发框架等多个领域。这些项目旨在帮助开发者利用AI技术赚钱,包括构建智能助手、自动化工作流、内容生成等应用。
Desktop Commander MCP是一个AI驱动的桌面文件管理和终端命令执行工具,通过Model Context Protocol(MCP)技术让Claude桌面应用能够直接访问文件系统、执行终端命令、管理进程和编辑代码,无需API调用费用。
该项目利用高级AI提示技术,通过Model Context Protocol (MCP)让AI代理(基于Google Gemini模型)与Windows传统应用MSPaint交互,解决复杂数学问题并在画布上绘制解决方案。
这是一个基于Next.js构建的MCP服务器项目,使用TypeScript和Tailwind CSS技术栈开发的现代Web应用。