百度发布文心5.0全模态大模型,参数达2.4万亿,具备强大语言理解与生成能力。其采用全模态统一建模技术,可同时处理文本、图像、音频和视频,实现多类型数据的融合优化,标志着AI领域的重要进展。
玩美移动升级时尚API,新增手表、手链等九类虚拟试穿功能,利用生成式AI和计算机视觉技术,精准识别人体结构,为品牌和开发者提供全面的AI穿搭体验,推动时尚行业发展。
YouTube CEO尼尔·莫汉在年度公开信中强调,2026年平台的首要任务是打击AI生成的垃圾内容和深度伪造视频。随着AI技术发展,合成内容与真实影像的界限日益模糊,YouTube正面临大量低质量、重复性AI视频的冲击,维护内容真实性成为科技巨头亟待解决的难题。
阿里推出AIGC创意设计平台“呜哩”,以生成式AI技术为核心,为创作者、设计师及营销人员提供高效多元的创意生成方案。平台已进入测试阶段,依托通义千问团队的技术支持,致力于提升创意设计生产力。
前沿AI图像生成器,结合双技术,有卓越文本渲染能力。
GLM Image是由GLM - Image技术驱动的AI图像生成与编辑器,功能强大。
使用先进的 AI 技术生成视频、图像和音乐。
Nano AI是先进的AI图像生成器,用纳米香蕉技术秒速生成惊艳图像。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
bartowski
这是对ai-sage的GigaChat3-10B-A1.8B模型进行的量化处理版本,采用llama.cpp的imatrix量化技术,可在不同硬件条件下更高效地运行。模型支持俄语和英语,主要用于文本生成任务。
DevQuasar
这是一个基于Moonshot AI技术的量化版本模型,专注于视觉语言理解与生成任务,致力于降低知识获取门槛,让知识为每个人所用。
mrgant
lans_v1 - lora是基于Qwen/Qwen-Image模型使用AI Toolkit by Ostris训练的文本到图像转换模型,采用LoRA技术进行优化,具备良好的图像生成能力。
BarleyFarmer
pejawan22-lora是一个基于AI技术训练的LoRA模型,专门用于特定图像的生成,可与多种AI工具集成使用,通过触发词'peja'来生成图像。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
lichorosario
piccoli_no_style-lora是一个基于图像到视频、LoRA技术的生成模型,使用AI Toolkit训练,以Qwen/Qwen-Image为基础模型,支持多种图像生成场景。
piccoli_no_style-lora 是一个基于图像到视频技术的LoRA模型,使用AI Toolkit进行训练,主要用于图像生成任务,可与多种主流AI工具配合使用。
trinty2535425
这是一个基于Qwen/Qwen-Image基础模型训练的图像到视频LoRA模型,采用LoRA(Low-Rank Adaptation)技术实现高效微调,可用于AI图像生成等相关任务
amd
Llama-3.1-8B-onnx-ryzenai-npu是由AMD基于Meta的Llama-3.1-8B模型开发的优化版本,专门针对AMD Ryzen AI NPU进行优化部署。该模型通过Quark量化、OGA模型构建器和NPU专用后处理技术,在保持高质量文本生成能力的同时,显著提升了在AMD硬件上的推理效率。
John6666
Noobai-XL-1.0是基于Stable Diffusion XL技术的文本到图像生成模型,专注于生成逼真、写实风格的图像,为图像创作领域提供高质量的AI生成解决方案。
Keltezaa
AiGirl_II 是一个基于 black-forest-labs/FLUX.1-dev 构建的文本到图像生成模型,结合了 LoRA 技术和 Diffusers 库,专门用于生成特定风格的图像。该模型采用 CC BY-NC-ND 4.0 许可证,适合非商业用途。
nvidia
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
mykor
Mi:dm 2.0 是一款以韩国为中心的 AI 模型,由 KT 运用其专有技术开发。该模型深入内化了韩国社会独特的价值观、认知框架和常识推理,不仅能处理和生成韩语内容,还能体现对韩国社会文化规范和价值观的深刻理解。
Zedge
Stability AI开发的文本生成图像扩散模型,采用双文本编码器和潜在扩散技术,支持独立使用或配合优化模块提升效果
Yntec
一个融合了达芬奇艺术风格的文本生成图像模型,通过LoRA技术将文艺复兴风格融入现代AI绘画。
MayZhou
基于e5-small模型通过LoRA技术微调的文本分类模型,专用于高精度区分AI生成与人工撰写文本
dataautogpt3
Proteus v0.6是基于SDXL架构的AI图像生成模型,经过全面重构后专注于提升图像的真实感。这是重构后的首个版本,采用多视角融合技术训练,能够生成高质量的逼真图像。
renderartist
基于AI生成图像训练的3D玩具设计模型,融合了SECourses的3D LoRA与填色书Flux LoRA技术
life
这是一个基于AI技术的文本到图像生成模型,专门用于生成具有巴什基尔女性特色的图像。该模型通过特定的提示词触发,能够生成各种场景和风格的巴什基尔女性图像,为艺术创作和设计提供灵感来源。
GraySwanAI
Mistral-7B-Instruct-RR是基于Mistral-7B的改进模型,通过表征重路由(RR)技术插入了断路器机制。该技术通过直接干预有害内容生成时的模型表征,以最小化能力损失的方式防止AI系统产生有害内容。
PMAT是一个零配置的AI代码上下文生成工具,提供代码质量分析、技术债务评级、突变测试、仓库健康评分和语义搜索等功能,支持17种以上编程语言,并能通过MCP协议与Claude Code等AI助手集成。
一个基于MongoDB Atlas向量搜索和Voyage AI嵌入技术的文档检索系统,支持语义搜索和文本匹配,包含文档分块、嵌入生成和存储功能。
Apple RAG MCP是一个为AI代理提供苹果开发专业知识的检索增强生成系统,集成了官方Swift文档、设计指南和Apple Developer YouTube内容,通过AI驱动的混合搜索技术提供准确的技术答案。
AI专家工作流MCP是一个基于OpenRouter API的模型上下文协议服务器,通过产品经理、UX设计师和软件架构师三个AI专家角色,提供从产品规划到技术实现的完整工作流解决方案。项目支持独立生成PRD文档,也可与Task Master集成进行任务管理。
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。
Project Synapse是一个革命性的MCP服务器,通过语义分析和知识图谱技术将文本转化为互联知识网络,并自主生成洞察。它结合Montague语义学和Zettelkasten方法,实现AI的认知协作能力。
Open Deep Research MCP Server是一个AI驱动的深度研究助手,通过结合搜索引擎、网页抓取和AI技术进行迭代式深度研究,生成全面报告。支持MCP协议和CLI两种使用方式,具备可靠性评估、范围控制、自动生成后续问题等功能。
Memory Bank MCP是一个基于Model Context Protocol(MCP)的项目知识管理系统,通过AI生成和结构化文档帮助团队管理项目知识,包括项目目标、产品上下文、系统架构、技术细节、当前任务和进展等六个核心文档类型。
Mercury Spec Ops MCP服务器是一个创新的AI工具平台,将动态提示生成和模板组装作为可编程工具提供给AI助手。它采用模块化架构,支持31种技术栈、10个分析维度和34个模板组件,通过6个工具实现技术特定的内容生成,彻底改变了AI与专业内容的交互方式。
一个基于Cloudflare Worker的极简图像生成模板,使用workers-mcp包和Workers AI技术,支持本地开发和快速部署。
DBChat是一个通过AI技术让用户能用自然语言与数据库对话的工具,无需编写SQL即可查询数据并生成可视化图表,支持多种数据库类型。
该项目通过ChatGPT测试LLM在信息检索、API集成(如IGN的APICARTO和GéoPlateforme服务)以及代码生成方面的能力,包括地理编码、邮政编码查询等功能,并探索AI在技术评估和开发辅助中的应用。
MITRE ATT&CK MCP服务器是一个AI原生威胁情报工具,通过Model Context Protocol提供对MITRE ATT&CK框架的全面访问,包含200+技术、140+威胁组织、700+软件条目的查询能力,支持ATT&CK Navigator可视化层生成,专为安全团队和AI智能体设计。
该项目包含MCP服务器和VSCode扩展,通过自然语言提示生成HTML、CSS和JavaScript应用,利用Google LLM技术实现AI代码生成。
这是一个包含多个开源AI项目的列表,涵盖了从自动化代理、大语言模型、图像生成到AI开发框架等多个领域。这些项目旨在帮助开发者利用AI技术赚钱,包括构建智能助手、自动化工作流、内容生成等应用。