谷歌CEO确认Gemini3.0大模型将于2025年底前发布,将在代码生成、多模态创作与推理能力上实现重大突破,引发全球AI社区热议。该模型据称已小范围测试,技术亮点聚焦代码与图像双突破,集成升级版图像生成引擎Nano。
李飞飞World Labs推出Marble 3D世界模型公测版,支持文本、图像、视频等多模态输入,快速生成可交互虚拟宇宙,助力开发者探索AI技术应用。
LinkedIn推出AI驱动的人脉搜索功能,用户可通过自然语言查询(如“谁对治疗癌症有了解?”)精准寻找专业人士,突破传统关键字搜索限制。这标志着公司在生成式AI领域的重要进展,背后是工程团队在技术优化上的持续努力。
国家网信部门将从严整治AI仿冒公众人物直播营销乱象。生成式AI技术被滥用于捏脸、换声、伪造形象,误导网民,涉嫌虚假宣传和侵权,破坏网络生态。近期已查处一批违规账号,如“百货超市小店”、“娜”等。
Gempix 2利用Nano Banana 2技术实现专业文本到图像生成与智能图像编辑
独立社区工具,用Nano Banana 2技术生成惊艳AI图像,免费使用。
免费AI图像生成器,基于Nano banana技术,可瞬间生成高质量纳米香蕉图像。
利用 AI 技术生成时尚产品图片和视频,提升电商销售。
openai
-
Input tokens/M
Output tokens/M
128k
Context Length
reka-ai
google
8k
DevQuasar
这是一个基于Moonshot AI技术的量化版本模型,专注于视觉语言理解与生成任务,致力于降低知识获取门槛,让知识为每个人所用。
mrgant
lans_v1 - lora是基于Qwen/Qwen-Image模型使用AI Toolkit by Ostris训练的文本到图像转换模型,采用LoRA技术进行优化,具备良好的图像生成能力。
BarleyFarmer
pejawan22-lora是一个基于AI技术训练的LoRA模型,专门用于特定图像的生成,可与多种AI工具集成使用,通过触发词'peja'来生成图像。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
lichorosario
piccoli_no_style-lora是一个基于图像到视频、LoRA技术的生成模型,使用AI Toolkit训练,以Qwen/Qwen-Image为基础模型,支持多种图像生成场景。
piccoli_no_style-lora 是一个基于图像到视频技术的LoRA模型,使用AI Toolkit进行训练,主要用于图像生成任务,可与多种主流AI工具配合使用。
trinty2535425
这是一个基于Qwen/Qwen-Image基础模型训练的图像到视频LoRA模型,采用LoRA(Low-Rank Adaptation)技术实现高效微调,可用于AI图像生成等相关任务
John6666
Noobai-XL-1.0是基于Stable Diffusion XL技术的文本到图像生成模型,专注于生成逼真、写实风格的图像,为图像创作领域提供高质量的AI生成解决方案。
Keltezaa
AiGirl_II 是一个基于 black-forest-labs/FLUX.1-dev 构建的文本到图像生成模型,结合了 LoRA 技术和 Diffusers 库,专门用于生成特定风格的图像。该模型采用 CC BY-NC-ND 4.0 许可证,适合非商业用途。
nvidia
Cosmos-Predict2.5是NVIDIA开发的专为物理AI设计的高性能预训练世界基础模型套件,基于扩散模型技术,能够根据文本、图像或视频输入生成具有物理感知的高质量图像和视频,为自动驾驶、机器人等应用提供世界模拟能力。
mykor
Mi:dm 2.0 是一款以韩国为中心的 AI 模型,由 KT 运用其专有技术开发。该模型深入内化了韩国社会独特的价值观、认知框架和常识推理,不仅能处理和生成韩语内容,还能体现对韩国社会文化规范和价值观的深刻理解。
Zedge
Stability AI开发的文本生成图像扩散模型,采用双文本编码器和潜在扩散技术,支持独立使用或配合优化模块提升效果
Yntec
一个融合了达芬奇艺术风格的文本生成图像模型,通过LoRA技术将文艺复兴风格融入现代AI绘画。
MayZhou
基于e5-small模型通过LoRA技术微调的文本分类模型,专用于高精度区分AI生成与人工撰写文本
dataautogpt3
Proteus v0.6是基于SDXL架构的AI图像生成模型,经过全面重构后专注于提升图像的真实感。这是重构后的首个版本,采用多视角融合技术训练,能够生成高质量的逼真图像。
renderartist
基于AI生成图像训练的3D玩具设计模型,融合了SECourses的3D LoRA与填色书Flux LoRA技术
life
这是一个基于AI技术的文本到图像生成模型,专门用于生成具有巴什基尔女性特色的图像。该模型通过特定的提示词触发,能够生成各种场景和风格的巴什基尔女性图像,为艺术创作和设计提供灵感来源。
GraySwanAI
Mistral-7B-Instruct-RR是基于Mistral-7B的改进模型,通过表征重路由(RR)技术插入了断路器机制。该技术通过直接干预有害内容生成时的模型表征,以最小化能力损失的方式防止AI系统产生有害内容。
briaai
BRIA 2.3是基于合法数据专项训练的文本生成图像模型,融合技术创新与伦理责任及法律保障,为AI行业树立新标杆。
EarthnDusk
这是一个基于Stable Diffusion技术构建的文本到图像AI模型,专门用于生成动漫、漫画和插画风格的图像。该模型结合了SDXL和SD 1.5的基础模型,并在多个数据集上进行了训练。
一个基于MongoDB Atlas向量搜索和Voyage AI嵌入技术的文档检索系统,支持语义搜索和文本匹配,包含文档分块、嵌入生成和存储功能。
Apple RAG MCP是一个为AI代理提供苹果开发专业知识的检索增强生成系统,集成了官方Swift文档、设计指南和Apple Developer YouTube内容,通过AI驱动的混合搜索技术提供准确的技术答案。
AI专家工作流MCP是一个基于OpenRouter API的模型上下文协议服务器,通过产品经理、UX设计师和软件架构师三个AI专家角色,提供从产品规划到技术实现的完整工作流解决方案。项目支持独立生成PRD文档,也可与Task Master集成进行任务管理。
这是一个包含大量开源AI项目的列表,涵盖了从自然语言处理、图像生成到自动化工作流等多个领域。这些项目旨在帮助开发者利用AI技术构建各种应用,包括聊天机器人、代码生成工具、数据处理系统等。
Project Synapse是一个革命性的MCP服务器,通过语义分析和知识图谱技术将文本转化为互联知识网络,并自主生成洞察。它结合Montague语义学和Zettelkasten方法,实现AI的认知协作能力。
Open Deep Research MCP Server是一个AI驱动的深度研究助手,通过结合搜索引擎、网页抓取和AI技术进行迭代式深度研究,生成全面报告。支持MCP协议和CLI两种使用方式,具备可靠性评估、范围控制、自动生成后续问题等功能。
Memory Bank MCP是一个基于Model Context Protocol(MCP)的项目知识管理系统,通过AI生成和结构化文档帮助团队管理项目知识,包括项目目标、产品上下文、系统架构、技术细节、当前任务和进展等六个核心文档类型。
DBChat是一个通过AI技术让用户能用自然语言与数据库对话的工具,无需编写SQL即可查询数据并生成可视化图表,支持多种数据库类型。
一个基于Cloudflare Worker的极简图像生成模板,使用workers-mcp包和Workers AI技术,支持本地开发和快速部署。
该项目通过ChatGPT测试LLM在信息检索、API集成(如IGN的APICARTO和GéoPlateforme服务)以及代码生成方面的能力,包括地理编码、邮政编码查询等功能,并探索AI在技术评估和开发辅助中的应用。
该项目包含MCP服务器和VSCode扩展,通过自然语言提示生成HTML、CSS和JavaScript应用,利用Google LLM技术实现AI代码生成。
这是一个包含多个开源AI项目的列表,涵盖了从自动化代理、大语言模型、图像生成到AI开发框架等多个领域。这些项目旨在帮助开发者利用AI技术赚钱,包括构建智能助手、自动化工作流、内容生成等应用。