Black Forest Labs发布FLUX.2系列四款模型,开源32B参数版本。核心突破:支持10图参考生成一致性超95%的图像,可锁定姿势光影配色;4MP编辑功能实现局部重绘与背景替换,分辨率达400万像素并计划支持PSD分层导出。
谷歌AI笔记工具NotebookLM新增幻灯片生成器功能,可将笔记快速转换为演示幻灯片,帮助用户高效整理内容、生成草稿并优化视觉效果。该功能与信息图工具均基于Gemini3Pro图像生成模型运行,能处理详细提示信息。
谷歌推出Nano Banana Pro图像生成模型,基于Gemini3技术,支持4K分辨率、14对象融合和5人身份一致性,新增联网搜索与双重水印。价格大幅上调:1080p/2K每张0.139美元,4K每张0.24美元,较前代涨3-6倍。功能亮点包括专业控制选项(如机位、光效)和默认生成6张高保真图片供选择。
OpenAI推出ChatGPT群聊功能,支持最多20人同时在线,AI可参与讨论。该功能已向所有登录用户开放,覆盖免费版至Pro版。用户可通过对话界面右上角“人物”图标创建群聊,生成分享链接即可邀请他人加入。
PixPretty是一款AI图像编辑工具,免费去背景、批量处理,功能强大
DeepPDF是一个AI研究助手,用于深度学习PDF文档,提供聊天、摘要、翻译比较以及关键术语、图片和公式分析功能。
PixNova AI是一款强大的AI图片生成和设计工具,提供多种AI功能,包括人脸交换、图片编辑等。
提供文档解析功能,将图片或 PDF 文件转换成 Markdown 格式,实现智能转换
google
$9
Input tokens/M
$72
Output tokens/M
1M
Context Length
aws
$5.76
$23.04
300k
dataautogpt3
ProteusV0.2是基于OpenDalleV1.1的进阶版本,通过核心功能强化实现卓越的文生图效果,特别在提示词理解和风格表现上有显著提升。
AWS MCP Servers是一套基于Model Context Protocol的专用服务器,提供多种AWS相关功能,包括文档检索、知识库查询、CDK最佳实践、成本分析、图像生成等,旨在通过标准化协议增强AI应用与AWS服务的集成。
一个基于MCP服务器的PowerPoint演示文稿生成项目,支持创建、编辑和保存演示文稿,包含多种幻灯片类型和图表生成功能。
该项目是一个基于MCP协议和python-pptx库的PPT制作服务,支持通过聊天交互动态创建、编辑和保存PowerPoint演示文稿,提供添加幻灯片、图片、表格等多种功能,并能生成下载链接和导出为Base64格式。
一个基于MCP协议的Pandas数据处理服务器,提供CSV文件读取、Pandas代码执行和交互式图表生成功能。
一个基于TypeScript的MCP服务器,提供Pixabay图片搜索API访问功能
基于MCP协议的Pollinations.ai服务接口服务器,提供图像和文本生成功能
一个基于FastMCP的服务器,用于程序化创建、编辑和渲染PowerPoint演示文稿,支持幻灯片操作、内容添加和图像渲染功能。
Deep Research是一个基于代理的工具,提供网页搜索和高级研究功能,支持PDF分析、图像描述和YouTube转录提取,可作为MCP服务器运行。
Pixeltable的多模态模型上下文协议服务器集合,提供音频、视频、图像和文档的索引与查询功能
PuchAI Hackathon项目提供多种工具集,包括Reddit内容分析、数据可视化图表生成、药品信息查询、用户偏好管理及任务管理功能,支持开发者快速验证市场假设和分析用户需求。
一个基于MCP服务器的PowerPoint演示文稿生成项目,支持通过API调用Stable Diffusion生成图片,并提供多种幻灯片模板和编辑功能。
phospho的官方MCP服务器,实现模型上下文协议,支持通过自然语言控制物理机器人,提供执行动作和摄像头图像流功能。
一个实现Model Context Protocol(MCP)的内存服务器,为大型语言模型提供基于知识图谱的持久化记忆存储和检索功能。
Vidu MCP Server是一个基于Model Context Protocol的服务器,用于与Vidu视频生成API交互,提供图像转视频、生成状态检查和图像上传功能。
一个为Windsurf提供图像生成和网页抓取功能的MCP服务器,支持Flux Pro模型生成图像和ScrapeGraph API进行网页内容提取。
Ebook-MCP是一个基于模型上下文协议(MCP)的电子书处理服务器,支持EPUB和PDF格式,提供智能图书管理、交互式阅读体验和学习辅助功能,实现与电子书的自然语言交互。
该项目为MCP内存服务器添加了知识图谱管理功能,采用PouchDB数据库实现高效存储,支持自定义存储路径和时间戳记录。
Imagician是一个基于Model Context Protocol(MCP)的图像处理服务器,提供包括调整大小、格式转换、裁剪、压缩等多种图像编辑功能。
Modal MCP工具箱是一个运行在Modal平台上的工具集合,基于模型上下文协议(MCP),可为LLM提供扩展功能,如Python沙箱代码执行和FLUX模型图像生成。
一个基于Python的LINE MCP服务器,通过标准化接口让语言模型能够读取和分析LINE对话消息。项目使用FastAPI框架,支持文本、贴图和图片消息处理,并提供了消息存储、API端点等核心功能。