苹果公司此前高调推出的Apple Intelligence功能,特别是图像生成工具Image Playground,因输出质量不佳被用户戏称为“最糟糕的AI功能”。然而,即将发布的OS27系统将带来转机,核心升级包括采用全新基础模型和引入Gemini算力支持,有望显著改善生成式AI的表现。
苹果在第15个全球无障碍意识日发布了全新辅助功能,融合Apple Intelligence技术,提升残障人士在iPhone、Mac和Vision Pro上的体验。VoiceOver功能升级,新增图像资源管理器,视障用户可通过AI识别图像内容,实现更便捷的视觉辅助。
苹果公司于5月19日发布一系列由Apple Intelligence驱动的新AI辅助功能,并借助Apple Vision Pro推出革命性眼控轮椅技术,标志着无障碍领域的重大突破。此次更新深度融合端侧AI,在保障隐私的前提下升级核心辅助功能,如“旁白”图像浏览器通过AI实现更精细的账单、照片等视觉内容描述。
谷歌在2026年I/O大会上推出AI图像工具Google Pics,面向Workspace用户,用于制作邀请函、海报等视觉内容。该网页应用融合生成图片与编辑设计功能,用户输入文字即可创作,设计类似Canva,标志着谷歌图像处理领域的创新。
Wan 2.7 AI视频生成器可秒将图片转为1080P视频,有动态等功能
PixPretty是一款AI图像编辑工具,免费去背景、批量处理,功能强大
DeepPDF是一个AI研究助手,用于深度学习PDF文档,提供聊天、摘要、翻译比较以及关键术语、图片和公式分析功能。
PixNova AI是一款强大的AI图片生成和设计工具,提供多种AI功能,包括人脸交换、图片编辑等。
Anthropic
$21
Input tokens/M
$105
Output tokens/M
200
Context Length
Alibaba
-
$4
$16
1k
$1
$10
256
$2
$20
$3.9
$15.2
64
Bytedance
$0.8
128
$0.15
$1.5
Baidu
32
dataautogpt3
ProteusV0.2是基于OpenDalleV1.1的进阶版本,通过核心功能强化实现卓越的文生图效果,特别在提示词理解和风格表现上有显著提升。
AWS MCP Servers是一套基于Model Context Protocol的专用服务器,提供多种AWS相关功能,包括文档检索、知识库查询、CDK最佳实践、成本分析、图像生成等,旨在通过标准化协议增强AI应用与AWS服务的集成。
一个基于MCP服务器的PowerPoint演示文稿生成项目,支持创建、编辑和保存演示文稿,包含多种幻灯片类型和图表生成功能。
该项目是一个基于MCP协议和python-pptx库的PPT制作服务,支持通过聊天交互动态创建、编辑和保存PowerPoint演示文稿,提供添加幻灯片、图片、表格等多种功能,并能生成下载链接和导出为Base64格式。
Vulcan File Ops是一个基于Model Context Protocol(MCP)的高性能文件操作服务器,可将桌面AI助手(如Claude Desktop、ChatGPT Desktop等)转变为强大的开发伙伴。它提供安全的文件读写、批量操作、文档处理、图像分析和Shell命令执行功能,具有企业级安全控制、动态目录注册和智能工具过滤特性,让用户完全控制本地文件系统访问。
一个基于TypeScript的MCP服务器,提供Pixabay图片搜索API访问功能
一个基于MCP协议的Pandas数据处理服务器,提供CSV文件读取、Pandas代码执行和交互式图表生成功能。
OneTool是一个统一的MCP服务器,通过Python API暴露100多种工具,大幅减少AI调用工具时的token消耗和成本,避免上下文污染,支持Web搜索、数据库、文件操作、图表绘制等多种功能。
基于MCP协议的Pollinations.ai服务接口服务器,提供图像和文本生成功能
一个基于FastMCP的服务器,用于程序化创建、编辑和渲染PowerPoint演示文稿,支持幻灯片操作、内容添加和图像渲染功能。
PuchAI Hackathon项目提供多种工具集,包括Reddit内容分析、数据可视化图表生成、药品信息查询、用户偏好管理及任务管理功能,支持开发者快速验证市场假设和分析用户需求。
Deep Research是一个基于代理的工具,提供网页搜索和高级研究功能,支持PDF分析、图像描述和YouTube转录提取,可作为MCP服务器运行。
Pixeltable的多模态模型上下文协议服务器集合,提供音频、视频、图像和文档的索引与查询功能
ParseFlow是一个AI驱动的全能文档解析库,支持PDF、Word、Excel、PPT和图片OCR,提供语义搜索和批量处理功能,并包含MCP服务器供AI助手使用。
phospho的官方MCP服务器,实现模型上下文协议,支持通过自然语言控制物理机器人,提供执行动作和摄像头图像流功能。
一个为Windsurf提供图像生成和网页抓取功能的MCP服务器,支持Flux Pro模型生成图像和ScrapeGraph API进行网页内容提取。
一个生产就绪的Model Context Protocol服务器,提供异步优先的Python架构,将高级ArangoDB操作(包括图数据库管理、内容转换、备份恢复和分析功能)暴露给AI助手。
一个实现Model Context Protocol(MCP)的内存服务器,为大型语言模型提供基于知识图谱的持久化记忆存储和检索功能。
一个基于MCP服务器的PowerPoint演示文稿生成项目,支持通过API调用Stable Diffusion生成图片,并提供多种幻灯片模板和编辑功能。
Vidu MCP Server是一个基于Model Context Protocol的服务器,用于与Vidu视频生成API交互,提供图像转视频、生成状态检查和图像上传功能。
Modal MCP工具箱是一个运行在Modal平台上的工具集合,基于模型上下文协议(MCP),可为LLM提供扩展功能,如Python沙箱代码执行和FLUX模型图像生成。