不错过全球AI革新的每一个时刻
每天三分钟关注AI行业趋势
AI行业大事记
列出所有AI硬件产品。
AI变现案例分享
AI图片制作变现案例分享
AI视频制作变现案例分享
AI音频制作变现案例分享
AI内容写作变现案例分享
免费分享最新AI教程内容
展示AI网站的总访问量排名
追踪AI网站访问量增长最快产品
关注访问量下降明显的AI网站
展示AI网站的周访问量排名
美国用户最喜欢的AI网站
中国用户最喜欢的AI网站
印度用户最喜欢的AI网站
巴西用户最喜欢的AI网站
AI图片生成网站总访问量榜单
AI个人助理网站总访问量榜单
AI角色生成网站总访问量榜单
AI视频生成网站总访问量榜单
热门AI项目总Start榜单
热门AI项目增速榜
热门AI开发者排名
热门AI组织排名榜单
热门deepseek开源项目
热门TTS开源项目
热门LLM开源项目
热门ChatGPT开源项目
github热门AI开源项目总览
发现与 Image Captioning 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
InternGPT (iGPT) 是一个开源的演示平台,你可以轻松展示你的AI模型。目前支持DragGAN、ChatGPT、ImageBind、类似GPT-4的多模态聊天、SAM以及交互式图像编辑等功能。访问igpt.opengvlab.com体验吧!
图像字幕生成:PyTorch 教程 | 展示、关注和讲述
「Prismer:一种具有多任务专家的视觉语言模型」的实现
图像数据集的标签管理器和字幕生成器
“Show, Attend and Tell” 的 TensorFlow 实现
精选的顶级基础模型和多模态模型列表![论文 + 代码 + 示例 + 教程]
用于图像字幕生成的网状记忆Transformer。CVPR 2020
OmniNet 的官方 PyTorch 实现 | OmniNet 是一种用于多模态多任务学习的统一架构 | 作者:Subhojeet Pramanik,Priyanka Agrawal,Aman Hussain
为视觉语言模型、大型语言模型、图像转音乐、文本转音乐设计的自定义 ComfyUI 节点,以及一致性和随机创意提示生成功能。
一个基于 TensorFlow 的开源自然语言处理(NLP)序列学习工具。
完成CS231n:用于视觉识别的卷积神经网络课程作业
图像字幕生成的“知其所看:基于视觉哨兵的自适应注意力机制”的实现
ICCV 2019 论文“用于图像字幕生成的注意力机制的注意力机制”的代码
基于Transformer的pytorch/fairseq图像字幕扩展
让团队轻松完成机器学习数据标注。只需上传数据,添加您的团队,即可在数小时内构建训练/评估数据集。
一个基于 Keras 和 TensorFlow 构建的模块化库,用于为任意输入图像生成自然语言描述。
基于Transformer的图像字幕生成
用于“基于CLIP奖励的细粒度图像字幕生成”(NAACL 2022会议论文集)的PyTorch代码
基于空间和通道注意力机制的图像标题生成
GRIT:更快更好的图像字幕Transformer(ECCV 2022)