探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
热门AI大模型性能、热度、年/月/日排行
寻找优质模型提供商,获取可靠模型支持
提交模型信息和服务,精准推广和触达用户
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
分析并追踪人工智能模型如何引用您的品牌
通过AI搜索优化服务,让品牌在AI中实现霸屏
检测品牌在AI平台中的可见度
一键检测电脑配置,研判运行模型的兼容性
根据算力需求,推荐匹配的服务器配置
提供用于训练、评估和测试模型的数据集
提供各类文档文字提取,支持自定义场景
发现与 Mulit Modal 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
MiniCPM-V 4.5: A GPT-4o Level MLLM for Single Image, Multi Image and Video Understanding on Your Phone
MiniCPM-o 2.6:一款可在手机上运行的、达到GPT-4o水平的视觉、语音和多模态直播大型语言模型
CLIP 的开源实现
基于CLIP的图像和句子可扩展嵌入、推理和排序
CVPR 2024录用(口头报告)InternVL家族:GPT-4o的开创性开源替代方案,性能逼近GPT-4o的多模态对话模型
AI 数据库。存储向量、图像、文本、视频等。与大型语言模型 (LLM)/LangChain 配合使用。存储、查询、版本控制和可视化任何 AI 数据。实时将数据流传输到 PyTorch/TensorFlow。https://activeloop.ai
ModelScope:让模型即服务(Model-as-a-Service)成为现实。
一个最先进的开放式视觉语言模型
一个中文版本的CLIP模型,能够实现中文跨模态检索和表征生成。
使用Pytorch框架实现/复现OpenAI的文本转图像Transformer模型DALL-E
基于基础模型的数据处理!
企业级、生产就绪的多智能体编排框架。网站:https://swarms.ai
统一的嵌入式生成和搜索引擎,也提供云端服务 - cloud.marqo.ai
OmniGen:统一图像生成。 论文链接:[https://arxiv.org/pdf/2409.11340](https://arxiv.org/pdf/2409.11340)
【EMNLP 2022】知识图谱抽取与构建的开放工具包
能够进行中文和英文多模态对话的语言模型
一行命令生成Disco Diffusion艺术作品
NExT-GPT 的代码和模型:一种任意到任意多模态大型语言模型
一个高效运行本地LLM(例如LLaMA/LLaVA)的C#/.NET库。
【EMNLP 2024?】Video-LLaVA:基于投影前对齐学习统一视觉表示