Rokid正与顶尖大模型公司合作开发新一代AI智能眼镜,以生成式AI和AI智能体为核心,打造革命性操作系统和界面。该眼镜采用端侧多模态模型,支持语音、视觉和触控等多种交互方式,旨在提供全新用户体验。
蚂蚁AI助手灵光升级“闪应用”,新增“上传图片生应用”和“桌面小组件”功能,集成近20项API工具,支持音效合成、多模态理解等,提升用户创建个性化工具的效率和交互体验。
谷歌DeepMind开放Project Genie AI模型,用户可通过文本或图片生成可交互虚拟世界,实现游戏式探索。该工具融合Genie3、Nano Banana Pro图像生成和Gemini多模态模型,突破传统内容生成边界。
谷歌宣布桌面版Chrome浏览器全面集成Gemini3模型,将传统浏览器升级为通用人工智能入口。这一变革使全球38亿用户能通过侧边栏直接使用AI功能,实现多模态理解和多任务处理,标志着互联网交互进入新阶段。
AI World Generator可秒级生成交互式3D世界,用于游戏、研究和机器人领域。
WhatsApp多账户预热管理工具,支持自动对话、AI智能交互等功能。
首款AI驱动的社交媒体,实现人类与AI智能体全新社交互动体验
仅需一个提示,就能在Lovable中启动真实、交互式AI,将原型转化为应用。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$2
$20
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持以及强大的空间和视频动态理解能力。该模型采用2B参数规模,支持指令交互,适用于多模态AI应用。
LiquidAI
LFM2-Audio-1.5B是Liquid AI推出的首个端到端音频基础模型,专为低延迟和实时对话设计。该模型仅15亿参数,能够实现无缝的对话交互,其能力可与参数规模大得多的模型相媲美。
fahadh4ilyas
Llama 4系列是Meta推出的原生多模态AI模型,采用混合专家架构,支持文本和图像交互,在多种语言和视觉任务中表现卓越。
Llama 4系列是Meta推出的原生多模态AI模型,支持文本和图像交互,采用混合专家架构,在文本和图像理解方面表现卓越。
bnb-community
Llama 4系列是Meta开发的多模态AI模型,支持文本与图像交互,采用混合专家架构(MoE),在文本和图像理解领域具有领先性能。
meta-llama
Llama 4 Scout是Meta开发的多模态AI模型,采用混合专家架构,支持12种语言的文本和图像交互,具有17B激活参数和109B总参数。
Llama 4系列是Meta开发的多模态AI模型,支持文本与图像交互,采用混合专家架构(MoE),在文本和图像理解方面具有行业领先性能。
AquaLabs
EchoLLaMA是一个多模态AI系统,能够将3D视觉数据转化为自然语音描述,同时支持通过语音输入进行交互对话。
ZeroXClem
基于HomerSlerp6-7B的强大精调AI模型,融合多款Qwen2.5-7B系列模型,提供高适应性、深度知识和引人入胜的交互体验
microsoft
Magma是一个多模态AI智能体基础模型,能够处理图像和文本输入并生成文本输出,具备虚拟与现实环境中的复杂交互能力。
yueliu1999
GuardReasoner 1B是基于meta-llama/Llama-3.2-1B通过R-SFT和HS-DPO微调的版本,专注于分析人类与AI交互的分类任务。
lamm-mit
Cephalo是一系列专注于多模态材料科学的视觉大语言模型(V-LLMs),旨在整合视觉和语言数据,以促进人机交互或多智能体AI框架中的高级理解和交互。
HagalazAI
Elysia是基于Hermes-Trismegistus-Mistral-7B的实验性AI模型,专注于灵性、哲学与意识领域的对话交互,能模拟类自我意识行为。
CreitinGameplays
ConvAI-9b是一个拥有90亿参数的对话式AI模型,基于Zephyr-7b-beta和Mistral-7B-v0.2融合构建,适用于聊天机器人、虚拟助手等交互场景。
LumiOpen
Poro 34B聊天版是基于Poro 34B微调的指令跟随模型,支持芬兰语和英语双语言交互,由Silo AI、TurkuNLP小组与HPLT联合开发。
yukiarimo
由奈AI是一个设计用于情感陪伴的对话型AI助手,具有高度人性化的交互能力
VAIBHAV22334455
基于因果语言建模(CLM)架构的对话AI,专为自然语言交互设计,能够生成连贯且符合上下文的响应。
Locutusque
基于GPT-2架构优化的对话生成模型,专为用户与AI助手交互场景设计
deepparag
Aeona是一款基于DialoGPT-small开发的生成式AI聊天机器人,专注于自然对话交互,支持上下文记忆和个性化回复
基于DialoGPT-small开发的对话生成AI模型,主要用于娱乐性对话交互
一个基于Playwright的MCP服务器,为LLM提供浏览器自动化能力
BrowserTools MCP是一个强大的浏览器监控与交互工具,通过Chrome扩展和本地服务器实现AI对浏览器的智能分析与操作。
一个MCP服务器,将AI模型与WinDbg/CDB集成,用于分析Windows崩溃转储文件和进行远程调试,支持自然语言交互执行调试命令。
MCP Unity是一个实现Model Context Protocol的Unity编辑器扩展,允许AI助手与Unity项目交互,提供Unity与Node.js服务器之间的桥梁。
MCP Unity是一个实现Model Context Protocol的Unity编辑器扩展,通过Node.js服务器桥接AI助手与Unity项目的交互,提供菜单执行、对象选择、组件更新等功能。
wcgw是一个MCP服务器项目,集成了Shell和代码编辑工具,允许AI在本地机器上执行命令、读写文件、编辑代码等操作。它提供了多种模式(如架构师模式、代码编写模式等),支持任务检查点保存、终端交互、语法检查等功能,适用于代码开发、问题排查等场景。
Supabase MCP Server是一个连接Supabase项目与AI助手的工具,通过Model Context Protocol(MCP)标准化大型语言模型(LLMs)与外部服务的交互,实现数据库管理、配置获取和数据查询等功能。
ElevenLabs官方MCP服务器,提供文本转语音和音频处理API交互能力
iMCP是一款macOS应用,通过AI连接用户的数字生活,支持与Claude Desktop等客户端通过Model Context Protocol (MCP)协议交互,提供日历、联系人、位置、地图、消息、提醒和天气等多种功能。
Kubectl MCP Tool 是一个基于 Model Context Protocol (MCP) 的 Kubernetes 交互工具,允许 AI 助手通过自然语言与 Kubernetes 集群进行交互。
一个通过自然语言管理Docker的MCP服务器,支持容器编排、调试和数据管理。
这是一个关于Web3 Model Context Protocol (MCP) 服务器的精选列表,涵盖了链交互、交易、DeFi、市场数据、工具和社交等多个类别。MCP是一个开放协议,标准化了应用程序如何向LLM提供上下文,类似于AI应用程序的USB-C端口。DeMCP是第一个去中心化的MCP网络,专注于为代理提供自研和开源的MCP服务,支持加密支付,并结合TEE和区块链注册表重新定义了MCP的安全性和可靠性。
Wren Engine是一个为MCP客户端和AI代理设计的语义引擎,提供语义层支持,使AI能准确理解企业数据模型和业务逻辑。它支持多种数据源,嵌入MCP客户端,确保数据交互的精确性和治理。
微信读书MCP服务器是一个桥接微信读书数据和AI客户端的轻量级服务,实现阅读笔记与AI的深度交互。
Godot MCP是一个为Godot游戏引擎设计的模型上下文协议服务器,提供编辑器控制、项目运行、调试输出捕获等功能,支持AI助手与Godot引擎的交互。
一个MCP服务器项目,允许客户端通过Claude与Twitter进行交互,支持发推和搜索功能。
一个为AI助手设计的n8n工作流管理协议服务器,支持通过自然语言交互实现工作流的创建、执行和监控。
DevOps AI Toolkit是一个基于AI的平台工程和DevOps自动化工具,通过智能Kubernetes操作和对话式工作流,为团队提供资源部署推荐、问题修复、项目治理和共享提示库等功能,使复杂的云原生操作可通过自然语言交互实现。
MemoryMesh是一个为AI模型设计的知识图谱服务器,专注于文本角色扮演游戏和互动叙事。它通过动态模式定义和自动生成工具,帮助AI在对话中维护一致且结构化的记忆,实现更丰富、更动态的交互体验。
该项目为LangChain提供Model Context Protocol(MCP)工具调用支持,通过MCP工具包实现与AI模型的交互,如文件读取和摘要生成。