OpenAI计划在2027年推出首款带摄像头的AI智能音箱,售价预计200美元左右。该产品是公司进军硬件市场的关键一步,将与智能眼镜、台灯等设备一同发布。目前已有超200名员工投入研发,显示其在硬件领域的雄心。
苹果公司正全力推进三款AI可穿戴设备的研发进程,涵盖AI智能眼镜、AI别针/吊坠(AI pin or pendant)以及带摄像头的AI AirPods。这些设备均设计为与iPhone无缝连接,并能够与正在开发中的更智能版Siri进行深度交互。 据悉,这三款新品均将集成摄像头功能,使AI能够“洞察”佩戴者周围环境,并就相关问题提供即时解答。
AI视频领域迎来质变,Xmax AI发布全球首个虚实融合实时交互视频生成模型X1,实现毫秒级实时交互。用户可通过手机摄像头与图片角色深度互动,打破传统被动生成模式,让虚拟角色在现实中“活”起来。
前美团高管创立的AI公司liko.ai获商汤、科大讯飞等投资,将聚焦端侧视觉大模型研发,以AI技术重塑家庭视觉产品市场。
快速分享屏幕和摄像头,创建专业视频,适用于内外部沟通。
通过网络摄像头将VTuber虚拟形象变为现实,提升直播体验。
TrackHands通过摄像头提醒你不要把手靠近嘴巴,帮助养成良好习惯。
视频眼神校正API,让视频中的眼神看起来始终注视着摄像头。
declare-lab
基于开放X具身数据集训练的视觉-语言-动作模型,以语言指令和摄像头图像为输入生成机器人动作
dima806
基于Google Vision Transformer (ViT)架构的图像分类模型,用于检测监控摄像头图像中的犯罪行为,准确率约83%。
openvla
OpenVLA 7B是一个基于Open X-Embodiment数据集训练的开源视觉-语言-动作模型,能够根据语言指令和摄像头图像生成机器人动作。
一个用于与计算机外设无缝集成的MCP服务器,提供统一的API来控制、监控和管理硬件设备,包括摄像头、打印机、音频设备和屏幕。
YOLO MCP服务是一个强大的计算机视觉服务,通过模型上下文协议(MCP)与Claude AI集成,提供物体检测、分割、分类和实时摄像头分析功能。
phospho的官方MCP服务器,实现模型上下文协议,支持通过自然语言控制物理机器人,提供执行动作和摄像头图像流功能。
一个基于MCP平台的本地代理服务器和客户端实现,集成天气查询、谷歌搜索、摄像头控制、图片生成和智能对话等多种AI工具功能,支持模块化扩展和高性能并发处理。
一个基于OpenCV的MCP服务器,提供网络摄像头控制和图像捕捉功能
OpticMCP是一个为AI助手提供摄像头和视觉工具的MCP服务器,支持USB摄像头、IP网络摄像头、屏幕捕捉、图像分析、二维码解码等多种功能,实现通用摄像头接口。
一个基于MCP平台的本地代理服务器和客户端实现,集成天气查询、谷歌搜索、摄像头控制、AI图片生成和智能对话等多种AI工具调用能力,支持跨平台运行和模块化扩展。
MCP是一个由Anthropic开发的开源协议,旨在为AI模型提供与外部数据源和工具交互的标准化方式。项目实现了天气查询、谷歌自动检索和摄像头控制等功能,具有高度可配置性,适用于智能助手、自动化工作流等场景。
一个MCP服务器项目,用于连接CCTV录像系统(VMS),实现视频流检索、播放控制及PTZ摄像头操作。