三星推出全球首款集成谷歌Gemini大模型的智能冰箱,具备AI视觉识别功能,可自动识别食材、推荐食谱、生成购物清单和管理红酒收藏,重新定义厨房智能体验。
微信元宝AI助手推出新功能,用户只需发送一句话即可设置提醒。元宝能自动识别任务内容和时间,并在指定时间通过微信服务通知提醒用户,让设置提醒变得简单便捷。
微信输入法iOS新版内测,核心升级语音输入。底层大模型优化,识别更快更准。最大亮点是原生支持多语言与多方言,用户说中文、英文或多种方言时,系统可自动识别,无需手动切换。
OpenAI计划于2026年第一季度推出ChatGPT的“成人模式”,旨在提供更开放的内容体验。公司正重点解决安全与年龄识别问题,目前正测试自动识别18岁以下用户的系统,以确保内容合规。
AI自动识别并移除图片中路人,自然填充背景,免费在线一键操作。
CapMonster云服务是一种自动识别和绕过验证码的解决方案,可绕过reCAPTCHA v2和v3等验证码,比手动识别服务至少便宜2倍,速度最多快30倍!
智能发票读取应用,支持多语种发票自动识别
智能语音识别为照片添加标题
pyannote
Community-1 是一个先进的说话人分割模型,能够自动识别和分割音频中的不同说话人。该模型支持16kHz单声道音频处理,可自动处理立体声或多声道音频的降混和不同采样率的重采样。
yifeihu
TF-ID是一系列经过微调的目标检测模型,用于提取学术论文中的表格和图片,解决学术论文中表格和图片自动识别的问题。
p1atdev
基于SwinV2架构的图像标签分类模型,用于自动识别图像中的内容和特征
ragavsachdeva
漫画解读者是一个自动转录生成系统,能够自动识别漫画中的文本和图像元素,并生成相应的转录文本。
davanstrien
基于BERTopic的聊天话题分类模型,能够从海量文本数据中自动识别和分类话题
ml6team
基于DistilBERT架构的英文关键词提取模型,在OpenKP数据集上微调,用于自动识别文本中的关键短语。
KoichiYasuoka
这是一个基于文言文预训练的RoBERTa模型,专门用于句子分割任务,能够自动识别文言文中的句子边界。
一个智能高效的Grafana Tempo MCP服务器,具备查询格式自动识别、正确URL编码和人性化响应等功能,解决了官方版本的多个问题。
一个基于MCP协议的对话异常检测与日志系统,能够自动识别并记录对话中的异常事件到SQLite数据库。
一个基于计算机视觉的MCP服务器,通过分析网页截图自动识别图像资产位置并提取布局结构,支持径向、网格等多种布局模式检测,帮助AI助手精确重建网页布局。
一个基于LLM的键值对提取MCP服务器,能从任意非结构化文本中自动识别并提取键值对,支持多语言预处理和多种输出格式,确保类型安全。
一个基于17track.net API的包裹追踪MCP服务器,支持自动识别快递公司和手动指定,提供包裹物流信息查询功能。