瞳行科技推出国内首款AI助盲眼镜,集成阿里通义千问大模型,为视障人士提供实时出行辅助。产品由眼镜、手机、遥控指环和盲杖协同工作,通过双摄像头实现300毫秒低延迟路况播报,支持识别公交牌、路标及环境概述。技术总监陈刚表示,大模型压缩70%研发成本,加速算法落地。眼镜还具备本地文本识别功能。
在刚刚结束的中国国际福祉博览会暨中国国际康复博览会上,中国移动的具身智能产业创新中心正式发布了一款名为 “灵犀” 的电子导盲犬。这款高科技产品的面世,标志着智能辅助工具又向前迈出了重要一步,为视障人士的出行提供了全新的解决方案。“灵犀” 电子导盲犬采用了先进的激光雷达和视觉单目三维重建技术,能够实时获取位置信息并构建高精度地图。这种地图不仅可以拼接,还能支持复杂的室内外环境,精度达到厘米级,确保视障人士在行走时的安全和精准导航。最令人
苹果与哥伦比亚大学合作开发SceneScout AI导航系统,专为视障人士设计。该系统整合Apple Maps API和GPT-4o多模态模型,提供个性化环境描述。核心功能包括路线预览(评估人行道质量等)和虚拟探索(支持场景查询)。测试显示72%的AI描述准确,虚拟探索功能尤其受10位视障测试者好评。研究论文已发布在arXiv平台。
苹果发布SceneScout AI代理,通过分析街景图像为视障人士提供环境描述。该技术包含"路线预览"和"虚拟探索"两种模式,准确率达72%-95%。用户研究显示其能有效提升环境认知,同时建议增加个性化描述和实时反馈功能。虽然尚处研究阶段,但展现了AI在辅助视障人士出行方面的潜力。
vidi-deshp
这是一个针对实时图像描述生成任务微调的CLIP-GPT2版本,旨在辅助视障人士理解图像内容。
LearnItAnyway
本项目整合了YOLO目标检测模型与LLaMa 2 7b大语言模型,旨在为视障人士的日常出行提供辅助导航支持。