近日,苹果公司与哥伦比亚大学的研究团队共同开发了一款名为 SceneScout 的人工智能原型系统。这一系统旨在为盲人及低视力群体(BLV)提供街景导航的辅助功能,帮助他们更好地进行日常出行。
SceneScout 系统通过结合苹果地图(Apple Maps)API 与多模态大语言模型(基于 GPT-4o 内核),生成个性化的环境描述。这一创新的技术使得用户能够获得更加直观和具体的导航信息,从而提升他们的出行体验。相关的研究论文已经在预印平台 arXiv 上发表,尽管尚未经过同行评审。
该系统的核心功能包括两大部分:首先是路线预览(Route Preview)。通过这一功能,用户能够预判行程中的道路状况,例如人行道的质量、交叉口的特征以及附近公交站的情况等。这些信息对于盲人用户而言,尤其重要,可以帮助他们在出行时提前了解周围环境。
其次是虚拟探索(Virtual Exploration)功能。该功能允许用户根据自己的需求进行开放场景的探索。例如,用户可以询问系统 “临近公园的安静居住区”,系统则会根据用户的需求提供相应的方向指引。SceneScout 通过模拟行人的视角解读可见内容,并生成结构化的文本信息,支持短、中、长不同格式的输出,能够适配多种读屏软件,方便盲人用户阅读。
在测试阶段,SceneScout 招募了10名视障用户进行使用,这些用户大多具有科技行业的背景。测试结果显示,72% 的 AI 生成描述被认为是准确的。而在虚拟探索模式中,用户反馈非常积极,称这一功能可以有效替代传统的信息获取方式,为他们的日常出行带来了极大的便利。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
海报生成中...
海艺AI的模型系统在国际市场上广受好评,目前站内累计模型数超过80万个,涵盖写实、二次元、插画、设计、摄影、风格化图像等多类型应用场景,基本覆盖所有主流创作风格。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。