无障碍技术研究助力视障人士创新工具开发

本文介绍了一位专注于无障碍技术研究的研究人员如何通过计算机视觉和机器学习技术改进智能设备功能,特别是为视障人士开发的物体识别系统。文章详细阐述了技术实现方案,包括交互模型设计和用户测试方法,展现了科技创新在社会包容性方面的重要价值。

约什·米勒:某中心的麦克阿瑟天才奖得主

米勒将毕生对科学的热爱与为残障人士创造更便利世界的使命相结合。

2021年9月,当某中心首席无障碍研究员约什·米勒收到麦克阿瑟基金会发来的电话邀约短信时,他的心跳加速。对于艺术和科学领域的工作者而言,被称为“天才奖”的麦克阿瑟奖学金堪比中彩票。这项62.5万美元的奖学金无法申请,只会通过基金会的电话神秘降临。

对于自幼失明、长期致力于为视障人士开发辅助工具的米勒来说,获得麦克阿瑟奖一直是个梦幻般的梦想。

“起初我以为只是咨询推荐人选,”米勒回忆道,“当得知自己入选2021年25位获奖者时,我欣喜若狂。”这笔为期五年的奖金可由获奖者自由支配。对于曾在非营利机构长期申请科研经费的米勒而言,这个消息让他手心冒汗、耳鸣不已,充满纯粹的喜悦。

专注无障碍技术

米勒于2003年获得加州大学伯克利分校心理声学博士学位后,在旧金山史密斯-凯特威尔眼科研究所工作了16年。2019年,他加入某中心设备研发部门,参与开发Echo智能音箱、Kindle电子书阅读器等产品线的无障碍功能团队。

他的核心工作是确保设计师和产品经理能够准确理解残障用户的实际需求。“我的职责是帮助设计团队理解他们服务的用户群体,”米勒解释道,“这对缺乏残障体验的设计人员尤为重要。”

改进“展示与讲述”功能

米勒加入团队时,正在开发面向Echo Show设备的“展示与讲述”功能。该功能利用摄像头和语音界面,通过计算机视觉和机器学习模型帮助视障用户识别物品。当用户手持物品询问“这是什么”时,系统能即时反馈。

项目初期,开发团队执着于实现100%精确匹配。米勒引导团队认识到,即使仅提供品牌标识等关键信息,也能有效帮助视障用户识别物品。团队最终建立了“渐进式反馈机制”:若无法精确识别,系统会尝试读取标签文字提供线索,并配合音频引导用户调整拍摄角度。

盲文技术支持

米勒还参与了盲文显示器和盲文屏幕输入技术的开发。“最关键的是邀请真实视障用户参与测试,”他强调,“针对特殊群体的可用性测试需要调整研究方案,包括确保知情同意书等材料本身具有可访问性。”

技术洞察与创新

米勒早期在伯克利系统公司参与开发了首批图形界面屏幕阅读器,这段经历让他意识到无障碍技术领域的独特价值。“我能为盲人设计实用工具的需求远超过成为行星科学家,”他表示,“这种社会正义感促使我持续创新。”

在某中心,他继续发挥自身视障经验的优势:“失明是我的超能力。我不仅了解多种残障需求,更懂得如何将这些群体的声音引入产品设计流程。”

通过结合计算机视觉、机器学习和人机交互技术,米勒团队成功打造了能有效提升视障人士生活品质的创新工具,展现了技术包容性设计的巨大潜力。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计