字幕眼镜 助听障人士「看到」别人说话(图)

发布 : 2024-1-22  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈



【明报专讯】商界常说本地劳工不足,必须输入外劳,但本地数十万残疾人士就业率长期偏低。其中听障人士的工作能力其实接近普通人,但碍于很多雇主和消费者未必愿意以纸笔等方式与他们沟通,他们仍然被投闲置散。有初创公司正研发一种「字幕眼镜」,透过将语音辨识成文字投射到镜片上,让听障人士「看到」别人的说话,协助他们工作和上学。

明报记者 薛伟杰

摄影 黄志东

创启社会科技有限公司共同创办人萧启颖表示,公司去年中开始研发「听障人士字幕眼镜」(以下简称字幕眼镜),设计概念是将语音即时辨识成文字,投射在镜片上,让佩戴该眼镜的听障人士能够「看到」别人说话,从而解决他们和其他人沟通的障碍。

以往曾经有公司提出另一种方案,让普通人在智能手机上安装一套视像辨识软件,来辨识听障人士的手语,以解决双方沟通问题。但萧启颖觉得,要即时视像辨识手语,难度比即时语音辨识大。所以,该公司选择了技术相对成熟的语音辨识方案。经过大约半年研发,该公司去年底已经造出字幕眼镜第一代原型,重约100克,配备一枚800mAh锂电池,充满电约需1小时,之后可连续用3小时。镜片方面,有透明镜片和太阳眼镜镜片两种选择。第一代原型暂时必须透过Wi-Fi,连线到智能手机或路由器上网才可运作,它使用微软云端服务将语音即时辨识成文字。

暂可辨识广东话普通话英语

语言方面,暂时支援广东话、普通话、英语的辨识;字几x??繁体中文、简体中文、英文等。考虑到广东话的独特性及听障人士的习惯问题,该公司将繁体中文字幕再细分成口语和书面语两个选择,即一共支援4种字幕。萧启颖解释,有些听障人士反映,他们大多比较习惯使用书面语文字,而不是口语文字,即使看字幕亦一样。

暂时有5名听障人士试用过第一代原型,包括社企「黑暗中对话」和「活发社」的听障员工。评语方面,主要是希望能够再提高语音辨识的准确率和速度,其中以黑暗中对话听障员工的评语较佳,活发社方面提供了较多改进意见。

支援4种字幕 包括口语

本身也是弱听人士的活发社创办人郑毅敏认为,以服务业的听障员工使用字幕眼镜来说,一定是选择透明镜片较佳,因为用太阳镜片会让顾客感觉不亲切。此外,现时第一代原型的眼镜臂太粗,外观较奇怪。应该要造得幼一点和轻巧一点,看来尽量与普通眼镜无分别。字几x??射方面,她认为只需显示别人的说话便足够,毋须显示听障使用者自己的说话。现时字幕眼镜同时显示别人和使用者的说话,看起来较混乱,画面也较多字和拥挤。

至于语音辨识速度,她认为还需再提高,尤其是字幕眼镜有时反应好像慢了一拍,若在服务业使用可能会引致尴尬。整体来说,她认为字幕眼镜适合弱听人士多过完全失聪人士。

该公司的弱听员工亦建议,增加一个遥控器,比起在眼镜臂上按按铀x??便。此外,现时原型不能将使用者背后的语音收集和辨识成字幕,若有人在背后呼叫,使用者无法知悉。所以,建议增加在眼镜后方收音功能。

萧启颖同意,第一代原型的设计未算很理想,还有很多地方可以优化。他接受关于字几x??射方面的建议,相信有关修改可以很快完成。至于语音辨识速度问题,他解释,因为字幕眼镜原型现时必须以连线模式(云端模式)运作,有时可能会因为网络不畅顺显得慢了。他计划将来增加离线运作模式,让语音辨识在字幕眼镜内处理,以缩短反应时间。不过,离线运作模式的缺点是,语音辨识资料库容量会比连线模式小得多,而且不能经常更新,准确率可能会因而降低。为了避免提高了速度但拖低准确率,他计划将来的字幕眼镜只需透过连接一条USB线到个人电脑,就可以更新软件。

已投资数十万 零售价料6000元

关于收身减重方面,萧启颖估计,若采用市场上能量密度最高的锂电池,眼镜臂可以缩小,整体重量也可降低至约80克,电池容量可增至1500mAh。但若是离线运作,连续使用时间只有3小时。因为离线运作模式需要晶片和记忆体频繁运作,耗电会比连线运作模式高。

该公司已在字幕眼镜的研发上投入数十万元,萧启颖估计,还要再研制多两代至三代,做更多测试和改进,至少一年后,字幕眼镜才可以量产??u出,估计零售价约6000元。他预料,累积总投资可能需要约300万元,所以希望能够找到投资者支持,同时考虑申请资助计划。