浦项科技大学开发用于精确语音识别的可穿戴式振动传感器
近年来,语音识别技术变得越来越普及,涉及的领域十分广阔,包括模式识别、信号处理、概率论和信息论、人工智能等等。
语音识别技术
作为一门新兴的交叉学科,语音识别技术经过最近二十年的发展,已经取得了显著进步,早已进入商用市场。曾经有人做出预计,10年之内语音识别技术将进入日常生活中的各个领域,比如家电,通信,医疗和家庭服务等等。尤其是现在,语音识别更加融入到我们的生活当中,如现在广泛普及的智能手机中都能看到它们的身影。
但是,由于周围环境中存在的障碍物和其他噪声,语音识别的表现总是有些不稳定,有时甚至会发生错误识别,这是因为手机中检测声音普遍使用的是麦克风。麦克风,简单的说它是一种将声音信号转换为电信号的能量转换器件。最初的麦克风是通过电阻进行声电转换,后来发展为通过电感或电容进行声电转换。因为它们通过感知空气中的振动进行工作,因此它们都有一个共同的缺点,容易受到环境噪声的影响。
据传感器专家网报道,近日国外的一项研究成果,成功解决了这项难题。浦项科技大学(POSTECH)的研究人员成功开发出一种灵活且可穿戴的振动响应传感器,可准确识别用户的声音。当连接到颈部时,传感器可以通过颈部皮肤的振动精确地识别声音,并且不受环境噪声或声音音量的影响。
可穿戴式振动传感器附着在人类颈部皮肤上来进行语音识别 资料图
这些可附着皮肤的传感器通过检查颈部皮肤振动来检测和识别人的声音,颈部皮肤振动可以通过几个参数来测量,包括速度、位移和加速度。
可穿戴式振动传感器与用于语音验证和语音控制应用的参考麦克风之间的比较示意图
传统的振动传感器通过空气振动识别声音,并且由于机械共振和阻尼效应灵敏度降低。因此,他们无法定量测量声音。因此,环境声音或口罩等障碍物会影响其语音识别的准确性,不能用于安全认证。
可穿戴式传感器即使在嘈杂的环境中也能准确识别语音而不会出现振动失真 资料图
在这项研究中,研究小组证明,声压与各种声压级别的颈部皮肤振动加速度成正比,范围为40至70 dB SPL(声压级)。研究人员开发了这种新的可穿戴振动传感器,利用皮肤振动加速。该装置由超薄聚合物薄膜和带有小孔的隔膜组成。它可以通过测量皮肤振动的加速度来定量地感知声音。在一次成功的演示中,可穿戴式传感器即使在嘈杂的环境中也能准确识别语音而不会出现振动失真,并且在佩戴口罩的情况下音量非常低。
该研究可以进一步扩展到各种语音识别应用,例如电子皮肤,人机界面,可穿戴式声乐健康监测设备。
研究人员在他的采访中解释了这项研究的意义。“这项研究非常有意义,它开发了一种新的语音识别系统,可以定量地感知和分析语音,不受周围环境的影响。它从传统的语音识别系统向前迈出了一步,只能识别语音定性“。该研究得到了韩国科学和信息通信技术部全球前沿研究计划下的先进软电子中心的支持。