> ChinaByte4月29日消息 英特尔推出了一种能让计算机读唇语的软件,朝着更高级的语音识别应用迈出了重要的一步。
这个名为AVSR(音视频语音识别)的软件能够跟踪讲话人面部表情和嘴唇的移动。通过把这些动作与语言进行比较,这个应用程序可向计算机提供足供的数据对语音识别指令作出回答,即使在噪声很大的环境中也可以。AVSR软件程序是OpenCV计算机图像库的一部分。那
是一个开源软件应用程序和工具集,能够帮助计算机解释图像数据。
计算机公司多年以来一直设法普及语音识别应用。但是,大多数计算机的处理能力不足和软件性能限制了语音识别技术的开发。现在这两个因素都发生了很快的变化。处理器平均速度速度现在已经达到了1.5GHz以上,最高速度已经达到了3GHz。此外,研究人员编写处理语音指令的应用程序的水平也提高了。
证明这种应用的一个方法就是把视觉信号转换为英特尔正在做的语音识别方案。例如,微软研究所开发出一种名为“GWindows”的试验型应用程序。用户可以使用语音和手势相结合的方式,利用这个软件对计算机中的文件和窗口进行操作。
GWindows软件与摄像机一起使用,以便跟踪手等目标的移动。计算机利用统计学原理进行工作。当计算机“看到”用户多次向左挥手,计算机就把这种指令解释为把把文件转移到左面。
英特尔对于AVSR软件还有其它应用。例如,这种软件可以同摄像机一起用于医院防止病人出现中风的危险,或者用于停车场防止偷窃。其原理是一样的,如果病人的生活节奏变慢或者有人在停车场不进商店而是挨个车观看,这个软件就会根据这些不正常行为发出警报。
英特尔AVSR软件的这些应用和开发工作是在英特尔公司在北京的中国研究中心进行的。