> 美国东部时间5月1日(北京时间5月2日)消息,英特尔公司最近发布新款的语音识别软件,这款软件在语音识别的基础上,加入了类似识别人类嘴唇的功能。这一功能的加入大大地提高了单靠语音识别软件的准确性。
这款软件的全名为可视音频语音识别软件(AVSR)。这款AVSR软件可以提高语音识别软件识别的准确率。特别是在外界背景有噪音的情况下,这款软件的作用就表现得更加明显。
AVSR软件是通过摄像头捕捉用户嘴唇动作,与此同时对声音同步识别。AVSR通过这两种方式的结合,提高了语音识别的准确性。这也是也普通语音识别软件的不同。
AVSR是英特尔公司的OpenCV计算机可视库的一个组成部分。AVSR在这个项目中的地位,是一个可视化的工具。OpenCV库中包含了许多面部表情识别的算法。OpenCV是一个开放的源代码库。它的源代码已经被下载50万次。
英特尔公司称,随着处理器速度的飞速发展,数码相机的价格下降以及USB 2高速接入的技术的普及,目前的主流个人计算机已经完全可以运行这样复杂的算法了。( 新浪科技 清风编译)
Tags:
责任编辑:小黑游戏