项目简介
数字与人类的日常生活和工作息息相关,把数字语音识别与其他语音命令识别相结合,组成各种嵌入式语音控制设备,这种嵌入式设备几乎涉及到人类生活的方方面面,使人们的生活,工作更加方便和舒心。譬如,如果在普通的手机或电话上加入语音数字识别和人名识别拨号系统,这种手机将变得更加smarter, 对于熟人,可以对着手机直呼其名,对于其他人可以叫出你想要通话人所在地区和电话号码,系统通过识别、确认即可直接接通所需号码。这一嵌入式识别系统的处理流程如图一。
图一 处理流程
语音识别技术是横架于不同方言和不同语种之间的桥梁,是人机自然友好交互的瓶颈。作为小词汇量连续语音识别的典型代表,连续数字串识别在现实社会中具有广泛的应用。比如,我们可以对着电话话筒自然地说出所要电话号码而不需要另外腾出一只手拨号。我们可以用语言自由控制家电而省却频繁使用遥控器按钮的麻烦。在许多公共场合,我们需要输入身份证号码,帐户号码,密码等,如果将这些录入设施改用语音录入设备,不但能使录入过程变得友好简单,而且更加卫生和易于接受。在需要输入及校对大量数据等领域,语音录入会有更为明显的应用前景。连续数字串识别虽然词汇量很小,但要做到高性能,也是个不小难度的挑战,其同时对大词汇量连续语音识别具有明显的启发和借鉴意义。
图二 应用领域
联系人: 杨徽
中科模识 语音事业部
Tel: 010-82872970 (2971) ext 803
Emai: yangh@mail.pattek.com.cn
Web: www.pattek.com.cn
中科模识公司供稿 CTI论坛编辑