首页 > 技术 > 技术文摘 > 颜永红：“搜索”语音识别技术的未来

颜永红：“搜索”语音识别技术的未来

2010-05-28 00:00:00 作者：来源：评论：0 点击：

　　颜永红:中科院声学所中科信利语音识别实验室主任。
　　1990年毕业于清华大学，1995年获得美国俄勒冈研究院博士学位，后在该校任教，曾担任OGI口语研究中心的副主任、英特尔微处理器实验室的主任工程师和人机界面总框架师，英特尔中国研究中心的主任和首席研究员,英特尔全球人机界面学术委员会主席。
　　2002年入选中科院百人计划，任声学所研究员、博士生导师，中科信利语音实验室主任和所长助理。长期从事人机界面研究工作，目前从事的研究领域：大词表非特定人连续语音识别，多模口语系统，嵌入式系统，多媒体数据检索，系统自适应和快速搜索算法。
　　10年前，他曾是英特尔微处理器实验室的主任工程师和人机界面总框架师，英特尔中国研究中心的主任和首席研究员。
　　如今，他一手创办的中科院声学所中科信利语音识别实验室已发展成为国内语言声学领域规模最大、学科最全的实验室，与实验室同时成立的中科信利技术有限公司也取得了长足的发展。
　　两个“孩子”的长大让他倍感欣慰。而同时，他错过了两个宝贝女儿的成长，这是他最遗憾的。
　　“没有什么后悔的，时间无法倒流，只能往前看。”中科院声学所中科信利语音识别实验室主任颜永红说。
　　一项技术，牵制搜索引擎
　　“在不久的将来，互联网将成为一个浩大的音视频档案库，对下一代搜索引擎来说，语音识别技术是关键。”颜永红说。
　　在浩繁的音视频数据库中，要查找出所需的音视频片断，已经成为困扰互联网搜索的难题——目前的技术主要是搜索音视频的关键词，比如音视频的名字或作者，并没有办法搜索音视频内容。而通过语音识别技术，可以把多媒体文件变成可识别的计算机语言，从而有效快速的实现准确搜索。
　　事实上，语音识别技术也是各大公司竞争的一大焦点。
　　去年11月份，谷歌推出的语音搜索引起极大关注。用户只需在手机上安装一个软件，然后利用手机原有的麦克风，用普通话对手机说出需要查询的内容，谷歌中文语音搜索会自动返回整合的搜索结果。
　　“从实验室成立到现在，我们一直在做这方面的技术积累，很快，我们和国内公司合作的语音搜索将面世。”颜永红笑着说。
　　目前，中科信利的中文电视广播新闻节目识别系统，就已经被多家公司采用，并作为其提供给全国各电视台的数字媒体管理系统中一个核心技术模块。
　　这个系统立刻引起本报记者的强烈兴趣——当系统“收听”到一段“新闻联播”节目，自动将节目内容生成文字，并且识别准确率惊人地高。
　　“那是不是我们的采访录音直接可以被转化成文字？”记者顿时兴致勃勃。
　　“现在还不行。”颜永红笑着说，“因为语音识别包括语言模型和声学模型，新闻语言可以建立语言模型，但口语却很难建立语言模型。”
　　在语音识别实验室里，视频精确搜索已不是问题。
　　在一段王楠比赛的视频中，你只要输入“侧身抢拉”、“前三板”等关键词，就可以找到精确到秒的视频。这就意味着，如果你想找一部电影里的精彩片段，只需记得其中的经典台词即可搜索。

共 2 页：1 2

《科技日报》