采访人:记者
记者:据我所知,天朗语音公司的核心技术研发人员,产品设计人员,市场推广销售人员都是来自于国家863语音实验室以及微软、英特尔等国际化大企业,是什么原因吸引了这么多优秀的人才聚集到语音技术研究及产品化的这项事业中来呢?
刘欢:语音技术的应用,是产业发展的必然。无论是PC平台,还是高端的平台、甚至移动设备,各种形态的嵌入式的计算设备等等,语音技术都可以使冰冷的计算设备以更富友好和人性化的界面出现。我们相信,这项对人类生活产生重大影响的技术必将使更多人、更多时间和更有乐趣地享受IT和计算带来的深刻价值。尼葛洛庞帝在《数字化生存》一书中写到"在下一个千年里,我们会发现我们和机器说的话,与我们和人类说的话一样多,或甚至比跟人类说的话还要多";而比尔·盖茨在COMDEX展会上也说道:"工业界应对语音识别领域的重大突破作好充分的准备,那将是席卷全球的另一次狂潮"。这一切都将预示着语音技术的应用将为人类未来的生活带来巨大的变革。
自20世纪90年代以来,包括微软、IBM等国外大企业,都在语音领域加大了研发力度。语音技术的发展对IT业,对建立高度智能的信息化社会有着深远的意义,语音技术的突破,将会在整个信息产业掀起一股狂潮。语音技术,已被公认为是21世纪最有开发潜力和应用前景的高科技技术。
长久以来,软件业的核心技术掌握在微软、Oracle、IBM等国外软件巨头手中,甚至与我们毗邻的印度在近10年的时间里,一跃成为除美国以外最大软件出口国,它所生产的计算机软件产品已远销75个国家,出口量是中国的100倍之多,2008年预计出口软件总值将达到500亿美元。
与美国、印度等软件大国相比,我们到底缺了什么?很显然,国内软件业在很长一段时间里存在着缺乏核心技术、科研规划能力不强、人才流失等等一系列问题。WTO时代的到来,也正是国内软件业大展鸿图的契机。国家加大对软件产业的扶持的力度以及重视对知识产权的保护,加之国内软件本身市场潜力巨大以及国内软件业具备本土化优势、教育高校人才云集等巨大优势完全可以带动国内软件业的发展,当然国内软件产业的提高最终还是需要自身技术的提高。
如今,天朗公司拥有国际领先的核心语音技术,有理由相信无论在传统的IT和电信领域,还是在其它领域;我们将在不断变化的市场中,提高我们自身的核心技术和核心技术适应能力。我们期望通过不断的合作实现从今天开始到未来的知识经济的时代的语音的科技之梦。
记者:语音技术曾一度是冷门学科,其科研工作过去也一直是在悄然中进行,如今,虽然语音技术已经达到一个相对高的水平,并正在从实验室研究中走出来,进入一个实用化的阶段,但在IT业界,相对其它软件技术来讲,语音在业界的声音仍然很小,甚至,对于大多数人来说,对语音技术感受还是比较陌生,您是如何解释这一现象?
刘欢:语音技术包括语音识别和语音合成,而前者又比后者更难于实现。语音识别是指从人的语音波形中提取信息并确定其语言含义的过程。它是人机交互技术中最为关键,难度又很大的一个课题。语音识别与计算机几乎是同时诞生,虽然有50年的研究历史,但是要实现实质上的突破,是被喻为和"人类登月计划"有着同等难度的攻关计划。
机器识别语音难在什么地方呢?人说话的语音信号是很不稳定的。不同人由于性别、年龄不同,所受的教育和性格不同,地方口音不同,说话的轻重不同,甚至说话时的心理、生理状况不同等等,都会影响语音信号的特征,使得计算机感到对它难于琢磨。这就是专业术语所说的语音信号的随机性和多变性问题。这种随机性和多变性造就了语音本身的不定性和难懂性。
清华-天朗语音科技研究中心在经过多年的语音识别研究后,提出了一套新的语音识别模型和相应的训练算法、识别算法。对声学处理我们提出了一个新的语音识别模型,这个模型与国际上(包括国内大多数研究语音识别技术所使用的)流行的语音识别模型不同之处恰恰就在于它能够描述于语音信号的随机性和不平稳性。目前大众对语音技术的陌生是很正常的,因为语音技术的全面深入应用是一个长期发展的过程,语音技术的成熟性要分阶段实现。相信经过研究者的不断努力,在攻克语音识别中的主要难题后,语音识别技术将对人类的生活方式产生深远的影响。
记者:业内人士都知道:语音技术是被列为国家863重点科研攻关计划,而清华-天朗语音科技研究中心作为长期承担国家863重点语音科研项目的研究机构,在王作英教授的带领下,取得了多项科研成果。请问天朗公司将如何把这些核心技术进行封装,实现产品化、产业化?同时,对于语音行业未来的发展,天朗语音有一个什么样的战略规划?
刘欢:清华-天朗语音科技研究中心从80年代末开始进行语音识别和语音信号处理方面的研究。经过十几年的努力,取得了很多重要成果,自94年以来,在国家863计划组织的测试中连续三届以较大优势获得冠军,代表了国内语音识别领域的最高水平。经过近一段时间的努力,所拥有的技术目前已经进行了实用化和产品化的工作。并已经将技术部分在飞利浦、中国电子器件总公司等投入使用。当今世界,科学技术发展日新月异,知识经济和理性互联网的概念是主流的思想。世界各国和地区纷纷把发展高新技术产业作为提高经济竞争力的制高点,大力增强技术创新能力,积极促进科技成果商品化。核心技术的产品化是中国软件产业必须坚持发展的道路。
虽然,目前的语音识别技术还没有达到非常理想的状态,但这并不妨碍以语音技术为核心的人机交流应用的发展。语音识别的应用是非常广泛的,目前,语音识别已经在听写机、电话查询系统、家电控制等诸多领域获得了广泛的应用。天朗语音将力争把核心语音识别技术深入应用到从电信、IT等领域,不断扩充到消费电子、汽车、玩具、电话等和大众生活息息相关的领域,让更多的人感受到语音高科技所带来的便利。如何更有效地将语音核心技术转化为产品是我们现阶段的工作重点,同时,我们将继续研究语音目前存在的难题,分阶段的解决这些问题,研发出更为高端的语音核心技术。
记者:自94年以来,清华-天朗语音科技研究中心在国家863计划组织的语音测试中连续三届以较大优势获得冠军,代表了国内语音识别领域的最高水平。请问天朗语音公司除了在语音识别技术上有优势以外,还有何别的竞争优势?
刘欢:天朗语音的核心研发部门清华-天朗语音科技研究中心从国家开展863计划以来,长期承担国家863计划的重点语音课题,同时也为天朗语音提供了强大的技术后台支持,这一点是天朗公司的核心竞争优势所在。但是,实现语音技术真正的产业化,缺少不了资本和市场的支持和接受。以市场为导向是语音公司能够稳定发展的关键。天朗公司的投资方之一是北京市政府下属的北京高新技术创业投资股份有限公司,具有丰富的高新投资经验的北京高新技术创业投资股份公司给天朗语音提供优良的技术研究和开发环境。北高投的介入为天朗语音提供了强大的政府资本支持,这也充分说明政府对语音行业前景十分看好,对国内的语音事业充满信心。此外,天朗语音的主要的产品化设计人员都来自英特尔、微软等国际化企业,具有丰富的产品设计和解决方案能力。同时,天朗语音还拥有一个具备成熟管理经验的经营团队,这一切都是天朗拥有的竞争优势。
记者:大家都知道,美国常常将最先进的科技运用到军事上,而日本则往往将其应用在与百姓生活息息相关的领域里。那天朗呢,天朗语音公司今后技术发展方向及产品开发方向的重点是什么?
刘欢:语音技术的应用最重要的应用就是实现人机的自然交流。任何人、在任何时间、任何场所都能够安全、方便、快捷、高效地获取可支付得起的、丰富的、无语言障碍的、个性化的信息服务,从而实现人与计算机的无障碍沟通。当这种沟通实现的时候,我们会在一个完全新型的计算环境和社会环境内。人们可以享受数字家庭的理想;可以利用移动电话,控制自己的家电;可以用简单的设备,实现家居的智能控制;语音技术的突破,使人们真正实现无障碍的地球村的梦想。NEC公司在本次世界杯,成功的使用了由日本本国技术研发的语音掌上设备。这个产品能够实现外国人和本国人的畅通沟通。我们期望在2008年的奥运会上我们本土的语音技术的应用能够完全实现中国申办奥运时的承诺,实现数字奥运的无障碍沟通。
IT产业的迅速发展是不平衡的,主要表现在作为IT业主体技术的计算机并不是非常适合于人的操作。解决这些问题,一直是人类的梦想,使这一梦想成真是天朗人的神圣职责。
记者:关于语音识别技术的发展水平及其商品化的时机问题众说纷纭:有人认为语音识别技术商业化的时代已经到来,有人则说还需那么三、五年时间。对此你有何看法?
刘欢:语音识别技术商品化是一个过程。在《智能计算机》的有关研究中,"863智能计算机"专家组提出了"顶天立地"的四字方针。所谓顶天就是创新,立地就是要产业化。就技术所能够达到的性能而言,今天的语音识别技术已经能够满足许多方面的使用要求。对语音识别技术的应用要求是多方面的,而实现每一种应用产品的设计都需要解决特定的用户需求。其中许多问题就需要在产品化的过程中去解决。当然也有许多技术层面上的问题,但是就目前而言,主要的问题是如何把已经达到的语音识别技术性能配上人性化的设计,应用到产品中去。语音技术的成熟性将会分阶段实现。
记者:联盟一直是IT行业的一道独特的风景线,而且正如您所说到的:语音技术的发展是和周边技术的发展分不开的,那么天朗语音未来的发展策略是什么?
刘欢:语音识别从学术上看,涉及了多种学科,属于交叉学科的范畴;从产业上看,语音识别遍布计算领域。语音识别技术的研究不同于其他软件技术,它需要长时间的积累,所需要的资源也是惊人的。语音识别技术的应用现阶段的核心是语音技术和其他相关技术的联合开发。事实上,在缺乏完整的理想核心技术解决方案的现阶段,应用技术和核心技术的联合开发将是非常重要的。
语音产业离不开应用的开发,离不开解决方案的开发,离不开运营商的支持和理解。天朗语音的模式非常简单清楚:采用多赢的合作模式,注重多领域的联盟和适合客户和市场的应用方案开发。
我们期望通过我们的核心技术,和所有的应用开发商联合,共同开发适合各种领域的应用产品,并提供部分解决方案和技术支持。同时我们将全力配合其它语音应用厂商和语音应用的运营商全力推广自身的产品。目前,天朗公司已和多家国际、国内高科技公司建立了战略联盟。唯有国内的企业、厂商都联合起来,结成统一战线,合作联盟,才能携手共创知识经济时代的科技之梦!
天朗语音公司供稿 CTI论坛编辑