首页 > 技术 > 解决方案 > 科大讯飞InterPhonic 3.0语音合成系统新特性预览

科大讯飞InterPhonic 3.0语音合成系统新特性预览

2004-01-12 00:00:00   作者:   来源:   评论:0 点击:


  领先的专业语音技术提供商-科大讯飞日前宣布其新一代重量级语音合成系统InterPhonic 3.0将于2004年第一季度推出。
  科大讯飞每一代语音合成系统的推出都标志着中文语音合成技术产品的一个全新里程碑,在效果表现和功能特性上的持续推进也得到了众多客户的充分肯定。InterPhonic 3.0延续了科大讯飞的技术产品基本路线与原则,即基于对语音合成技术发展的深入思考、稳健把握和对用户需求的广泛收集与详细分析,将以全新的面貌展现在合作伙伴与客户面前。
  现在我们已经可以预览InterPhonic 3.0的一些重要新特性:
1.全新风格的女声音库,并支持多音库管理和运行时自由切换;
  除支持全新风格的女声音库外,InterPhonic 3.0语音合成系统也同时支持原有的语调平稳,语气正式的女声音库。InterPhonic 3.0允许客户选择安装两种音库中的任意一个,或者是同时安装两个音库。并且提供了这两种音库自由切换的功能。客户可以在系统运行的情况下,通过参数设置切换合成服务的发音人。这样客户可以根据业务的变化,选择更加适合应用需要的发音人,而使整个语音应用能提供给用户更加自然的感受。
2.中文合成技术和中英文混读合成技术方面都有新的突破;
3.在中文文本分析和处理的多个方面都有显著的改进;
  在分析了不同应用领域的文本特征之后,采用了统计和规则相结合的方法来进行中文信息的分析处理。收集了大量与客户的业务领域相关的文本和实际应用中需要合成的文本信息,在进行统计分析之后,进一步优化了统计模型和数据库,并且增加了大量的处理规则,提升了文本中词组的识别和特殊符号的处理的准确性。通过统计和规则的结合,系统既保证了对大量文本分析处理的正确性,也保证在一些特殊语言环境下分析处理的正确性。
4.支持定制资源包和行业专用版;
5.背景音支持;
6.用户提示音资源管理;
  InterPhonic 3.0中具有对提示音的统一管理和处理的功能。用户可以将提示音添加到系统中作为资源,并提供了自动或手动的方式调整提示音的语音特征,使提示音和合成语音合成更好的衔接。客户使用CSSML文本标记利用序号引用提示音,通过合成系统的开发接口得到的语音数据会自动处理提示音与合成语音的拼接问题。客户不需要的额外的开发工作就可以提升同时使用两种语音的情况下播报的语音效果。如果结合InterPhonic 3.0新支持的背景音特性,两段语音之间有背景音乐进行过渡,语音应用的效果将更加自然。
7.提供功能丰富、使用便捷的合成工具包。
  以上只是InterPhonic 3.0部分新特性的预览,InterPhonic 3.0同时还支持目前市场主流应用的InterPhonic CE 2.2的所有重要特性。我们相信,随着InterPhonic 3.0的推出,将促使语音应用迈上更高的台阶。

科大讯飞公司供稿 CTI论坛编辑

相关阅读:

分享到: 收藏