TTS与语音识别软件
2001/12/17
TTS(text to speech),又称为文语转换或机器朗读系统。
ASR(Automatic Speech Recognization)又称语音识别系统。
三汇公司最早于1995年开发成功第一代汉字语音库,该语音库采用真人录音,并附加了汉字文本与相应语音之间的检索表,可以实现简单的TTS应用。1999年三汇与IBM公司合作,成为IBM中文语音识别系统在国内最早的推广应用者。
三汇关于中文TTS和语音识别的软件产品有:
汉字语音库
真人发音,支持全部的汉字发音,并提供二级字符内码与语音库偏移量的索引表。可用于简单的TTS应用,例如播放数字、人名、地名、股票名称等。提供C语言编程示例源代码,适用于任何操作系统和任何语音卡。
中文TTS系统
完整的中文TTS系统,具有海量词库,能正确识别多音字,能正确掌握朗读的语调和节奏。采用可选的男声或女声真人发音,可调的音量、语速和语调,具有较好的真实感,主观可懂度大于99%。适用于IVR系统的语音提示,有声EMAIL系统,大容量新闻信息发布等应用,可以省去繁琐的预先录音工作,支持全部型号的三汇语音卡。
系统可工作于预先合成和实时动态合成两种方式,采用客户/服务器结构支持多通道大容量系统。
支持操作系统:
WINDOWS NT 4.0
WINDOWS 2000
使用编程工具:
VB、VC、BC、VF、PB、DELPHI等,提供丰富的编程序查源代码。
IBM Viavoice Telephoney中文电话语音识别系统
三汇语音卡为国内最早集成IBM ViaVoice Telephony语音识别系统的公司,应用最成熟,是IBM公司在国内语音识别领域最重要的合作伙伴和系统经销商。所有三汇语音卡均支持IBM ViaVoice Telephony语音识别系统,同时该系统也为使用者提供了一个开放式的语音识别引擎和完善的应用开发环境,用户可以方便快捷地在电话系统中集成语音识别功能,为声讯服务系统、电子商务平台和涉及电话通信的语音应用系统提供语音交互界面。
性能特点:
◆语音识别引擎采用实际电话信道的语音样本,连续语音识别率高。
◆语音识别引擎没有特定授话人的限制,对于各种不同信噪比的电话信道均具有很好的适应性。
◆电话语音应用系统伸缩性较强,不仅可以运行在单机系统上,而且可以扩展为多引擎、多服务器的大型企业级应用。
◆语音合成自然清晰,易于理解。
◆语音识别引擎可以辨识无限量的词汇表。
◆输入语音即可添加词汇,也可以在系统运行状态下对词汇集进行动态添加,添加方法灵活。
◆与硬件无关的C/C++应用编程接口,可以方便地挂接语音识别引擎和语音合成引擎。
◆可以输出不同候选结果及相似度得分。
杭州三汇公司供稿 CTI论坛编辑
ADI Blackfin推出适合三汇的VoIP电话和呼叫中心方案 2009-05-11 |
杭州三汇荣获CIPCA 2008中国IP通信大奖 2008-10-08 |
三汇成功开发高性能真人接听检测算法助推外拨应用 2008-08-26 |
三汇新一代C型传真卡撼市登场 2008-05-15 |
三汇ATP-24A新型模拟录音产品问世 2008-05-05 |