首页 > 技术 > 技术文摘 > CTI技术与现代电信网络

CTI技术与现代电信网络

2001-10-11 00:00:00   作者:   来源:   评论:0 点击:


 

一 CTI技术的概念及发展概述

CTI(Computer Telephony Integration)是在电话网络进入数字化时代,计算机技术广泛应用于通讯领域后逐渐发展起来的一门综合技术。从早期数字通信技术替代模拟通讯技术以来,计算机已经不只是简单作为电信交换和传输网络的控制部分而存在,而是逐渐演变成语音通信的一部分,将智能化的语音延伸到通信网络的每一个角落。这种计算机电话集成技术的发展从简单的语音信箱应用开始,很快发展起来了智能网业务、IP电话技术、ATM语音技术、统一消息技术、交互式会话系统等,其中IP电话和交互语音(IVR Interactive Voice Respond)是目前发展最快和应用前景最为广泛的两种技术,并且已经逐步渗透到无线通信网络和多媒体网络中。

CTI技术应用范围的不断扩展,特别是在与电信网络融合的过程中,协议标准化问题显尤为重要。CTI技术标准大部分由ECTF(Enterprise Computer Telephony Forum)定义。

二 CTI关键技术以及遵循的协议和国际标准

CTI在对语音的处理上流行的几项技术主要包括:语音编码技术、语音识别技术、语音合成技术等几方面。

同电话系统相似,语音编码技术最常用的是脉冲编码调制(G.711 64K PCM标准),自适应差分脉冲编码调制(G.721 ,G.722 ADPCM标准),和增量调制(DM)。语音编码方案一向以追求低码率、短延时、高质量为目标,目前的G。728标准采用的优化后的短延时激励码(LD-CELP)速率可达到16K/S,算法延时小于2ms;1995年 ITU推出的G.729标准再度将速率降到8K/S。日本数字移动通信采用的矢量和线性预测编码(VSELP)已将语音编码标准定为6.7K/S。高效的编码方案将是语音在IP、ATM网上高速传输保证。

语音识别技术和语音合成技术是近几年发展起来的计算机语言学(Computer Phonetics)的主要研究方向。语音识别早期主要采用的技术包括:线性预测分析技术(LPC),动态时间规划算法(DTW),矢量量化技术(VQ)等。80年代以来对隐马尔可夫模型(HMM)的研究推动了语音识别的迅速发展。这类方法的特点是,设计人员根据人工神经网络技术,设计出一种可训练的模型,并用大量已经存在的数据去训练,得到大量非特定人连续语音识别模型。

语音合成技术又称作文语转换系统(TTS),包括文本分析、韵律建模和语音合成三部分。文本分析目前主要以统计学方法以及人工神经网络技术应用为主,具有代表性的有:二元文法(Di Grammar Method)、三元文法(Tri Grammar Method)等;韵律特征包括的声学参数包括频率、时长、音强、停顿等;语音合成技术中比较著名的有Klatt的共振峰(Formant)合成系统,和最近发展起来的波形拼接(PSOLA) 语音合成技术。

由于CTI技术是伴随计算机通信发展起来的,CTI应用初期的关键技术就是计算机与电话交换机之间的接口技术,1988年欧洲计算机制造协会ECMA(Eoupean Computer Manufacture Association)首先提出了计算机与交换机之间的标准协议:CSTA(Computer Supported Telecommunications Applications),是OSI应用层协议,其主要对象是基于交换机特别是专网电话交换机的中继线和排队机,主要技术包括连接、应答、转移、会议等呼叫控制服务;话机性能、音量控制等设备服务;消息的收发、事件管理和计费等内容。目前CSTA-III(98)版本仍广泛应用于PBX等领域。

美国国家标准学会(ANSI)于1989年制定了应用于程控交换机中虚拟交换网(Centrex) 方面的标准:SCAI(Switching Computer Application Interface)实现了计算机和电话交换的集成。

目前随着计算机硬件技术的迅速发展,特别是板卡和接口软件技术的进步,CTI领域最广泛采用的还是各类应用程序接口(API)技术和相关标准。

1.TAPI技术标准:Microsoft公司提出的,其目标是为了促进开发电话语音应用和呼叫控制的Windows 电话 API。在TAPI 3.0的白皮书中,允许用Java、C/C++和VB等任何语言写TAPI的应用程序,实现用Windows应用程序控制通信设备。TAPI是Windows 95和Windows NT的标准组件,支持USB和ActiveX控件,侧重与计算机与电话的集成应用。其结构示意如下:

2、TSAPI技术标准:由Novell公司开发。它将程控交换机或中央电话系统与Netware网络集成在一起。可以实现呼叫转移,交互式语音(IVR)和自动呼叫分配(ACD)等功能。支持包括Windows各种版本、OS/2和Unix等目前主要操作系统。不同于TAPI ,TSAPI在计算机和桌面之间建立一个逻辑的连接,通过这些连接在任一端的TSAPI应用就可以完成呼叫控制。由于TSAPI主要为Netware网操作系统增加电话服务,不在每个电话和PC之间建立直接的连接,而是由一个电话服务器Netware可加载模块(NLM)、一个电话服务器API(TSAPI)、一个电话服务器库和一个电话客户库组组成在服务器电话系统间建立的连接,因此这个连接也称为PBX-To-Server连接。电话服务器 NLM是负责 PBX和 Netware服务器间传送信息的。电话服务器 API是为运行于服务器上的应用提供电话服务器API。三方连接在客户--服务器组网中比单方连接有更大的灵活性。网上的每个用户都可迅速地通过现有的LAN基础结构拨入PBX。对其他服务的接入,如主机或终端仿真、传真、E-mail等,都可以通过CTI接口获得,只要这些业务已经存在于网上。结构如图:

TAPI和TSAPI强调对电话的控制。1995年成立的企业计算机电话论坛(ECTF)对媒体控制的信号处理系统架构(SCSA)进行研究并发展成为一种媒体控制API标准-S.100,并于1996年发布。媒体控制API的主要应用领域是建立基于PC机的媒体处理系统及基于PC机的语音处理系统的开发,称为媒体和交换服务界面,提供了包括语音信箱、传真和其他媒体的转换,是定义CTI应用于交互操作的技术基础。在此基础上又推出了不同应用之间进行S.100业务通信的协议标准—S.200和对系统资源的控制的协议标准--S.300。

三 CTI技术在现代电信网上的应用

CTI技术的发展既依赖于电信网络又对现代电信网络提出了更高的要求。由于计算机技术的迅猛发展,传统的电信业务已经远不能满足人们信息交流的需求,九十年代以来,以数字交换与传输网络为基础的,结合计算机技术应用而发展起来的ISDN业务、IP语音业务(VoIP)、交互式语音(IVR)、智能业务(IN)以及即将出现的INTERNET语音门户Voice Portal、扩展语音标记语言(Voice XML)技术和统一消息业务给等将计算机与语音通信技术结合构成一个全新概念的现代电信网络。

1.IP语音技术(VoIP):IP语音不同于传统的基于电路交换的语音业务,而是以分组数据报的形式传递话音。自从95年以色列VocalTec公司研制出可以通过Internet打长途电话的软件产品"Internet Phone"以来。IP电话发展到现在,已经融合了分组语音技术、语音编码和压缩技术、IVR等技术成份。并且随着QoS不断提高,成本不断降低,现在已经开始分流传统长话业务。目前IP电话关键信令技术由ITU-T H.323 和IETF会话初始化协议SIP(Session Initation Protocol)两套标准体系构成,SIP和H.323都是使用RTP作为媒体传输协议。SIP侧重于将IP 电话作为Internet上的一个应用,借鉴了其他Internet标准和协议的设计思想,比如FTP,SMTP等,增加了信令和QoS功能。相比之下H.323协议采用的是传统的实现电话信令的模式,定义了4个主要的组件:终端(Terminal )、网关(Gateway)、网守(Gatekeeper)和多点控制单元(MCU)便于与现有的电话网互通。由于H.323发展得比较成熟。我国目前的IP电话网也普遍采用了这种方式。

2.呼叫中心:是CTI技术应用的一个主要领域,一般的呼叫中心由智能分配中心(Auto Call Distribution简称ACD)、CTI服务器、自动语音应答设备(IVR)、自动传真服务器、外拨服务器以及人工座席等几部分构成。排队机通过CTI-Link与CTI服务器相连,根据话务量、客户代表的要求或用户呼叫历史记录分配资源。CTI服务器与前置交换机相联,并屏蔽了交换机与计算机之间复杂的通信协议,向上提供统一的编程接口,使开发人员能方便地开发呼叫中心的各类应用。CTI服务器一般由电话服务单元、安全数据库和电话服务库等组成,实现同步语音与数据的传送、协调语音与数据的转移、智能路由等功能。交互式语音应答系统(IVR)。能识别用户通过双音频话机数字键盘输入的有关信息,并向用户播放预先录制好或通过TTS(Text-To-Speech)生成的语音。 用户可以通过电话键盘与自动语音应答设备进行对话,并选择自己所需的服务。

3.智能网技术:智能网(IN)是通信网发展的一个主要方向也是CTI在电信网络上的另一个重要应用。根据AT&T公司Bellcore制定的智能网标准(IN-1,IN-2),以及后期的AIN(Advanced Intelligent Network)标准,ITU-T 1993年提出了智能网第一组功能集(CS-1)的建议,即Q.1200系列建议,并于1995对CS-1功能完善经历了CS-2、 CS-3阶段。现在智能网对CS-4的研究将包括智能网B-ISDN综合、智能网支持宽带移动业务,及通用个人通信、虚拟专用网、被叫集中付费等业务;实现虚拟归属环境(VHE)的所有功能;支持IMT-2000;增加了认证管理功能(AMF)或位置管理功能(LMF)。我国于1995年颁布了以ITU-T CS-1智能网标准为基础的中国智能网标准,近几年国内智能网建设发展很快。现在我国除流行的七种标准智能业务(ACC记帐卡、FPH被叫付费、VPN虚拟专网、UPT通用个人通信、WAC广域Centrex、VOT电话投票、MAS大众呼叫)外,各地方运营公司根据本地市场需求又推出了AD广告、NP流动号码、TP电话付费业务等。

4.Internet呼叫中心:也是CTI技术最激动人心的应用之一。Internet呼叫中心是呼叫中心技术与因特网技术相结合,设想一下:当客户在浏览网页同时,如果希望就某一问题与客户服务代表进行讨论,此时客户不必呼叫中心的电话号码,而是通过点击网页上的“呼叫”链接按钮,顾客便可和业务代表进行语音或文字的交流。Internet的呼叫中心提供以下几种联系客户的方式:电子邮件(E-mail):发送的电子邮件通过智能路由选择功能分配到最适合的客服代表进行处理;文字交谈(Chat);客户与客服代表之间无需语音通信而是通过实时的文字形式进行交交流;互联网电话(Voice Over IP):客户可以使用VOIP功能,通过计算机呼叫呼叫中心。客户的互联网电话呼叫经过呼叫中心的智能路由选择后,被转接到适合的客服代表; 电子商务:尽管电子商务发展迅速,并已经形成一个相对独立的网络应用分支。但是电子商务平台和应用软件都离不开CTI技术。

四、CTI带动语音通信技术的发展

——伴随技术的进步,下一代电信网络将是以宽带IP/ATM、宽带无线网络、全光网络、软交换的为技术支撑,广泛结合CTI应用,原有的电信网络开放化,接口协议标准化,并实现业务应用与承载的分离。用户可以自行配置和定义自己的业务特征,不必关心承载业务的网络形式以及终端类型。多协议标记交换(MPLS)协议将成为通信网络采用的主流技术。而实时话音处理操作系统(VPOS)是下一代CTI系统的核心。

1.统一消息(Unified Messaging):任何人、任何地方、任何时刻、使用任何一种消息设备都能处理任何一种消息是未来信息技术的发展目标。它不但要求具有实时性、准确性可移动性还要能够广泛兼容各种通讯媒体。理论上统一消息将所有的消息类型,如语音、电子邮件、传真和数据等,以不同的形式集中存储在一个设备中。这样,用户可在任何时候采用方便的方式访问该设备中的任何消息。统一消息服务系统实现的关键是解决各种不同的消息表现格式间的兼容问题,实现语音、传真、电子邮件等不同信息格式间的相互转换,其主要采用的技术之一是语音合成技术(Text to Speech)。语音合成技术就是把可视的文本信息转化为可听的声音信息。具体到统一消息服务中,就是将电子邮件、传真等文字信息转化成可听的电话语音。

2.多协议标记交换(MPLS)技术:尽管IP已经得到各类平台广泛支持,但是由于其面向无连接,QOS不完善, ISP面对各种新兴的增值业务,实施流量工程和计费管理措施还存在一定困难,Cisco提出的基于Tag-Switching技术的MPLS很快就被推崇为下一代Internet宽带网络技术的发展方向。由于采用标记分配信令协议(LDP)用于实现标签的分配与转发,通过TCP层保证信令消息可靠传输,采用基于标记化的VPI/VCI及DLCI转发机制,因此可以在ATM层上直接承载IP业务,解决了Internet扩展和QoS传输的问题,并能够提供IP无法保证的流量控制业务,平衡负荷保证某些业务的必要带宽。路由、寻址与控制等功能集成使控制过程简化。

3、软交换(Softswitch)技术:现在电信网络核心仍是基于电路交换的现在正逐渐向IP交换技术过度。预计在未来网络中的语音消息将通过由软交换机控制的媒体网关和语音网络之间传送。软交换机有时候也称为呼叫代理(Call Agent)、呼叫服务器或媒体网关控制器,它主要提供连接控制、翻译和选路、网关管理、呼叫控制、带宽管理、信令和呼叫计费信息生成等功能。软交换是一个基于软件的分布式交换机 ,为下一代网络(NGN)提供具有实时性要求的呼叫控制和连接控制功能,是下一代网络呼叫与控制的核心。软交换的主要功能有:连接各种媒体网关,如PSTN、IP、ATM媒体网关等; 执行呼叫控制功能,包括呼叫的建立、保持和释放;提供多种业务, 包括PSTN/ISDN、IN、ATM交换等业务并实现各种网络信令互通。各种网络组件,通过使用交换协议,如媒体网络控制(Megaco)、媒体网关控制协议(MGCP)、SCTP/M3UA和会话初始协议(SIP)相互通信。

4、语音门户(Voice Portal)与Voice XML语言(eXtensible Markup Language):当人们使用电话设备实现信息交流同时,也希望通过电话语音接入网络并以交互方式访问INTERNET得到信息或进行电子交易。交谈式语言是人类最易掌握的交流方式,通过语音浏览和接入互联网,促进了语音门户(Voice Portal)的出现。语音门户是自动语音识别(ASR)技术、文语转换(TTS)技术和CTI技术、Web技术、电信技术、计算机及网络迅速发展的结果。从早期的交互式语音应答系统IVR到最近出现的Voice XML语言都为语音门户的发展提供了有力技术支持,Voice XML 让Web“听”懂了人类语言,以AT&T,LUCENT,IBM,MOTOROLA几家公司联合发起的Voice XML 论坛确立了Voice XML1.0标准,对其语法结构给了详细定义。

综观CTI技术与现代电信网络的演进,语音从电路交换到分组交换,承载业务从单一话音到各种媒体,广泛采用软交换技术将传统交换机的功能模块化、部件化接口协议标准化使电信网络逐全面,与计算机技术进一步融合真正实现三网合一,以全光波分复用(DWDM)和无线通信技术为主的传输网络为语音通信业务发展成为交互式多媒体通信提供更高的数据传输速率。而随着统一消息、语音识别等技术成熟,语音门户将成为INTERNET的又一重要形式。

本文由作者向CTI论坛提供

作者简介:敖旭光 1990年毕业于长春邮电学院,长春电信分公司交换中心副主任,现就读于北京科技大学计算机硕士专业。
作者联系方法:
aoxg@sohu.com

相关阅读:

分享到: 收藏

专题