期刊大全 杂志订阅 SCI期刊 投稿指导 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 编码技术论文

编码技术论文精品(七篇)

时间:2022-02-16 04:27:12

序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇编码技术论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。

编码技术论文

篇(1)

关键词:网络编码无线网络信息交换

一、网络编码技术与传统网络的差异

在传统的计算机网络数据传输过程中,要借助路由器进行数据传递,根据数据的目标地址,路由器将数据包向各个链路发送。由于没有统一的安排和协调,在同一链路中会出现很多数据包,必须排队等待通过的情况,这就制约了计算机网络的传输速度和效率的提升。2000年,新型网络编码技术一经出现就得到了广泛关注。网络编码技术着力解决的问题是有效地将同时到达路由器的数据同时发送出去,不让数据产生拥塞,从而提高数据传输速度。

二、网络编码技术在无线网络中的应用

2.1网络编码的概念

网络编码是一种融合了路由和编码的信息交换技术,它的核心思想是在网络中的各个节点上对各条信道上收到的信息进行线性或者非线性的处理,然后转发给下游节点,中间节点扮演着编码器或信号处理器的角色。

2.2网络编码应用于无线网络的优势

网络编码融合了路由和编码的概念,使网络节点不仅可以对数据进行存储转发,还可以进行编码处理,已证明了使用线性网络编码已经能足够达到网络多播容量。但网络编码的好处不止这些,尤其是当网络编码应用于无线网络时。网络编码首先应被应用在无线网络环境。无线网络的特性是不可靠性和广播特性,使网络编码非常适合应用在无线网络上,因为无线链路的不可靠性和物理层广播特性非常适合使用编码的方法。应用网络编码,可以解决传统路由、跨层设计等技术无法解决的问题,提高网络编码在无线网络中的应用。无线网络的广播特性使其非常适合使用网络编码,当一个节点传输一个数据包给它的一个邻居节点时,它的其它邻居节点也可以接收到这个数据包。因此,当一个节点的邻居节点对不同的数据包感兴趣时,可以将这些数据包编码后再一起传输,这样子可以使其所有的邻居节点都收到感兴趣的数据包并可以节约无线资源。

应用网络编码,可以解决传统路由、跨层设计等技术无法解决的问题,提高网络性能。网络编码在无线网络中的应用可以提高网络的吞吐量,尤其是组播吞吐量。可以减少数据包的传播次数,降低无线发送能耗。当网络部分节点或链路失效时采用随机网络编码,最终在目的节点仍然能恢复原始数据,增强网络的容错性和鲁棒性。网络编码对无线网络的性能改善主要体现在提高网络编码的吞吐量上,网络编码已经被证明对于提高某些网络的吞吐量有着很大的作用。运用网络编码可以在很大程度上提高网络吞吐量,但是同时会增加网络的复杂性。不少研究者在研究提高无线网络的组播吞吐量的同时,研究如何降低因采用网络编码带来的复杂性。在网络状况恶劣的条件下,网络编码和路由之间组播吞吐量的差别不大,网络编码的优势体现在降低网络复杂性上;在网络状况较好的条件下,网络编码相对于路由方法,在很大程度上,提高了组播吞吐量。这为根据网络状况动态调整网络编码算法提供了可能。

2.3网络编码如何提高无线网络的安全性

网络编码在提高无线网络的安全性研究方面亦取得了一定的成果。在无线网络组播中,对于数据包的恶意修改的检测,过去是使用基于消息认证码或者数字签名的方法。基于网络编码产生了一种基于数据包的随机网络编码检测策略,这种方法计算量小,而且检测概率可以根据通信控制开销、网络编码复杂程度和检测时间这些因素进行调控。但这种方法亦存在不足。这种方法要求接收节点需要预先获得至少一个没有被恶意修改过的数据包,并且数据包的内容不能被攻击者知晓,因此,这种方法对抗攻击效果不好。

无线网络广播重传处理中,多个接收节点中的任意一个节点的丢包都要求源节点重传数据包,需要广播发送较多的重传次数.本文将随机线性网络编码技术应用在无线网络广播重传中,提出一种新颖的广播重传方法(RLNCBR)。该方法中,源节点记录多个接收节点中丢包最多的接收节点丢包数,再按照随机线性网络编码的方法编码组合该丢包数个线性编码包。源节点广播重传,接收节点采用运算编码线性组合的方法获得信息包数据。数学分析表明,该方法能保证所有接收节点的编码可解性,同时重传次数可达到理论最优性。模拟测试结果表明:与传统重传方法相比,RLNCBR有效地减少了信息包的平均传输次数,提高了传输效率。

三、网络编码在无线网络的应用发展方向

网络编码正在给现有的网络带来革命性的变化:网络编码从用来达到有线网络中的组播容量,发展到在有线和无线网络中提高吞吐量、节省能量、增强鲁棒性和安全性,甚至改变网络结构、改变网络协议设计方法。网络编码在无线网络中的应用还存在着以下的几个问题:网络编码的具体实现和降低网络编码的复杂性。现在已经提出了很多网络编码方法,有集中式线性网络编码和分布式随机网络编码,但是如何在实际网络环境中实现网络编码,需要考虑许多实际应用问题,例如同步、控制开销等。网络编码在实际网络环境中如何实现是一个很迫切的问题。采用网络编码可以在很大程度上提高网络性能,但设计和实现上的复杂性也随之增加。如何在不显著增加网络开销,综合考虑效率和性能的前提下,实现网络编码问题是将来需要进行深入研究的方向。

四、结束语

无线网络环境由于环境的多变性,使得数据包在传输过程中更加容易丢失。目前,重传常被用来实现无线广播的错误处理,普通重传方法思想基于发送方通过反馈得到接收方的出错情况,重传出错的数据报文来恢复出错的报文。:

网络编码技术是近十年来飞速发展的一个研究课题。虽然还没有应用到实际的通信网络中,但已引起了较大的关注,比如美国军方已经意识到网络编码技术的优势,已经拨款研究网络编码技术在移动自组网(MobileAdHocNetwork)中的应用。因此,我们也应当及时跟踪国际上的网络编码技术的发展趋势。同时,结合各种应用深入思考网络所涉及的各种安全技术问题。

参考文献

[1]范明,盂小峰.数据挖掘概念与技术[M].机械工业出社,2001.8.

[2]胡国强.数据挖掘在远程教育决策支持系统的运用[J].开放教育研究,2003,(5)44-45.

[3]YEUNGRW,ZHANGZ.Distributedsourcecodingforsatellitecommunications[J].IEEETransactionsonInformationTheory,1999,45(3):1111-1120.

篇(2)

关键词: H.264标准;视频压缩;视频编码

0 引言

以数字视频的采集、压缩、处理为核心的现代视频监控技术,采用先进图像处理芯片对视频进行压缩处理,把智能图像处理技术用于图像显示、监控成为嵌入式视频监控系统的重点研究方向[1]。无论是MPEG1、MPEG2或者是MPEG4、H.263都已经无法满足运动图像压缩的要求,这时新一代的H.264标准便被制定,H.264作为新一代的编码方式,有效提升了视频压缩率,仅需原先的一半带宽即可播放相同质量的视频,而且视频编码的码率更加灵活,架构主要包括,帧内预测、帧间预测、转换、量化、去区块滤波器、熵编码等模块,下面将研究H.264视频编码的关键技术及其应用前景。[2]

1 H.264压缩标准

H.264是两个组织专家ITU-T和ISO为多媒体传输设计的数字视频编码标准[3],全称是MPEG-4AVC,翻译成中文意思是“活动图像专家组-4的高等视频编码”,或称为MPEG-4Part10。各种分辨率的视频图像格式都可以被H.264视频编码标准支持,包括sub-QCIF、QCIF、CIF、4CIF、16CIF等[4]。H.264是一种视频压缩标准,同时也是一种被广泛使用的高精度视频的录制、压缩和格式。H.264比其他编码标准有着更高的视频质量和更低的码率,被广泛用于网络流媒体数据、各种高清晰度电视陆地广播以及卫星电视广播等领域。H.264的特点是能低码率、高清晰持续提供较高的视频质量,能大大加强图像的编码效率和改善图像数据在网络中的传输效率。[1],使网络更加灵活、适应性更强,最大的好处就是节约了成本,弥补了技术差距,让存储与视频管理变得更高效。

2 H.264编码器的结构和特点

H.264只是规定了输入码流的格式及编码之后输出比特流的句法结构,其标准的编码思路是混合编码模式,以帧间和帧内预测来清除空间和时间的冗余分量,用变换和量化编码来清除频域冗余分量。H.264视频编码在一定情况下提高了视频压缩编码性,其视频解码与编码实现的过程相反,依据帧内编码进行逆量化,反变换,重构帧,最后经块滤波器平滑滤波后得到重建图像,[1]H.264编码器的功能组成框图如1。

3 H.264编码器关键环节分析

3.1 帧内预测 比起H.263,H.264提供了更多不同的工具来降低码率,以编码单位来说,h.264中每个宏块(macroblock/mb)大小都是固定的16×16像素,能够实现高分辨率视频的压缩,对于帧间编码来说,它允许变换块的大小根据运动补偿块的大小进行自适应的调整;对于帧内编码来说,它允许变换块的大小根据帧内预测残差的特性进行自适应的调整。

3.2 帧间预测 H.264标准与早期标准不同之处在于,它所使用的是块结构运动补偿,运算精度精确到1/4像素点上。[8]不仅如此,H.264标准还使用了多帧预测的方法,能够明显改善预测增益。[5]

3.3 整数变换与量化 H.264中整型变换与之前的MPEG系列标准所采用的DCT变换都有区别:

①它是整形变换(所有的操作都为整数运算,不存在解码精度损失)。②用整数算术变换可以确保编解码之间实现零失配。③变换的核心运算部分只用到加法和移位运算,不需要乘除运算。④到量化器的缩放乘积因子为整数,减少了乘积因子的数据位数。[4]量化的目的是减小信号的值域,以更少的比特来表示信号,从而达到减少数据量的目的。H.264中量化的步长总共有52种,其按照12.5%递增,并且变换系数的读取有双扫描和之字形两种方式。

3.4 熵编码 熵编码是对数据的冗余信息进行压缩的方法,变长编码和Huffman编码相结合进行,以较短的字长表示出现概率较大的数据,较长的字长表示出现概率较小的数据来达到降低数据量的目的。

CAVLC是一种变长编码。先对变换系数进行zig-zag扫描。用行程码(L,V)表示扫描以后的数据,V代表数值,L代表该数出现的次数。因为视频块在整形变换和量化后,大部分变换系数成为0,只有很少的数据在低频部分,用行程数L代表连续出现的0的个数,V代表0串后挨着的非零值,接着对L和V分别采用Huffman编码进一步压缩,有不同的码表可以查询亮度块和色度块。行程编码大大降低了编码的码字字长。CABAC是一种二进制算术编码,其通过构建模型来预测当前的视频信号。相对于CAVLC编码,CABAC的编码效率更高,更节省码率。[4]

3.5 码率控制 H.264视频编码标准虽然对于编码器的结构实现模式没有具体的规定,但编码器实现的核心问题要解决编码器的结构、相应的视频编码如何控制。H.264编码器采用基于拉各朗日Lagrangian优化算法的率失真优化模型实现视频编码的控制,其实现方法简单而且效率高。[5]

H.264编码标准由于以上关键技术的支持,获得了较高性能编码,但编码器复杂度增加,约为MPEG2的4倍,MPEG4的2倍。其高复杂度原因有两个方面,一是编码选项复杂,二是计算量高。具体内容有宏块的划分及搜索模式的组合的选取、高精度亚像素运动补偿和多参考顿预测,H.264更细化,更精确的数据压缩导致了计算量高。[6]

4 应用前景

H.264作为一种具有高效压缩性能的视频压缩编码技术,其在制定的过程中就充分参考和吸收了H系列和MPEG系列的优秀研究成果,修改或重新制定了其中不合理的部分,使其有很好的压缩性能。H.264能够比H.263和MPEG-4大约省去50%的码率。[7]H.264的高效的视频压缩能力和优异的网络适应性,为视频数据传输的可靠性提供了保障,其可广泛应用于数字摄像、英特网、数字视频录像、DVD及电视广播等领域的图像压缩。

5 结束语

网络视频监控系统要达到良好的监控效果,仅提高摄像头的分辨率是不行的,只有通过改善数字视频的压缩技术,降低视频传输的误码率,提高视频的质量,才能推动网络视频走向智能化。[1]H.264标准的推出是视频编码标准的一次重要的进步,尽管其算法复杂,但是能够大幅度提高编码效率,使得应用范围更加的广泛。

参考文献:

[1]李红京.基于H.264视频压缩技术的网络视频传输系统设计[J].河北工业科技,2011,28(4):236-239.

[2]齐淋淋,向健勇,唐巍.H.264视频压缩关键技术及其应用前景[J].电子科技,2005(10)13-16.

[3]党晓军,尹俊文.基于H264的嵌入式视频监控系统研究[J].计算机技术与应用进展,2008:407-412.

[4]刘继红,孙海龙,屈鹏.TD-MBMS中H.264视频压缩的实现过程[J].信息通信,2008,4:14-16.

[5]牛建民.H.264视频压缩算法应用研究[M].同济大学工程硕士学位论文,2007,5.

[6]蒋文倩.基于H.264视频采集与无线传输系统的设计与实现[M].武汉理工大学硕士学位论文,2013,3.

篇(3)

关键词:H.264,运动估计,整像素预测

 

1、引言

H.264是一种高性能的视频编解码技术, 它是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。论文写作,整像素预测。

作为新一代的视频编码标准,它具有很高的数据压缩比率和优异的性能,广泛应用于视频会议、视频点播、高清视频、移动播放器等多个领域。

H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。论文写作,整像素预测。和MPEG-2和MPEG-4ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。论文写作,整像素预测。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。

在H.264的编码芯片结构中,相比帧内,帧间(Inter Prediction)编码的效率高,但是运算复杂度也比较高。帧间编码的核心运算部分是“ME”(motion estimation)即运动估计,占用最多的逻辑与时钟资源。帧间预测的运动估计过程分为整像素运动估计(IME)和分像素运动估计(FME),首先找到整像素的最佳MV,然后再进行分像素的搜索。除了巨大的计算复杂度,编码过程也很长,包括预测,重构和熵编码。

2、运动估计运算

H.264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。由于引入了1/4像素精度、多种分割预测等先进技术,在获得更高压缩率的同时,其算法复杂度也大大提高,使得帧间预测编码耗时占到整个编码计算时间的50%以上,若采用全软件实现高清图像的实时编解码,明显力不从心,这就要求使用高性能的硬件编解码器来完成高清实时编解码任务,这也是本人研究的主要内容。

编码宏块(16x16象素)可以分割成不同大小的块像数据,例如16x16、16x8、8x16、8x8、8x4、4x8、4x4等七种模式。而“ME”的再对各种宏块分割方式下的每个块象素进行预测运算,然后由后续模块统计和比较出最优的分割方式。

运动估计包括整像素预测(IME)和分像素预测(IME)两部分,这两部分是串行的。每一个宏块,只有在IME 做完之后,找到最佳整像素MV,再进行FME。

在进行IME计算时,首先要计算MVP,对于一个块象素,预测运算就是在参考帧中搜索出最佳匹配(即两者差异最小)的同尺寸块象素作为当前块的参考区域。如果在整个参考帧的范围下进行全面的搜索,固然可以得到最为匹配的区域,但是复杂度太大。事实上,相邻块在参考帧中的匹配区域一般位置比较接近。综合考虑算法复杂度,编码效果,资源使用等方面,帧间预测做了如下处理:首先根据周边块的Mv值预测出当前块的Mv值,即Mvp,然后在Mvp所指参考帧中象素点周边搜索最佳块象素。

MVP的搜索过程如图2所示,假定E为当前的宏块、宏块分割或者亚宏块分割,除了16x8和8x16,MVP为A、B、C的MV的中值;对于16x8分割,上面部分MVP由A预测,下面部分MVP由B预测;对于8x16分割,左面部分MVP由B预测,右面部分MVP由C预测。论文写作,整像素预测。以MVP作为搜索的起点。

图2 MVP 计算

IME在进行当前宏块MB(x)的MVP计算的时候,前面的宏块MB(x-1)包含分像素的MV还未得到,这个时候我们无法得到准确的A,所以我们此时以MB(x-1)的16x16分割搜索时所得到的整像素MV来代替A,并把据此计算得到的MVP作为搜索的起点。

3、IME模块及功能

IME模块的架构如下图所示

图3 IME模块架构图

IME的主要功能是:

(1)数据:把原始和参考YUV从inter_config模块中取出,为PS和FME模块准备预测所需数据;

(2)控制:控制帧间预测的过程

IME的模块划分及各自功能:

Pipe_ctrl:不同分割间的搜索和选择 将不同分割方式的顺序搜索改为并行,用两条水线来实现加速 Pipe0:进行P16x16,P8x16,P4x8 ;Pipe1:进行P8x8,P16x8,P8x4,4x4由两条共同完成(为了减少pipe0的等待时间,把pipe1的部分工作放到pipe0中)

MVp_ctrl:每种分割的具体搜索过程

(1)计算MVp值

(2)控制reg_ctrl模块的数据存取

Reg_ctrl:为相连模块准备数据

(1)为整像素准备数据,传输给PS模块;

(2)为分像素搜索准备数据,传输给FME模块;

(3)为重构准备数据,传输给FME模块

4、与IME模块相关的主要功能模块

图3中与IME工作相关的有两个主要的部分,一个是Inter_config 模块,还有一个是PS模块,它们在系统中起着重要的作用。论文写作,整像素预测。

1. Inter_config模块及功能描述

Inter_config模块,即帧间数据调度模块,其数据传送如图4所示,Inter_config模块有两部分功能:一是为IME服务,把IME所需的数据从DDR取到Sram;二是为Loop Filter服务,把LoopFilter模块的deblock运算所需要的一部分数据从DDR取到Sram以及将deblock运算后的宏块数据存入DDR。

图4 Inter_config模块数据传送

Inter_config模块与IME有关的工作包括:

1)取原始YUV数据,Luma部分直接拉给IME_Reg_o,Chroma部分存入Sram0。

2)为IME准备计算所需的9个宏块的Luma数据,并存入Sram0和Sram1。

3)将这9个宏块的Chroma数据准备到Sram1中,用于Chroma资料拼接之用。

4)接收到IME_ChromaStart_i信号有效后,开始FME运算所需Chroma数据的相关准备工作。包括:①从Sram0中取Chroma的原始YUV送给IME;②从Sram0中取Chroma3x3Mb数据并进行拼接(将每个block对应的2x2像素,向右向下扩展,变成3x3像素)后送给IME。论文写作,整像素预测。

5)把最后一行的5个mv(当前Mb最后一行的block的4个mv及右侧相邻的1个mv)存入Sram0,作为下一宏块行进行Mvp预测所需数据。

2. PS模块功能描述

PS模块,即预测选择模块,本模块主要用于选择当前编码宏块的最佳预测方式,帧内预测还是帧间预测;若是帧间预测还需给出宏块的最佳分割以及分割的最佳MV,除此之外,还需求残差值,用于后面的重建。其主要功能如下:

1)接收IME模块的整像素亮度值,以进行整像素搜索,找出最佳的整像素MV;

2)将两套流水线所得出的cost进行比较,选出最佳partition;

3)接收inter_ctrl模块中IME模块的亚像素亮度值,以进行亚像素搜索,找出最佳的亚像素MV以及cost,并与最佳的整像素MV的cost相比较,选择最佳的MV;

4)将选出的最佳的cost与intra_ctrl中的最佳的cost,比较得出最佳的预测方式,帧间还是帧内;

5)若选出的是帧内,则结束当前宏块的帧间操作,准备下一个宏块的帧间操作;若选出的是帧间,则接收IME或FME的亮度和色度值,进行求残差操作,送给DCT以备后面重建。

5、总结及展望

本文对帧间编码中IME运算所需数据进行探讨和分析,并提出一套架构设计方案,时序和资源使用都比较优化。设计方案在空间上具有较高的并行度,处理能力高,非常适合实现高清视频编码。目前市场上对于H.264的研究开发一般都是基于PC或者DSP解决,很少有基于硬件实现的开发,功能上还不足以实现高清实时信号的编码和解码。本设计能够实现帧间预测的关键部分,在后续的研究中如果能使用H.264标准在帧间预测所带来的高压缩率,如果能将其带来的复杂度的增加限制在可容忍的范围内,支持帧间预测的高清实时视频编解码的芯片实现是非常有意义的,应用前景很广阔。

参考文献

[1]新一代视频压缩编码标准——H.264/AVC 毕厚杰 人民邮电出版社

[2]Iain E.G.Richardson.H.264 and MPEG-4 Video Compression: VideoCoding for Next Generation Multimedia. U.S: Wiley Press, 2003.

[3]Tung-Chien Chen, Chung-JrLian, and Liang-Gee Chen. Hardware Architecture Design of an H.264/AVC VideoCodec. Asia and South Pacific Conference on. Design Automation, 2006.

[4]Renxiang Li, Bing Zeng, and Ming L. Liou. A new three-stepsearch algorithm for block motion estimation. IEEE Trans.Circuits Syst.Video Technol., vol. 4, No. 4,Aug 1994

篇(4)

《职业时空》,主管部门:河北省教育厅,主办单位:河北职业技术学院,国内统一刊号:CN13-1349/C,国际标准刊号:ISSN1672-8963,邮发代号18-347,半月刊,正刊。创刊于1995.ASPT来源刊中国期刊网来源刊,该刊是04年度北大中文核心期刊,《中国知网》、《中国学术期刊(光盘版)》全文收录期刊,中国学术期刊综合评价数据库来源期刊

主要栏目:现代职业新理念、职场宏观管理、职业政策研究、职业心理研究、职业教育研究、法制建设、主题论坛、高管论坛、争鸣、观点辑要、国外研究与借鉴、调查与探索等

1.来稿要求论点明确、数据可靠、逻辑严密、文字精炼,每篇论文必须包括题目、作者姓名、作者单位、单位所在地及邮政编码、摘要和关键词、正文、参考文献和第一作者及通讯作者简介(包括姓名、性别、职称、出生年月、所获学位、目前主要从事的工作和研究方向),并请在文稿的首页地脚处注明论文属何项目、何基金(编号)资助,没有的不注明。

2.论文摘要尽量写成报道性文摘,包括目的、方法、结果、结论4方面内容(100字左右),应具有独立性与自含性,关键词选择贴近文义的规范性单词或组合词(3~5个)。

3.文稿篇幅(含图表)一般不超过4000字,一个版面2400字内。文中量和单位的使用请参照中华人民共和国法定计量单位最新标准。外文字符必须分清大、小写,正、斜体,黑、白体,上下角标应区别明显.

4.文中的图、表应有自明性。图片不超过2幅,图像要清晰,层次要分明。

5.参考文献的著录格式采用顺序编码制,请按文中出现的先后顺序编号。所引文献必须是作者直接阅读参考过的、最主要的、公开出版的文献。未公开发表的、且很有必要引用的,请采用脚注方式标明,参考文献不少于3条。

来稿特别约定

1来稿勿一稿多投,收到稿件之后,7个工作日内共同审稿,电子邮件回复作者。重点稿件将送同行专家审阅。如果10日内没有收到拟用稿通知(特别需要者可寄送纸质录用通知),则请与我们联系确认。

2.来稿文责自负。所有作者应对稿件内容和署名无异议,稿件内容不得抄袭或重复发表。对来稿有权作技术性和文字性修改,作者需要安排版面数,出刊日期,是否加急等情况,请在邮件投稿时作特别说明

3.请作者自留备份稿,不退稿。

4.论文一经发表,赠送当期样刊1册。

篇(5)

关键词:Ad Hoc网络;智能手机;语音通信系统

中图分类号:TP393文献标识码:A文章编号:1009-3044(2012)01-0081-03

Design of a Smart Phone Voice Communication System Based on Ad Hoc Networks

LIN Qiu-peng

(College of Computer Science and Technology, Shandong Jianzhu University, Jinan 250101, China)

Abstract: Mobile flexibility of ad hoc network lead to a broad prospect of application,currently,smart phones develop rapidly and support wifi,which formed ad hoc networks will convenient and affordable. This paper analyzes the problems and key technology in the ad hoc networks famed by smart phones ,and build a ad hoc network architecture by the voice communication features in the smart phones.And I pro? posed a design of smart mobile voice communication system based on the system architecture and the characteristics of smart phones.

Key words: Ad Hoc Network; Smart Phone; Voice Communication System

Ad hoc网络是一种分布式的无线移动网络,它不依赖固定的基础通信设施,没有中心节点,具有自组织能力,抗毁性强,网络中的各节点地位平等,且具有转发报文的功能。一般适用于军事通信、抢险救灾、应对突发事件等无法得到有线网络支持或者临时需要通信的环境。

随着wlan技术及手机应用的迅速发展,越来越多的智能手机加入了WI-FI功能,诸如主流的iOS、Android、Windows Mobile、Sym? bian等手机操作系统都支持无线网络的接入,为手机终端组建ad hoc网络提供了支持。在应对自然灾害等紧急场合中,固定网络往往受损,导致人们之间无法通信,此时利用手机组建Ad Hoc网络进行通信就变的必要可行。同时,随着手机的应用发展,人们希望降低手机的各项费用,尤其对于学生这样的低消费人群,在小范围内如果可以组建Ad Hoc网络通信,便可以节省通信费用,因此,提出一种基于Ad Hoc网络的智能手机语音通信系统方案,以实现智能手机终端间无需借助运营商网络支持的自组织语音通信。

1国内外发展现状

国内外对无线Ad Hoc网络已经有了比较广泛的研究并取得了大量的成果,但已有研究绝大多数针对介质访问控制(MAC)[18]、路由系统[17]、拓扑管理、功率控制、服务质量控制[9][12][16]、安全[11]等领域来开展,且通常以无线Ad Hoc网络作为一种网络基础设施支持多样性应用为研究背景,研究的理论成分较重。

从公开发表的文献看,利用智能手机内置的IEEE802.11构建Ad Hoc网络并实现节点之间语音数据传输的成果不多。P.B. Vel? loso等人利用仿真实验研究了移动性和QoS提供等对Ad Hoc网络语音通信容量问题进行了研究[1];HuiYao Zahng等人研究了不同路由协议对语音应用系统性能的影响[2];C.H.Saleem等人研究了利用Ad Hoc组建对等网络支持紧急情况下指挥控制系统的语音通信问题[4]; Feng GAO等人构建了Symbian平台下基于蓝牙无线Ad Hoc网络语音通信的中间件系统[3]。清华大学的陈萍萍在“手机终端的自组织通信协议的实现”[5]一文中基于Symbian智能手机终端实现了一种基于蓝牙和WiFi的Ad Hoc网络语音通信系统,但其测试网络规模过小。同时董梅也在Symbian平台下实现了流媒体即时通信系统[7],但同样存在质量保证跟网络规模问题,鉴于小规模网络和大规模网络的问题迥异程度较高,其实现方法在较大规模网络中的可行性和性能需要进一步研究;李振宇等在“一种移动Ad Hoc网络中实时语音通信方法的研究”[6]一文中从网络层面和应用层面两个方面讨论了机遇As Hoc网络的语音通信方法,包括QoS控制机制等,但相关讨论建立在仿真实验基础上,并没有构建实验验证网络。

可以看出,尽管对Ad Hoc网络和VoIP[10][13]技术的研究已经取得了大量成果,但公开发表文献未见关于“基于无线Ad Hoc网络的智能手机终端语音通信系统”可以实用的成果发表。

2关键技术

由于Ad Hoc网络独有的无中心,自组织,多跳路由,动态拓扑,特殊的无线信道特征,安全性差等特点,所以需要考虑路由协议、服务质量保证、语音编码技术、安全性等多个方面的问题,其中主要对路由协议与服务质量、语音编码技术进行重点研究。2.1 VOIP技术

VOIP技术是将语音电话建立在IP技术上的语音传输技术,其基本原理是将普通电话的模拟信号转换为数字语音信号,通过语音压缩算法将语音数据进行压缩编码处理,然后把这些语音数据按相关协议进行打包封装处理,通过IP网络把数据包传输到目的地接收端,再把这些语音数据包重新装配,经过解码解压缩处理后,恢复成原来的模拟语音信号,从而达到利用IP网络进行语音通信的目的。我们可以利用此技术在ad hoc网络上实现手机的语音通信,通信模型如图1。

2.2语音编码方案

通过网络传输实时语音与传输普通数据不同,应用网络的组成必须符合这种实时传输的需要。语音的分组传送通常要求网络提供充足的带宽。但是Ad Hoc网络带宽资源有限,在这种情况下,我们可以通过编码压缩技术来减少对带宽的使用

目前,语音编码方案较多,主要包括G.711(64kbps)、G.723(5.3kbps~6.3kbps)、G.728(16kbps/8kbps)、G.729(8kbps)、MP3(128-112kb? ps)等,不同编码方案的编码码率不同。目前智能手机中应用的802.11b/g协议的标准数据速率分别是11/54Mbps,而实际应用中可能远达不到此标准。手机中GSM语音通话是采用G.711编码,由于无线Ad Hoc网络的链路容量较低,加之由于移动性导致的传输路径的变化,采用固定的编码方案和编码速率可能无法较好的在语音质量和应用系统性能之间进行折中,所以可以采用G.729与G.711相结合的动态语音编码方案。在链路状况好的情况下优先考虑语音质量,采用G.711编码,当网络中发生拥堵断路等影响传输速率的时候,选用低速率的G.729编码方案。

2.3 QoS路由协议

在Ad Hoc网络中,随着节点移动,网络拓扑结构在不断变化。如何快速准确地选择到达目的节点的路由是一个重要和核心的问题,路由协议分类如图2。

语音通信系统对传输性能要求较高,延迟抖动要小、丢包率要低,在Ad Hoc语音通信系统中,Ad Hoc网络中的节点在不断移动,这样就会引起网络拓扑结构的动态变化,从而出现路由中断,节点或链路拥塞,传输链路故障等问题,同时手机作为网络节点能量有限,所以基于QoS/基于能量考虑的路由协议更适合于该系统。

QoS路由协议是一种基于数据流QoS请求和网络可用资源进行路由的机制。一般QoS路由协议有两个目标:一个是找到满足QOS要求的路径;另一个是充分利用全局网络资对现有路由协议的分析。结合Ad Hoc网络的特殊性,通过两个节点之间可能存在的多条路径传输语音数据能够更好地满足需求。针对目前Ad Hoc路由协议的研究现状,按需多路径距离矢量(AOMDV)路由协议更适用于本系统,如何找多多条路径、如何维护多条路径、如何实现多条路径的负载平衡等问题是关键。

3 Ad Hoc网络体系结构

根据Ad Hoc网络中手机通信的特性,构建语音通信系统的Ad Hoc网络体系结构。将整个网络分成五层。针对各层的功能,将所用协议进行分层划分,详细结构如图3。

应用层根据voip协议原理采用自适应编码方案,根据网络负载情况,当网络负载轻时选用语音通信质量好的G.711编码方案,当网络出现拥塞等情况导致网络传输下降时选用G.729编码方案。

传输层根据voip原理将包进行封装,为了更好的实现语音通信的实时传输,需要加入实时控制协议RTP头,将数据进行RTP封装后加入UDP头等信息进行UDP封装,然后交由ad hoc网络进行传输。网络层根据ad hoc网络特性采用AOMDV协议进行路由选 路。链路层MAC协议采用DCF可以避免隐藏终端与暴露终端的问题。目前主流手机采用的无线协议多是802.11b/g两种协议。

4系统概要设计

因为Ad Hoc网络中的每一个节点都是独立平等的,所以系统每一个模块都应包含客户端和服务器端两部分的功能。根据语音通信过程将系统分为以下四个模块,具体如下图4。

4.1语音处理模块

手机作为客户端,利用麦克风对语音信号进行采集,并对采集的信号进行数字化,用合适的编码方式对数据进行压缩;作为服务器端,对接收到的数据进行解压,将解压后的语音信号在手机上通过话筒播放。

4.2实时控制模块

源节点将语音模块处理的数据进行封装处理(RTP封装、IP封装),将数据通过合适的端口发送到网络中;中间节点对接收到的数据包进行转发;目的节点将接收到的数据包按照正确的顺序排列,去掉报头等交给语音模块进行处理。

4.3路由模块

客户端(源节点)发起路由的查询与建立,并对路由信息进行维护;服务器端(中间节点、目的节点)对源节点进行响应,建立源节点到目的节点之间的数据通信线路,实现语音数据的双向通信,根据网络变化状况对路由进行控制维护。

4.4无线传输模块

对系统的wifi进行配置管理,获得接入Ad Hoc覆盖范围内手机终端的信息(SSID、MAC、IP等),网络周期性的更新与维护,根据路由模块选择的路径发送数据包。

5结束语

本文根据目前智能手机的发展情况,结合ad hoc网络的特性,提出一个基于ad hoc网络的智能手机语音通信系统的设计方案,该方案只是一个概要设计,对于路由协议、编码方案、信令协议等问题可以进一步研究改进。

参考文献:

[1] Pedro Braconnot Velloso,Marcel0 G. Rubinstein,Otto Carlos M. B. Duarte. Analyzing voice transmission capacity on ad hoc networks. Pro? ceedings of ICCT,2003,1254-1257.

[2] HuiYao Zhang, Marek Bialkowski, Garry Einicke, John Homer. An Extended AODV Protocol for VoIP Application in Mobile Ad Hoc Net? work. 2007 International Symposium on Communications and Information Technologies ,2007,836- 841

[3] Gao Feng, Weiwei Wang, Jun Cai.Reliable Busy Tone Multiple Access Protocol for Safety Applications in Vehicular Ad Hoc Networks. IEEE Communications Society subject matter experts for publication in the IEEE ICC 2010 proceedings.

[4] Choudhry Humayun Saleem, Khadim Hussain . Using Peer to Peer Voice Over Wireless Ad Hoc Networks as an Emergency Command and Control System. Technical report, IDE0903, February 2009.

[5]陈萍萍.手机终端的自组织通信协议的实现,[D].清华大学综合论文,2008,6.

[6]李振宇,李思敏.一种移动Ad Hoc网络中实时语音通信方案的研究[J].电子测量与仪器学报,2009,23(5):40-45.

[7]董梅,Symbian平台下基于移动Ad Hoc网络的流媒体实时共享系统[D].北京邮电大学硕士论文,2009,2.

[8]张楠.基于Ad Hoc网络技术的无线通信网络平台研究[J].科学技术与工程,2007,7(20):5043-5048.

[9]冯欣,尹方超,贺丽柏,韩永林.Ad Hoc网中经典路由协议QoS性能研究[J].长春理工大学学报,2010,33(4):131-133.

[10]顾玮奇,Ad Hoc网络中VOIP应用的研究][D].南京邮电大学硕士论文,2009,6.

[11]余旺科,马文平,严亚俊,陈和风.AdHoc网络单向安全路由协议[Jl.吉林大学学报(工学版),2011,41(1):193-197.

[12]殷脂,叶春明,温蜜.移动Ad Hoc网络QoS路由的闭环DNA计算模型[J].上海理工大学学报,2010,32(6):593-601.

[13]孙毅,方更法,石晶林.移动自组织网络上VoIP的实现方法研究[J].计算机工程,2005,31(18):99-101.

[14]李晓涛.基于Ad-hoc网络的短距离语音通话系统的设计与实现,中国科学论文在线,[DB/Ol].ttp://paper.省略

[15]蒋维华.多跳Ad Hoc网络中实现语音通信的技术研究[D].北京科技大学硕士论文,2009,5.

[16]钱琛.Ad Hoc网络语音通信Qos研究及模拟分析[D].南京邮电学硕士论文,2008,4.

篇(6)

 

主要栏目

综述与评论、综合自动化系统、过程控制及应用、智能控制技术及应用、优化控制技术及应用、企业资源计划系统、制造执行系统、计算机控制系统及软件

 

投稿须知

1、来稿要求论点明确、数据可靠、逻辑严密、文字精炼,每篇论文必须包括题目、作者姓名、作者单位、单位所在地及邮政编码、摘要和关键词、正文、参考文献和第一作者及通讯作者(一般为导师)简介(包括姓名、性别、职称、出生年月、所获学位、目前主要从事的工作和研究方向),在文稿的首页地脚处注明论文属何项目、何基金(编号)资助,没有的不注明。

2、论文摘要尽量写成报道性文摘,包括目的、方法、结果、结论4方面内容(100字左右),应具有独立性与自含性,关键词选择贴近文义的规范性单词或组合词(3~5个)。

3、文稿篇幅(含图表)一般不超过5000字,一个版面2500字内。文中量和单位的使用请参照中华人民共和国法定计量单位最新标准。外文字符必须分清大、小写,正、斜体,黑、白体,上下角标应区别明显。

4、文中的图、表应有自明性。图片不超过2幅,图像要清晰,层次要分明。

5、参考文献的著录格式采用顺序编码制,请按文中出现的先后顺序编号。所引文献必须是作者直接阅读参考过的、最主要的、公开出版文献。未公开发表的、且很有必要引用的,请采用脚注方式标明,参考文献不少于3条。

6、来稿勿一稿多投。收到稿件之后,5个工作日内审稿,电子邮件回复作者。重点稿件将送同行专家审阅。如果10日内没有收到拟用稿通知(特别需要者可寄送纸质录用通知),则请与本部联系确认。

7、来稿文责自负。所有作者应对稿件内容和署名无异议,稿件内容不得抄袭或重复发表。对来稿有权作技术性和文字性修改,杂志一个版面2500字,二个版面5000字左右。作者需要安排版面数,出刊日期,是否加急等情况,请在邮件投稿时作特别说明。

8、请作者自留备份稿,本部不退稿。

9、论文一经发表,赠送当期样刊1-2册,需快递的联系本部。

篇(7)

关键词: 藏文编码; 搜索引擎; 倒排索引; 网页爬虫

中图分类号:TP393.4 文献标志码:A 文章编号:1006-8228(2017)06-22-04

Research on key technologies of Tibetan web search

Zhang Yunyang

(Library of Tibet University, Lhasa, Tibet 850000, China)

Abstract: Through analyzing the characteristics of the Tibetan characters' coding in Tibetan website, and introducing the characteristics of the search engine, this paper studies the key technologies of Tibetan web search. The technologies of URL processing, the qualified crawler, inverted index, words' retrieval, sorting for results and the others for Tibetan web are discussed in detail. This paper proposes a relatively complete method for Tibetan web search, which has certain practical value for Tibetan web's information search and use.

Key words: Tibetan coding; search engine; inverted index; Web crawler

0 引言

藏族是我民族大家庭的重要成员,藏语言文字是藏族同胞在日常工作/生活中广泛使用的文字。几千年以来,藏文字作为信息文化的传播载体,对于传承藏民族传统文化、传播现代科技知识和促进地区经济的发展都发挥着重要的作用。在计算机世界中,藏文字区别于汉字和英文的最主要特征是字符编码,目前国内网站多数使用GBK编码存储信息,使用基于GBK的字体显示文字。而目前的藏文网站,为了方便兼容和统一检索,主要使用基于国际标准编码的Microsoft Himalaya字体和珠穆朗玛系列字体。

1 藏文网站字符编码技术

藏文在计算机和国际互联网的使用,在输入法和字体方面采用基于Unicode字符集的方法较为合理,方便信息共享,方便藏文广泛交流。互联网世界的藏文网站和网页,现在都倾向于使用基于Unicode的藏文字体。

通过对国内比较著名的藏文网站源码分析发现,主要的藏文网站均采用utf-8编码,即藏文字符采用国际标准编码Unicode字符集,而藏文字体采用基于Unicode的珠穆朗玛系列字体和 Microsoft Himalaya字体。国内部分藏文网站和网站的字符编码及字体分析如下。

2 网页URL处理

2.1 URL简述

URI:Universal Resource Identifier,通用资源标志符。URI通常由三个部分组成:访问资源的命名机制,存放资源的主机名,资源自身的名称[1]。

URL是URI的一个子集,它是Uniform Resource Locator的缩写,译为“统一资源定位符”,即通常说的网址。URL是Internet上描述信息资源的字符串,主要用在各种WWW客户程序和服务器程序上。采用URL可以用统一的格式来描述各种信息资源,包括文件、服务器地址和目录等[2]。URL的格式由三部分组成:第一部分是协议(或称为服务方式);第二部分是存有该资源的主机IP地址(有时也包括端口号);第三部分是主机资源的具体地址,如目录和文件名等。

2.2 URL处理流程

网页搜索并不是对实时的网站信息进行检索,在用户提交检索提问词后,实际上是转入搜索引擎的索引数据库检索,这些索引数据库通常是由网络搜索引擎的爬虫进行采集、更新从而建立起来的。爬虫最主要的处理对象是URL,它根据URL地址取得所需要的文件内容,然后对它进一步处理,网页爬虫URL处理流程如图2所示。

3 藏文网页爬虫

3.1 爬虫“黑洞”

爬虫在搜集藏文网页的过程中,必须考虑可能出现的“黑洞”情况。爬虫黑洞是指,在抓取一张网页的链接时,链接本身是一个无限循环,导致爬虫抓取时跟着循环,浪费资源。有时一些URL看起来不同,但实际指向同一张网页,也会使爬虫陷入重复抓取的境地。

为了避免爬虫误入黑洞,一般采取两种策略。一是爬虫回避动态网页,因为动态网页常常会把爬虫带入黑洞。识别动态网页时,只需要判断URL中是否出现问题,含问号的就是动态网页。二是使用Visited表记录已经访问过的URL,凡是遇到新的URL存在于Visited表,就放弃对该URL的继续处理。例如:当遇到abcdce这样的环路链接,爬虫就会掉进去,反复抓取c、d对应的页面。使用Visited表,就能避免这个问题。

3.2 限定爬虫

藏文网页搜索使用的爬虫,是一种限定爬虫,在爬虫的功能定位上只抓取藏文的网页,本质是对网页文本所用语言的限定。藏文网页的限定爬虫,表面上是限定语言,具体操作层面需要通过限定IP、限定URL、限定charset来实现。

限定爬虫就是对爬虫所爬取的主机的范围做一些限制,通常,限定爬虫包含以下几个方面[3]:①限定域名的爬虫。比如,只抓取结尾的域名;②限定爬取层数的爬虫。比如,限定只抓取2层的数据;③限定IP的抓取。比如,只抓取自治区内的IP;④限定语言的抓取。比如,只抓取中文汉字页面。

抓取藏文网页一方面要设计限定爬虫,另一方面建立动态更新的藏文网站域名库、藏文网站主机IP库,配合限定爬虫工作。目前已有部分藏文网站在页面中加入了标记,如中国藏学网采用的是,IT网采用的是,琼迈藏族文学网采用的是。可以根据网页代码中的标记来识别判断藏文网站。藏文网站域名库和藏文网站主机IP库,需要人工操作,人为添加一些地址,这方面参照现在互联网广泛使用的“纯真IP数据库”实现。

3.3 藏文网页倒排索引

藏文网页倒排索引的建立流程如下。

第一步:抽取网页正文。网页正文是相对网页噪声而言。当今的互联网网页上,页面的很多篇幅用在广告、搜索推荐和其他链接上。网页搜索工具关注的是网页本身要表达的信息,所以在通过爬虫获取到页面源码之后,要去除那些与本文无关的噪声,抽取到网页正文。

第二步:分字。藏文文字区别于汉文,汉文是一个字使用一个编码,而藏文是对组成字的基字编码,一个完整的藏文字可能存在多个编码,这些编码按组成藏文字的方法顺序排列。藏文的分字通过藏文字分隔符 ‘ ’ 来实现,如这段藏文字,中间有四个分隔符,句末有一个断句符。在分字过程中,需要去掉一些无实际意义的字和符号,只留下有明确表意的字进行网页的检索。

第三步:对全文以字建索引。以字建索引,虽然检索过程的匹配计算量会更大,但考虑到目前藏文网页总体数量不大,应该是一种可行的提高查全率的办法。根据上一步得到的字,记录每个字在文中出现的位置,计算每个字出现的次数,建立链表。位置用于检索时的准确定位,次数用于计算字对文档的重要性,也用于相关性排序计算。

第四步:对标题建索引。大部分的Web文档有文档标题TITLE,标题反映了文档的主要内容,是搜索和导航的重要依据。标题索引以词、短语或句子为索引单位,具体根据词表匹配情况确定,如果标题匹配词表中的规范词则使用规范词,如果没有则直接以标题建索引。藏文规范词表是动态更新的。检索时以匹配标题索引为优先策略,先查询标题索引库,再查询全文索引库。

第五步:索引旄新。网站的页面信息是动态更新的,由网络爬虫抓取得到的藏文网页倒排索引库也需要更新。搜索引擎的倒排索引更新有多种方式,包括修改更新、覆盖更新和添加更新。鉴于目前上线的藏文网站数量少,网络爬虫工作周期短,藏文网页的倒排索引库更新可以采取添加更新加覆盖更新的策略。每次爬虫工作完成后,建立新的索引库,将查询引擎链接指向新的索引库,同时保留近两期的索引库,将更早的索引库删除。每次添加新的索引库后,先将之前近两期的索引库保留一段时间备用。

4 检索

藏文网页搜索工具为用户提供检索藏文网页信息,先根据用户提交的检索提问标识,去匹配索引库中的网页信息标引标识[4],然后将匹配上的结果按相关系数降序排列,匹配出的每一项条目直接指向网页源地址,同时在结果页显示每条结果的网页快照,以高亮显示匹配字符。

4.1 检索词审阅

我国于2004年和2008年先后通过的《藏文编码字符集扩充集A》、《藏文编码字符集扩充集B》两套国家标准,收录藏文字符7205个,包括现代藏文、古藏文和梵音转写的藏文字符,藏文覆盖率达到99.99%[5]。在藏文网页搜索过程中,有必要对用户输入的藏文字进行拼写检查,确认输入的每个字是正确的藏文字。将这两套国家标准收录的藏文字逐一列出,查出对应的国际编码,建立藏文国际编码字表,在用户输入检索词时使用此表来进行文字审阅。

4.2 文字匹配

藏文网页搜索,实质是将用户输入的检索提问标识与索引库中的网页标引标识进行比对,找出匹配的条目。现有的字符编码体系,对汉字是以整字编码,如“汉”的GBK编码是“BABA”,“汉”的unicode编码是“6C49”;藏文字是对构成字的每个构件进行编码,因此一个藏文字的编码实际是由一个或多个构件的性,藏文字符匹配相对汉文和英文需要更大的计算量,比对一个字实际需要比对多个编码。

文字匹配采取精确匹配和模糊匹配两种策略。优先采用精确匹配,将理论上最相关的结果反馈给检索用户。如果精确匹配命中条目很少或者没有命中条目,采取模糊匹配策略,将近似相关的结果反馈给检索用户。精确匹配是找出完全包含检索词的结果集,模糊匹配是找出语义上近似的相关结果集。应用检索理论中的缩检与扩检,当命中结果很多时,筛选最相关结果集;当命中结果很少或完全没有时,逐步减小相关系数阈值,或多或少地为用户提供一些近似相关结果集,尽量满足用户的检索需求。

4.3 结果排序

检索结果排序是网页搜索的重要一环,一般的全文检索系统,是按更新时间和点击率对结果集排序,如利用文献管理系统查阅图书时,查询结果根据图书出版时间降序排列,或者根据外借次数降序排列,突出显示热门图书。但是,用户的网页搜索需求不完全是将时效性排在第一位,网页爬虫在抓取网页更新索引时对每个网站的更新周期不一样,等级高的网站被爬取的频次高,等级低的小型网站被爬取的频次低。因此,网页搜索结果不能按网页时间排序,用户普遍更关注的是相关度[6]。

Google等大型搜索引擎使用复杂的PageRank算法进行链接分析,递归地计算网络上的全部站点排名[7]。藏文网页搜索的规模较小,可以采取简单的策略。以检索词的匹配程度作为主列排序,以信息时间作为次列排序,按相关度从大到小排序,相关度相同的按更新日期从晚到早排序。

5 结论

互联网世界的藏文字符已经趋向于使用基于Unicode的字符集和基于utf-8编码的字体,这有利于人们更多地使用藏文进行交流。目前,Google搜索已经开发了针对藏文网页的搜索功能,国内多家单位也正在研发本地化的藏文网页搜索引擎。总体来讲,藏文网页搜索还处在探索阶段,究其原因,主要有三个方面:一是多年来藏文字符编码不统一,一些藏文软件还沿用着基于国家标准的藏文字体,不兼容当前国际标准编码;二是藏文网页/网站数量较少,用藏文记述的文献信息体量巨大,但目前“搬”上网的还很少;三是藏文与汉文的混排、混检技术还处于发展中,最直接的解决办法是平台上的藏文和汉文都使用基于Unicode的字符编码,但会额外增加大量的汉文字符存储开销和网络流量开销,这也是一些大型站点保持使用GBK的原因。目前针对藏文信息处理的研究有很多,我们期待将来藏文在互联网世界更广泛更灵活的应用。

参考文献(References):

[1] 谢玉开.基于JAX-RS的面向资源架构应用研究[D].浙江理

工大学硕士学位论文,2011.

[2] 范剑波.网络数据库技术及应用[M].西安电子科技大学出版

社,2004.

[3] 王娟,吴金鹏.网络爬虫的设计与实现[J].软件导刊,2012.4:

136-137

[4] 王沣.运用信息技术保护莽人语言文化的研究[J]. 科技情报

开发与经济,2014.11:144-145

[5] 普顿.移动电话上实现藏文信息处理的方法研究[D].大

学硕士学位论文,2009.

[6] 吕月娥,李信利.基于信息类别的网页过滤算法[J].福建电脑,

2007.2:99,122