时间:2022-05-21 11:23:19
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了一篇统计数据论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
1问题的提出
近年以来,统计数据质量问题受到社会各界的广泛关注,我国官方统计数据屡遭质疑,并在2010年上半年达到顶峰,也曾在一时,“被增长”、“被降低”、“被统计”,似乎成了一个时尚的名词。那么,近年来为什么我国官方统计数据会屡遭质疑呢?我们认为一是源于社会各界对统计信息需求的大幅度提高,二是在于信息披露的多路径化和低成本化。而要消除对我国政府统计数据质量质疑,我们必须要做好三个方面的工作。这就是一要加强统计研究,进一步推进统计方法制度的科学化进程;二要从源头数据管理做起,把好统计数据质量关;三要加强统计管理机制建设,遏制官员对统计数据的干预。鉴于统计数据质量的形成源于各方利益的驱动,所以,为了确保上述工作任务的完成,我们必须站在博弈的视角来开展统计数据质量管理的研究。本文拟以“联网直报”方式下的国家统计数据生成流程为线索,基于地方官员、基本单位和统计机构的理性驱动,来构建国家统计数据质量管理博弈机制,并通过该机制的描述与设计,来研究国家统计数据质量管理的最优战略。
2国家统计数据质量管理的博弈机制分析
统计数据质量问题产生于统计数据生成路径,源于统计数据提供者的利益驱动,为此,统计数据的生成过程,也是统计数据质量的博弈过程,依据该过程中所内含的博弈机理,我们终可寻找出国家统计数据质量管理的路径。长期以来,我国一直推行统计数据上报的“逐级汇总”,并由此而引发了许多统计数据质量问题。为此,国家决定从2011年统计调查年报和2012年统计调查定期报表起,推行统计数据上报的“联网直报”方式。“联网直报”作为“四大工程”的一个重要组成部分,其是通过与“一套报制度”、“基本单位名录库”和“数据采集处理软件系统”紧密结合的基础上,共同来完成统计数据采集、传输、汇总、加工、上报任务的。由于“企业一套表”制度的实施,不但统一了统计数据的口径,而且也消除了数出多门的现象产生;“网上直报”方式的推行,减降了统计数据上报过程中的人为因素干扰;网上“数据采集处理软件系统”的采用,增加了表内、表间统计指标数据的逻辑审核以及人工审核功能,所以,在“联网直报”统计背景下,统计数据质量可以得到了进一步保障,但统计数据质量问题仍不可得以消除。这是因为:通过数据采集与处理系统逻辑审核关的基层数据,并不能完全保证就是实际数据,只要基层单位想虚报瞒报,任何先进的统计数据采集与处理技术均是难以全面防范的。所以,“四大工程”实施后,统计数据质量控制仍是一项艰巨的任务,统计法制建设仍然不可松懈。那么,“联网直报”背景下的统计数据质量问题是如何形成的呢?我们认为,“联网直报”方式下的统计数据质量问题,主要来源于基层数据的虚报瞒报,这种虚报瞒报现象的产生仍将来自于基本单位利益的驱动,并遵从于博弈的机理。一般来讲,基本单位是基层统计数据的起报单位,在填报基层统计数据过程中,是实报还是虚报、瞒报,这主要来自于其本身利益的权衡。首先,这种利益的权衡来自于其自身利益最大化的追求;其次,这种利益的权衡来自于地方官员的压力;第三,这种利益的权衡来自于统计违规处罚。基于此,地方官员、基本单位、统计机构之间利益的权衡过程,构造了国家统计数据质量管理的博弈过程,地方官员、基本单位、统计机构之间利益的统一,形成了国家统计数据质量博弈的纳什均衡。
3国家统计数据质量管理的博弈机制描述
3.1背景假设与符号定义为便于研究,我们假设:理性的官员、基本单位和统计机构构成了源头统计数据质量博弈的参与人;官员的行动空间为{虚报性干预,瞒报性干预,不干预};基本单位的行动空间为{虚报,瞒报,实报};统计机构的行动空间是{检查,不检查};在博弈的过程中,地方官员是先行动者,基本单位是第二行动者,统计机构是最后行动者。在上述背景假设条件下,我们定义:(1)Q为基本单位基层统计数据实际值。(2)πg为地方官员干预基本单位上报基层统计数据的净收益总额。(3)πf为基本单位上报基层统计数据的净收益总额。(4)πs为统计机构统计执法检查净收益总额。(5)β为地方官员对基本单位的干预倾向,β在1的领域内取值,β>1为虚报干预程度,β=1为不干预,β<1为瞒报干预程度。(6)v为地方官员干预基本单位的收益系数,也即基本单位每上报一单位的虚假数据地方官员所获得的经济或行政收益。(7)m为地方官员干预基本单位的支付系数,也是一种激励系数,当基本单位上报倾向与地方官员干预倾向一致时,体现为地方官员对基本单位的一种经济支付;当基本单位上报倾向与地方官员干预倾向不一致时,其体现为地方官员对基本单位的一种经济处罚。(8)k为基本单位的基层统计数据上报倾向,k在1的领域内取值,k>1为虚报,k=1为实报,k<1为瞒报。(9)t为基本单位综合税率。(10)λ为基本单位报假被统计机构查处时的统计处罚系数,是指每上报一单位的虚假数据的经济处罚额。如果假设F为处罚总额,则:λ=F(k-1)Q(1)上式表明,当k-1>0时,λ应取正值;当k-1<0时,λ应取负值。λ与(k-1)Q相组合可以构成统计机构检查时基本单位报假的总成本:Cf=λ(k-1)Q(11)N为基本单位统计数据上报次数。(12)P为统计机构统计执法检查概率,也即统计执法检查次数与基本单位统计数据上报次数的比值。如果假设统计检查次数为n、基本单位上报次数为N,则:p=nN。(13)c为统计机构单位检查概率统计执法检查查实成本系数,也即:c=CspQ(2)其中,Cs为统计执法总费用,Cs=pcQ。
3.2收益函数的建立在对相关符号进行定义的基础上,依据各利益主体的成本收益分析,可建立各利益主体的收益函数。
3.2.1官员的收益函数。从地方官员理性出发,地方官员干预基本单位基层统计数据的上报行为,是基于其收益最大化的。而这种收益通常指的是一种净收益,也即总收益与总成本的差额。如此,根据相关背景假设,我们可以将官员的收益函数定义如下:πg=ν(k-1)Q-(β-1)m(k-1)Q(3)其中:(k-1)Q为基本单位在地方官员的干预之下,实际虚报、瞒报或实报的结果,ν(k-1)Q则为这种干预给官员所带来的总收益,当基本单位选择虚报时,其数值为正,表现为一种收益;当基本单位选择瞒报时,其数值为负,负值表现为一种损失;当基本单位选择实报时,其数值为零。(β-1)m为地方官员干预基本单位上报符合自身要求的基层数据时,对基本单位的经济补偿支付系数,也即地方官员的单位干预成本,(β-1)m(k-1)Q为地方官员对基本单位的干预总成本,当地方官员的干预行为与基本单位的上报倾向一致时,其取正值;当不一致时,其取负值,负值表现为一种收益。
3.2.2基本单位的收益函数。基本单位关于基层统计数据上报行为的选择,也是基于其成本收益分析的。其中,基本单位上报虚假数据的收益主要来自于地方官员的政策激励和税收节约,成本主要来自于统计机构的统计执法处罚。通常,考虑到地方官员的激励和税收的上缴情况,在统计机构不进行统计执法检查的情况下,基本单位的收益为地方官员的激励与税收上缴情况的权衡。也即:πf1=[(β-1)m-t](k-1)Q其中:(β-1)m-t为基本单位在考虑地方官员干预行为和税收缴纳的情况下,单位报假净收益,在虚报的情况下,去取决于地方官员虚报激励系数与由此而带来的税收上缴之间的差额,其差额为正,基本单位选择虚报,差额为负选择瞒报。在统计机构进行统计执法检查的情况下,基本单位的收益为地方官员的激励与税收上缴及被统计机构查处罚款之间的权衡。也即πf2=[(β-1)m-t](k-1)Q-λ(k-1)Q其中,λ(k-1)Q为基本单位在统计执法检查被查处时的罚款总额。考虑到统计机构的统计执法检查带有一定的随机性,也即统计机构的统计执法所采用的是混合战略,所以,基本单位的收益通常也是带有不确定性的,为此,其收益函数往往是一个期望收益函数。从而,在假设统计执法检查概率等于基本单位被查处概率的情况下,我们可以将基本单位的期望收益函数定义如下:πf=(1-p)πf1+πf2?????=(1-p)[(β-1)m-t](k-1)Q+p{[(β-1)m-t](k-1)Q-λ(k-1)Q}(4)对式(4)进行整理可得:πf=[(β-1)m-t](k-1)Q-pλ(k-1)Q(5)我们称式(5)为基本单位上报倾向期望收益函数。由该函数可知,当基本单位选择报真时,k=1,πf为零;当基本单位选择虚报或瞒报时,其是一个不确定的值。
3.2.3统计机构的收益函数。单纯从其收益来讲,统计机构的收益来自于统计执法检查的经济处罚,虽然这种经济处罚应该上缴国家财政,但我们也可暂且把它看成统计机构的收入,以此相对应的则是统计执法检查费用的支付,它可构成统计执法检查的成本。基于此,在统计部门检查的情况下,如果基本单位报假,其净收益为处罚收益与检查成本之差,如果基本单位报真,其净收益为检查成本,是一个负值。在统计部门不进行检查时,无论基本单位报真还是报假,其均无任何收益。这样,如果假设统计执法检查概率为p,则在基本单位报假在统计执法检查中的被查处率为100%的情况下,我们可将统计机构的期望收益函数可以定义如下:πs=p[λ(k-1)Q-pcQ]+(1-p)0(6)其中:λ(k-1)Q为统计执法检查总收益,pcQ为统计执法检查总成本。对式(6)进行整理可得:πs=pλ(k-1)Q-p2cQ(7)我们称式(7)为统计机构收益函数。式(7)表明,当统计机构不检查时p=0,πs=0。当统计机构检查时,如果基本单位上报的是虚假统计数据,则统计机构存在πs=pλ(k-1)-p2Nc的收益;如果基本单位上报的是真实统计数据,则统计机构的收益为πs=-p2Nc。也即存在着一种负的收益。
3.3模型体系的构建根据国家统计数据质量博弈机理与路径,以及动态博弈纳什均衡的求解思路,国家统计数据质量管理博弈模型体系及纳什均衡的求解,我们将从统计机构的理性行为分析入手。
3.3.1统计机构最优战略的确定。从统计机构的收益最大化出发,统计机构的最优战略将存在于其收益最大化取值的一阶条件之中。所以,我们对式(7)求解关于统计执法概率的一阶偏导数可得:?πs?p=λ(k-1)Q-2pcQ(8)令式(8)为零并进行整理可得:p=λ(k-1)2c(9)我们称式(9)为统计机构的最优战略或反应函数。式(9)表明,最优的统计机构统计执法检查概率与统计机构的处罚收益成正比,与统计执法检查成本成反比。在统计执法收益不变的情况下,统计执法成本越大,统计执法检查概率越小;统计执法成本越小,统计执法概率越大。在统计执法成本不变的情况下,统计执法收益越大,统计执法概率越大;统计执法收益越小,统计执法概率越小。
3.3.2基本单位最优战略的求取。在观测到地方官员的行动并准确地预计到统计机构将以一个什么水平的概率进行统计执法检查后,基本单位将依据自身收益最大化的原则来确定自己的最优战略。首先,我们将式(9)带入式(5)可得:πf=[(β-1)m-t](k-1)Q-λ2(k-1)22cQ(10)对式(10)求关于k的一阶偏导数可得:?πf?k=[(β-1)m-t]Q-λ2(k-1)cQ(11)令式(11)为零,并进行整理可得:k=1+c[(β-1)m-t]λ2(12)我们称式(12)为基本单位的最优战略。式(12)表明,基本单位的上报倾向,决定于(β-1)m-t。如果(β-1)m>t,基本单位倾向于虚报;如果(β-1)m<t,基本单位倾向于瞒报;如果(β-1)m=t,基本单位倾向于实报。
3.3.3地方官员的最优战略的确定地方官员的最优战略也是在准确地就预计到基本单位的行动后,依据自身收益最大化的原则来确定的。所以,我们首先将式(12)带入式(3)可得:πg=νc(β-1)m-νctλ2Q-cm2(β-1)2-cmt(β-1)λ2Q(13)对式(13)求取β的一阶偏导数可得:?πg?β=νcm+cmtλ2Q-2cm2(β-1)λ2Q(14)令式(14)等于零并进行整理可得:β=1+ν+t2m(15)我们称式(15)为地方官员的最优干预倾向。式(15)表明,地方官员对基本单位的干预倾向为虚报性干预,其干预力度取决于收益与成本的权衡。在基本单位上缴税收综合税率一定的情况下,收益系数越大,干预力度越大,支付系数越大,干预力度越小。
3.3.4纳什均衡的求解。将式(15)带入式(12)可得:k=1+c(ν-t)2λ2(16)将式(16)在带入式(9)可得:p=ν-t4λ(17)我们称式(16)为基本单位的最优行动,式(17)为统计机构的最优行动。式(16)、式(17)与式(15)相组合,可以构成国家统计数据质量博弈的纳什均衡。如式(18)所示:{β=1+ν+t2m,k=1+c(ν-t)2λ2,p=ν-t4λ}(18)式(18)表明:地方官员对基本单位的干预倾向为虚报性干预,其干预力度取决于收益与成本的权衡。基本单位的上报倾向具有不确定性,当地方官员的收益系数大于基本单位上缴税收综合税率时,基本单位倾向于虚报;当地方官员的收益系数小于基本单位上缴税收综合税率时,基本单位倾向于瞒报;当地方官员的收益系数等于基本单位上缴税收综合税率时,基本单位倾向于实报。统计机构统计执法检查的概率决定于地方官员的收益系数与基本单位上缴税收综合税率的差额和统计处罚系数所形成的比率,当地方官员的收益系数与基本单位上缴税收综合税率的差额为正时,我们要重点查处虚报现象;当地方官员的收益系数与基本单位上缴税收综合税率的差额为负时,我们应重点查处瞒报现象。
4国家统计数据质量管理的博弈机制设计
如果假设统计处罚只针对基本单位、不涉及地方官员;统计处罚系数是一个激励合同;基本单位的个人理性约束和激励相容约束可以进行整合,则在上述符号定义下,依据委托理论,可对国家统计数据质量管理博弈机制也即最优处罚系数进行设计。
4.1统计机构和基本单位反应函数的引入为了构建国家统计数据质量管理委托模型,我们首先引入统计机构和基本单位的反应函数。统计机构的反应函数:p=λ(k-1)2c(19)基本单位的反应函数:k=1+c[(β-1)m-t]λ2(20)。
4.2委托模型的构建根据委托分析的基本原理,委托模型设计的基本目的在于寻求一个既能使委托人的收益达到最大,又对人具有激励作用的最优合同。通过上述分析,我们可以看出,λ作为一个激励合同,满足式(19)的λ,能够使统计机构的收益达到最大化,满足式(20)的λ,可以对基本单位产生激励作用,能够同时满足式(19)和式(20)的λ,就是一个最优合同。所以,将式(19)和式(20)联立,即可构建国家统计数据质量管理委托模型。如式(21)所示。p=λ(k-1)2ck=1+c[(β-1)m-t]λ2(21).
4.3最优统计处罚系数的求解对式(21)进行整理可得:k-1=2cpλ(22)k-1=c[(β-1)m-t]λ2(23)将式(23)带入到式(22)可得:2cpλ=c[(β-1)m-t]λ2(24)对式(24)进行整理可得:λ=(β-1)m-t2p(25)式(25)即为统计机构统计处罚系数测算模型。
4.4模型内涵分析由式(25)我们可以看出,统计处罚系数具有如下政策内涵:(1)在统计执法检查概率降低的情况下,统计机构应提高处罚力度。式(25)表明,λ与p成反比,p反映了统计执法检查的概率或频率,所以,在统计执法成本上升而导致统计执法检查频率下降的情况下,统计机构应加大统计处罚力度,并借此来弥补统计执法检查频率的不足。(2)在基本单位单位违法收益提高的情况下,统计机构应加大统计处罚力度。式(25)还表明,λ与(β-1)m-t成正比。其中,(β-1)m-t为基本单位虚报瞒报数据的收益。为此,可以认为统计处罚系数与基本单位单位违法收益成正比。这样,在基本单位单位违法收益提高的情况下,应该提高统计执法处罚力度;在基本单位单位违法收益下降的情况下,应该降低统计执法处罚力度。当然,由基本单位单位违法收益我们还可以看出,基本单位的单位违法收益取决于地方官员的干预力度与综合税率之差。该差额越大,基本单位的单位违法收益越大,该差额越小,基本单位的单位违法收益越小。所以,当地方官员的干预力度加大时,统计机构也应该加大统计处罚力度,在地方官员干预力度减小时,统计机构可以适当减小统计处罚力度。(3)统计处罚系数可能存在正负两个值,其所表明的是对不同报假倾向的处罚。式(25)表明,统计处罚系数的测算,存在着正负两个值。其中正值对应的是基本单位虚报的处罚系数;负值对应的是基本单位瞒报的处罚系数。这种取值也保证了基本单位收益函数的成本项,在基本单位采取虚报行动时,统计执法处罚构成了其违法成本;在基本单位采取瞒报行动时,统计执法处罚仍构成了其违法成本。
5实证研究
5.1背景资料与数据的获取为了说明本文所构建模型的可操作性,我们的实证研究工作将基于河北省的区域范围,并就此而获取了相关背景资料与数据如下:(1)财政部、国家税务总局关于固定资产投资税收抵免相关政策。(2)中华人民共和国统计法第四十一条规定《统计法》相关处罚规定。(3)某省2011、2012年相关统计数据,如表1所示。
5.2相关指标统计数据的整理(1)地方官员干预收益系数v指标数据的整理依据表1计算如下:ν=DyDi=17285.60-16059.8212311.85-8866.56=1225.783445.29=0.36也即本实证分析中的地方官员干预收益为0.36。(2)地方官员干预支付系数m指标数据的整理根据财政部、国家税务总局关于固定资产投资税收抵免相关政策,我们假设地方官员干预支付系数m为10%。(3)基本单位综合税率t指标数据的整理依据表1,我们计算某省基本单位综合税率如下:t=947.59+1067.1216059.82+17285.60=2014.7133345.42=0.06也即本实证分析的基本单位综合税率为0.06。(4)统计报假处罚系数λ指标数据的整理根据中华人民共和国统计法第四十一条第二款和中华人民共和国统计计法实施细则三十二条第一款的规定,如果认定虚报瞒报率达到100%的为情节极为严重者,并执行20万元的罚款,则每1%的虚报瞒报率的处罚额度将达到0.2万元。据此,我们认为统计报假处罚系数为0.2。(5)统计执法成本系数c统计执罚成本系数的测算,我们将在统计执法收益等于统计执法成本的基础上,来进行。首先,我们利用某省统计执法检查典型案例材料,整理汇总成表2。然后,我们以单位虚报瞒报率处罚额度为0.2,推算出各单位应交处罚额。在此基础上,我们来测算统计执法成本系数:c=统计执法检查总费用统计执法检查概率′统计数据实际值=46.480.33′9975.35=46.483291.87?=0.0141也即在统计执法检查中,平均每次统计执法检查的单位查实成本为0.0141。
5.3存在地方官员干预的国家统计数据质量的博弈机制分析根据上述研究结论,在存在地方官员干预的情况下,国家统计数据质量管理博弈的纳什均衡为:{β=1+ν+t2m,k=1+c(ν-t)2λ2,p=ν-t4λ}据此,我们可以求解地方政府、基本单位和统计机构的最优战略:β=1+ν+t2m=1+0.36+0.062′0.1?=2.1k=1+c(ν-t)2λ2?=1+0.0141′(0.36-0.06)2′0.22?=1+0.004230.08?=1.053p=ν-t4λ?=0.36-0.064′0.2?=0.375也即:{β=2.1,k=1.053,p=0.375}(26)式(26)为地方官员、基本单位、统计机构的最优战略组合。其说明,在地方官员虚报干预且干预力度为2.1的情况下,基本单位具有虚报倾向,但受到统计机构统计执法处罚的威慑,其只能将虚报倾向确定为1.053,也即存在5.3%的虚报份额。在此背景下,统计机构最优的行动是以37.5%的概率进行统计执法检查。
5.4不存在地方官员干预的国家统计数据质量管理的博弈机制分析在不存在地方官员干预的情况下,国家统计数据质量管理博弈纳什均衡中的地方官员干预收益系数v和地方官员干预支付系数m将等于零,这样,地方官员不干预背景下的国家统计数据质量管理博弈纳什均衡将转化为:{β=1,k=1+c(ν-t)2λ2,p=ν-t4λ}如此,依据上一节中的数据我们可以求取基本单位、统计机构的最有战略组合:k=1-ct2λ2?=1-0.0141′0.062′0.22?=1-0.0008460.08?=1-0.0106?=0.9894p=t4λ?=0.064′0.2?=0.075也即{β=1,k=0.9894,p=0.075}式(27)为地方官员、基本单位、统计机构的最优战略组合。其说明,在地方官员不进行干预的情况下,为了逃避纳税,基本单位存在着瞒报统计数据的倾向,但限于统计执法检查的威慑,其瞒报程度只能达到1.06%。在此情况下,统计机构的最优行动是以7.5%的概率来进行统计执法检查。
5.5最优统计处罚系数的测算根据上述数据,我们可以对统计机构统计处罚系数进行测算。在存在地方官员干预且干预力度为的m=0.1的情况下,如果t=0.06、p=0.33,则将最优的统计处罚数为:λ=(β-1)m-t2p?=(2.1-1)′0.1-0.062′0.33?=0.075(28)式(28)表明,在存在地方官员干预时,基本单位存在虚报现象,如果地方官员的干预力度为0.1、综合税率为0.06、统计执法检查概率为0.33时,统计机构的最优处罚力度为0.075。也即每1%的虚报率罚款0.075万元。如果不考虑地方官员的干预倾向,也即m=0时:λ=-t2p?=-0.062′0.33?=-0.091(29)式(29)表明,在不存在地方官员干预时,基本单位存在瞒报现象,如果综合税率为0.06、统计执法检查概率为0.33,统计机构的最优处罚系数为0.091。也即每1%的瞒报率,处以0.091的罚款。
6结论与建议
本文的上述研究,得到了如下结论与建议:(1)源头数据是当前国家统计数据质量管理的重点“联网直报”方式下的统计数据生成路径表明,伴随着基本单位名录库、企业“一套表”制度、数据采集处理软件系统和联网直报等“四大工程”的建设,我国国家统计数据的生成流程正在发生一种质的变革,在这种变革中,统计数据传输流程中的统计误差,可以得到有效的控制。从而,“四大工程”全面推开后,我国国家统计数据质量管理的重点,将推移到源头数据。(2)源头数据质量问题源自于地方官员、基本单位以及统计机构利益的权衡对源头统计数据的生产过程所进行的分析表明:在源头数据的生产过程中,存在着地方官员、基本单位和统计机构等三个利益主体,同一质量的数据对三个不同的利益主体会产生不同的利益,为了自身的利益最大化,三个利益主体都在追求着不同的统计数据质量,从而伴随着地方官员、基本单位以及统计机构利益的权衡,也就产生了国家统计数据质量管理的博弈。(3)基本单位是国家统计数据质量管理博弈的核心在国家统计数据质量管理博弈中,基本单位的利益受到来自地方官员和统计机构正反两个方面力量的冲击。从自身利益出发,基本单位本身具有瞒报倾向,但地方官员从自身利益出发却引诱其虚报,统计机构从自身职责出发,又以法律为准绳督促其实报。从而将基本单位推入到了三难境地,以基本单位上报倾向选择为核心,构成了国家统计数据质量管理的三方博弈。(4)地方官员的干预具有正反两个方面的作用在国家统计数据质量博弈中,地方官员的干预行为具有正反两方面的作用,正面作用在于其可以促使基本单位实报,反面作用是可以导致基本单位虚报。因为基本单位通常都具有瞒报的倾向,地方官员通常都具有虚报倾向。在地方官员的干预下,如果地方官员的干预力度恰好与基本单位的瞒报倾向相等,则会促使基本单位实报,如果地方官员干预力度大于基本单位的瞒报倾向,基本单位将转瞒报为虚报。(5)统计处罚系数应具有激励作用,可以基于委托论来测算在统计执法检查过程中,统计处罚不是目的,而是手段,其应具有促使基本单位按照统计机构的意愿来选择上报倾向的激励作用。为此,统计处罚系数的测算可以在委托理论的指导下来完成。在委托理论指导进行统计处罚系数测算时,相关目标函数与约束条件的设计要充分考虑动态博弈的特点,并可基于该特点将个人理性约束条件和激励相容约束条件加以整合。(6)作为统计监督检查的工具与手段,统计处罚力度与统计检查频率具有相辅相成的关系统计执法检查加之统计执法处罚为统计机构维护自身利益的两大手段。最优统计处罚系数测算模型表明,统计执法处罚力度与统计执法检查概率存在着反向关系,加大统计执法力度,可以提高统计执法检查的威慑力度,因而可以降低统计执法检查频率;减低统计处罚力度,会减降统计执法检查的威慑力度,所以要提高统计执法检查的频率。因此,统计执法处罚力度与统计执法检查频率具有相辅相成的关系。
作者:张玲芝 单位:河北经贸大学经济管理学院
论文摘要:随着社会主义市场经济的不断发展,统计失实的的现象日渐严重,统计工作者应当本着对本职工作高度负责的精神,进行全过程的、全员参加的、以预防为主的统计数据质量控制。要尽可能采用计算机处理统计资料,最大限度的减少人工参与,加强对统计人员的职业道德和专业水平培训以及加大统计执法力度等,以保证源头数据的准确性,使我们的统计工作更好的地为现代社会经济服务。
现代经济正步入以世界统一市场为标志的世界经济一体化轨道,企业的成败,取决于信息获取、识别、处理、转换、传递的准确性、效率与速度。因此,信息在企业经营管理中的重要作用也将愈来愈显著。随着我国改革开放,确立市场经济体制,和加入WTO,企业要能在国际国内激烈的市场竞争中求得生存与此同时发展,一个重要的条件就是——必须要有一个健全的高效的信息系统,以满足企业经营管理决策所需的各种内外信息。因此,作为提供信息的企业统计必将在其中扮演重要角色,发挥重要作用。特别是对我们***系统来说,随着“大企业、大市场、大品牌”的形成,以行政区划为单一的卷烟市场割据将很快被打破,搬掉门槛推倒墙是大势所趋。再下一步就有可能是***专卖法的取消,所有这些都告诉我们,***行业也将马上面临着国际国内激烈的市场竞争。想在这种激烈的竞争中生存发展,必须要有一支能够为企业的决策和管理者提供准确数据的素质过硬的统计队伍。
近年来,我国统计工作取得了比较显著的成绩。从总体上来看,我国现有的统计数据,基本上还是能够反映客观实际的。但是,随着社会主义市场经济的不断发展,经济结构复杂化,利益主体多元化,再加上体制转化过程中经济秩序混乱,人为干扰增多,因而搞准统计数据的难度也就日益增大,统计失实的潜在危险性也就日渐严重,并将逐步暴露。对此,我们必须要有清醒的认识,要始终不渝地把提高统计数据质量问题,摆到统计工作的首要位置,并采取综合治理措施,切实抓紧抓好。下面就统计数据质量问题谈谈自己一些粗浅的看法。
一、统计数据质量控制的意义
企业统计的目的是为企业经营决策管理提供统计信息。在市场经济条件下,企业经营决策极具风险性,风险产生于不确定性并由不确定性程度决定风险的大小,而不确定性又与信息的准确和及时程度直接相关,信息愈准确及时,不确定性愈低,反之,亦然。所以,准确性和及时性是对统计资料的两项基本要求。其中,准确性的要求是第一位的,是统计工作的生命。它确定着统计资料是否有效和价值的高低,是衡量统计数据质量的根本标志。准确可靠的统计数据,便于决策和管理者正确地把握形势,客观地剖析问题,从而作出科学的决策。反之,有水分的、失实的统计数据,相互矛盾的统计数据,给决策者以错误的信号,将会误导决策和调控,对企业的发展将会造成重大损失。因此,统计工作者必须以对本职工作高度负责的精神,以统计数据为对象,以消除统计数据的差错为目标,千方百计搞准统计数据,达到强化统计数据质量控制的目的。
二、常见的统计数据质量问题及分析
(一)、数据虚假
这是最常见的统计数据质量问题,也是危害最为严重的数据质量问题。这类统计数据完全是虚构的杜撰的,毫无事实根据。造成统计数据虚假的因素多种多样,比如,有意虚报,瞒报统计数据资料,指标制定不严密,统计制度不完善,不配套等。
(二)、拼凑的数据
这种数据是把不同地点,不同条件,不同性质的数据在收集、加工、传递过程中,人为地拼凑成同一时间、地点、条件和性质下的同一数据。这种东拼西凑的数据,虽然分别有事实根据,但是从整体上看数据是不符合事实的,其性质与数据虚构相同。
(三)、指标数值背离指标原意
这是由于对指标的理解不准确,或者是因为指标含义模糊,指标计算的随意性大等原因造成的数据质量问题,表现为收集整理的统计数据不是所要求的统计内容,数据与指标原意出现走样,面目全非。
(四)、数据的逻辑性错误
这是指统计资料的排列不合逻辑,各个数据、项目之间相互矛盾。例如,企业卷烟库存商品中主要的组成部分是省产烟、省外烟、国外烟,如果企业报送的统计资料中,卷烟库存商品总金额显著下降,而省产烟库存金额大幅度上升,省外烟和国外烟库存金额只是持平或只有小幅度的下降,这就存在矛盾,表明数据有逻辑性错误。
(五)、数据的非同一性
它是指同一个指标在不同时期的统计范围、口径、内容、方法、单位和价格上有差别而造成的数据的不可比性。例如,2003年的统计资料中不含税价在30元以上的卷烟为一类卷烟,而在2004年的统计资料中,不含税价50元以上的卷烟为一类卷烟,如果在此基础上来比较两年的一类卷烟的销售量,而得出一类卷烟销售量大幅度下降的结论显然是不合理的。
(六)、数据不完整
这里指调查单位出现遗漏,所列项目的资料没有搜集齐全,不符合统计资料完整性的要求。数据不完整,就不可能反映研究对象的全貌和正确认识现象总体特征,最终也就难以对现象变化的规律性做出明确的判断,甚至会得出错误的结论。
(七)、统计手段和统计分析落后
目前许多企业统计工作仍处于手工状态,很原始!即使采用计算机也仅仅是减少工作量去做一些汇总、指标计算,并没真正引用先进的计算机技术和网络技术。所做的统计分析也局限于事后分析,即对统计数据进行单纯的讲解说明;不能利用网络技术实行信息共享等方式进行事前分析和预测。换句话说,“统计预测”这一职能根本没有发挥作用,缺乏对信息的收集、综合和系统化。
此外,常见的统计数据问题还有计算错误、笔误等。
可见,统计数据质量问题既可能是来自于设计阶段,也可能是来自于统计资料的整理阶段。
三、统计数据质量控制方法
(一)、统计数据质量控制的原则应当是全过程的、全员参加的、以预防为主的数据质量控制。
首先,统计数据质量控制要贯穿于统计工作的全过程。每进行一步,都要对已完成的工作进行检查、对已发生的差错及时进行纠正,做到层层把关,防止差错流入下一个工作环节,以保证统计数据的质量。其次,参加统计数据质量管理和控制的人员应当是全面的。全体统计工作者都要树立数据质量意识,各个主要的工作环节都要落实专人负责。统计数据质量的好坏,是许多工作和许多统计工作环节质量的综合反映,牵涉到统计工作的所有部门和人员,因此,提高数据质量需要依靠所有统计工作者的共同努力,决不是单纯靠某一个部门或少数人所能搞得好、抓得了的。只有人人关心数据质量,大家都对数据质量高度负责,产生优质的统计数据才有坚实的群众基础。因而,统计数据质量控制要求把差错消灭在它的形成过程中,做到防检结合,以防为主。这就要求有关人员在质量控制中具有超前意识,抛弃那种出现了统计数据问题才想办法解决问题的被动的局面。
实行全员性的质量控制,就要把统计数据质量目标及其关键交给广大统计工作者,落实到每个工作岗位,使每个岗位都有明确的工作质量标准,做到合理分工、职责明确,职责越明确,数据质量控制就越有保证。
(二)、统计设计阶段的质量控制
统计设计是统计工作的首要环节,统计数据质量的好坏,首先决定于这个过程,它是提高统计数据质量的前提。如果设计过程的工作质量不好,就会给统计数据质量留下许多后遗症。设计过程的质量控制需要抓好以下几项工作:
1、正确规定统计数据质量标准。数据质量标准是指根据不同的统计目的对统计数据精度所提出的要求。满足统计目的精度的统计数据就是准确的,高质量的统计数据。首先要作充分的调查,系统地收集市场和用户对统计数据的反映和实际使用效果的情况;其次要分析研究过去统计数据的主要质量问题,找准统计数据质量控制的主攻方向;最后要进行反复论证,考虑到统计工作中实际能够达到的水平。
2、合理设计统计指标体系及其计算方法。
统计指标设计得是否合理,也是影响统计数据质量的因素之一。采用统计报表搜集资料,首先要实行标准化管理,制定的指标要符合统计制度的规定,范围要全,分组要准,指标涵义的解释和计算方法要精确;其次要对统计报表的设计、颁发、填制、汇总的全过程实行全面质量管理。
(三)、资料整理鉴别阶段的质量控制
统计资料整理鉴别阶段出现的差错是统计数据质量问题的重要方面。如果资料不准确,就会影响结论的正确。因此,要特别注意审查资料的可靠性和适用性,要弄清楚统计指标的口径范围、计算方法和时期时点。对于口径不一致或不完整的资料,需要进行调整、补充;对于相互比较的资料,必须要注意有无可比性;一旦发现数据有严重的质量问题,应进行核实,避免有质量问题的资料进入汇总处理阶段。总之,对搜集到的资料,经过鉴别推敲、核实审定、使之准确无误,才能使统计数据的质量得到保证。
(四)、人为错误的质量控制
1、尽可能采用计算机处理统计资料,同时提高统计分析水平。
计算机作为当今社会不可缺少的高科技产物已渗透到我们生活、工作中的各个环节。运用计算机整理、汇总统计资料,速度快、效果好,其优越性是手工整理无可比拟的。现在国内大部分著名企业基本上实行网络化、全球化,利用网络资源了解世界先进行业信息,采用科学先进的统计分析方法和手段,进行横向、纵向对比,找差距挖潜力,努力赶超世界先进企业。要能够写出有一定深度的统计分析预测报告,系统、全面、科学地去挖掘利用网络资源和从市场取得的第一手资料,完善整个分析、预测手段方法和过程。但是,也应重视计算机处理数据的质量问题,提高计算机数据处理的关键在于提高录入数据的可靠性。
2、统计工作者本身应提高自身素质。
统计人员没有深厚的专业知识和丰富的实际工作经验,没有跟上时代及时进行知识更新,不善于统计调查获取第一手资料,写不出有一定深度关于本企业某一方面对决策层有参考价值的统计分析报告。因此,对统计人员应该加强培训工作,企业内部应建立配套的培训机制,对每一层次统计岗位实施针对性的培训,必要时到企业外请有关专家学者授课,或到相关先进单位进行考察学习,做到取长补短。统计工作者本身也应该努力学习统计知识,钻研业务,不断提高统计业务素质和水平,杜绝因业务不熟悉而造成的数据质量问题。
3、加强对统计人员的职业道德培训。
目前,上级部门下达计划和各类政绩考核对统计数据干扰不可低估。有些地方,以是否完成计划和各类数据的高低作为考核地方政绩的依据,导致很多下级部门所报的统计数据高于计划数或持平,这并不是计划部门的计划多么精确合理,而是说明某些统计对象或统计部门受某种利益的驱动而使统计数据的质量得不到保障。当然,数据不真实、不准确的原因是多方面的,其中统计人员的思想道德对统计数据的影响是很大的。这就要求我们加强对统计人员的思想品德和职业道德教育,要求每一个统计工作者必须坚持实事求是的工作作风,认真对待每一个统计数据,如实地反映情况。
4、加大统计执法力度,保证源头数据的准确性。
统计部门今后应在加强统计信息工程建设的基础上从数据采集的圈子中跳出来,重点加大统计执法检查,对弄虚作假的单位要坚决严肃查处。在立法上,罚款数额应该大幅增加,以威慑统计违法者,逐步建立全社会的统计诚信体系。
以上是本人对统计数据质量控制的一点肤浅的认识,旨在唤起统计部门和广大统计工作者更加重视统计数据的质量,抵制统计上弄虚作假的行为,提高统计数据的质量水平,使我们的统计工作能更好的地为现代社会经济服务。
【摘要】我国政府于2002年4月15日正式加入了数据公布通用系统。统计虽然“入世”了,但不论是与社会各界对统计信息的需求相比,还是对统计核算和统计数据公布的国际准则的运作要求相比,我国的统计数据质量目前都还有一定差距。为了更好地满足社会经济发展过程中社会各界对统计数据的需求,使我国统计进一步与国际接轨,有必要对我国统计数据质量管理进行研究。
【关键词】统计数据;质量问题;国家统计局
统计数据质量问题是衡量统计工作的核心指标。尤其是我国加入WTO,与世界经济接轨的今天,社会各界对统计信息的需求量越来越大,对统计信息质量的要求也越来越高。统计信息质量的高低直接影响和决定着统计信息的可利用性。统计数据质量低下将会直接导致错误的决策。因此,努力提高统计数据的质量,实现统计信息的准确、有效、全面、有着重要的意义。
一、统计数据质量的含义
传统的统计数据质量仅仅指其准确性,通常用统计估计中的误差来衡量。但如今“质量”的概念被拓宽了,“统计数据质量”的概念也有必要拓宽。目前各国统计机构和有关国际组织对统计数据质量含义的解释和理解仍存在一定的分歧,对统计数据质量应涵盖哪几个方面,还没有统一的标准。各国从本国的实际情况以及对数据质量含义的理解出发,确定了不同的数据质量标准。如英国政府统计数据质量标准是准确性、时效性、有效性、客观性;韩国的质量标准则是适用性、准确性、时效性、可索取性、可比性、有效性。在我国,统计数据质量主要包括统计数据的核心质量、形式质量及延伸质量三大方面。
二、我国统计数据质量管理现状及存在问题
改革开放以来,我国统计人员大胆探索,辛勤实践,在指标体系、调查方法、统计标准、技术手段、数据报送与处理方式等方面进行改革,较好地满足了社会各界对统计信息的需求,推动了统计事业的发展。但是,浮夸风以及片面追求假、大、空现象仍然存在,这些都违背了统计工作的基本要求,阻碍了统计工作的发展。目前我国统计数据质量管理上存在的问题主要有:
1.统计数据失真。统计制度不够完善是造成统计数据失真的内在因素,表现在:统计部门内部各专业在统计方法、指标涵义、口径上还存在一定程度上的不统一;专业间统计方法改革不同步;统计范围、口径的理论值与实际值出入有时还比较大;统计与财会在核算周期上还存在一些差异,并且在统计数据质量管理上各级统计管理部门在统计执法过程中力度不够,对统计过程缺少制约与监督,对统计数据缺乏校验与复查的有力措施。
2.设计时需求不明确,缺乏远见。数据库与文件管理系统的重要区别之一在于不仅存放数据,而且存放数据之间的相关性。相关性不仅表现在数据依存的时间、地点、类型和名称等原始属性上,还会在数据的转移过程中产生再生的相关性。搜集数据阶段使用的方法不正确,应用需求不明确等都会影响数据完整性和准确性。
3.数据处理手段发展不平衡。数据处理手段出现从基层的手工操作到省、国家一级政府统计数据处理的高度信息化。就地域而言,占全国70%以上的地方统计数据处理是手工操作或半手工操作,速度慢、效率底,可靠性差,这与统计的及时性要求不相符合。统计所反映的当前经济现象的真实性难以确定。
4.质量管理监督措施不够健全。由于多数检索系统没有进入实际应用阶段,数据质量的控制和监督往往被人们忽视。绝大多数单位在数据准备、录入阶段缺乏审核等质量控制、监督措施,著录标引的检查,一般采取自己审核或互相审核的方法。缺少科学的统计数据质量评估和监控造成统计数据不同层次脱离实际的偏差,给决策带来极大的不便。
5.统计人员队伍素质不高。基层统计工作薄弱,统计手段落后,统计人员素质比较低,基层统计队伍不稳定都影响了统计数据质量。
三、我国统计数据质量管理问题的原因分析
在目前我国统计数据质量管理中,以单项数据质量管理为主,缺乏综合的、全面的质量管理体系;对数据质量内涵的理解相对来说仍较为狭隘,在实践中主要围绕着数据准确性进行评估,对数据质量的其他方面重视不够;在评估过程中,没有让社会公众和用户充分参与进来,评估机制缺乏必要的透明和有效性,未能取得社会各界对数据资料的充分理解和认可;对于多种经济成分的数据质量评估方法不够明澈;缺乏明确的数据质量管理要求和目标。
从数据质量管理的角度来看,我国统计数据质量管理存在诸多问题的原因在于:
1.统计数据质量理论及其控制技术与政府统计实践脱节。各种统计数据质量控制技术在我国的实际统计工作中的研究和应用不多,对于经常性统计数据质量控制,实际上还主要是采用事后的分析评估和挤水分的方法,而事前的分类预防控制不多,建立误差模型进行分析的也不多,所应用的仅有的一些事后质量控制技术和统计数据质量管理的组织活动没有实现很好的结合,虽然指定了主要统计数据质量的评估方法,但具体方法的应用、由哪些部门负责以及这些部门的质量责任、职权和义务并不明确。
2.统计数据质量管理中的全面质量管理并不全面。全程性上,只重视调查环节,不重视统计设计环节对数据需求的研究,从而影响数据相关性、及时性的提高;全域性上,所实行并取得很大成功的统计数据全面质量管理的措施及经验,主要集中于几个专项的普查,应用范围较窄;全员性上,只重视统计系统内部的人员控制,而对统计系统外部的,占统计工作人员2/3的基层统计人员却无从控制。
3.缺乏明确的质量管理目标和统一的质量管理规范。对统计数据质量管理缺乏明确的质量方针和质量目标,缺乏相对统一的统计数据质量管理标准和规范,导致了统计数据质量的混乱。
4.控制措施与事后评估结果及发现的问题没有很好结合。统计是一项循环往复的过程,因此每一次新的修订统计设计都应反映出上一次数据质量评估的结论以及质量改进的要求。但是从公布实施的统计调查制度上看,事先的控制措施,如填表要求中的平衡关系,逻辑审核关系用于质量控制的设计内容较少。
四、提高我国统计数据质量管理的对策和建议
多年来,国家统计局一直把统计数据放在首要地位,通过不断努力与实践的,摸索出一套方法,即一靠科技,二靠法制,对统计数据实行全面质量管理。在此,结合专家学者对统计数据质量管理的研究,笔者提出一些自己的看法。
1.搞好统计调查方法的改革是提高统计数据质量的前提。国家统计局在《国家统计制度的总体方案》中提出了我国统计调查方法改革的长远目标,即“建立以必要的周期性普查为基础,以经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方案体系”指明了抽样调查作为新统计调查体系的主题,精简全面统计报表。要提高统计数据质量,必须推广抽样调查方法的应用,它避免了对总体单位的逐一调查和较多的中间环节,在较大程度上减少了各方面对统计数据在调查过程中的干扰,因而使得调查的数据较符合客观实际。它具有事先计算及控制抽样平均误差和便于对样本指标进行检查,避免调查工作中间环节的弄虚作假的特点。大大提高了统计数据的准确性和及时性。
2.强化统计基础工作是提高统计数据质量的保证。首先要搞好统计调查表的设计。企业综合统计部门应根据上级部门和本企业生产经营管理的需要,会同会计等部门统一设计企业内部套表,在设计中应体现新的国民经济核算体系,各指标之间应相互联系,相互配套,统计指标的涵义、范围、计算口径应一致。统计表的设计,统计分类标准和各种编码应当统一,以适应计算机整理、汇总、分析的需要。新的统计报表的采用,可以克服企业统计工作中存在的杂乱、重复、矛盾等弊端,也有利于报表的规范化、系统化,更有利于统计数据的准确性。其次,实现原始记录、统计台账的标准化。我们知道,原始记录是业务核算、会计核算、统计核算的共同基础,只有这样才能使三种核算结果相互衔接,口径一致,而要保证核算数字的准确性,要求核算的数字来源,都有真实的原始记录为依据。从原始记录开始一直到整理、场内报表及三种核算,数字来源通过逐级加工,都是有据可查的。只有这样核算,数字的准确性才有确切的保证。
3.加强统计法制法规建设是提高统计数据质量的法律保障。在企业统计工作中,主观随意性是影响统计数据质量的重要因素。领导者的法制观念和对统计数据质量的重视程度以及统计人员的综合素质,对统计数据质量有着直接的影响。只有具有强烈的事业心和责任感,具有高度的统计法制观念,具有基本的工艺技术知识和统计技能的统计人员,才具有做好统计工作的前提和基础。因此,要加强统计法制建设,健全统计法规,防止某些企业领导和统计人员对统计数据弄虚作假,要确定统计犯罪的界限,作出良性的具体规定,以强化统计法规的法律效力和约束力。应通过典型案件的查处和暴光宣传《统计法》,引起全社会的关注,提高社会公众的法制观念和执法自觉性,使《统计法》真正成为提高统计数据质量的法律保障。
4.提高统计人员的业务素质是提高统计数据质量的关键所在。统计数据质量与统计人员的业务素质和队伍稳定有直接的关系,企业统计人员是提高统计信息最基础、最原始数据的源泉,因此,为了提高统计人员的业务素质,必须搞好他们的上岗和在岗培训,要实行“统计员资格”考试制度,达到合格标准并取得上岗合格证方可上岗。要提高统计人员的统计分析能力,掌握多种使用统计分析方法,例如聚类分析法、判别分析法、回归分析法、相关分析法、主成分分析法等。其次还要提高统计人员对现代统计分析软件的应用能力做到“一专多能”。依靠科技手段快速提供高质量的统计数据。企业还应按规模大小、统计业务的难易程度,配备有一定统计职称的综合统计人员,以提高统计工作质量,保证统计数据的准确性。
5.用科学的统计分析方法对数据质量评估是提高统计数据质量的方法保证。首先,可运用抽样调查法推断总量指标的准确性,它是对全面报表、普查、重点调查的基层统计数据或汇总统计数据进行可靠性检验或误差判断的科学方法。其次,运用回归分析法检测统计数据的可信度。例如,在对汇总数据的评价中,可利用回归分析,发现矛盾,提高数据的可靠性,并可用计算机建立模型,对各类数据纵横比较,以确定其质量。另外,还可用主次因素排列分析图、因果分析图来分析各种统计数据质量。在多种经济成分的统计数据中,要寻求一种能够多因素同时考虑的方法,不能只局限与一些单一因素的评估方法。例如运用模糊评价法等。要加快成立相对独立的专门从事统计数据质量评估的社会终结组织结构,确保统计数据评估的独立性和公正性。
6.加大新的统计技术的应用是提高统计数据质量的必要途径。计算机技术不仅可以实现数据处理高速化、数据传输网络化、数据贮存资源化,从而降低统计数据在人工处理、传输、贮存等环节上的技术性误差和逻辑性差错,而且有利于从机制上形成强有力的统计质量管理体系,维护统计数据管理相对独立性并有效地遏止随意虚报、瞒报以及统计数据质量的其他腐败行为。
总之,提高统计数据质量是统计工作的永恒主题,要在明确什么是统计数据质量的基础上,抓住影响统计数据质量的关键,采取切实有效措施,最大限度地保证提高数据的质量,确保统计三大职能的发挥。
五、结语
统计信息是社会经济信息的主要组成部分,在社会经济生活中发挥着越来越重要的作用。作为其表现形式的统计数据的质量也受到越来越多人的关注。而目前我国的统计数据质量管理,不论是与社会各界的需求相比,还是与相关国际准则的运作要求相比,均存在一定差距。完善我国统计制度是一项长远的任务,这需要统计人员与社会各界的共同努力。
[摘要]统计工作的精准对我国国民经济发展的影响至关重要。准确、全面、及时、系统的统计数据,是各级党委政府在进行科学决策和管理,制定宏观调控措施,做出科学、合理、正确决策的必要依据。要确保统计信息的质量,必需重视基层,夯实基层,才能使整个国民经济保持协调、稳定、快速、健康发展。但是在实际的统计工作中却存在着这样那样的问题,文中分析了我国统计工作存在的不足及其原因,并针对这些缺陷提出了相应的对策。
[关键词]统计工作、数据误差原因、策略
一、目前我国统计工作现存的不足之处
领导的重视程度不够,或者说,一些领导干部在如何正确看待统计工作的问题上存在有一定的误区,从而出现了“拍脑袋、凑数字、瞎估计”的现象,统计工作,由于统计方法、手段等的不合理、不完善,造成了统计性误差的存在统计数据的真伪,由于缺乏有效的监管措施,在一定程度上,存在着人为地虚报或瞒报的成份。
二、存在于统计工作中的“数据误差”产生的主要原因
第一,行政部门领导干部的干预,领导干预对统计信息的准确性的影响非常大,多年以来,由于受到领导干部业绩考核指标的影响,许多基层干部出于无奈,不得不故意虚报统计数据,来为自己的“政绩”增光添彩。同时,其主管部门对此也处于无奈的窘境。第二,统计数据采集不准确。数据采集是统计数据的源头,力求统计信息准确就必须保证所采集的数据是真实的。现在的现状是:(1)报表人责任心不强,报表随意性大。(2)报表人员素质不高,对报表不理解。(3)很多的企业不重视统计,有的则是会计人员兼职。(4)某些地区、部门、行业,出于对自身利益的考虑,故意瞒报统计数据,以达到少缴、甚至不缴国家规定必须缴的一些规费、税金,从而导致了国家的相关规费、税费的大量流失。而这些地区、部门、行业,却因此而得到了大量的不当收益。第三,虽然我国的统计工作已经与国际接轨,但由于我国正在建设有中国特色的社会主义市场经济,现阶段仍处于发展中国家的阶段。统计工作中的统计方法、手段,还需要进一步的规范和完善。因此在数据采用及事理分析中,就容易产生错误,造成统计数据质量下降,影响统计工作。
三、针对我国目前统计工作中存在的“数据误差”应对的策略
1.加大对统计工作的宣传力度。力争使每一位统计参与者,特别是党政领导干部都要了解统计工作对我国国民经济建设起的巨大作用,努力提高他们对统计工作的正确认识,得到他们对统计工作的支持。开展统计法制教育,以法治统。通过多种多样的形式进行普及《统计法》的教育,从思想上提高他们对提高统计数据质量的认识,促使他们在实际工作中坚持原则,敢于同影响统计数字真实性的违法行为作斗争,真正做到以法治统。其次,还可对统计人员进行《统计法》的理论考试,让法深入人心,以便他们理直气壮地按法办事。再次,对大中专学校经济类专业应加设一门《统计法》基本知识课,以便学生将来走上统计工作岗位后能够依法办事,知法工作,把保证统计数据质量放在首要地位,为党政领导及企业管理和决策提供可靠的依据。
2.对目前干部考核中一些片面强调GDP增长的业绩考核制度进行改革。长期以来,统计工作中存在着“以数字论英雄”的局面,从而出现了“官出数字、数字出官”的怪现象。淡化统计数字的政绩观,建立科学的干部考核制度。这是走出“官出数字、数字出官”怪圈,让统计数据不受个人意志左右的治本之策。首先应当在调查研究的基础上,制定切实可行的考核目标,防止因考核目标不切实际而引发的虚报浮夸的歪风蔓延。其次,应完善干部实绩考核统计制度,将定量考核与定性考核有机结合起来,改进目标考核实绩的统计方法,确保目标考核实绩数据的准确性最后,应建立干部政绩公议制度,扩大干部政绩考核的民主。实施领导干部政绩公议制度可改变过去那种干部只“对上负责、不对下负责”的弊端,提高干部工作的公开化、民主化程度,不断增强干部政绩考核准确性。增强他们工作的责任感和为民服务意识。
3.完善统计工作中的统计考核指标体系,以及与此相适应的统计方法,从而在源头上来遏制问题产生的基本动因。必须对我国统计工作现状进行深入的分析,总结出统计工作中的行之有效的方法。在现实工作中,政府已经相应成立了国家统计局直属调查队,其隶属关系不在当地,因而可以免受许多人为因素的干扰,为我国宏观经济决策提供重要的参考依据。
4.努力提高我们统计从业工作者的自身素质。统计工作者自身素质的提高,是做好统计工作的首要的、基本的条件。试想,如果一个统计工作者对统计工作不太了解,统计手段落后,基层统计队伍不稳定,我国统计工作的质量的提高又从何谈起?
5.综合使用行政手段、法律手段和经济手段,提高统计违法成本。可以从以下三方面着手:一是对违法的统计工作人员除依法处理外,一律清除出统计队伍。二是对参与违法的领导,一经查实,必须依照有关法规从重从快处罚,决不手软,达到以儆效尤的目的。三是将处罚费用与统计违法行为责任人挂钩,从经济上处罚责任人。这样,就可以把行政手段、法律手段和经济手段有机结合起来进行综合处罚,让违法者得不偿失。
四、结论
统计工作必须还要强调“以人为本”,以人的全面发展来带动统计工作的正确发展并通过统计工作的正确发展,反过来推进人的全面发展。此外,充分运用现有的科技成果,使政府各职能部门数据共享,使得虚报、瞒报者无处藏身。与此同时,还可以利用网络资源,在查出虚报、瞒报的同时,去引起、带动职能部门对其进行专项调查,从而使统计工作能真正地服务于国家建设,同时服务于党风廉政建设,服务于人民的需要。但这是一个漫长的过程,需要一步一步地去努力。我相信统计工作在国家宏观调控和微观管理下,在广大统计工作者的努力下,其可靠性、真实性和权威性会逐步提高,统计数据失真的现象会得到有效的控制。统计工作会随着大家的共同努力会不断提高。
摘要:企业一套表的率先实施是经济发展新常态下国家统计局为做好统计数据工作而进行的制度改革与创新,很好的诠释了现代化统计的优越性和时效性。从新常态下的数据采集过程来看,其实践意义也是相当明显的,但新常态提出了诸多新要求,特别是三新统计,是时展的需要,应对新常态下复杂多变的经济环境,深化统计改革的新举措。现就现行体制下的统计数据采集在新常态下源头数据采集过程中所面临的一系列问题进行探讨,并提出相应的对策及建议。
关键词:新常态;统计数据采集;企业一套表
随着社会的发展,科学技术的突飞猛进,大数据、云计算、物联网的新时代随之到来,我国经济发展进入了新常态,传统的统计数据采集过程以纸介质填报,级级汇报,层层汇总模式,已不能适应新形势下统计发展需求,利用互联网改进统计数据采集过程已经成为现代统计发展的必然趋势。“互联网+统计”的数据采集模式实现了统计数据“质”与“量”的飞速跨越。
一、新常态下统计数据采集现状及实践意义
2008年以来,“企业一套表”改革从部分省市试点到全面实施,取得了重要的突破性成果。随着一套表的不断深入实施,现在大部分行业数据统计采集过程都已纳入了联网直报,是统计数据采集工作步入现代化统计的一个重要标志。现行统计制度下的数据采集主要有联网直报、PDA数据采集、电子报表、记账户记账、现场采价、实割实测、电话访问等方式,根据不同要求,采取合理的采集方式采集原始数据。其中:联网直报和PDA数据采集分别利用IP地址和GPS定位功能对统计源头数据采集进行实时监控,防止源头数据失真。近年来,统计工作一直紧跟科技发展的脚步不断改革和创新,现代化统计数据采集的实践意义已相当明显:第一减少报表环节,可以准确、及时、全面地提供统计信息,提高统计数据质量的真实可靠性和社会公信力。互联网下的统计数据采集过程,使统计生产过程完全透明、可控,更好地接受各级政府统计机构、填报单位以及人民群众的监督和检查。尤其是新经济下的个体户数据的直接采集,实割实测GPS定位专用工具的地亩数测量,将统计误差尽可能地缩小到最小,既提高了统计数据质量,又确保了统计数据的时效性。从根本上提高了统计数据质量的真实可靠性和社会公信力。
第二避免重复交叉统计,减轻统计员的报表负担。实施统计联网直报和PDA数据采集,统一布置,统一上报,有效避免统计任务重复填报,大大减轻企业统计人员报表负担,保证数据的准确性,有利于对经济社会形势准确把脉。第三数据资源高度共享,采集的数据更易长久保存及查询。一方面统计联网直报和PDA数据采集都实现了统计系统内部资源共享,提高了统计数据查询、检索、评价环节的透明度。另一方面通过统计联网直报平台、PDA数据采集、企业一套表采集上来的历史数据保存完整,不易丢失,有利于内部系统对历史数据的查询和对比工作。第四及时、充分、准确地反映创新驱动战略的落实情况,体现区域经济转型升级,大众创业、万众创新发展成效。新常态下提出的“三新”统计(即新产业、新业态和新商业模式)成为经济发展新的经济增长点,是推进现代统计体系建设的新创举,也是新常态下统计部门的历史担当。它通过互联网大数据、云计算、物联网,对其发展进行全面、真实、准确、及时的监测,客观解读和描述经济运行的新特征、新变化、新规律。
二、新常态下统计数据采集过程面临的一系列问题
(一)“三新”统计数据采集尚不能适应
现行的数据采集方式第一现行的《国民经济行业分类》无法完全匹配“三新”发展,给“三新”数据采集带来较大困难。三新”企业具有跨界的特点,经营模式多元化,业务边界区分较模糊,很难进行统计上的产业划分和行业界定。第二现行统计制度下“三新”统计数据的采集难以做到不重不漏。随着时展不断转型升级,很多企业既存在实体店售卖,也通过各种网络平台进行网售,统计数据采集时很容易出现重复统计;餐饮平台上的大量私厨、租车平台上的大量私家车并未纳入常规统计,会导致漏统。另外,百度外卖涉及的平台、第三方、或证照存疑、或无门面、或多家一地等复杂情况的处理,都是“三新”统计中的难点之所在,与当年在地统计的经营地、注册地原则不同,无论这个原则如何划定,都会造成统计数据或重或漏采集。第三“三新”统计部分指标匹配不衔接,不适应基层统计数据采集,影响数据采集质量。“三新”统计制度下的居民人均可支配收入,就存在指标不匹配现象,从2012年城乡住户一体化以来,基层统计部门不管是居民人均可支配收入还是居民人均消费支出的数据采集都仍处于城镇与农村分别采集的过程,并没有一个统一的城乡居民可支配收入及消费指标,数据采集上就出现了采集困难的问题。
(二)正常报表期间服务器设备运行不稳定
现行的统计联网直报数据采集,主要流程为专业报表选择定期开网,在开网期间基层统计人员在基层登录联网直报平台进行数据的填报工作,PDA数据采集模式与联网直报基本相同,所以说在报表期间由于数据采集平台登录人群量较大,势必要有强有力的服务器运行设备支撑。然而我们现有的服务器设备并不给力,联网直报平台稳定性不高,报表期间极易出现平台登不上、重置浏览器、证书过期及汇总较慢等一系列问题,甚至在报表高峰期服务器还会出现系统崩溃现象,导致不能正常报表,甚至存在录入数据丢失现象,必然引起基层统计员对统计联网直报平台的不认可,对统计上报工作的不重视,难以保障统计数据的时效性和真实性。
(三)PDA后期数据处理工作有待加强
近年来,经济普查、人口普查、农业普查及其他统计调查工作都采用了PDA数据直接采集模式,然而,PDA作为一个现代化的数据采集工具,对已采集数据的备份措施尚不完善,统计员在数据采集过程中,PDA设备发生硬件故障、软件系统故障或丢失等问题引起的数据丢失现象时常发生,导致普查员的二次录入,如果调查工作时间紧、任务重,会出现在一些指标有遗漏或有差错的情况下强制保存数据上报的现象,影响调查数据质量。另外,PDA数据上传需要网络支持,采集数据易被通过网络等手段窃取,数据安全性得不到保障。
(四)现有统计人员低配备与现代化统计的高素质要求不匹配
从统计员配备现状看,基层统计人员由于政治和经济待遇较低,更换频繁,部分企业统计人员身兼数职,对统计工作不够重视,统计法律意识淡薄,不认真执行统计制度,填报的报表随意性大,不规范,基层数据得不到有效的保障,严重影响了基层统计数据质量和统计工作的稳步推进。
三、对策及建议
(一)完善“三新”统计制度方法,适应新常态下统计数据的采集
一是加强统计基础制度建设、构建科学合理的统计指标体系。加强与相关部门、企业、行业协会的沟通协作,捕捉新的统计信息咨询,在保持原有的统计指标体系架构的基础上,适当增加统计指标,构建灵活多变的统计指标体系,以适应当前社会经济发展需要,确保统计数据“来有踪,去有影”。二是采集数据时要依托互联网进行全程监测,时时掌握瞬息万变的经济运行环境。“三新”经济的跨界、共生、渗透、融和等典型特征,要求出厂产品要具备“二维码”识别标志,依托互联网做好产品的生产、流通、消费的全过程跟踪,确保产品进入流通环节体现产品流向,进入终端消费领域体现产品最终使用去向,做到产品有来源,有去处。三是精心组织、狠抓落实、确保实效,全面准确及时地反映“三新”发展状况,以促进建立现代、科学的统计体系架构。
(二)加大服务器定期维护投资力度,保证报表期间服务器的正常运行
保证统计数据采集系统的网络稳定性是做好统计报表的前提条件,我们必须继续加大对统计数据采集系统服务器的投资力度,并在非报表期间对服务器进行定期维护,给予统计数据采集系统的上报工作有力的后勤保障,努力做到报表期间系统正常稳定运行,让每一个报表人都能够及时、准确、高质量的完成统计数据报送工作。
(三)强化组织领导,夯实统计队伍建设
统计基础工作是整个统计工作的基石,要提高统计数据质量就必须加强基层统计组织的建设。第一定期组织针对性较强的业务培训,对统计人员知识进行更新,扎实有效地推进统计工作的质量与效率。第二基层报表单位设置专门的统计人员。避免统计员因为兼职所引起的填报统计报表时间紧张,负担过重而应付报表的现象发生。第三基层单位要建立完善的统计工作交接制度。严格遵循“先补后调”的原则,确保统计工作衔接的好、交接的上、统计资料不丢失,从而保障统计工作的连续性不受影响。
(四)建设统计数据安全防护体系,保障数据的安全可靠
网络安全是统计数据质量的生命线,做好统计数据的安全防护工作,是我们的首要任务。一通过优化防火墙和网关性能,完善政务环境、局域边界,数据信息三个安全防护机制,确保统计信息的安全上报;二严格遵守信息安全等级保护和风险评估制度,对机房开启24小时故障报警检测,定期开展应急预案措施,提高外界攻击应对能力;三做好数据安全教育工作,杜绝木马侵入,数据丢失和泄露等情况的发生,真正从思想源头上加强预防和管控。
(五)实现统计数据资源完全共享,便于已有数据的应用查询
经济发展新常态下,现代化的统计数据采集方式实现了统计资源的共享,既保障了数据的时效性和真实性,又提高了数据的保存时效,然而,在系统内部应用上并没有完全与现代科技同步,统计成果尚未实现资源完全共享。譬如:年鉴资料还处于文本成册阶段,在部门统计数据运用上还处于比较落后的传统查询阶段——纸介质人工查询。开发内部应用统计数据查询平台,建立电子年鉴数据库,专业定期报表数据库内部查询系统,最终实现互联网+统计的整体模式,让统计成果得到充分有效的利用,简便、快捷地服务于社会各界。坚持做到只要有网络,我们就可以通过内部链接随时随地查询到分省市、分行业、分年限的每一项统计数据,甚至可以一目了然的看到数据近几年的发展现状,及时准确的为领导提供有效数据,为下一步决策做好参谋。
作者:吉立爽
摘要:
从传统统计数据与大数据之间的演变历史、数据特征等方面展开讨论,厘清两者之间存在的千丝万缕但又千差万别的联系,提出传统统计数据是大数据的简单形式和初期阶段,大数据是传统统计数据的复杂演化形态的论断,指出两者在数据分析思维方式上存在巨大差异,并对数据质量管理内涵、全周期数据质量保证等问题提出不同的解决思路和方案。
关键词:
传统统计数据;大数据;数据分析;数据质量
0引言
传统统计数据的内涵在于揭示数字背后信息与现实世界的关系。大数据是指巨量数据,是无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。从传统统计数据到大数据的持续演变导致在理论层面大数据内涵复杂,并与传统统计数据在信息界限上概念模糊。从传统统计数据到大数据不仅是量的积累,更是质的飞跃。厘清传统统计数据与大数据之间的内涵辩证关系,是有效利用数据的基础和关键。
1传统统计数据向大数据演变的动力
信息技术的进步为传统统计数据向大数据演变提供了物质和技术基础。随着互联网的日益发展,每一次网络存储技术的进步都使信息的生产、存储、传输成本大幅度降低,而流通的范围、深度、速度则显著提升。JimGray的新摩尔定理认为,每18个月全球新增信息量是计算机有史以来全部信息量的总和,新摩尔定律以信息量的维度确定了数据化演变信息的节奏。这种趋势导致的基本形态就是数据信息空前丰富,大数据成为了研究和利用热点。信息需求多样化与个性化是传统统计数据向大数据演变的基本动力。数据最终是为信息需求服务的,用户信息价值最大化才是数据应用的关键所在。在数据化趋势下,随着人们认知实践与需求状态的变化,数据一方面从满足基本特定信息需求到利用复杂的数据属性解析出多样化信息需求转变,另一方面从被动满足简单需求到主动发掘复杂有效需求,并探知用户个性化信息需求转变。这两方面成为传统统计数据项大数据内涵演变的基本动力。相应地,数据内涵也从朴素的信息真实业务逻辑向满足复杂需求的数据化逻辑迁移。随着信息技术的发展和用户需求的变化,信息效率价值的实时化及数据泛滥造成数据噪声增强和有效信息稀缺现象,大数据应运而生。传统统计数据是大数据的简单形式和初期阶段,大数据是传统统计数据的复杂演化形态。
2传统统计数据与大数据的数据特征差异
数据量增多是人们区别传统统计数据与大数据的第一个认识。传统统计数据数据量小,以MB、GB、TB等为存储单位。大数据数据量大,一般以PB、EB、ZB等为存储单位。但这两者之间特征区别并不仅仅是体量,还包括数据类型、研究对象的范围、信息视角等方面。
2.1传统统计数据与大数据的数据类型对比
传统统计数据是一种结构化的标准数据。其数据类型单一,主要以结构化、体量小、标准化、价值密度高及周期化数值为特征,数据产生和变化的速度慢。其数据特点是朴素真实、简单有限、准确性高及被动有用性。大数据统计范畴扩大、数据类型复杂,其中包括:a)非结构化非标准数据,如动态实时时序数据。b)半结构化数据和非结构化数据,如文本、图像、视频等。c)现有的结构化数据,如传统统计数据。其数据模型具有复杂多维的特征,统计结果多是非精确多种相关性趋势数据。大数据具有4个V基本特征,即Volume(体量浩大)、Variety(模态繁多)、Velocity(生成快速)和Value(价值巨大但密度很低),且具有来源多样、实时、多元的信息化特点。这些特点导致数据在产生、获取、存储、传输和计算过程中,因体量大、快速多变易产生冲突和不一致,人工很难检测和修复。
2.2传统统计数据与大数据的研究对象范围不同
传统统计数据的研究对象是宏观视角下有限的随机样本数据。随着信息化的发展,实践中产生大量冗余沉淀数据,这一时期经过清洗的全样本数据是数据挖掘的研究对象。而大数据面对的则是原生态全样本数据,也就是所谓的总体数据。从随机样本数据到经过清洗的全样本数据再到原生态总体数据,数据内涵总体信息视角从宏观向中观和微观扩散。研究对象范围向宽度和深度两个方向不断扩展,不断深入系统微观的多维度个体感知,信息能力和价值也不断提升。这种转变来自技术和需求的驱动,新型数据处理技术及需求获取能力成为演变的关键因素。
3大数据相对传统统计数据分析方式的变革
数据中蕴含的宝贵价值成为人们存储和处理数据的驱动力,数据分析是实现数据价值的必要途径。由于传统统计数据与大数据在体量、结构、内涵等方面有着本质的区别,所遵循的数据分析理论基础、分析思路、相关技术也不同。
3.1传统统计数据与大数据数据分析的理论基础
对传统统计数据进行数据分析的理论基础是分布理论,以概率为保证,即根据样本去推断总体特征,其逻辑关系是“分布理论—概率保证—总体推断”,分析过程是“假设—验证”基础上的“定性—定量—再定性”。对大数据进行数据分析是以全体数据为基础,以数据信息相关为保证,其逻辑关系是“实际分布—总体特征—概率判断”,可以不受任何假设的限制去寻找关系、发现规律,分析过程是“定量—定性”及“发现—总结”重要数量特征和关系基础上的定量回应。
3.2传统统计数据与大数据数据的分析思路
传统统计数据价值的实现路径为“数据到信息再到知识和智慧”。传统统计数据分析着力于经典严密封闭系统的精确性和因果关系的探索,找到事物属性之间的因果关系,比较容易实现。对于开放复杂的巨系统,传统的因果分析难以奏效,因为系统中各个组成部分之间相互有影响,可能互为因果,因果关系隐藏在整个系统中。因果关系本质上是一种相互纠缠的相关性。大数据数据分析无法检验逻辑上的因果关系,不能致力于寻找真正的原因。Mayer-Sch觟nberger在《大数据时代》一书中指出了大数据时代处理数据理念的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。因此,大数据分析逻辑体现为走“数据直接到价值”的捷径。大数据数据分析关注事物相关性认知分析,所谓相关性是指两个或两个以上变量的取值之间存在某种规律性,即对数量巨大的数据进行统计性的搜索、比较、聚类、分类等分析归纳。相关分析的目的是找出数据集里隐藏的相互关系网(关联网),一般用支持度、可信度、兴趣度等参数反映相关性。
3.3传统统计数据与大数据的数据分析处理技术
进行数据分析需要相应的数据分析处理技术以及技术人员的全力参与。数据分析领域面临的主要矛盾是快速增长的数据信息需求与有限统计资源和滞后数据处理能力的矛盾。信息技术应用成本的低廉化和性能效率的聚变成为数据需求和质量要求快速增长的基本动力。传统统计数据的分析和处理遵循一般的关系数据库的数据分析和处理技术,技术人员经过一定的训练即可胜任。对大数据进行分析和处理需考虑以下技术因素:a)数据清洗。大数据价值密度低、冗余数据增多、垃圾数据泛滥,大数据清洗需要专业和细致。数据不能清洗过细,否则会增加数据清洗复杂度,甚至有可能过滤掉有用信息。数据也不能清洗过粗,要保证数据筛选的效果。b)以MapReduce(一种编程模型)和Hadoop(Apache基金会所开发的分布式系统基础架构)为代表的非关系型数据库的非关系型数据分析技术,因其具有良好的横向扩展性,在大数据分析处理中得到广泛应用。c)要深入分析数据,数据分析人员既要熟悉数据分析技术和工具,又要具备相关领域的专业知识。
4传统统计数据与大数据的数据质量内涵
高质量数据是进行数据分析的前提和基础,是数据发挥效能的保证。传统统计数据数据质量以有限信息逻辑的因果性、确定性、清晰且高度的结构化为主要特征,主要关注数据自身本源的质量问题,例如准确性、完整性和客观性。质量标准至少应该包括指标解释(含义、范围、口径)、数据特征、调查方法、统计误差、获取时间、频率及渠道等方面的内容。大数据以既定边界内总体数据系统相关性的随机、自身的不确定性以及总体的非结构化为特征。由于数据质量问题在大数据环境下会被不断放大,因此,大数据主要关注数据可信与溯源等非数据本源性质量问题,即数据资源产生后在传输、存储和应用过程中产生的突显问题。下面重点从流程和管理两方面分析传统统计数据和大数据所面临的数据质量的挑战及应对措施。
4.1从流程视角看数据质量保证
从流程的角度(即从数据生命周期角度)来看,可以将数据生产过程分为数据采集、数据存储和数据使用三个阶段,三个阶段对传统统计数据和大数据的质量保证提出了不同的要求。
1)数据采集过程中数据质量保证问题
数据采集阶段是整个数据生命周期的开始,这个阶段的数据质量对后续阶段的数据质量有着直接的、决定性的影响。传统统计数据数据量小,通过编写简单的匹配程序,甚至是人工查找即可实现多数据源中不一致数据的检测和定位。大数据由于数据来源复杂,数据之间存在着冲突、不一致或相互矛盾的现象。因此,需要在数据获取阶段保证数据定义的一致性及元数据定义的统一性,以保证数据质量。
2)数据存储过程中数据质量保证问题
数据存储是实现高水平数据质量的基本保障,如果数据不能被一致、完整、有效的存储,数据质量将无从谈起。传统统计数据以结构化数据为主,主要采用传统的结构化数据存储架构(如关系型数据库)进行数据的存储。大数据数据结构多样、数量庞大、数据结构复杂、变化速度快,需要使用专门的数据库技术和专用的数据存储设备进行大数据存储,以保证数据存储的有效性,方便对数据进行快速读取。数据库一般采用分布式文件系统和分布式并行数据库(如HDFS〔分布式文件系统〕、BigTable〔Google设计的分布式数据存储系统〕等),在数据存储过程中,数据格式的转换非常关键和复杂,要根据大数据结构的要求和特点合理设计数据存储和使用规则。
3)数据使用过程中数据质量保证问题
数据价值的发挥在于对数据的有效分析和应用。传统统计数据的使用需要遵从关系型数据的完整性约束和数据一致性保证技术要求。由于大数据使用人员众多,数据规模庞大、变化速度快,对数据的处理速度要求较高,很多时候需要同步、不断地对数据进行提取、分析、更新和使用,因此需要保证数据使用的一致性。
4.2从管理视角看数据质量保证
传统统计数据一般由业务部门负责掌管数据,IT部门负责信息技术的应用,这种分离式的运营管理方式容易造成业务人员不了解分析不同数据所需的不同IT工具,而IT人员在运用IT技术分析数据时不了解数据本身的内涵,甚至会做出错误的数据解释,影响了企业决策的准确性和有效性。为了更好地利用大数据,保证大数据的质量,企业高层管理者应给与重视和支持,需在高层配备专业数据管理人员。在大数据生产过程的任何一个环节,企业都应该配备相应的专业数据管理人员,如由专门人员负责记录定义并记录元数据,收集原始数据,建模、提取并利用隐藏在大数据中的信息。
5结束语
传统统计数据和大数据是数据科学发展过程中由于技术的发展和客户需求的多样化、个性化而必然出现的数据阶段。由于两者之间关系不清,界限模糊,采集、分析、处理等技术多样,难度大,因此,从业者难免存在模糊认识和畏难情绪。本文从两者的演变历史、数据特征、数据分析和质量管理等方面对两者的异同进行辨析,指出传统统计数据是大数据的简单形式和初期阶段,大数据是传统统计数据的复杂演化形态,大数据从广义上来讲包含了传统统计数据。试图通过对两者的辨析为从业者提供一个辩证和清晰的思路。数据的分析应用无止境,任重而道远。
作者:李敬华 贾蓓 李倩茹 单位:西安通信学院
1概述
工业经济增长率一直是宏观经济和产业经济研究的重点内容(Barro,1993;Krugman,1994)。在以全要素生产率(TFP)为重要测度指标的工业及分行业增长率研究中,实证研究已经成为主流的方法(DiegoComin,2006)。但是,在实证研究中,数据起始时间的确定并未引起足够重视。在已有的研究中,不同的学者根据自己的研究需要,采用不同的基年。如黄勇峰等(2002)和张军(2003)把1978年作为基年,郑玉歆和罗斯基(1993)把1979年作为基年,陈勇、李小平(2006)把1980年作为基年,刘建国、李国平、张军涛、孙铁山(2012)把1990年作为基年,张军等(2004)、吴延兵(2008)把1993年作为资本存量折算的基年,薛钢、陈思霞、蔡璐(2015)把2005年作为基年。在对工业基础数据进行全要素生产率分析时,对基础数据的来源及处理也缺乏足够的认识。刘建国、李国平、张军涛、孙铁山(2012)运用Malmquist指数模型测度了1990-2009年中国省域的经济效率和全要素生产率,并对其影响因素进行了分析;梅国平、甘敬义、朱清贞(2014)测度了我国29个省级地区2001~2011年全要素生产率的变动及其区域非均衡性;薛钢、陈思霞、蔡璐(2015)基于2005~2012年的省级面板数据,利用DEA-Malmquist非参数分析方法,研究了城镇化对全要素生产率的增长效应以及公共支出政策的作用机制。但是,以上学者在基础数据处理中或许是忽视,或许是由于篇幅的原因,并未对工业统计数据的来源、统计口径调整等数据处理问题做出详细说明。
综合来讲,目前从工业经济统计数据的选择和使用来看,存在的主要问题是:①工业经济实证研究数据时间起点选择的一定程度的随意性。②忽视了工业经济统计数据标准和口径调整变化对数据的影响和相关处理。文章创新性贡献工作主要体现在如下三个方面:第一,对中国工业数据的来源数据库按照时间发展阶段,进行了科学、合理的划分,并给出了理论依据。第二,提供了工业基础数据实证研究时间起点确定的方法及其理论依据。第三,系统地对工业数据及来源数据库进行了分析。全文结构安排如下:第二部分主要分析我国工业经济统计数据库,第三部分,对不同的工业经济统计数据来源,借鉴企业生命周期理论,首次提出了我国工业经济统计数据库的三阶段划分,并给出了理论依据。第四部分从全要素增长率的维度,按照实证建模的视角,分析了工业经济增长中最核心的产出和投入要素。第五部分是研究结论与建议。
2中国工业企业的主要统计经济数据库的来源
目前,对于工业经济增长的理论和实证研究中,主要采用国家统计局数据库、研究机构和公司数据库。本质上,国家统计局和国家部办委及研究机构和公司数据库,在工业经济原始数据上是完全一致的。综合统计数据库和专题统计数据库。综合统计数据库主要有:中国统计局工业统计数据库;“中经网”“、国研网”工业经济统计数据库;其他综合统计数据库。专题数据库是同综合数据主要有:人口调研数据库;其他专题统计数据库。
3工业经济统计数据库的分类及理论依据
根据我国工业数据库与我国宏观实体经济发展的匹配状况、数据库的稳定程度、数据库的完整状况和与现代国际数据的接轨程度,借鉴企业生命周期理论,把我国改革开放(1978年)以后中国工业数据库分数据库的初创期、成长期和成熟期三个发展阶段。
3.1第一个阶段:社会主义市场经济工业统计数据库的初创期(1980~1997年)中国社会主义市场经济建立的过程。1978年十一届中全会的召开,拉开了以经济建设为中心的序幕(吴敬琏,2015)。因此,具有实质市场意义的数据测度才有可能建立。中国工业城市改革一直到1984年才开始1(陈康、谢千里、辛格,1992)。1992年以前,我国采用的苏联及东欧等社会主义国家采用的物质平衡核算体系(MPS),1993年新的国民经济体系核算建立,建立了国民经济核算体系(SNA),GDP就成为新体系中的核心指标。总体而言,1993年以后的数据比较完整(陈诗一,2008)。
3.2第二个阶段:工业经济统计数据库的成长期(1998~2010年)1997年以前,我国是按照行政隶属关系来统计各类报表。在1998年以后,工业经济的统计指标转变为按照工业经济的体制属性和经济规模为统计标准。2008年全部工业统计指标主要是按照规模以上工业企业和规模以下工业企业。规模以上工业企业科技活动统计指标。许多学者在实证分析时,把1998年作为起始时间2(孟连、王小鲁,2000;张军、陈诗一、GaryH.Jefferson,2009)
3.3第三个阶段:工业经济统计数据库的成熟期(2011年~目前)在这个阶段,有一个重要的调整时间是2011年以后的工业企业数据,规模以上工业企业的统计门槛从每年工业总产值500万元,提高到每年工业总产值的2000万元。从我国工业经济发展历程看,除了上面的时间分类,还有几个关键时间是可以作为划分时间点的,分别是1984年的工业归类变化和1994年财税改革。但是由于1980~1984年时间太短,不适合依次划断。1994年的财税改革同1998年的统计标准变化来讲,后者更具有普遍意义。因此,采用上面的工业数据库的发展阶段分类。在工业企业统计数据库的阶段划分主要依据如下原则:工业经济统计数据与宏观经济发展阶段相匹配的原则;数据库各项统计指标调整的频率和相对稳定程度;数据库的完整程度;与现代数据库接轨的程度。
4工业产出投入变量数据选择、构建现状
在对工业经济增长率的实证研究中,需要关注产出变量和投入变量。具体一点讲,就是一个增长率模型中的解释变量和被解释变量。在模型的左端,工业产出的变量选择争议不大,在模型的右侧,被解释变量的选择,则非常广泛。其中最核心的无疑是资本和劳动这两大基本变量,因为它揭示了经济增长的基本动力。
4.1产出变量在产出变量中,经常作为实证模型的被解释变量的有:工业总产值、工业增加值、工业净产值。我国统计部门自1986年以后,就了工业行业和39个工业分行业的相关产出指标。
4.1.1工业总产值总产值指标的数据一般与会计的主营业务收入数据接近,所以普查中会出现企业以主营业务收入代替总产值的情况,特别在规模以下工业企业中比较常见。许多学者把工业总产值指标作为工业产出的替代指标。如谢千里等(1993)和李小平等(2005)计算工业部门的TFP时采用的是工业总产值。
4.1.2工业增加值、工业净产值工业增加值和工业净产值的关系为:工业增加值=工业净产值-支付给非物质生产的费用-利息支出+固定资产折旧+大修理基金。从理论上说,两种组合在投入产出的相关分析中结果一样,但实际上两种组合都存在无法回避的数据构造的难题。陈勇、李小平(2006)采用的方法是:根据工业净产值推断出工业增加值,然后根据统计年鉴提供的工业品出厂价格指数进行平减3。根据1993年年鉴中的1992年工业净产值和工业净产值的数据对照,分析发现,1992年整个工业行业的工业增加值相对工业净产值的偏差只有2.91%,偏差较小(陈勇、李小平,2006)。同时,如果研究时间范围不是关注于改革开放以来的长期序列数据“,工业净产值”作为一个工业的过去常用的经济指标,在后续的研究中,可以逐步得到解决。
4.2投入变量作为测度经济增长的模型,最基本的投入要素变量有资本存量、劳动投入变量和中间投入变量。部分工业行业或工业分行业增长测度模型,只用到了资本存量和劳动投入变量。
4.2.1资本的估算资本投入的测量和估算是一个非常复杂的理论问题4。许多经济学家对于资本测量方法这个问题进行研究。国外Triplet(1998)有较详细的论述,Harcourt(1972),Diewert(1980),Burmeiste(r1990),Hicks(1981),Hulten(1990)都进行了相关综述,Jorgenson(1980,1986,1989,1992,1996)对资本投入进行了持续研究。从操作层面讲,OECD(1993,1999,2001)的资本测量手册非常详细地介绍了资本测量的步骤。目前,在资本存量的估计问题上的分歧逐渐减少,PIM的方法已经被广泛认同。
4.2.2劳动投入劳动投入是工业增长率研究的另一个重要投入变量。对于劳动投入,使用比较多的变量是“职工人数”“、从业人员人数”、“受教育年限”和“工资水平”等变量5。需要说明的是,由于中国二元经济结构的影响,我们目前的就业和失业的统计方法和标准,与国际上通行的就业和失业标准并不一致6。我们目前统计的失业率是城镇登记人口失业率,一是“城镇人口”,而非全部人口,二是“登记人口”,这些问题是在实证研究中使用劳动投入数据中需要考虑的地方。
4.2.3中间投入采用工业总产值为模型的解释变量时,需要估算中间投入。郑玉歆(1998)和黄勇峰等(2002)在计算国有和集体工业的中间投入时,采用的推算方法为:中间投入=(工业总产值-折旧-大修理基金)/平减指数。如果考虑细分工业行业,这种估算方法容易使人无所适从(郑玉歆、罗斯基,1993)。李小平等(2005)也通过构造中间投入平减指数估计了工业各行业的中间投入,不过他在计算等式中忽略了大修理基金。谢千里、罗斯基、郑玉歆(1990)测度国营企业和集体企业的生产率时,采用的指标是劳动、资本和中间投入等三个投入的柯布道格拉斯生产函数(C-D),总产出按照1980年为基期调整的工业总产值。
5结语
中国工业数据源自中国工业从计划经济转向社会主义市场经济的实践。由于中国的工业经济转型时间非常之短,只有30~40a的时间,给数据调整和处理提出很大的挑战。对于我国工业数据库的初建期、成长期的投入产出数据,在实证时,需要充分考虑到统计标准的调整频繁而导致实证的结果的可靠性和科学性,对于我国工业企业经济统计成熟期的数据,只需要关注统计口径的微调即可。因此,在进行工业经济增长、经济波动等实证研究时,如果不是针对改革开放后的全区间实证研究,或者一定需要某一特定时段的工业数据,可以选择时间稍晚一点的数据库为宜。从研究时间的起点来看,以2003年,2000年,1998年,1995年等为研究起点,都是不错的选择。
作者:王济平 刘亚菲 单位:武汉纺织大学 管理学院
对于企业的统计工作来说,其所统计出来的数据信息是核心内容。保障数据信息的真实性、准确性是十分关键性的问题,它是管理者进行正确决策、保障企业方向发展稳定、是否利于企业可持续发展的前提条件。统计的质量及效率的等重要因素都是由计人员所需要重视的问题,特别是基层统计人员的工作效率及质量,影响着整个企业统计工作的顺利进行,结合自身实际的经验之谈,笔者用以下的内容进行具体的阐述。
1基层统计人员与企业统计数据质量的联系
1.1基层统计人员的自身观念对于基层统计工作来说,以外界看来,十分的简单易上手,只需要将数据信息进行整理即可,方式方法也不复杂,大多数的工作人员都可以胜任。其实,对于基层统计人员来说,其所面对的是第一手的数据,需要足够的责任感及统计数据的准确无误才能为上级服务,作为基础工作性质应该得到重视。但是,对于大多数的企业来说,企业的统计工作只是作为决策者进行决策的一个参考性意见存在,所以管理者对其不够注重,也就缺少了对基层统计人员的职业水准及职业素养的培训。因此,工作人员的积极性很难调动,甚至存在着被忽略感,在此工作岗位上很难持久,岗位人员的流动性比较大。这就会导致基层统计工作效率很难提升、质量很难确保准确,工作职责划分不明确,工作人员之间互相推卸责任等等。在样的发展趋势下,很难存在比较优秀、经验丰富的从业人员为企业所服务,统计工作的顺利进行收到一定的阻碍,为企业的发展战略决策工作带来了一定的困难或者误区。
1.2基层统计人员的流动性大每个行业中都存在佼佼者,统计工作虽然工作程序比较一致,但是真正的进行工作起来,也会具有一定的复杂性及难度,统计工作者大都有如此感受。当前各大企业之中,对于统计工作的开展遇到的难题大多是人员的流动性比较大,很难在岗位上持久的发展,这就造就了一种懒散的局面产生,对于下发的任务完成即可,主动意识差,不会对收集数据的准确性进行考察,只是按照程序依次进行整理、提交。除了这些问题以外,基层统计人员的基础知识储备量不足,对待统计工作的执行方式及统计的规律不够了解与掌握,导致统计工作存在一定的误区及效率低下,如若刚开始就是错误的方向,将会影响整个数据统计的进度及领导决策的及时性。因此,企业的整体发展受到阻碍,基层统计工作很难正常的开展。其发展前景也不容乐观。
1.3被统计对象的多样性统计人员是统计工作的主体,那么被统计的对象是统计工作的客体存在,需要统计什么是统计人员的具体工作内容。由于其具体的数量及特征是不一定的,具有多变性。这种工作特性造就了统计工作具有一定的复杂性及增加了难度,为统计人员的工作带来了一定的难题。与此同时,在统计人员进行工作的过程当中,数据的统计计算具有一定的系统误差,无法闭合。这种误差都是由统计客体的本身特性造成的,所以工作人员应该尽最大可能来规避误差,保证数据信息的准确,为企业的发展贡献一份力量。
1.4基层统计人员的自身素质问题基层统计人员作为统计工作的一个重要的组成部分,其自身的素养对于企业来说十分重要,其工作态度及工作能力会影响到工作效率及质量的好坏。企业的统计工作正常情况下应该由具备专业知识的统计学专业人员进行从业,然而有些企业对于统计工作不够重视,对其了解甚浅,同时为了节约开支的成本,将专业外的工作人员雇佣来进行从业,这就很大程度上导致了统计工作的不规范性、不科学性以及不能按照一定的规章制度进行开展工作。统计学中具有一定的专业术语需要从业人员进行了解,方便编制报表等。然而在非专业人员的操作过程中,往往对于术语的真实含义不清楚,只是从字面上进行理解,刀子数据记录的混乱,整个统计工作无法进行。对一些看似简单的数据加减法,其实具有很深层的含义很难被了解及应用。因此,企业对于统计人员的从业资格应该予以审查,聘用正规的统计学专业从业人员进行管理,将大大的提高工作效率。
2改善企业统计工作的质量的方法
2.1作为统计工作的基层工作人员,应该具有一定的热爱集体、热爱岗位的热忱,积极的投入到工作中,提高工作效率,企业应该加大对于基层统计人员的重视,明确其工作的重要性的同时,帮助员工奖正确的社会价值观树立起来,使员工清楚认识到自身工作的重要性,积极性调动起来,变被动为主动,为公司基础的数据信息更加的准确无误。
2.2企业要重视对于人才的培育,特别要加强统计人才队伍的建设,将队伍建设作为企业发展的前提标准并及时的放在企业重要议程上,同时做好机构设置及完善的人员配备工作,经常性的进行培训,激发员工的工作热情,尽可能的保证基层统计队伍的稳定。
2.3统计主体在对统计客体进行实际研究时,应当选取适当的统计指标和方法进行统计工作的标准,以保证数据的准确性,克服误差的影响。
2.4企业加大对基层统计人员的培训力度,统计工作人员应当不断强化自身知识水平与能力,积极参加后续职业培训,让自己的知识结构和知识水平能够不断与现实社会的变化接轨,同时单位要加强考核,对不合格的统计工作人员进行批评督促,对优秀的统计人员进行奖励,奖罚分明,提高工作积极性。
2.5统计方法对统计工作而言十分重要,正确的科学的统计方法能够对统计工作起到事半功倍的效果,错误的统计方法会降低统计效率,影响数据的易得性和真实、准确与完整程度。所以,建立正确的统计方法,规避繁杂程序,是统计工作中的前提和基础。“工欲善其事,必先利其器”,只有有了良好的统计方法,才能在实际工作中取得事半功倍的成绩。
3统计工作的发展前景
随着我国的信息时代的到来,企业的统计工作也逐渐的被网络信息化,初步的实现了统计政务电子化、统计工作流程电子化、统计办公电子化,统计生产力实现了跨越式的发展。此基础上应该更加注重基层人员的职业水平及素质水平的提升,并且满足时代背景下的技术要求,提高统计工作的效率的同时,统计工作也将有无序变得有制有序。更好的为企业的发展提供有价值的意见。结束语从上述文章中我们不难看出,基层统计是企业整个统计系统的基础保证与核心内容,也是为管理者提供正确决策及利于企业发展方向的数据信息。应该统计数据是一个企业决策的参考性存在,所以其真实、准确性十分的重要。因此,企业应该积极的进行从业人员的职能培训与素质提升,保证其工作效率稳定提高,统计工作的顺利开展,为企业提供正确的发展方向。
作者:王光明 单位:辽宁省大石桥市统计局
随着全球化进程的日益加深,国与国之间的商品贸易与服务贸易规模在不断扩大,贸易统计数据的非对称问题变得越来越突出。例如,2011年中国内地报告的对香港商品贸易出口额达到733.4亿美元,而香港报告的从中国内地进口商品贸易仅有142.13亿美元,双方报告数据差异之巨大让人费解。贸易统计数据非对称背后折射出来的是统计数据准确性问题。目前,研究贸易统计数据的非对称已成为评价贸易统计数据准确性和国际可比性的一种较为普遍的方法。随着中国服务贸易规模的迅速扩大,服务贸易统计薄弱性日益凸显。加强对服务贸易统计数据非对称问题的研究,对进一步改进我国服务贸易统计工作,提升服务贸易统计数据准确性具有积极意义。
一、问题缘起
国际贸易统计非对称问题最早是20世纪90年代提出的(Tsigas,1992),自此之后一直是政府部门和学术界主要关注的领域。其中,最经典的案例就是对中美(FungandLau,1998)及中国内地和香港特别行政区间的贸易非对称问题(FerrantinoandWang,2008)的研究。目前的研究主要集中在商品贸易领域,少有对服务贸易领域的研究。已有研究认为,导致商品贸易领域中出现统计数据不对称的原因主要有三种。第一种,不对称主要来自一些不可避免的因素,其中最主要的是在贸易实践中报价基础不同。国际贸易实践中,进口一般按CIF报价,出口一般按FOB报价。IMF(2011)认为CIF价中包含运费和保险费,因此CIF价一般比FOB价要高出10%左右。Federico和Tena(1991)以及Makoul和Otterstrom(1998)在控制了因CIF和FOB报价导致的差异后发现,发达国家以及总体水平上,贸易统计数据基本是对称的。Pomfret和Sourdin(2009)认为,如果贸易伙伴国之间距离更远以及商品贸易的权重增大,CIF价与FOB价之间的差异会更大。在剔除运输成本因素后,结果是中性的。第二种,不对称主要来自贸易伙伴国之间统计结构上的差异,如贸易记录时间的不同、贸易记录门槛的不同以及汇率波动等。第三种,不对称主要来自不同的分类以及故意误报。不同的分类主要来自人为的误差,或者是海关官员缺乏经验,又或者是国家贸易统计体制的不同。特别是在转口贸易的情况下,各国分类口径的不同导致贸易统计数据的非对称性很大。海闻、芬斯阙(2000)等认为中美各自公布的贸易逆差值不一致最重要的原因是香港的转口贸易。如果将从中国内地运往美国的产品和从美国运往中国内地的产品各自在香港的附加值都归为香港的出口值,中美贸易逆差差异则会大大降低。故意误报主要来自骗税、走私等。因此,贸易统计数据非对称还被用于检测逃税和其他贸易中的灰色地带的存在。研究表明,较高的关税、腐败、贸易中的灰色地带与双边贸易统计的较大差异有关(JavorcikandNarciso,2007;BergerandNitsch,2008)。此外,Yeats(1995)发现,发展中国家的贸易数据非对称非常显著,这些显著性差异不能仅仅被不可避免因素或结构型因素所解释。Hamanaka(2011)发现哥伦比亚贸易统计数据在进口数据以及细项数据的准确性上存在严重的问题。HeliSimola(2012)通过与其他贸易伙伴国统计数据对称性的比较,发现俄罗斯的进口数据质量逐年改善,但与其他发达国家仍有很大差距,尤其在细类统计数据方面。这种问题主要是由错误的分类以及故意误报导致的。
二、镜像数据和测度指标
(一)镜像数据的内涵理想状态下,贸易国与其伙伴国之间相对应的贸易统计数据应该是相等的,即A国对B国的商品或服务的出口(进口)应该等于B国对于A国的相同商品或服务的进口(出口)。这就是贸易统计数据完美对称的情形。但现实中,这种情况很少发生。两个国家间对应的贸易数据差异越大,说明两个国家间的非对称问题越突出。这里,伙伴国相对应的贸易数据被称为镜像数据(mirrordata)。贸易统计中的非对称性主要通过比较统计数据与镜像数据间的非对称性来衡量。欧洲统计局(Eurostat,1998)将镜像统计数据定义为“对一个贸易流的两个基础测度之间的双边比较”,“是发现非对称原因的一种基本工具”。镜像数据可以检测每个报告国所报告的贸易额与其伙伴国报告的贸易额的差距情况。当报告数据与镜像数据差异过大时,有助于识别报告国是否相对某个伙伴国所申报的数据偏高了或是偏低了,从而查找出现差异的原因,甚至查找统计环节中是否存在系统性误差、定义上的差异或者统计上的错误做法。
(二)非对称系数的测度目前,学术界大多采用的是Ferrantino和Wang(2008)提出的贸易差异度指标来衡量贸易统计数据的非对称程度。为了能更好地反映差异与均值的偏离程度,本文对该指标进行了修改,将贸易伙伴间的统计数据差异与他们报告数据的均值进行比较。本文将该指标称为非对称系数,主要用两种表达方式:一种是报告国是出口方,另一种是报告国是进口方。当系数为0时,贸易统计数据是完美对称。系数偏离0越多,说明贸易统计数据之间的非对称性越强。贸易差异度可以为正数也可以为负数,它可以用于估计一个国家相对于其贸易伙伴公布的数据而言,所报告贸易流是偏高了还是偏低了。
三、服务贸易双边镜像数据的比较
我国服务贸易统计始于1982年,最初的进出口总额仅为44亿美元,占全球服务贸易总额的0.6%。2013年我国服务贸易进出口总额达到5396.4亿美元,占全球总额的6%,居全球第三位,同比增长14.7%。在服务贸易大发展的背景下,高质量的服务贸易统计数据是加强对服务贸易的理论研究和政策支持、强化对服务贸易的国内管理和国际协调的前提。目前,我国国际服务贸易统计体系正在逐步建立,但是现有体系下所产生的统计数据能在多大程度上反映我国国际服务贸易的真实交易量是首先需要解答的问题。本文通过与主要贸易伙伴镜像数据的比较来对中国服务贸易统计数据的准确性进行初步探讨。本文中中国与贸易伙伴国的双边服务贸易数据主要来源于WTO官网、UNservicetrade数据库以及OECD数据库。
(一)我国主要服务贸易伙伴本文选取了与中国服务贸易交易量最大的中国香港、美国、欧盟、日本及韩国作为主要伙伴国(地区)进行研究。如表1所示,无论是“一般商业服务”还是分类服务贸易,中国与上述五个国家(地区)的服务贸易额大体都处于前五位的关系。中国与上述国家(地区)实现的服务进出口额占中国服务进出口总额的六成以上。其中,中国香港为中国最大的服务贸易伙伴,双边服务进出口总额约占中国服务进出口总额的1/4。中国香港仍为中国最大的服务出口目的地、进口来源地和顺差来源地。通过对与这些国家(地区)服务贸易统计数据非对称性的研究,有助于找出我国服务贸易统计数据存在的主要问题以及问题的主要方面。
(二)我国服务贸易统计数据的非对称性考虑到数据的可获取性以及时效性,本文主要以中国、中国香港、欧盟、美国、日本、韩国2011年双边贸易数据作为研究对象,分别对运输服务、旅游服务、其他商业服务以及一般商业服务四个类别进行研究。表2列出了2011年各国(地区)与其伙伴国(地区)之间出口数据和进口数据的非对称系数。系数为正,说明报告国(地区)的数据相对于镜像数据偏高;系数为负,说明报告国(地区)相对于伙伴国(地区)报告的数据偏低。此外,本文通过均值的比较来反映我国服务贸易统计数据非对称程度的整体水平(见表3)。系数绝对值越大,说明差异度越高。尤其是当系数的绝对值大于0.5时,属于统计数据极度不对称状态。从表2、表3中可以看出以下几点:第一,总体上,我国服务贸易统计数据的非对称情况要远高于商品贸易。但有一点值得注意的是,在商品贸易领域,中国进口数据非对称性异常突出,明显高于其他伙伴国(地区)水平。第二,我国服务出口数据非对称情况要比服务进口数据非对称情况严重,如表3所示,中国各类服务贸易出口统计数据的不对称性要高于其他贸易伙伴国(地区)。“其他服务贸易”统计数据不对称性最严重。其次是“运输服务贸易”。第三,其他商业服务贸易方面,各国(地区)统计数据不对称情况最普遍。在五个贸易伙伴国(地区)中,除欧盟外,进出口数据都与伙伴国(地区)存在极度不对称的情况。第四,运输服务贸易方面,中国对中国香港的出口数据以及中国对欧盟的进出口数据都存在极度不对称状态。第五,旅游服务贸易方面,数据非对称情况相对要少很多,但中国与美国旅游服务贸易的进出口数据存在严重的非对称。第六,在五个伙伴国(地区)中,与中国服务贸易出口统计数据差异最大的地区是中国香港。如图1、图2所示,中国内地与中国香港在所有四个服务部门的非对称系数都超过了0.5,尤其是运输服务和其他商业服务非对称系数甚至超过了1。中国与其他贸易伙伴国的非对称性情况不如与中国香港这么突出,主要在某个部门存在较明显的非对称性。例如中国与韩国主要在其他商业服务方面存在显著不对称,中国与欧盟在运输服务贸易方面存在显著不对称。
四、统计数据非对称的原因分析
(一)与其他国家服务贸易统计体系存在较大差异由于服务的无形性,服务贸易统计存在很大的难度。虽然目前国际上有通行的《服务贸易统计手册》和BPM5标准作为各国服务贸易统计制度的指导,但是各国的服务贸易统计体系仍存在很大的差异。首先,各国BOP范畴下服务贸易统计数据的采集方法不同。目前国际上通行做法有结算、调查混合三种。我国BOP服务贸易统计以间接申报制度为主,主要依赖结算系统来获取数据。中国香港的服务贸易数据以各项有关机构和住户的统计调查搜集为主,辅助行政记录而得。美国主要通过商务部经济分析局的调查问卷来获取服务贸易数据。而欧盟各国正逐渐由结算系统向混合或调查方式转变。随着网络技术的发达,许多服务贸易是通过电子转移的方式进行的,并没有向相关机构进行申报,并且大量的跨国公司内部交易的存在导致结算系统越来越难以反映真实的交易情况。目前,由结算系统向调查系统和混合系统转变是BOP服务贸易数据采集的一大趋势。我国主要通过结算系统来获取统计数据的做法已经落后服务贸易实践的发展。其次,各国对服务贸易统计口径贸易记录制度、货币折算标准不同及统计时间差异等原因都会造成统计结果的巨大差距。中美之间关于贸易顺差和逆差的多次争论就是例证。这种情况在服务贸易领域尤为明显。
(二)我国服务贸易统计制度环境不够完善从成功开展服务贸易统计的国家或地区看,它们都是在法律、制度的保障下有效地开展服务贸易统计工作的。美国国会于1985年通过了《国际投资和服务贸易调查法》,授权美国商务部经济分析局(BEA)为美国服务贸易的首要统计机构和首要机构,并授权经济分析局进行各行业服务交易的强制性调查以及国际直接投资的强制性调查,从而保障了美国服务贸易统计工作的顺利进行。中国香港则根据《普查及统计条例》(第316章)及附属法例收集服务贸易统计数据,这是中国香港服务贸易统计领域的最重要立法。长期以来,由于缺乏服务贸易统计制度,缺乏服务贸易统计归口管理部门,中国的服务贸易统计工作明显落后于发达国家(地区)。虽然《国际服务贸易统计制度》(以下简称《制度》)于2008年1月1日正式实施,并且2012年进行了修订,但整体而言,《制度》对数据(尤其是占服务贸易总额一半以上的运输、旅游、通信、金融和保险数据)的采集和使用等方面的指导过于笼统,缺乏可操作性。例如,在《制度》中指出“运输、旅游、通信服务、金融服务、保险服务等进出口数据则利用相关部门行政记录、统计资料以及测算数据和其他信息源进行统计”,但是具体、统一的指导意见和要求却缺位。这导致各省(直辖市、自治区)采集的服务贸易数据不完整、不可比。《制度》中虽然强化了企业直报的调查方式,但却对拒报、迟报、伪报、篡改统计数据的行为缺乏监管和惩处力度。另外,目前我国服务贸易统计是商务部、外汇管理局以及各个服务业管理机构并行的多头统计管理体系,各自统计口径的差异也影响统计数据质量。
(三)服务贸易统计工作自身的复杂性《服务贸易总协定》将国际服务贸易分为12大类共155个服务项目,涉及经济生活的各个方面,相关服务企业数量众多。服务贸易有跨境交付、商业存在、境外消费和自然人流动等四种模式,涉及服务、人员、资本等流动。服务贸易调查对象广泛,服务经济活动形式多样,都为服务贸易统计增加了极大的难度。由于服务的特殊性,有许多服务是依附在货物上的,服务价值很难剥离。如运费大部分时候是与商品的价格打包以报价的形式反映出来。此外,如嵌入在出口或进口货物上的软件、知识产权的价值等。随着网络通信技术和交通运输技术的发展,服务贸易量激增,贸易形式日新月异,许多服务贸易数据很难被捕捉。另外,许多服务贸易数据基本上来自政府或民间机构的定期调查和普查。调查包括对国内外公司合同的调查、对服务业雇工情况的调查、对服务价格信息的调查等。普查一般不间断进行,涉及的范围更广一些。但由于经费和人力有限,采用调查或普查的方法会面临一些潜在的问题,例如,一些国家在调查或普查时更多地采用抽样方法获得服务贸易数据,多少带有猜测估计的因素,缺乏应有的可靠性和真实性。如果在调查过程中匆忙行事,对样本缺乏必要的评估,对调查程序缺乏严格控制或对调查资料缺乏严格的审核等,就会使调查结果以偏概全,错误百出。本文中研究的“其他商业服务”是一个杂项类,是不包含运输与旅游服务之外的所有商业服务。根据BPM5中的定义,“其他商业服务”应包括通信,建筑,保险,金融,计算机和信息,专有权利费和特许费,其他商业服务,个人、文化及娱乐服务,视听及相关服务等。这些服务类别涉及门类多、交易形式多样,不同采集方法下产生的数据差异值将更大。“其他商业服务”作为多种细项服务类数据的加总,也会导致各种差异的叠加,将进一步加大统计数据间的差异程度。
(四)与某些国家间可能存在系统性差异本文前面的分析适用于解释各国之间统计数据差异的一般性原因,但却不能有效解释中国与贸易伙伴国(地区)在特定服务贸易领域中长期存在的显著差异。例如,在运输服务和其他商业服务领域,中国出口数据与中国香港的镜像数据一直处于差异异常显著的状态。要解释这些差异产生的原因,需要了解两个国家(地区)间贸易及其统计的实践特点。本文以运输服务贸易为例,尝试分析统计数据不对称的系统性原因。自中国入世以来,中国香港的转口贸易功能进一步强化。经香港转口出口额占全部香港出口额的比重近年来一直呈上升趋势,2001年为89.63%,而到2010年一路上升为97.71%,到2011年7月,这一比重又上升0.2个百分点,为97.91%。在中国香港的转口贸易中,内地一直扮演着最重要的角色。1998年以来,转口贸易中来源于内地的货值占总货值的比例一直稳定在60%左右,2010年来源于中国内地的转口额占香港全部转口货值的61.5%。本文认为转口贸易可能加剧了两地之间运输统计数据差异。我国运输服务贸易的出口主要基于国际收支统计间接申报,根据我国运输服务企业提供的服务国际收支数据获取。当我国的承运人将货物运至香港转口时,这段运输服务记为中国内地对中国香港的“运输服务出口”。在运输服务进口方面,当前国际范围内广泛应用的是依据货物进口数据进行估算。估算方法如下:货运服务进口=按CIF计算的商品进口总额×运费系数×外国承运人在外贸运输市场的份额。在贸易实践中,在中国内地输往香港的货物中,如果其中有些货物在香港解释作转运或者是过境,这些货物不在香港做进一步的加工,也不在香港消费、转卖,那么这些货物按照香港特别行政区的规定就可以不必向海关提交报关单。因此,这些货物也就不列入香港统计的内地的进口。而香港运输服务进口也可能因为货物进口数据的缺失而缺失,即不存在相对应的香港从中国内地的“运输服务进口”。因此,转口贸易的大量存在以及两地之间在统计实践上的差别,可能是造成两地运输服务统计数据差异的一个重要原因。
五、改进的对策
(一)建立内外协调、统一的服务贸易统计制度服务贸易统计涉及门类众多,经济活动形式多样,是一项十分艰难的工作。一个健全的服务贸易统计制度首先要做到内外协调统一。外部体现在,我国的统计制度应与国际通行的统计准则相协调。当前,《国际服务贸易统计手册》(以下简称《手册》)从广义上提出了一个国际公认的国际服务贸易统计编制和报告的框架,包括编制国际服务贸易统计的指导性意见和操作流程。我国应进一步提升服务贸易统计制度与《手册》的协调统一性,尽可能按照《手册》的要求来设计制度和相关实施细则。只有加强对外的协调统一,才可以进一步提高服务贸易统计数据的国际可比性。内部体现在,加强服务贸易统计与已有统计体系间的协调。其一,加强与国际收支统计体系下服务贸易统计的协调。我国以前的服务进出口统计主要通过国际收支核算体系获取,由外汇管理局负责。《国际服务贸易统计制度》实施后,商务部负责服务进出口数据的汇总和编制。两者在统计分类、归口管理、统计手段上都存在很大差异,两套统计体系并行会造成服务贸易统计方面的混乱。其二,加强与已有外资及对外直接投资统计的协调。建立FATS统计可以充分利用现有的外商投资统计和对外直接投资统计,加强与现有外资和对外投资统计的协调,能节约大量社会成本。其三,加强各地区间服务贸易统计实践的协调。服务贸易统计实施细则的缺位导致各地服务贸易统计具体操作存在一定差异,对地区间统计数据的可比性产生负面影响。
(二)完善服务贸易统计立法和执法工作虽然《中国服务贸易统计制度》为服务贸易统计工作奠定了一定的立法基础,但是具体实施层面却缺乏立法保障。从国外经验来看,完善各种形式的服务提供者和消费者的贸易登记制度,并以法令的形式加以规范,将极大地提高服务贸易信息反馈的数据和质量。因此,我国需进一步加大对服务贸易统计实践环节的立法工作。除了需要立法保障外,还应加大执法检查力度。根据有关法律对拒保、迟报、伪报、篡改统计数据的单位进行严肃查处,直到追究法律责任,以保证统计数据的真实性。
(三)加强与其他国家服务贸易统计的经验交流和学习目前,美国已形成最科学、最完整和最具推广意义的服务贸易统计体系和统计方法。美国还是世界上最早能够提供与GATS服务贸易概念一致、连续、系统的双向服务贸易统计数据的国家。欧盟国家也较早地进行了有益的探索并付诸实践,目前欧盟大多数国家均能依据BPM5收集服务贸易统计数据,并可提供内外向FATS数据。上述国家的做法和经验丰富了国际公认的《国际服务贸易统计手册》内容,对我国具有许多可借鉴之处。我国应通过与具有丰富统计经验的国家的交流和学习,发现和比较各国的做法,促进国外好的经验和做法在我国的推广。例如,在数据采集渠道方面,通过借鉴美国和欧盟等服务贸易统计数据收集方面的先进经验,更多地采用抽样调查、问卷调查、重点调查等方法收集服务贸易数据。
(四)构建与伙伴国的双边数据交流机制一个国家分国别地进行服务贸易进口统计,能反映有关伙伴国对本国服务贸易出口的基本统计信息。因此,尽可能地编制主要伙伴国双边服务贸易统计数据,同时加强与伙伴国构建双边数据交流机制,实现数据互换、信息共享,有利于我国及时跟踪我国服务贸易流与镜像数据贸易流之间的差异程度和差异方向,及时发现问题,找出原因。此外,我国还应建立服务贸易统计信息交换平台,与国际组织、国家(地区)、国内有关机构加强信息资源的共享与合作开发。
作者:杨丽琳 单位:江西财经大学国贸学院
1数据挖掘技术在统计工作中的适用性分析
1.1较高的有效性数据挖掘技术作为一种数据的深加工技术,其本身是带有鲜明的目的性的,在实际应用活动中能够对长时间积累下来的经济统计数据进行基于数据使用者要求的深入加工。在实践应用活动中主要有两种重要的应用形式,一种是对积累经济统计数据的管理高效化处理,一种是对现有经济数据的目的性分析。其中第一种分析方式是从经济数据管理的角度出发的,在应用中主要是以固有数据信息的统计、分类为基础,将原本混乱的数据库信息进行科学、系统的归类,保证统计数据管理的高效性和使用的便利性。另一种工作方式是一种经济数据的再加工过程,以鲜明的数据统计、分析目标为指引对原有数据的呈现形式、组成内容和关联形式进行重新加工,以保证经济统计数据能够最大限度地服务于管理者的需求。
1.2综合应用性强如前文所述,数据挖掘技术是一个工具系统而不是单一的工具,能够实现使用主体的各种信息需求,随着现代社会经济的快速发展,当前我国经济管理的各个部门都需要大量的经济统计信息来作为经济管理决策的基础。但是因为各个管理部门经济管理的领域不同、经济管理的方式不同、经济的管理权限不同,所以相应的经济统计数据呈现形式的需求就不同。这就为经济数据统计系统提出了更高的要求,其不仅要对符合各个经济管理部门需求的数据内容进行统计,同时要将统计完成的数据换算成各种不同的呈现形式,并根据统计信息的来源和统计信息的计算方式对其可靠性进行评估[2]。最终这些数据信息的输出格式还应该符合所服务的经济管理部门管理系统的格式要求,保证统计数据能够在管理部门的管理系统中正常录入、应用,数据挖掘技术很好地满足了上述的复杂经济数据管理要求,其功能的综合性促进了其应用深度的提高和范围的扩大。
1.3宏观数据库有利于数据挖掘技术的应用当前因为经济管理部门的职权较为分散,各个经济管理部门的经济统计数据需求不尽相同。所以我国的经济统计活动绝大多数还采用传统的经济统计方法,统计收集的经济信息存在一定的局限性,不能够服务于经济管理活动的整体,或者造成一些数据统计工作的重复,对经济数据统计工作造成了一系列的质量和效率上的影响。经济数据统计活动急需一个能够整合各个统计系统,实现统计数据信息融合的新技术。宏观经济统计数据库为数据挖掘技术的开展提供了平台,数据管理系统的经济统计信息要正确无误,然后经过数据挖掘技术的整合,就能得到更加丰富的数据资源[3]。
2数据挖掘技术的应用
在社会经济管理活动中,管理主体对经济统计数据的要求主要有两个。一个是统计数据的真实性、一个是数据统计信息的实用性。单就这两个经济统计数据要求而言,数据挖掘技术能够很好地满足经济统计工作的需求,是适用性极强的一种经济数据统计技术,其在具体的经济数据统计活动中主要有以下三种应用方法。
2.1预处理方法在经济数据统计活动中,最为基础的一种处理方式就是经济数据的预处理方法,因为数据挖掘本身是一种基于提供基础信息的智能分析技术。其本身是受基础经济信息限制的,不可能无中生有代替经济数据收集系统的功能。所以所有作为数据挖掘系统数据基础的经济统计数据信息都应该进行预处理,处理的内容主要包括对这些数据中不正确、不真实、不准确,以及不同经济统计数据信息之间差距较大的现象。对这些基础数据存在的问题进行处理的过程被称为数据清理,当前数据清理主要采用的方法有均值法、平滑法和预测法。其中均值法是现代分析技术中模糊理念的一种应用形式,当基础数据中的一个数据点是空值或者噪声数据的时候,可以采用均值法进行处理,即用数据库中所有该属性已知的属性均值来填补空缺。保证数据挖掘系统对基础数据的分析和整理能够正常进行,得出相对而言准确度较高的统计分析数据。其中Ci表示当前数据点的取值,Cj表示当前数据点前后不为空的数据点,K表示当前数据点进行计算所取的参考数据点数量[4]。平滑法依然是对基础数据中空值和噪声数据的计算方法,其与均值法的区别是用加权平均数代替了平均数,考虑了计算过程中提取的每一个数据对数据结果的影响权重,所以计算出的结果往往更加接近真实的数值。其中Ci表示当前数据点的取值,Cj表示当前数据点前后不为空的数据点,K表示为对当前数据点进行计算所取的数据点数量。WJ表示Cj数据点的权值。
2.2集成化处理方法在数据挖掘技术的应用活动中,因为相同地区的数据统计主体不同,或者在不同地区对相同经济数据的统计标准不统一,会产生一系列的数据集成问题,如何对这些调查方向不同或者是呈现方式不同的数据进行有效集成而不影响经济数据统计的准确性,是数据挖掘技术的重要任务。在具体的数据集成过程中主要考虑以下几个方面的问题[5]。
2.2.1模式集成当前因为社会经济活动中经济数据的统计内容过于广泛,很多经济数据统计并不是来自于官方的统计局而是来自一些民间统计组织,或者是由一线社会经济主体直接提供的经济数据,在数据挖掘过程中将这些来自多个数据源存在多种数据呈现模式的经济数据信息进行集成就涉及实体识别的问题。例如在数据挖掘过程中如何确定一个数据库中“std-id”与另一个数据库中的“std-no”是否表示同一实体,当前一般使用数据库与数据库之间的含元数据对比来保证实体识别高效率和高质量[6]。
2.2.2冗余问题数据挖掘本身是对经济统计数据的一种深加工技术,经过其加工的经济统计技术应该在本质上达到最简状态。在数据挖掘过程中要将与其他数据呈现某种正相关关系的数据项目进行精简,以保证数据库中数据量维持在一个较低的水平,为数据管理和应用提供便利。在经济数据挖掘活动中人均国民生产总值就是典型的冗余属性,因为其数值是可以通过国内生产总值和总人口属性计算出来的,所以类似人均国民生产总值这种冗余属性在数据挖掘过程中就应该精简,应用的时候在利用国民生产总值和人口属性计算得出[7]。对冗余属性的判断主要通过相关度对比来实现。其中n表示元组的个数,分别是属性A和属性B的平均值,分别是属性A和属性B的标准方差,在这一公式中如果则表示A、B两个属性是正相关,也就是说A越大B就越大,值越高二者的正相关关系就越密切;如果则表示属性A、B之间没有直接关系,是相互独立的;如果则表示A、B两个属性呈负相关,属性B会随着属性A的减小而增大,的绝对值越大,二者的负相关关联关系就越密切。
2.3决策树方法在数据挖掘技术应用过程中,经过系统的分析和总结以后,分析数据的输出是一个关键的环节,其输出的数据形式会对使用者的经济管理决策产生直接的影响。决策树是一种较为常见的、直观的快速分类方法。其应用的关键是决策树的构建,具体而言主要分为两步:第一步是利用训练集建立并精简一棵决策树,建立输出分析的模型;第二步是利用构建完毕的决策树进行输入数据的分类,这一分类是一个递归的过程,从决策树的根部开始进入到树干、枝丫,直到输入数据的分类满足了某种条件而停止。在具体的应用中停止分割的条件有两个:一个是当一个节点上的所有数据都属于同一个类别的时候;另一个是没有分类属性可以对输入数据进行再分割[8]。在决策树构建完成后,还要根据使用者的具体要求对决策树进行“剪枝”,剪枝的主要目的是要降低因为使用训练集而对决策树本身数据输出产生的起伏影响。
3结语
经济统计活动是现代社会经济管理的重要基础数据提供主体,其本身对社会主义现代化市场经济建设的影响是广泛而深远的,所以其运行过程中的质量和效率至关重要。数据挖掘技术是针对现代数据管理活动中存在的数量基数大、构成复杂和数据缺失现象严重等客观问题而研发的一种高效的数据深度加工技术,其在经济统计中的应用能够更好地满足经济统计的需求。本文从数据挖掘技术概述、数据挖掘技术在统计工作中的适用性分析、数据挖掘技术的应用三个方面对这一问题进行了简要的分析,以期为数据挖掘技术在经济统计中应用水平的提升提供支持和借鉴。
作者:李荣单位:怀化学院经济系
一、统计道德风险产生的原因
(一)监督得不到有效合理的控制,导致统计工作产生风险我们大家都知道统计数据一般都是反映宏观整体现象,这种宏观整体现象往往都掩盖了事物的个体本质,因此大多数公众与某些部门对它产生怀疑却无从下手去监管,另外统计部门在统计信息时,占有主动权,具有权威性,这种信息的不对称性也容易产生职业道德风险,再有统计部门的垂直领导形式,使其工作都是“上派下行”,从而导致一些统计数据都是现有目标,再有统计,最后达到预期结果,统计工作的这种被动与尴尬已经成为普遍现象,这种从上到下无人监督,无人管理的现象所产生的后果是距离现实在越来越远,“此地无银三百两”的故事距离我们越来越近,社会将进入颠倒是非,真假难辨的恶性循环之中。
(二)统计法的力度不够,加速统计数据的风险产生从上边统计风险产生原因我们可以看到都是由于某些政府和个人短期利益的因素,而导致统计产生巨大的风险,这种短期的效益与其产生的长期风险是远远不对称的,但是许多政府与某些单位以及个人却还是选择了这一瞬间的短期利益,这是为何?我们常常听到某些单位或个人由于违反各种会计法、经济法,最后导致严重违反财经纪律、贪污腐化从而导致受到行政法律的制裁,严重者触犯刑法,最高可判无期乃至死刑和罚金。但是统计法律法规却没有这么大的力度,即使提供了虚假数据,即使受到行政处罚,也都是轻描淡写、隔靴搔痒而已,从根本起不到惩戒、震慑和遏止作用,却反而助长了统计数据失真的力度,加速了统计风险的速度。最后形成了“统计统计,三分统计,七分估计”的熟语。这也很好地回答了上述问题产生的根本原因。
二、针对当前我国统计工作职业道德产生的风险应采取的措施
(一)全面提高相关业务人员的综合业务素质统计工作涉及面广,对理论知识与实际工作能力要求高,它要求相关业务人员不仅懂得国家的法律法规,而且还要求相关业务人员掌握一定的财务、审计、经济、统计分析等一定理论知识,并且还特别强调了统计人员应该加强爱岗敬业、尽职尽责的职业道德,德才兼备,以德为先的职业道德和业务素质修养永远是统计人员的最起码要求,也是有效地避免统计风险的基本前提,所以统计人员应该通过各种渠道提高自己的综合水平,如参加各种统计相关的考试、学习辅导班以及业务比赛活动,使他们融入当今社会潮流之中,这样可以增强统计人员的自我提升、自我风险保护意识,这也是抵制社会上统计工作不正之风最有效的措施。
(二)政府及主管领导要用正确的发展观去指导统计工作我们大家都知道统计是为政府部门服务的,这是国家参与宏观调控的重要手段,但是在当今的市场经济体制下,以市场微观调控为主,国家宏观调控为辅的理念指导下,统计需要减少政府的干涉,甚至消除人为干预,这样才有助于国家的经济建设。所以各级政府应该转变职能态度,从而合理地引导各级主管领导具有科学的世界观,进而正确指导统计工作,引导宽松的统计工作环境,使统计工作者在良好的工作氛围中,放下包袱,努力工作,为国家制定合理有效的重大决策提供真实的数据,从而真实地反映国家的宏观目标,这样更有力促进社会经济的发展,促进人们的安全、社会的和谐。
(三)加强统计数据的监督反映统计数据失真给统计工作带来了一定的风险与隐患,其最大原因就是统计数据缺乏像会计工作那样的监督机构,另外统计数据的公布也非常笼统化,不如财务指标那样详细,计算方法与方式也不像会计那样进行详细地披露。所以国家应该尽早地出台一些法律法规以及有关政策,让统计部门加大信息披露的力度,如时间间隔应该缩短,披露的数据来源、方法、处理的过程等统计信息应该详细,让数据的使用者与监督者能够很好地分析数据的真实可靠程度,这样不仅增强了统计的公众监督力度,又有利于公众对统计的了解与认可,进而也让统计工作者工作起来有的放矢,避免了其左右为难的工作情绪,更避免了统计工作的重大隐患风险的存在。
(四)加强统计法律法规建设,完善统计规章制度目前国家对会计、经济等各种法律法规都进行了不断的完善与调整,此种方式方法得到了有效的反映,如偷税漏税逐步减少,行贿受贿、大吃大喝公款的现象极度收敛,这样不仅促进国家经济的发展,也受到了百姓的拥护与好评。那么如果在这种良好的氛围下,大力加强统计法律法规的建设,对那些原来不合理、不完善、不适合市场经济体制下的统计法律法规及规章制度进行删除或者合理的更新,并加以完善和必要的补充,如加大对政府与部门人为反方向干扰统计工作的监督与惩罚,加大胁迫统计工作者编制虚假数据而承担的法律后果,以及统计工作者在此过程中给予抵制而受到的奖励制度和听之任之、同流合污而承担的法律后果等等规定。这样统计工作者才能坚定地拿起法律的武器来保护自己,使自己勇敢地面对不法分子坚持真理,永不胆怯。因为谁也不能拿自己的一生和终身的家产去赌注,迫使不法分子没有可乘之机。这是杜绝统计工作职业道德风险,强化统计职业道德意识最有效的措施。
三、结束语
总之,时代在发展,经济在腾飞,信息网络飞速更新升级,统计数据愈加重要,统计工作也愈加复杂、愈加引起人们的关注,统计人员的使命感愈加突出,其统计职业道德风险就愈要加以防范,为了更好地促进金融危机下国家经济的正常发展,抓好统计工作势在必行,科学有效地防范统计风险愈加重要。
作者:修伟单位:辽宁省丹东市中心医院
《科技传播杂志》2014年第十八期
1统计学的数据整合,利于发挥新闻的监测功能
统计学的介入,让专题新闻的表现形式多元化,由多媒体制作的统计图片,表格等具有直观、准确、全面、深入等特点。这也便于以调查为归宿的专题新闻有了屏障。通过对比,综合分析事件背后的原因,将真相呈现在大众眼前。《今晚800》一期名为《暴雨之后成都菜价波动调查》的节目中,2013年7月,特大暴雨袭击成都,造成蔬菜市场价格的巨大波动。蔬菜一天一个价,就像坐过山车一般,时高时低。在整个新闻调查中,数据成为了真相的证据,也为之后政府的决策提供了依据。大雨侵袭后,平日里普通的蔬菜也悄然涨价。就拿莴苣来说,从过去的1块/斤涨到了现在5元/斤。莴苣这类叶子菜普遍比大雨前涨了3倍以上。数据描述了现象,就需要从现象中看到事件的本质。记者通过调查周边地区的菜农得到了答案。因为暴雨降临,成都、绵阳、雅安等地受灾严重。截至7月15日9时统计,此次暴雨洪涝灾害已造成阿坝、德阳、成都、雅安、绵阳等15市(自治州)90个县(区、市)344.4万人受灾。农作物受灾面积156.5千公顷,直接经济损失200.8亿元。对于蔬菜基地的破坏尤为严重,一个生产基地破坏,源头大量减产,商户去收菜,收不到。菜价出现波动,交易量出现下跌,远一点的菜受到交通影响,一车菜都出来不了,商户绕道5、6百公里,花三倍时间,运输成本大幅上升,蔬菜质量比原来下降的多,要么大量的菜同时进入市场、要么全部堵在路上,价格波动明显。受灾规模大,商家运输困难造成了蔬菜价格大涨。为了应付而四川盆地7月的这场特大暴雨,成都市农委和成都市商务局着情下药,该中心立即启动了市场调节机制。外地蔬菜之前供应成都市场占到了40%多不到50%、是走向成都区域的,雨季期间供应成都市场的量占到了60%以上了,大部分货源走向了成都区域,弥补了成都区域货源不足。新闻中的数据为政府宏观调控提供了便利,蔬菜价格的异常在宏观调控中得到合理的控制,通过政府对市场的干预和调节,这种突发性的涨价,很快就可以得到回落。
2统计数据在专题新闻中的应用
2.1数据信息含量大,增强新闻的底蕴在所提供的数据中,很多包含了新闻的背景信息,这些信息不仅延伸了新闻的深度。更重要的是,信息含量大,意味着新闻的角度越宽。对于记者来说,他能选取到更佳的报道角度来反映主题。而对于观者来说,也能从不同的角度去解读同一件事情。为什么现代的连续剧有这么多版本,但是每个版本表现的内容却不同。这就是因为导演收集的资料和表现的方式不同。在老三国中,导演着重以蜀国的视角来解读三国。因此,开篇选用了桃园三结义来表现蜀汉的情义。为了表现蜀汉忠于汉室,难免贬低曹操、孙权等。可随着时代的变迁,人们不在拘泥于过往传统小说的解读模式,而是以新角度、包容的态度去接纳这类影视作品。才有了《新三国》被称为《曹操传》的“事实”。其实,这些都和已有的数据有关系。过往人们的思维总认为,传统给予的信息是对的。但事实并非如此,收集的数据资料越丰厚,可供选择的信息就越多,解读的角度也会不同。专题新闻很多时候讲究多维度表现,从多方面反映新闻事件。比如,采访“公交防狼法”时,除了要采访到当事人、交管部门、市民之外,律师、防狼教练、医生也是必须要采访到的,使节目更具立体感,调查也显得深入。
2.2统计数据全面,深度解析实事专题新闻中的数据引用量大于普通新闻,数据的跨度比较大,为了说明一个现象时,会大量出现与现象相关的关联数据。这些数据帮助专题新闻能从时间和空间多层面展现事件全貌,挖掘新闻真相。比如,《今晚800》—25年成都驾考那些事节目中,就对自1987到2012年全面实行电子化驾考做了全面的数据分析。先是说明改制后,考生的合格率,据成都市车管所提供的数据显示:成都全面实现电子化驾考第一天,参加考试的1500名考生中,有540人通过考试,合格率为36%。到了第三天,共有3183人参加考试,考试合格为953人,合格率为30%。相比于改制前,合格率明显下降了不少。1988年时全市拥有驾照人数占总人数比例为0.006%;也就是说平均每10万人中,仅有6个人拥有驾照,2010年拥有驾照人数占总人数比例为24%。也就是说平均每100人中有24人持有驾照。驾驶员人数机动车数量增长了29倍,驾驶人总数增长了59倍,成为中国汽车第三城;会开车也从一种工作技能,变成了一个人的生活基本能力。成都驾考所走过的25年,无论是从考试场地、评判手段,还是从考试规模上都发生了巨大的变化,这也从一个侧面折射出成都社会经济的巨大变化。
3结论
统计数据能完美地融于新闻学中,它不但能让新闻展示出更为真实有效的信息,更能提高新闻的表现力。记者在专题新闻中引用的数据并非空穴来风,而是经过深入调查得来的。这些数据能帮助新闻从业者进行更深入地调查,也能便于他们理清新闻脉络。更重要的是,这些宝贵的数据便于政府部门对症下药,快速有效地找出问题的症结,及时处理,解决老百姓生活中的疑难杂症。
作者:程一丁单位:成都理工大学
一、垦区劳动工资统计出现的新情况和新问题
改革开放以来,随着垦区经济体制改革的不断深入,职工家庭农场逐步兴起,垦区农业职工原有的固定等级工资已不能客观地反映职工实际所得的劳动报酬,不能再作为年终工资统计的依据。职工家庭农场是在垦区计划指导下,对国有土地实行定期承包、自主经营、包干上交、独立核算、自负盈亏的经济活动单位。随着家庭农场的兴起,垦区内部生产组织形式发生了变化,同时在用工方式和分配方式上也发生了很大的变化。主要变化表现为:在用工制度上,改革了原来固定工制度,全面的实行劳动合同制;家庭农场根据生产需要,雇用了一些短期帮工或长期帮工,其人数少则三、五人,多则十几人;分配方式方面的变化也很大,近两年,家庭农场职工种地上交完农场利费粮,盈余部份可自行分配,但是很难在盈余部份中划清有多少是工资,有多少是净利润。面对这些问题,如何将家庭农场职工的工资收入划分清楚并如实统计出来,是劳动工资统计面临的新问题。
二、农业劳动工资统计数据控制思路及办法
从目前农业从业人员分类看,有机关、事业管理人员,这些人劳动报酬容易统计,可以从其单位财务部门直接取到;还有打工人员、兼职人员,这些人的劳动报酬可以调查获得;另外一大部分就是从事农业生产的农场职工,他们的工资就较难直接取到,常常会出现漏报、工资总额少报等问题,其主要原因是统计方法出现了问题。为了真正使劳动工资统计数据反映客观实际,确保主要数据能客观地反映劳动经济运行趋势,为宏观决策和制定政策提供准确、可靠的依据,我们可以将其控制在一定的区间内,力争在趋势上把握农业职工平均工资的水平,保证所上报的数据不偏离甚至背离正确的趋势。
(一)劳动工资统计数据控制思路
由于对农业职工的平均工资进行全面统计是不可能的,为了保证统计数据质量,力争在趋势上把握农业职工平均工资的水平,我们为农业职工工资确定一个区间,保证所上报的数据不偏离甚至背离正确的趋势。以黑龙江垦区年报210表第一产业人均纯收入为基础,来估算年报202表农业(农、林、牧、渔业,下同)平均工资,给农业职工工资确定下限和上限。
(二)具体控制办法
1.确定下限。
农业人口是垦区辖区内直接从事农业生产的常住人口,以户主为准,家庭其他成员也算做农业人口。换而言之,农业从业人员从农业生产中获得的收入供养辖区内的人口,若用农业人口数除以农业从业人员得到一个系数K1,根据垦区近几年的年报数据计算出此系数K1,那么K1×a(a为黑龙江农垦年报制度“农场职工家庭人均纯收入调查表”中的指标家庭经营收入与工资性收入的和)就是农业在岗职工平均工资的下限。对于系数K1,可以理解为每一个农业职工所能扶养的家庭人口数。从事农业生产的每个农业职工和每个其他从业人员从单位土地(或其他)上得到的收入可以说是相同的(去除个别因素),农业职工和其他从业人员家庭成员构成上大体相同,这样每个农业职工所能扶养的家庭人口转换为每个从业人员所能扶养的农业人口。系数K1可以得到,用系数K1与a乘积就是平均每个家庭从第一产业得到的纯收入,而这个纯收入是由该家庭农业职工所创造的。
2.确定上限。
用农业人口减农业其他从业人员的差除以农业职工作为系数K2,系数K2代表每一个农业职工的收入既供养其家属又供养其他从业人员的家庭成员,实际的农业职工平均工资应小于K2与第一产业人均纯收入的积。这样就确定了区间的上限。
三、对农业劳动工资统计数据控制办法的验证
我们用垦区2007-2012年数据进行测算后,计算得到下限系数K1为1.8,上限系数K2为2.4。我们用垦区某农场2012年全年数据进行了验证,结果是科学合理的。2012年该场人均纯收入31906元,从农场人均纯收入构成来看,其中农业人均纯收入14950元,占总收入的47%,财产性收入和转移性收入4124元,占总收入的13%;家庭经营纯收入20521元,占总收入的64%。依据人均纯收入调查表推算农业从业人员劳动报酬是可行的,该场人均纯收入31906元,农业人均纯收入14950元,农业在岗职工工资应该在26910-35880元之间,是比较合理的、是可行的。
作者:于传文单位:黑龙江农垦工业学校