期刊大全 杂志订阅 SCI期刊 投稿指导 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 大数据分析论文

大数据分析论文精品(七篇)

时间:2023-03-14 15:12:39

序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇大数据分析论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。

大数据分析论文

篇(1)

关键词:大数据 交易平台 数据资源 数据分析服务 融合

1.引言

目前发展大数据产业已经上升为国家战略,大数据的价值也得到了社会的广泛认可。众多研究[1-5]表明,大数据不仅为政府治理开辟了新思路,还是企业创新的重要源泉和高校科研的重要支撑。大数据交易平台是整个大数据产业的基础与核心,它使得数据资源可以在不同组织之间流动,从而让单个组织能够获得更多、更全面的数据。这样不仅提高了数据资源的利用效率,更重要的是,当一个组织拥有的数据资源不断丰富和立体化,有助于其通过数据分析发现更多的潜在规律,从而对内提高自身的效率,对外促进整个社会的不断进步。

在现有的大数据交易平台上,数据供应方和需求方各自供需信息,交易双方浏览这些信息,如果发现合适的交易对象,则进行大数据资源的买卖,交易平台只作为信息中介存在。这类大数据交易的本质,其实是单独的大数据资源交易,现有平台可以统称为第一代大数据交易平台。第一代大数据交易平台在供需平衡、数据定价和时效性三个方面都存在较大的不足。本文针对这些不足进行改进,设计了一种全新的第二代大数据交易平台,命名为:融合数据分析服务的大数据交易平台,该平台将数据资源交易与数据分析服务进行深度融合,实现了数据与服务的一体化交易。本研究不仅为当下正在建设的各类大数据交易平台提供有益的借鉴,也丰富了大数据交易的基础理论体系。

2.相关研究

目前大数据交易的相关研究中,比较有代表性的有:

(1)大数据的财产属性和所有权。王玉林等[6]对大数据的财产属性展开研究,认为大数据的法律属性会直接影响大数据产业的发展,而大数据交易实践本身就反映出大数据具有财产属性。但大数据与传统的财产权客体存在较大不同,它符合信息财产的特征,是信息财产权的客体,应受到相关法律的保护。齐爱民等[7]从宏观的角度分析了国家对于其主权范围内数据的所有权,剖析了个人拥有的数据权以及数据的财产权。

(2)大数据的定价问题。刘朝阳[8]对大数据的定价问题展开研究,首先分析了大数据的基本特征、价值特征等定价基础。接着讨论了效用价格论、成本价格论等定价模式。最后分析了大数据的定价策略,并对大数据定价的双向不确定问题进行了详细论述。刘洪玉等[9]认为在大数据交易过程中,由于缺乏足够的历史参考,其数据资源的交易价格很难确定,因此提出一种基于竞标机制的鲁宾斯坦模型,用于大数据交易双方进行讨价还价,以求达成一个交易的均衡价格。翟丽丽等[10]从资产的期权价值角度来评估大数据资源的价值,并指出数据在不断变化和更新,加上数据的非独占性等情况的出现,数据资产的价值可能会下降,最后综合这些因素构建了一个评估模型来计算数据资产的价值。

(3)大数据交易的安全与隐私保护。史宇航[11]认为非法的数据交易会对个人数据等高价值信息的安全造成影响,对非法数据交易的购买方和协助方都应进行处罚。提出应先明确数据的法律属性,再以数据交易所为平台进行交易,并对数据交易所的法律地位进行了分析。殷建立等[12]为应对大数据时代数据采集、交易等过程中的安全问题,综合考虑技术、政策和管理平台等方面的因素,构建了一种个人数据溯源管理体系,该体系可在数据应用时实现个人数据的追踪溯源,从而保护其个人隐私。王忠[13]认为大数据环境下强大的数据需求会导致个人数据的非法交易,为应对这种情况,应该建立个人数据交易许可机制,通过发放交易许可证、拍卖授予等措施实现隐私保护。

(4)大数据交易的发展现状与问题。杨琪等[14]认为我国的大数据交易还处于行业发展的早期,大量数据源未被激活,原因是大数据产业价值链的各个专业环节发展滞后,并且对数据交易中的安全问题和隐私泄露等有较大的担忧。应该对数据产品进行改造,使其更商品化,并且通过政府开放公共数据等措施逐渐消除数据流通中的安全顾虑。唐斯斯等[15]首先分析了我国大数据交易的发展特点、交易类型等现状,接着指出目前大数据交易存在法律法规相对滞后、行业标准不完善、交易平台定位不明确、数据质量不高等问题,最后提出应加快相关法律和标准建设,并推动数据开放,加强交易方式的创新。

除了上述四个主要研究方向以外,李国杰等[16]从理论的角度分析了大数据研究在行业应用和科学研究方面的重要作用,这从客观上反映了大数据流通的必要性。涂永前等[17]认为大数据时代企业管理和运用数据资源的相关成本会成为企业的主要交易成本,这会改变企业的组织结构,并导致企业边界的变化,企业会进行多方向的扩张,这为促进大数据产业发展的相关法律的制定提供了理论支持。总的来看,由于大数据交易本身属于较新的领域,因此相关研究总体上较少,已有研究也大多集中在上述几个研究方向上。实际上,大数据交易平台是实现大数据交易的重要载体,是大数据资源流通转换的主要节点,交易平台本身需要随着整个大数据产业的发展,不断的改进和升级,而现有研究中恰恰缺少对大数据交易平台本身进行创新的研究。由此,本文针对现有大数据交易平台的不足,结合实际设计了一种全新的融合数据分析服务的大数据交易平台,为实践和科研提供借鉴和参考。

3.现有大数据交易平台的不足

大数据本身作为一种新兴事物,当把它作为一种商品进行交易时,其交易平台的设计很自然会参照传统的商品交易模式,即:交易双方先供求信息,再经过讨价还价,达到一个均衡的价格则成交,卖方将大数据资源经过脱敏处理后,交付给买方。目前无论是政府主导的大数据交易所,还是企业或者高校创建的大数据交易平台,都是采用类似的交易模式,这也是第一代大数据交易平台的突出特点。实际上大数据与传统商品有很大的区别,照搬传统商品的交易模式会出现很多问题。本文将从供需平衡、数据定价和时效性三个方面分析现有大数据交易平台的不足。

3.1 数据供需的错配

现有大数据交易平台的第一点不足就是数据供需的错配,即:供应方提供的数据资源往往不是需求方所需要的,而需求方需要的数据在交易平台上找不到,即使有相近的数据资源,也存在很大的数据缺失或冗余,买回去也无法使用。对数据供应方来说,由于无法准确预知数据买方多样性的需求,它只能从自身角度出发,将可以公开的、并且自认为有价值的数据资源放到平台上待售。对需求各异的买方来说,供应方提供的标准数据很难与自己的应用方向精准匹配,这也是目前大数据交易还不够活跃的原因。当然,当供需双方建立初步联系以后,供应方甚至可以为需求方个性化定制大数据资源,但即使这样,供需错配的问题仍然无法解决,原因就在于单个的数据供应方无法提供多维的数据资源,只有多维的数据资源才具有较高的分析价值。

3.2 大数据资源定价困难

大数据资源定价困难是现有大数据交易平台的第二点不足。大数据资源和普通商品不同,普通商品可以直接消费或者作为再加工的原材料,其价值都可以通过最终的消费品价格得到体现。而大数据本身的价值无法直接衡量,需求方购买它的目的是作为数据分析的信息源,但是否能发现潜在的规律还未可知。因此无法在购买前,准确判断出待售数据资源的价值大小。此外,需求方在不确定某大数据资源是否能真正能给组织带来收益情况下,很难给出一个较高的价格,这在客观上会影响数据供应方的交易积极性,加大了供需双方达成交易的难度。

3.3 数据的时效性不强

现有大数据交易平台的第三点不足,就是数据资源的时效性不强。目前很多大数据交易平台上待售的数据资源都以历史数据为主,这是因为数据资源在交易前需要经历脱敏处理,将涉及政府信息安全、企业商业机密和个人隐私等敏感信息进行变换和替代。此外,供应方还需要对原始数据进行初步的清洗,整理成一定的数据格式集中存贮和交付,方便需求方进行数据分析。由于一般的数据供应方并不具备对大数据进行实时脱敏和清洗的能力,只能将采集到的数据资源,经过一段时间的离线处理后,再放到交易平台上,所以只能供应历史数据。随着社会节奏的不断加快,历史数据很可能并不能反映当下的真实情况,越来越多的数据分析都需要用到实时数据作为信息源,这是未来大数据交易必须克服的一个短板。

4.融合数据分析服务的大数据交易平台设计

本文提出将数据分析服务融合到目前的大数据交易中,以此来克服现有交易平台的不足,本节将首先对数据分析服务进行概念界定,再依次介绍平台设计的总体思路和核心模块的设计,具体如下。

4.1 数据分析服务的概念界定

数据分析是指运用各类数据处理模型和信息技术手段,对数据资源进行深度的挖掘,从而发现其中蕴含的规律,作为管理决策的依据。数据分析本身是一种能力,如果一个组织将其数据分析能力提供给其他组织或个人,并收取一定的费用,这就是数据分析服务。在大数据环境下,数据资源不仅体量巨大而且种类多,对数据分析能力的要求不断提高。在这种情况下,只有少数组织具备独立处理大数据的能力,其他的组织比如大量的中小企业,都需要从组织外部寻求专业的数据分析服务,来满足自身的需要。因此,数据分析服务和大数据资源一样存在巨大的市场需求。

4.2 平台设计的总体思路

本文将提出的融合数据分析服务的大数据交易平台,定位为第二代大数据交易平台,它将大数据资源交易与数据分析服务两者进行深度融合,在交易平台上实现数据与服务的一体化交易。大数据交易平台的角色也从原来的数据资源买卖的信息中介,转变为大数据综合服务商。在融合后的大数据交易平台上,数据需求方不再提交数据资源的需求信息,而是直接提出自己的应用方向和想要得到的结果,交易平台再根据需求方的应用方向,反向匹配数据资源和数据分析服务。这个匹配的过程不是单一的数据集或服务的查找,而是对全平台的数据资源进行有效整合,形成高价值的多维数据,再结合复合型的数据分析技术,得到最终的分析结果,最后将分析结果与基础数据一同交付给需求方。交付基础数据的目的,一是方便需求方进行分析结果的对照,为决策提供更精准的参考。二是需求方可以根据基础数据进行衍生挖掘,进一步提高数据的利用效率。平台设计的总体思路绘制成图1。

图1 平台设计的总体思路

4.3 核心模块的设计

融合数据分析服务的大数据交易平台共划分为四大模块,具体如图2所示。

图2 融合数据分析服务的大数据交易平台的主要模块

系统管理模块具体又分为用户管理、系统维护和安全管理。安全管理是系统管理模块的重点,主要包含三个方面的功能:第一,负责整个交易平台的系统安全,通过对交易平台进行实时监控,阻止外部的非法入侵行为,保障平台的正常运行。第二,对数据供应方提交的数据资源进行审核,如果发现是非法数据,则阻止其交易,并及时将有关情况反馈给相关的政府监管部门,由它们进行调查处理。第三,检查所有数据是否经过脱敏处理。如果发现部分数据存在未脱敏或者脱敏不合格的情况,交易平台将负责对该数据资源进行脱敏处理,从而保护数据中的隐私不被泄露。

大数据资源池模块、数据分析服务模块和协同模块是交易平台的三大核心模块,是数据与服务两者融合并实现一体化交易的关键,本文接下来将对这三个核心模块的功能进行详细设计。

4.3.1 大数据资源池模块

大数据资源池模块主要包含三个方面的功能:数据资源格式的整理、数据的多维度整合、大数据资源的云存贮。具体如下。

(1)数据资源格式的整理。由于大数据交易平台上的数据资源来自不同的数据供应方,因此其数据资源的格式会有较大的差异。如果不经过格式整理就直接进行数据分析,很可能会因部分数据无法准确读取,而影响数据处理的效率,严重者还会导致数据分析中断。数据资源格式整理的主要任务是将同一类型数据的格式进行统一,对部分缺失的数据属性进行补充,对错误的数据格式进行修正。

(2)数据的多维度整合。在上文3.1中提到供需错配的一个重要原因,就是单个数据供应方无法提供高价值的多维数据。所谓多维数据是包含用户或者行业多个背景和情境的大数据资源,这些多维数据使用户或行业多个侧面的信息产生了关联,有利于发现深层次的潜在规律。融合数据分析服务的大数据交易平台应该作为数据整合的主体,将单个数据供应方提供的零散的数据资源,进行多维度的整合,当缺少某一个维度的数据时,再向相应的数据供应方进行定向的采集,最后得到相对完整的多维数据,具有很高的分析价值。

(3)大数据资源的云存贮。大数据资源经过格式整理和多维度整合以后,已经可以作为数据分析服务的信息源。下一步就是将这些数据资源进行统一的云存贮,以便数据分析服务调用。以往部分大数据资源由于体量巨大或实时更新的需要,无法上传到交易平台上,或者只提供部分调用接口。融合数据分析服务的大数据交易平台通过建立云存贮中心,将整合后的多维数据进行统一存放和调用,有助于提高数据资源的存取效率。

4.3.2 数据分析服务模块

数据分析服务模块首先根据数据需求方的应用方向,匹配出合适的多维数据资源,再选择相应的数据分析模型分配所需的计算能力,最后将得到的分析结果反馈给需求方。本文将数据分析服务划分为三个大类:基础性分析服务、高级分析服务、深度定制的分析服务。具体如下。

(1)基础性分析服务。基础性分析服务是指那些常规的数据统计,比如:总体中不同对象的占比分析,基于不同属性的关联分析或相关性分析等。这些分析服务耗时较短,分析技术较为简单,只要数据资源本身完备,就可以迅速得到结果。基础性分析服务由大数据交易平台本身来提供,可以面对不同的需求方,实现快速交付。

(2)高级分析服务。高级分析服务是指那些较为复杂的数据分析服务,比如:精准的趋势预测、全面的用户兴趣画像、非结构化的信息挖掘等。这些分析服务需要大量专业的数据处理技术,比如:兴趣建模、视频分析,音频分析、深度语义分析等,必须由大数据交易平台对接第三方的数据分析服务商,由它们来提供高级分析服务。大数据交易平台在同一数据分析领域,应引入多家数据分析服务商,通过动态的竞争,来保证服务的质量。

(3)深度定制的分析服务。大数据分析目前还处在快速发展阶段,很多前瞻性的技术还在试验当中,应该说数据分析技术的发展相对于旺盛的现实需求来说是滞后的。当需要用的某一数据分析技术,在目前的市场上还找不到现成的提供方时,就需要大数据交易平台为其进行深度的定制,交易平台通过多方位的研发能力评估,寻找合适的技术主体来进行专门的技术攻关。

4.3.3 协同模块

协同模块主要包含两个方面的功能:数据分析服务之间的技术协同、交易各方的管理协同。具体如下。

(1)数据分析服务之间的技术协同。在面临较为复杂的数据分析任务时,可能需要用到多个领域的数据分析技术,这时单个的数据分析服务商可能无法独立完成。因为不同的行业领域,都有其行业技术的独特性,需要长时间的专业积累。在这种情况下,就需要多个数据分析服务商相互合作才能完成。数据分析服务之间的技术协同,就是通过一定的技术标准和操作规范,让多个数据分析技术提供方,能够在完成同一任务时,在技术上不冲突,能够相互并行的完成对数据资源的处理,按时按质的交付最终的分析结果。

(2)交易各方的管理协同。在融合数据分析服务的大数据交易平台上,交易的参与者一共有四类,分别是数据资源的供应方、数据分析服务商、需求方和交易平台自身。数据需求方在提交自己的应用方向和预期结果的同时,提交自己的交易预算。交易平台根据需求方提交的应用方向和预期结果,对数据资源和数据分析服务进行反向的选择。如果数据分析任务中只用到了基础性分析服务,则整个交易为平台方、需求方、数据资源供应方的三方交易。如果某数据分析任务,平台自身无法完成,需要用到第三方的数据分析服务商,则整个交易包含了全部四类参与者,是一个四方交易。交易的基本原则是实现参与各方的利益共享。交易各方的具体利益分配如图3所示。

图3 交易各方的利益分配

需求方希望在获得预期结果的同时,其支付的成本在可接受的范围内。交易平台在对数据和服务进行反向匹配后,会出现两种不同的情况:第一种情况是在原交易预算下,可以达到需求方预期的结果,则可成交。第二种情况是,原交易预算较低,在该预算下无法达到需求方要求的结果,这时交易平台会和需求方沟通,提出新的报价,需求方经过考虑后,与平台进行讨价还价,它们在价格上达成一致时才能完成交易。由于交易数据是整合后的多维数据,因此原始数据资源供应方的收益,由平台从总交易价中支付,具体的支付方式可分为平台一次性买断或按次数支付。同一数据资源对于不同的需求者来说,其价值是不一样的,融合数据分析服务的大数据交易平台根据最终的一体化交易成交价,反向对数据资源进行定价,相对于现有的大数据交易平台来说,是一种进步。交易平台的深度参与,会使数据交易的频率加快,原始数据资源供应方会获得更多的收益。数据分析服务商根据具体的数据分析任务,直接参与由平台发起的竞价,达成交易后由平台支付。交易平台本身的收益则是需求方支付额减去其他各方收益的差价。

5.融合数据分析服务的大数据交易平台的优势

本文3.1到3.3中指出现有大数据交易平台存在数据供需错配、大数据资源定价困难、数据的时效性不强三大不足。融合数据分析服务的大数据交易平台作为改进后的第二代大数据交易平台,可以很好地克服上述三点不足。除了这三个方面的优势以外,由于融合后可实现数据与服务的一体化交易,这将扩大交易对象的覆盖范围,提升交易的活力,具体如下。

5.1 直接面向应用,从根本上避免了数据供需的错配

在融合数据分析服务的大数据交易平台上,需求方对交易平台直接提出应用方向和预期结果。交易平台对全平台的数据进行多维度整合,如果缺失某个维度的数据,可以进行定向的采集和补充,最后形成高价值的多维数据。这些多维数据才是真正具有分析价值的数据资源,这是单个数据供应方无法提供的。在得到多维数据后,结合平台自身和第三方数据服务商的分析能力,得到最终的分析结果。交易平台最后交付给需求方的是数据分析结果和基础数据,这种直接面向最终应用的大数据交易方式,从根本上避免了数据供需的错配。

5.2 融合后定价更有根据

在现有的大数据平台上,数据需求方是将数据资源买回去以后自己分析,而在购买数据资源之前,不能预知数据分析效果的好坏,因此无法进行有效的价值判断,这是定价困难的关键点。在融合数据分析服务的大数据交易平台上,需求方不再直接对数据资源付费,而是对最终的数据分析结果付费,并且数据分析结果是根据需求方的要求反向定制的,是符合需求方利益的。需求方可以通过评估预期结果对自身的重要性或收益的改进程度,给出适当的交易预算。交易平台以该预算为参照,对数据和服务进行选择,若出现原预算约束下无法实现预期结果的情况,交易平台再与需求方进行沟通,双方讨价还价后达成交易。这样相对于现有的大数据交易平台来说,融合后定价更有依据。

5.3 融合后可提供实时数据

在融合数据分析服务的大数据交易平台上,数据资源采用云存贮的模式,由平台进行统一管理,这提高了数据资源的安全性。在数据安全有保障的前提下,由交易平台出面和数据资源供应方进行实时数据的对接,将实时数据纳入大数据资源池中。对于单个的数据资源供应方来说,实时的数据脱敏难度太大。但大数据交易平台不一样,它可以利用规模优势,组建强大的计算能力,对大数据资源进行实时的脱敏和清洗,极大地提高了数据资源的时效性。

5.4 融合后将扩大交易对象的覆盖范围,提升交易的活力

融合后可实现数据和服务的一体化交易,让很多自身不具备数据分析能力的组织和个人,也能方便地利用大数据,特别是大量的中小企业,这将大大增加交易对象的覆盖范围。

交易对象的增多会促进交易频率的增长,从而为数据资源供应方带来更多的收益,这样会提升它们参与交易的积极性,鼓励它们供应更多的数据资源,从而提升交易的活力,整个大数据交易行业就形成了正向循环的良好发展态势。

6结语

本文对大数据交易平台本身进行了改进与创新,设计了一种全新的第二代大数据交易平台,即:融合数据分析服务的大数据交易平台。该交易平台可以直接面向需求方的应用方向,实现数据和服务的一体化交易,不仅从根本上避免了数据供需的错配,还使大数据交易的定价更有依据,平台的深度参也让提供实时数据成为可能,这些将从整体上提升大数据交易的效率。融合后数据和服务的一体化交易降低了大数据应用的技术门槛,鼓励更多组织和个人参与,增加了交易活力。未来笔者将继续关注大数据交易平台的创新研究,为实际应用和学术科研提供更多有益的参考。

参考文献

[1]赵强,单炜.大数据政府创新:基于数据流的公共价值创造[J].中国科技论坛,2014(12):23-27.

[2]徐继华,冯启娜,陈贞汝.智慧政府:大数据治国时代的来临[M].北京:中信出版社,2014.

[3]李文莲,夏健明.基于“大数据”的商业模式创新[J].中国工业经济,2013(5):83-95.

[4]侯锡林,李天柱,马佳,等.大数据环境下企业创新机会研究[J].科技进步与对策,2014,31(24):82-86.

[5]张峰,张迪.论大数据时代科研方法新特征及其影响[J].科学学研究,2016,34(2):166-170,202.

[6]王玉林,高富平.大数据的财产属性研究[J]。图书与情报,2016(1):29-35,43.

[7]齐爱民,盘佳.数据权、数据主权的确立与大数据保护的基本原则[J].苏州大学学报:哲学社会科学版,2015(1):64-70.

[8]刘朝阳.大数据定价问题分析[J].图书情报知识,2016(1):57-64.

[9]刘洪玉,张晓玉,侯锡林.基于讨价还价博弈模型的大数据交易价格研究[J].中国冶金教育,2015(6):86-91.

[10]翟丽丽,王佳妮,何晓燕.移动云计算联盟企业数据资产评估方法研究[J].价格理论与实践,2016(2):153-156.

[11]史宇航.个人数据交易的法律规制[J].情报理论与实践,2016,39(5):34-39.

[12]殷建立,王忠.大数据环境下个人数据溯源管理体系研究[J].情报科学,2016,34(2):139-143.

[13]王忠.大数据时代个人数据交易许可机制研究[J].理论月刊,2015(6):131-135.

[14]杨琪,龚南宁 .我国大数据交易的主要问题及建议[J].大数据,2015(2):38-48.

篇(2)

关键词:大数据背景;专业技术;技能探究

中图分类号:G64 文献标识码:A 文章编号:1009-3044(2016)33-0123-01

Abstract : With the theme of declare big data and applied technology major, this thesis was written by author from telecommunications engineering academy. It has researched and analysed the composition of big data, related technologies, application requirement about the data mining and the problems has been solved by big data technology; Also it described what kind of related knowledge and skills need to be master by higher vocation education students in school, analysed the teaching qualities contrast with the needs of modern enterprises in details, by all means this thesis will focus on practically personnel training and explore the thinking of vocational colleges’ big data application technology major.

Key words : big data background, professional technology, skills exploration

随着网络和数据信息科学的发展,数据在量和复杂度上的爆炸式增长让人类进入了大数据时代。根据IDC监测,人类产生的数据量正在成指数及增长,大约每两年翻一番,以此速度在2020年之前会持续保持下去。大量数据源的出现则导致了非结构化、半结构化数据爆发式的增长即数据结构日趋复杂。大数据分析意味着企业能够从这些新的数据中获取新的洞察力,并将其与已知I务细节相融合。大数据对各种行业似乎产生了前所未有的巨大影响,从制造商到旅游业,从产品设计到消费者行为分析,大数据能提供前所未有的信息,帮助公商行业做出最好的决策。公商行业对合格的数据分析师或者数据工程师的需求很大。

人才市场需要会分数据并以有用的方式呈现信息的雇员。根据市场需求,高职院校需要培养学生成为具有数据应用技能的人才以满足市场需求。我们研究方向是调查公司企业所需要的技能和大学教的数据分析技能,对比两方面的技能的差别。人才需求调研裼昧宋示矸绞讲杉专家的意,专家分为相关专业学科教授和企业内本行业专家。

大数据应用技术专业的课程设置应跟随新技术的应用,跟随社会及企业需求,在新专业中重视培养专业技能和项目经验人才,课程设置应贴合社会需求培养相应的就业技能。需要研究关于合格的数据分析师或者数据工程师应该具有什么资格及知识技能。调研的结果可以帮助学院开设有关大数据学科的学校及大数据有关的课程教材。

调研内容如下表格:

综上所述,十报告传达的是要重视高等职业教育,强调“要全面实施素质教育,深化教育领域综合改革,着力提高教育质量,培养学生创新精神。”中国的职教体系也在深入发展改革的过程中。本调研是针对高等职业院校的大数据应用技术专业的课程设置的进行探究,通过对大数据应用技术专业在市场人才需求的研究,对全面实施素质教育,重视学生的创新能力的培养具有重要意义。

参考文献:

[1] 王星.大数据分析:方法与应用[M].清华大学出版社,2013.9.

[2] 曹正凤.数据分析统计基础[M].电子工业出版社,2015.2.

[3] 屈泽中.大数据时代数据分析[M].复旦大学出版社,电子工业出版社,2015.7.

[4] Hames R.Evans.Business Analytics:Methods,Models,and Decisions[M].电子工业出版社,2015.7

篇(3)

关键词 大数据;CiteSpace;教育

中图分类号:G642 文献标识码:B

文章编号:1671-489X(2016)18-0069-03

Abstract The advent of the era of big data has brought new vitality

and challenges for educational research. This paper uses bibliometric visualization software Cite Space to analyze thesis with key words data and education from CNKI based on Co-occurrence analysis of keywords, explore the hot issues in the field of educational research, summarize the research status and trends.

Key words big data; CiteSpace; education

1 引言

近年来,教育领域研究者开始关注大数据背景下的教育管理模式转变、教育决策研究等内容,大量基于大数据背景的教育领域研究论文逐年增加。以“大数据”“教育”为主题关键词在CNKI中国知网进行搜索,仅选择SCI、EI、中文核心、CSSCI四类来源期刊截止到2015年12月出版的文献,共检索到417条数据,从2010年开始呈现出逐年上升的趋势。对这些文章进行浏览和筛选,选择与本研究主题相关的论文,共247篇。对这247篇文章的关键词信息进行研究,分析大数据的出现对教育领域研究热点及发展趋势的影响。

2 教育领域热点问题研究知识图谱

CiteSpace软件是一款引文可视化分析软件,着眼于分析科学知识中蕴含的潜在信息,通过可视化的手段呈现科学知识的结构、规律和分布情况[1],能对文献进行作者分析、关键词共现分析、机构分析、作者共被引分析、文献共被引分析等。关键词共现分析是一种内容分析技术,通过分析在同一个文本主题中的款目对(单词或名词短语对)共同出现的形式,确认文本所代表的学科领域中相关主题的关系,进而探索分析学科领域的发展,发现学科的研究热点和研究趋势[2]。

使用CiteSpace软件对下载的文献进行关键词共现分析,生成图1所示关键词共现知识图谱,分析大数据的出现对教育领域研究热点和趋势的影响。关键词出现的频次由圆圈代表的节点反映,圆圈越大,表明关键词出现次数越多,最大圆圈代表的关键词是“大数据”。

根据图1得到表1所示文献关键词、被引频次、中心性等指标数据。中心性代表共现程度的高低,中心性越强,表明该关键词与其他关键词共同出现的几率就越大,也就表示该关键词在共现网络中的影响力越大。从知识理论角度分析,频次和中心性高的关键词一般是某一段时期内研究者共同关注的问题,也就是研究的热点和前沿。表1中,“大数据”是频次最高也是中心性最高的关键词;“学习分析”频次为23,中心性为0.22;“数据挖掘”频次为13,中心性为0.15,等等这些都是热门的研究主题。

3 大数据背景下教育领域的热点研究

依据图1和表1所示结果,将大数据背景下教育领域的热点研究总结为以下几个方面。

学习分析和数据挖掘 教育数据挖掘是数据挖掘在教育领域的新型应用,主要目标为知识发现、决策支持和推荐等。学习分析是测量、搜集、分析和报告学生及其相关的学习环境的数据,用以理解和优化学习过程和学习环境[3]。

教育数据挖掘专注于技术层面,侧重教育数据模型和模式的抽取,强调挖掘结果的自动化反馈;学习分析更注重研究有利于改善学习的干预措施。

2012年,美国教育部了报告《通过教育数据挖掘和学习分析促进教与学》[4],提出“数据驱动学校,分析变革教育”的大数据时代已经来临,要综合运用教育数据挖掘和学习分析,构建教育模型,探索教育变量,为教育教学提供有效支持。

在CNKI中以“学习分析”和“教育数据挖掘”为关键词进行检索,得到图2所示的文献数量趋势图。如图2所示,2010年以前的文献数量很少,但2010年之后开始呈指数式增长;2016年1―2月份刊登的相关主题期刊论文已有5篇,可以预计本年度,学习分析和数据挖掘仍将是大数据背景下教育领域的研究重点和热点之一。

在线教育――兴起与变革 以“在线教育”和“大数据”为关键词进行搜索,得到图3所示文献数量趋势图。目前在线学习的发展趋势主要有如下表现。

1)移动学习是大方向:随着无线网络的覆盖,移动终端特别是手机用户的增多,移动学习逐渐发展起来。

2)免费是大趋势:目前在线学习存在各式各样的免费现象,如免费试用、前期付费后期免费等形式。

3)细化管理是要求:任何一种在线学习方式,都离不开资源开发、管理和优化等工作,需要设定管理要求,细化规则。

4)实现互动是必然:交互功能是在线学习软件必然要设计的功能,大多数在线学习使用者表示学习过程中希望能有更多的互动交流。

5)个性化学习是亮点:学习分析和教育数据挖掘的出现,使得在线学习存储的大量数据能够被更快速分析和使用,学习者可以随时掌握学习状况,开发商也可以掌握学习者的兴趣点、学习特征等,为学习者推荐或制订个性化的学习方案。

教育信息化 我国的教育信息化主要包含两层含义:一是把提高信息素养纳入教育目标,培养适应信息社会的人才;二是把信息技术手段有效应用于教育,注重教育信息资源的开发与利用。教育信息化的核心是教学信息化,要求在教育过程中较全面地运用现代信息技术,促进教育改革,适应信息化社会提出的新要求,深化教育改革,实施素质教育。随着大数据时代的来临,教育信息化也在不断进步,未来的教育信息化将在教育云平台上进行展现,现有的教育网、校园网将全面升级,实现互联网、电信网、广电网等跨平台使用并支持移动设备。

在CNKI中以“教育信息化”和“大数据”为关键词进行检索,2013年共有3篇学术论文,2015年共有10篇,研究主题包括大数据时代的信息化教学、教师培训、课程资源建设、教育舆情监控等。

教育决策 以“教育决策”为关键词搜索到上千篇学术论文,以“教育决策”和“大数据”为关键词,2013年以来共有8篇论文。大数据将在教育决策中发挥越来越重要的作用已成为共识,但如何利用大数据进行决策是目前面临的难题,如何解决这个难题也是研究者重点关注的领域。教育决策离不开数据,大数据背景下的数据更加复杂、凌乱,呈现碎片化的特征,并且掺杂一些虚假数据,如何收集、选择数据,是第一步需要做的事情。大数据对于教育决策的价值在于为教育服务,将数据转化为支持决策的信息,需要数据分析者具备综合、全面的数据分析素质和能力。大数据的核心是预测,随着教育信息化和在线学习的持续发展,数据呈爆炸式增长,需要对数据进行整合、分析,发现新知识,为教育优化服务。

4 数据推动决策

传统决策过程主要依靠决策者的经验,主观性较强,或多或少存在一些不足,难以充分发现教育过程中的潜在问题,无法真正有效地优化教学、提高学生表现。信息化推动了人类发展,逐渐成为人类生活必不可少的重要部分;信息化技术普及的同时,也产生前所未有的海量数据。大数据时代的来临,颠覆了传统数据分析方法;大数据背景

下,利用数据挖掘方法发现问题、支持决策具有多方面的意义。

1)优化教学、提高教育质量。教师若能充分利用学生学习数据,分析学生学习过程,可以更加快速、便捷、有效地了解学生,发现不足之处并及时反馈,提供改进意见等[5]。

2)为学校管理者制订更加合理的教学计划和方案提供决策支持。基于数据的教育决策能够为管理者提供更加准确、合理的决策支持。基于数据的教育决策能够提供从数据到决策,实施决策后产生的数据再到决策的一种良性循环过程[6]。

3)帮助地区甚至是国家级决策者进行科学判断。数据推动决策具有相当明显的优势,能为决策者提供全方位的视角。大数据分析得到的结果具有全面性、多视角性、参考性强等特点,能够更好地为决策者提供决策支持。

5 结语

上文所分析出的教育领域热点研究问题,都紧紧围绕“数据推动决策”这一主题,学习分析和教育挖掘是分析方法和技术;在线教育是数据来源;教育信息化是信息化大数据环境;教育决策则是根据数据制定决策并运用于教育教学。可见,利用数据推动决策已成为教育领域在大数据背景下最为重要的研究问题之一。

参考文献

[1]陈悦,陈超美,胡志刚.引文空间分析原理与应用:Cite Space实用指南[M].北京:科学出版社,2014.

[2]潘黎,王素.近十年来教育研究的热点领域和前沿主题:基于八种教育学期刊2000-2009年刊载文献关键词共现知识图谱的计量分析[J].教育研究,2011(2):47-53.

[3]Siemens G. Learning and Knowledge Analytics-Knewton-the future of education?[EB/OL].[2011-04-17].http:///?p=126.

[4]Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics[DB/OL].[2012-10-12].http://ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf.

篇(4)

关键词:大数据时代 数字图书馆 机遇与挑战

中图分类号:G25 文献标识码:A 文章编号:1672-3791(2016)10(b)-0150-02

在科学技术的影响下,学术资源建设速度越来越快。例如:中国最大的学术资源建设商――中国知网,已经从期刊论文向国内外期刊论文发展,在图书资源收藏方面收集了大量资源,可以给行业机构、学术等提供大量文献。在此种发展形式下,数字图书馆承受了较大压力,如何在未来发展中更好生存,已经成为人员研究的主要问题,必须及时对其进行分析。

1 国内外研究与启示

1.1 国内外相关论述对我国的影响

随着大数据时代的到来,人们对数据的需求量不断增大。目前国外相关研究已经从理念、技术和数据等方面进行了很多研究。美国加州大学伯克利分校图书馆的Huwe在《构建数字D书馆》一书中明确指出,大数据与数字化图书馆的发展方向吻合,可以借助数字图书馆进行信息采集和收集,进而挖掘用户行为,帮助人们了解阅读行为与信息的联系。Borgman等人将嵌入式技术成功安装于数字图书馆系统中,增加了数字图书馆功能,可以实现图书分类、收集处理和关联等各项操作,促进了数字图书馆与网络技术的融合,发挥了大数据的作用。

国内研究人员曾建勋曾在《数字图书馆论坛》中明确指出,大数据时代将数据数字图书馆数据管理、收集等服务的深层次发展,对数字图书馆人员提出了较高要求。另外武汉大学生陈传夫等也从理念、发展知识和财政投入机制等,分析了图书馆素质等问题,并提出了相关应对措施。

从上述研究均可看出大数据对数字图书馆带来的发展机遇和挑战,促进了数字图书馆和大数据的融合。为了促进高校图书馆和我国公共图书馆在大数据时代的发展,发挥数字图书馆在人们的生活或科学研究中的作用,必须深入思考,及时转变观念,提高数字图书馆的竞争力。

1.2 启示与思考

从当前的发展状况来看,学术资源建设商已经在大数据时代取得了很大进展,不仅包含网络资源与期刊,还涉及各种文献资源,可以查找作者、文献关系与学者等关系,给数字图书馆的发展带来了很大压力。所以图书馆相关人员必须提高思想认识,将资源建设商带来的威胁作为新的机遇。在实际工作中,必须积极吸取图书馆建设资源,扩展图书馆资源范畴,进行各种资源的有机结合,同时还要充分发挥资源价值,促使各种资源的整合,深入挖掘数据规律,认真分析数据规律,发现数据潜在价值。从服务角度上分析,图书馆还要向众多资源建设商学习,从用户角度探索问题,给用户提供人性化服务,满足用户对资源的需求。

经过分析发现,大数据时代,必须要改变传统的思维模式,形成适合数字图书馆发展的模式,适应大数据时代的发展,充分利用大数据促进数字图书馆的发展,让数字图书馆在人们的生活、学习和工作中发挥更大作用。

2 浅析数字图书馆的大数据思维

数字图书馆的大数据思维主要表示从大数据角度思考并分析数字图书馆发展中存在的问题,实现数字图书馆和大数据时代的有机融合,增加数字图书馆产品种类,提高数字图书馆服务水平。

2.1 建设数字图书馆资源

第一,扩大数字图书馆资源范围。资源是数字图书馆发展的基础,也是提高数字图书馆服务质量的主要方法。在长期发展中,图书馆非常重视资源建设,主要是图书、期刊及学位论文等资源。为了在大数据时代下发展,必须创新思维,引入一些数据库资源或一些社会热点信息等内容,以用户的搜索习惯作为数字图书采集参考,深入挖掘各种数据之间的联系,实现可再生资源的生产、收集和储存,扩大数字图书资源范围。第二,提高数字图书馆资源整合度。大数据时代的主要特点是数据类型较复杂,单纯的文本信息已经不能被大数据时展用户吸取,可以实现资源整合向综合信息服务转变。为了满足不同用户的需求,还可以实现文献和政府等信息的整合,扩大社会资源和数字图书馆的联系,将公众最关注的问题引入到社会资源整合中。第三,加强数字图书馆资源加工深度。在大数据时代,虽然数字图书馆结构信息具有较强的表现形式,但主要体现在资源库内部。在大数据时代下,必须及时扩展数字资源和外界的联系,构建全社会数字图书馆资源架构。同时进行图书馆资源深度加工时,必须从知识结构向知识建构加工方向发展。例如:从图书馆文献资源中分析知识结构,利用知识单位和文献建立知识建构,形成新知识。

2.2 灵活应用数字图书馆技术

大数据时代,数字图书馆技术已经开始从处理局部数据向更广的区域发展。从图书馆技术体系分析主要进行信息处理、组织架构、分析预测、服务技术等操作。

第一,应用语义技术。大数据环境中可以采用语义实现复杂数据的联系。当前数字图书面临的主要问题是将语义加入数字文献信息中。所以必须将本体技术、人工智能等先进技术应用到实际工作中,让数据间形成语义关系,促进收录资源和知识挖掘等各项操作。目前语义技术已经广泛应用到图书领域中,如:汉语主题词表、图书分类法等均是依靠语义发展起来的。知识相互间的语义关系,不仅可以帮助用户及时获取知识,还可以获得有用知识途径。第二, 数据聚类技术。数据聚类是实现信息相互聚集的过程。在繁杂的数据中,只有灵活应用聚类技术,才能发挥信息服务、处理等各种功能。在大数据背景下,利用数据聚类可将不同数据划分成相互联系、主体相近的小数据,给用户信息检索、选择和分析提供很大方便,给用户个性化服务提供了数据支持。第三,信息分析技术。大数据时代可以充分利用信息分析技术。可以将大数据技术融入到书籍图书馆中,拓展了数据分析工作,给用户提供了高端服务。例如:联机分析技术可给在线用户提供数据支持;定量定性分析技术可以在数字图书馆中得到充分应用。

2.3 数字图书馆的定位

第一,打破传统资源框架束缚。大数据给图书馆提供了较广阔的发展空间,满足了用户对不同信息的需求,在信息采集、收集和服务等方面均发生了变化。数字图书馆进行定位时,必须打破传统资源框架,将数据理念融于到数字图书馆建设中,所以不仅要采用传统的方法进行信息采集,还要进行网络信息自动获取,构建语义关系、数据联系等信息组织框架。

第二,建立全方位服务信息。传统图书馆主要进行文献服务。数字化图书馆服务资源发生了变化,服务形式开始从被动化向主动化发展。一方面向全社会提供服务;另一方面,提供全新资源服务;最后不断扩展服务与传播方式,全面扩展数字图书馆服务。

第三,定位数字图书馆员。大数据时代对图书馆员提出了更高要求,每馆员都要有敏锐的数据分析能力;及时了解学术变化;掌握大数据分析技术;熟练使用各种数据分析工具和软件,准确定位网络资源,促进数字图书馆的发展。

3 结语

大数据时代给数字图书馆带来了挑战,是数字图书馆的一种巨大转型,可以扩展数字图书馆数据资源,提高数字图书馆服务功能;同时,还要不断思考资源框架、技术应用模式和服务功能,与广大学术资源建设商共同发展。

参考文献

篇(5)

Abstract The arrival of the era of big data endows the library with new service content and requirements. In the aspect of open data services, libraries need to switch roles, and to provide users with collections catalog, data governance,open access, knowledge discovery, semantic analysis and other services.

Keywords big data;open data;library service;knowledge discovery;information organization

大数据带来的信息风暴正在变革人类的生活、工作和思维[1]。在大数据时代,渗透到各个行业、领域的数据成为了推动社会发展的要素之一,因此有人称大数据时代的数据就是“金矿”。但这种“金矿”的价值挖掘与实现需要借助相应的技术与平台,也需要人类智慧的参与,于是,对大数据资源的高效利用成为了相关业界如IT、企业、科研等普遍关注的问题。以信息组织、信息利用为所长的图书馆,也感受到了大数据时代所带来的变化,在近年来也展开了大量的图书馆视野下的相关理论研究。

大数据带给图书馆的影响与变化主要是数据的变化,即图书馆从面对传统的有序、单一、少量的结构化数据如数据库数据向无序、多元、海量的非结构化数据、半结构化数据方向转移。其中,作为大数据组成部分、集合了理念与实践的开放数据(Open Data)也受到了关注与研究。本文在概述大数据与开放数据的基础上,对开放数据视角下的图书馆角色进行了审视与分析,最后对大数据时代开放数据环境下的图书馆创新服务如数据监管、知识发现等服务进行了列举和概述。

1 大数据与开放数据概述

1.1 大数据

目前,业界对大数据还没有一个明确的定义,但也一般都认为大数据是不可能用常规软件和分析工具进行分析的巨大数据集[2]。此外,大数据既有结构化数据,也有非结构化数据和半结构化数据,涵盖了文本、数字、图像、视频等多种类型,并可跨越多个数据平台,如社交媒体网络、网络日志文件、传感器、智能手机的定位数据、数字化文档及归档的照片和视频等[3]。

1.2 开放数据

互联网与开放获取(Open Access,OA)运动的发展,既使得人们的信息交流更加便捷与方便,也让对开源和开放知识、数据、资源的利用逐渐成为人们获取信息的主要组成部分。由此而产生的自由开放思维也成了人们信息获取的主要思维,总是期待着出现解决不局限于软件、开放格式和数据自由公开与再使用的开放信息,于是一种实现了更广范围的公开与再使用数据即开放数据便应运而生。

对开放数据的定义存在争论,不同的组织、机构也存在不同的理解视角,但对于开放数据的内涵即其是一种理念及实践、数据不受版权与专利等机制限制、可以被任何人自由获取还是都能接受与认可。有学者也曾对开放数据的内涵阐释为:按照用户特定的需求和一定的互联网协议、规则、框架,对Web数据进行存储和组织的活动,而利用的数据来自不同的数据源或是不同的数据类型,最终目标是实现信息在网络空间的开放、共享与重用,以寻求信息数据最大可能的无限获取与重用[4]。

开放数据与一般的数据相比,其最大的特征就是数据集增值方式,即对象数据包含了所有的事实、数据、信息乃至智慧和知识,也不如其它传统数据可以直接获取、利用和分析,依赖于见证者而存在,不是我们接受或不接受的数据或其它,是我们给予、分享和接受的记忆[5]。同时,开放数据还具有开放性增值方式,因而在用户多、普及率高的政府网站及公共信息服务、商业应用等领域应用广泛,目前,英、美、澳等政府和淘宝等商业组织都应用开放数据进行信息公开等服务,以增强与公众、用户之间的交流与互信。

2 基于开放数据视角的图书馆角色审视与定位

在开放数据的具体实践如开放存取运动、开放研究出版、科学家电子实验笔记开放及科学知识的出版与交流等形式中,图书馆都是各个实践形式的主要参与者与推行者,但由于开放数据运动目前在各国的实践主体主要是政府,并且世界主要发达国家如美国、英国、法国等也均承诺政府将把公众的需求放在重要位置,通过征求公众意见逐步开放有价值的数据集,体现了政府在开放数据运动中的绝对推动者、践行者地位。在这种环境下,图书馆必须准确定位自己的角色,发挥自身优势为开放数据的发展提供服务,如基于开放数据的馆藏目录、开放获取等。

Hope Leman认为在开放数据运动中,图书馆员是知识工具箱与支持专家,即实现对概念的知识注释、实验及相关技术研发的知识支持[6]。我国学者刘春丽、徐跃权则认为在开放数据环境中,图书馆可能扮演与研究周期各个阶段的科学产出匹配的知识服务中心和开放数据的管理和保存中心两大角色[7]。

(1)知识服务中心。随着科学研究的周期不同,图书馆在科研过程中所发挥的作用和提供的服务也随之不同,如在科学研究的概念阶段,图书馆可为进行科学理念、研究计划讨论的用户提供开放书目等服务,并将讨论结果等形成新的知识分享数据;在数据分析与出版阶段,图书馆可借助于在开放存取期刊发表、提交到机构知识库中等途径将科学研究的结论、实验数据、科研过程等进行开放获取与共享交流;在同行评审阶段,图书馆可以发挥科研情报中心的作用,基于学术社交网络及开放存取平台,分析科学研究论文与数据的使用与评价活动,提取基于使用与评价的选择性计量指标(Altmetrics),对科学论文和科学数据的科学价值进行评价,进而评估论文与作者在某一个研究领域的学术影响力[7]。

(2)开放数据的管理与保存中心。欧洲研究图书馆协会主席Paul Ayris博士认为在科学研究的开放工作流中,要增加专业图书馆的可见度,要重视科学数据的再利用及科学数据保存的可持续性[8]。笔者以为在以数据密集型为科学研究特征的第四代科研范式下,数据特别是产生于实验、记录了科研过程等重要信息的科学数据是科学研究所重视和再利用的数据对象,图书馆有责任与义务扮演开放数据管理与中心的角色,以为科学家等用户群体提供开放数据的检索、分析、保存等服务。基于开放数据的连续利用视角,图书馆还需进行诸如开放数据的关联与、标示与引用等服务。

3 大数据时代的图书馆开放数据服务

大数据带给社会以数据驱动的社会创新与发展动力,因此如美国总统科学技术顾问委员会给总统和国会的报告所说“联邦政府的每一个机构和部门,都要制定一个应对大数据的战略”[9]一样,包括政府在内的社会各个机构如美国政府、欧盟等都制定了应对大数据的战略对策。2010年11月,欧盟通信委员会向欧洲议会提交了“开放数据: 创新、增长和透明治理的引擎”报告[10],首次将开放数据与大数据关联到了一起,并以开放数据为核心,对大数据时代的挑战进行了战略部署。但将大数据概念应用到开放数据上,则首先意味着数据的规模和类型有了变化,产生于社交媒体、智能终端、传感器上的海量非结构化数据、半结构化数据都是开放数据的范畴;其次,意味着数据的应用发生了变化,即数据不再是单一领域的数据,而是覆盖了用户的所有需求领域,并可直接获取和应用。

大数据赋予开放数据的新要求也意味着大数据时代的图书馆开放数据服务将被赋予新的要求,笔者认为,大数据时代的图书馆开放数据服务,主要有:

(1)多领域数据源的整合与开放服务。从目前的开放数据运动发展来看,主要实践有开放政府数据、开放存取学术期刊与机构知识库,距大数据时代所要求的多类型、多领域发展程度要求尚远。图书馆由于有着涵盖了所有领域的丰富馆藏资源,是大数据时代数据开放与整合的最佳实践者。因此,图书馆可整合多方资源,如科技、人文、气象、政务等诸多领域的报告、实验数据等资源,进行数据的整合与开放,让公众通过图书馆的一站式检索服务平台来获取所需的数据。

(2)基于知识联盟的数据开放与共享服务。由于大数据时代的开放数据是整合了不同系统、政府和部门之间的数据集,这就需要建立一个数据共享和互操作的框架,如新泽西州运输部利用采集到的数据(在汽车制造商的管辖下)能够发现诸如拥堵和交通流等问题,而这些功能通常是由当地或全国的政府交通运输部门负责[11]。图书馆可借鉴这些成功的案例进行构建或参与到由政府、企业、社会机构组成的知识联盟,利用协作分析技术对数据和系统进行无缝隙整合。

(3)基于一站式服务平台的知识发现服务。数据“开放”的核心是为了用户更高效的发现和利用,以缩小信息所有者和用户的信息不对称距离。EDS、PRIMO、SUMMON等一站式知识发现平台的应用为图书馆的开放数据知识发现服务提供了方便,图书馆可应用这些平台对用户提供知识咨询等服务。

(4)数据的开发、创建、共享与转换服务。此类服务在图书馆界已有着成功的实践,如开源站点biblios.net采用了类似维基模式向图书馆界提供开放MARC数据的开发、创建、共享、转换服务,目前以3000万余条数据成为为全球最大的免费图书馆编目数据平台[12],德国国家图书馆[13]、大英图书馆[14]也宣布对外提供开放数据服务。

(5)数据监管服务。开放数据的检索、价值挖掘与应用实现,必须经过一定的排列、存档与管理过程,而这些数据有可能是来自于有数据组织经验和能力的政府、企业、公益组织等,也可能是来自于只提供数据而没有数据组织或没有组织意愿的公众、机构。图书馆可发挥自身的信息组织、信息分类特长,对这些数据进行修改、合并、标引、分析与索引,即提供数据监管服务,使数据集合之后获取最大收益。

篇(6)

关键词:大数据; 湖南省;绿色大数据港湾;战略对策

0 引言

随着信息技术网络化、泛在化、智能化的发展,人机物三元世界开始深度融合。大数据将有力支撑教育、文化、健康、电子商务、制造等产业以及在线服务、社会管理等行业,解决未来信息社会结构下生产力发展的重大瓶颈问题;有助于解决交通出行、医疗卫生、应急抢险、人口教育等各类社会发展问题,大幅提升民生领域的智能化程度和服务水平。如果能有效地筛选和使用大数据,将有效为地方经济、科学研究、社会治理等方面积极服务。因此加快大数据开发利用,一方面有利于促进产业转型,提升社会活力、促进经济增长和提高生产效率,另一方面也有利于攻破体制机制障碍,推进依法行政和促进政府职能转变,提升国家综合实力,保障社会安全。

1 构筑湖南省大数据港湾的战略目标

开展若干面向重点区域与行业的大数据示范应用,建设科学研究、电子政务、智能制造、公共安全、医疗卫生、文化教育、互联网服务、城市管理、社会公共服务等领域的大数据应用,为湖南省经济社会发展提供大数据科技支撑保障,加快湖南省大数据分析应用的产业化布局,服务湖南省经济社会建设,促进经济结构调整和产业转型。促进行业融合发展、推动产业转型升级、助力智慧城市建设。

2 构筑湖南省大数据港湾的战略措施

通过对大数据发展趋势的研究,预测大数据对经济、政府与社会运行所带来的影响,制定五年或十年的发展规划,协同政府各部门、各行业主管单位、企事业单位及个人各方面力量出谋划策、发挥聚合效用,促进可持续共同发展。其战略重点主要集中在以下几个方面:

2.1 突破大数据的关键技术

建设开放共享的大数据分析平台,发展大数据条件下的类人视觉和类人思维决策计算模型,突破类人视觉技术,研究基于深度神经网络的图像视频中目标检测、跟踪、分类以及行为和事件识别,研制类人视觉传感器,构建类人智能计算和理解的核心系统,为相关产业提供实时智能服务。突破互联网、物联网和广电网视觉大数据中视觉场景理解、多目标检测跟踪、人员身份识别、视频信息检索、大范围安全监控等关键技术,面向公共安全等重大需求提供透明时空示范应用。

2.2 加快大数据基础设施建设

当前,大数据相关的基础软硬件设施、分析方法、领域应用及数据生产等方面已经形成了一批企业和技术系统,大数据产业生态系统的雏形已经明确。大数据产业生态系统涵盖了大数据的获取、存储、处理、分析、服务、安全等诸多环节,并逐步与传统产业结合释放出巨大的生命力。重点推进信息产业园、软件园等园区开展大数据基地建设,加快建成湖南数据中心,支持建O金融机构和企业数据中心及尝试县级大数据应用服务园区。吸引国内外知名大数据龙头企业,创新研发平台,突破大数据关键技术,培育新兴业态领域。

2.3 重视大数据人才培养

为培养我省大数据技术研发、服务咨询、市场推广等应用型人才,应加大鼓励高校与行业企业、科研院所深度合作,支持大数据企业与高校建立生产性实训教学基地,建立院士工作站和博士后工作站,协同创新我省与大数据知名专家学者长效科技人才培养机制,为我省大数据产业发展提供人才支撑与智力支持。

2.4 启动大数据产业试点

面向国计民生重大需求,重点选取教育、健康、公共安全、医疗卫生、金融证券、智能制造、智能交通等具有大数据基础的领域,集成大数据基础理论、类脑智能、视觉语音文本大数据分析、多源异构数据融合的研究成果,探索大数据分析应用的创新服务模式,在特定领域发展多源感知网络(物联网、互联网、电信网、广电网)大数据智能分析的综合集成系统,建设具有示范引领意义的大数据应用。

2.5 完善大数据立法

在地方立法的权限范围内,在信息采集、数据处理、敏感数据保护、数据交换标准和规则、个人隐私等方面设立大数据地方性法规和政府规章,确保大数据相关信息安全。加强建立大数据信息安全集中保障体系,开展基于大数据背景下信息安全认证体系建设,针对数据的收集、清先、存储和运用等环节明确数据安全与保护的规则;明确划分大数据生态中各不同主体的责任。同时鼓励和支持企业在电子认证、安全测评、数据加强应急防范、容灾备份等数据安全技术方面提供服务。

3 构筑湖南省新型绿色大数据港湾的应注意的问题

大数据为管理者创造了新的机遇和挑战,在应用大数据推进我省建设的同时,需要特别注意潜在的问题,加强应对策略的研究。

3.1 重视数据的质量

在利用大数据解决具体事务时,要客观地认识大数据。数据本身有时也是存在缺陷的。有些数据收集时本身就是不正确的,有些数据之间还存在冲突、不一致等现象,因此,在运用这些数据时,“数据噪声”则此产生,不同程度影响分析和决断。公共部门或企业管理层在利用这些大数据进行分析时,需要对其收集的数据进行清洗、检查、筛选,从而保障其运用的数据的质量。

3.2 防止对数据过分依赖

科学预测与决策的有力武器是数据,通过数据分析,从而为实现管理的智能化、增强管理能力及提高管理水平出谋划策。但是,也应该看到数据不是完全可靠的,过度依赖数据,一方面,会让我们做很多没有价值的数据分析;另一方面,也会限制本来应有的灵感和创意。只有让让数据真正嵌入到设计与决策中,让直觉创造的心智能力,情感理解的社交能力,与大数据相结合,切实解决用户的实际问题,真正做到“用户洞察”,让产品或措施体现用户需求,服务用户,超出用户的预期想象。

3.3 加强信息安全机制建设

新技术新业务带来大数据日见渐长的网络安全问题,建议与实体经济安全相结合,进行统筹处理,同时建立关键信息安全管理制度,对互联网平台的职责划分予以明确。制定数据安全风险评估机制,不仅关注数据本身,而且关注到数据资源整体的安全性,对特定类型的主体从事相关数据分析设定一定的条件。通过政府提供适当的政策和务支持,创设轻松环境,加强相关的法律法规建设,保护数据透明开放同时保障信息安全。

4 构筑湖南省大数据港湾的预期价值:

随着商业企业,政府公共事业应用的大量数据,新产业数据大量涌现,湖南新增经济增长空间,大数据形成新的产业链。围绕上游与下游,必将推动智能终端的应用,促进云计算等行业快速发展。

大数据能有效减少社会经营成本,提高经济与社会效率。例如在医卫行业,可以通过大数据的分析避免重复治疗、过度治疗及减少错误治疗,提高工作效率,提升治疗质量。公共管理领域,利用大数据提高教育部门、就业部门的服务效率,有效推动税收工作开展,零售业领域,利用大数据改善和提高整体供应链和业务流程的效率,提高其经营利润60%以上。

大数据改变了传统的商业模式,带来了准确的营销。有效提升企业数据资源利用率,提高从数据到信息的转换率,使业务决策更加准确,提高整体运营效率。

大数据推动政府政务公开,提高公共决策的预见性和准确性。例如通过对社交网络和手机短信中的信息进行分析,从而对失业率、疾病暴发等进行趋势预测分析。利用大数据实现政府行政管理方面的运作效率提高,节省开支。

大数据有助于破解社会转型中的难题。中国经济已进入转型期,社会进入矛盾凸显期,改革进入攻坚期。宏观经济形势错综复杂、各种社会改革盘根错节、频发等突出问题,仅仅依靠现有的管理手段与方法已明显落后。有效地组织和使用大数据,将对社会经济、科学研究、社会治理等产生巨大的推动作用。

5 结语

篇(7)

关键词:大数据媒体;广告营销

2012年以来,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多地意识到数据对企业的重要性。哈佛大学社会学教授加里・金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。作为传统媒体的广告来说,在大数据时代将会面临更为严峻的挑战和考验,同时也出现新的发展和机遇,广告媒体需要抓住历史性的机遇实现创新和发展。

广告营销是指企业通过广告对产品展开宣传推广,促成消费者的直接购买,扩大产品的销售,提高企业的知名度、美誉度和影响力的活动。随着经济全球化和市场经济的迅速发展,在企业营销战略中广告营销活动发挥着越来越重要的作用,是企业营销组合中的一个重要组成部分。大数据时代的广告营销在数据分析上的基础上明确了广告信息受众。趣味广告,互动广告和个性化广告是广告营销的发展趋势。

1.数据分析与广告信息受众

大数据时代广告信息传播目的性更强,信息受众经过一系列数据挖掘与数据分析将更为准确。传播媒体在大数据时代的作用将更为突出。传媒作为沟通人类的桥梁,在移动化,社交化、智能化的今天已经成为人们生活中必不可少的“陪伴”人们通过媒介使用在持续产生着海量数据,这些数据将成为大数据时代的重要资源,同时传媒也是沟通各种类型商家与用户的纽带,在数据分析的基础上能够通过传媒使商家与用户建立起深入、持续、稳定的互动关系。

大数据时代的数据分析使得市场细分和目标市场选择变得可视化。商家和媒体通过各种渠道收集和整理用户数据,并根据聚类分析划分不同类型的信息受众,使得市场细分和目标市场的选择更加客观,广告的设计和投放能够直接面对有相关需求的客户。这种客观性和直接性不仅表现在对广告内容的把握,更体现在对广告投放渠道的选择。

广告营销最重要的是效果,让不同地域的受众看到不同产品的广告,利用独有的区域定向模式技术,将网民以地域 (精准到地级市) 为单位加以区分,打破了以往互联网传播只可泛不可精的区域传播壁垒。大数据时代的市场细分将用户的信息行为,包括浏览路径,浏览内容,停留时间,最终选择等,转化为可用数据,并进行数据清洗与数据筛选,最后进行聚类,将属性相同的用户集中到一起,根据其特点选择广告投放内容和途径。并深入分析各节点之间的关系,找出其中规律,有目的地进行广告,从而避免了广告投放的盲目性,实现“不同人看不同广告”的效果。

2.趣味广告

通过对营销以及传媒发展历史的梳理可以发现,很多经典的成功案例都与“趣味”这一因素密不可分,“笑声”已经成为广告制胜的重要法宝,许多广告因为幽默、生动、有趣而受到广大观众的欢迎。观众的好感度直接影响着消费者对广告产品的接受程度。好感度越高的产品和品牌更能得到消费者则的青睐。如此看来,广告的“趣味”性是决定广告是否成功的重要因素。

创意广告出现的形式有很多种,其中主要有搞笑型、公益型、惊奇型、讽刺型、雷人型、夸张型、无聊型等多种形式,最主要的是要有创意,想象力。因网络文化的发展创意广告也随之高登,受万众的欢迎。创意广告具有渗透性、流传性。能凭借吸引人的创意在网络上迅速自发以葡萄藤形式推广流传。并让广告元素深入移植。主要以视频的形式表现出来。趣味广告要紧跟时代潮流或选择有吸引性的主题。在广告风格和广告台词的设计上可以选择网络流行风向中的语言和表达。比如爱奇异视频中的奇葩说栏目,将广告宣传内容和节目选手结合起来,既幽默风趣,又体现产品的风格特点,牢牢地吸引了观众。很多广告选择电影中的经典桥段进行设计,比如《大话西游》中的“如果上天能够再给我一次机会,我希望是一万年”台词的应用,益达广告中经典老歌“如果没有你”的应用。

3.互动广告

广义的互动广告是指所有互动形式的广告,包括传统媒体中的互动形式的广告。西奥多・莱维特在其营销哲学理论中提到“成功的营销像是一场成功的婚姻,会不可避免地变成一种长久的关系,而买卖之间的相互交往界面也就变成可相互依存”。相互交往成为决定现代传播成功与否的重要因素。Web2.0,web3.0技术的成熟发展为互动广告提供了技术保证。微博,微信的广泛使用为互动广告提供经验。互联网电子商务白热化发展和小米粉丝营销取得成功为互动广告指明方向。大数据时代互动已经成为现代传媒业的一个重要特征。

由于PC、手机、平板电脑的终端特性,以及由此而产生的用户与视频之间的交互行为,让视频广告产生了无限的互动可能,如图所示:

图1.互动广告作品示意图

4.个性化广告

在大数据时代,个性化将颠覆一切传统商业模式,成为未来商业发展的终极方向和新驱动力。大数据为个性化商业应用提供了充足的养分和持续发展的沃土,基于交叉融合后的可流转性数据,全息可见的消费者个体行为与偏好数据等等,未来的商业可以通过研究分析这些数据,精准挖掘每一位消费者不同的兴趣与爱好,从而为他们提供专属的个性化产品和服务。大数据改变了商业模式,未来市场是一个性化消费者为中心的,“未来广告的核心变化方向,是从现在每个人看同样内容的广告,演化为每个人看不同内容的广告”所以营销活动也要依托消费者这一中心展开创意的策划和实施。

我们都知道以往的广告模式是一对多的,广告商不知道自己的广告方式和手段是否满足用户的需求,但是随着媒体掌握越来越多的用户数据,能够方便地让企业通过技术分析出关注企业的用户具体属性和用户行为的画像。通过这些洞察分析出来的这些用户画像,能够让企业对每类用户进行有针对性的广告服务。企业做广告不仅是要针对新用户,更重要的一点是对老用户的激活。但是怎样激活老用户,以及和用户更好地进行有效沟通,几乎是广告行业都挠头的问题。但是运用大数据技术可以让企业对 用户生命周期进行管理和挖掘,让企业对不同生命周期的用户进行标签化管理,让企业及时把把相关运营信息推送给不同生命周期的用户。

小结

大数据时代对于广告营销来说即使机遇,又是挑战。广告营销要时刻注意时代和技术的发展和变迁才能在数据化的浪潮中处于不败之地。趣味广告、互动广告、创意广告是广告营销为适应时代的发展而产生的不同的紧跟时代的营销形式,是发展的起点而不是中点。因此随着人类迈向数据化的脚步越走越快,广告也需要有更新更有效的营销方式,而这将成为以后学者研究的重点。

参考文献:

[1]歌晓.大数据 落地“三道坎”与信息安全[J].上海信息化.

[2]吴娜娜,任红丹,张璨 .以多芬为例浅析广告营销[J].产业与科技论坛,2009(08):6-7.

[3]刘峰.大数据时代的电视媒体营销研究[J].华东师范大学博士论文,2014.