时间:2023-03-24 15:14:19
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇计算机大数据论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
在大数据时代环境下,信息的获取和选择、信息技术的掌握应用,直接影响知识的生产、科技的创新和成果的转化。大数据时代对高校的教学、学生的计算机应用能力提出了新的要求。产业界需求与关注点发生了重大转变,企业关注的重点转向数据,计算机行业正在转变为真正的信息行业,从追求计算速度转变为关注大数据处理能力,软件也将从编程为主转变为以数据为中心。学生要学会对数据的去冗分类、去粗取精,从数据中挖掘知识,要能够把大数据变成小数据,要在不明显增加采集成本的条件下尽可能提高数据的采集质量。要研究如何科学合理地抽样采集数据,减少不必要的数据采集。
二、大数据时代背景下的教学策略
(一)营造适合学生全面发展的软硬件环境信息时代的发展使得高职院校图书馆和数据中心具备了大数据的特征。科学研究和科技创新越来越依赖于对数据的管理和利用,打造良好、适宜的软硬件环境是提高职业院校学生信息素养的基础。目前互联网技术及应用普及度较高,建设智慧校园可为学生提供更多的接触信息资源的机会。加强高职院校数据中心和网络中心的建设力度,在依托传统图书馆文献存储量的基础上,增加馆藏图文电子数据、电子文献与多媒体文献,打造信息化图书馆,为学生提供多元化的信息资源与服务。加强校园社交网络平台的建设,利用微信等新型传播媒介,采用主动推送的方式传递正能量,提供有益于学生健康成长的信息,监控、屏蔽不良信息的传播,过滤影响学生身心健康的不良信息,构建适合高职院校学生学习的良好环境。
(二)发挥数字化图书馆在教育过程中的核心作用数字化图书馆的建设是图书馆业今后发展的主要方向。数字化图书馆也是一个科技含量较高的系统工程,高职院校各级领导应正确认识,加强资金投入,充分发挥其对教育过程的支持作用。数字化图书馆的典型特征是存储数字化、操作计算机化、传递信息网络化、信息存储自由化和结构连接化,可与高职院校的基础建设可以同步推进。在建设与发展过程中,教师要积极引导学生充分利用数字化信息资源。学生在使用数字化图书馆的过程中会产生一系列的行为特征数据。通过对学学习路径和学习偏好的数据分析,根据其特点与实际量身设计合理的信息资源智慧导航,从而为学生学习新技术、新知识提供个性化的服务。
(三)加强学生创新能力的培养在知识经济时代,创新决定着一个国家和民族的综合实力和核心竞争力。培养具有创新能力、实践能力的高素质技能人才,是高职院校人才培养的一个重点方向,也是高职办学的特色及亮点。创新能力培养的关键是创新思维的培养,而创新思维的核心在于思维的独特性和新颖性。在大数据时代,学生面临众多数据资源。教师需要对学生提供专业的指导,让学生学会利用互联网技术和计算机软件工具解决实际问题,在解决问题的过程中培养创新思维。高职院校应努力营造创新教育环境,结合创新教育,大力推进素质教育。将“小发明、小创造”“大学生实践技能展演”“大学生才艺展示”等活动纳入校园文化活动中。组织学生参加各行业举办的职业技能大赛,实现从应试教育向素质教育的转轨,培养实用型、创新型的复合技能人才。充分重视学生的个性发展,建立专业的师资队伍对学生的创造发明活动给予强有力的技术指导。对于技术含量高的、有市场推广价值的创造发明活动,要引导学生进行自主创业,带动就业。加大创新教育课程的开发与建设力度,强化学生创新能力的培养。
(四)培养学生对信息技术的兴趣与爱好兴趣是最好的老师,是激发学生学习积极性的动力,是激发创新能力的必要条件。学生只有对身边的事物发生了兴趣,才会活跃思维,激发潜力。在课程设计中加入了生动、形象、贴近工作、贴近生活的典型案例,可以有效地激发学生的学习兴趣,让学生乐在其中,愉快地完成学习任务。教学实践环节也应紧密围绕着学生熟悉的事物、案例来开展教学。授课教师应了解信息技术在行业的实际应用状况,根据不同专业的特点,结合学生,的知识体系结构精心准备授课内容,确定课程的重难点。在教学过程中,通过师生互动了解学生对课程内容的掌握程度,因材施教、精选案例、突出重点,从培养学生兴趣与爱好入手,让学生在轻松、愉悦的课堂教学中学习信息技术在专业领域的最新应用,了解最新的前沿学科理念,学握较新的实用技术。教师如果在教学活动中能及时、准确地解决学生在学习实践中遇到的疑难,并指导他们完成实训内容,将有助于学生在学习过程中获得成就感,激发学习的积极性、主动性和创造性。教师动手实践能力将使得更多的学生得到有效指导和帮助,实现高质量的课堂教学。
(五)探索高效教学模式根据高职人才培养目标的要求,计算机课程的教学需要与时俱进,随着各行业大数据产业的不断发展与应用而不断进行调整、创新。通过对学生在校期间学习、生活的轨迹进行搜集、整理,形成基础数据,进而分析他们的学习行为、学习喜好和思维模式,制定适合他们全面发展的教学方法,有针对性地培养和提高他们的计算机应用能力。利用各种辅助软件,开展行之有效的教学实践活动,让学生在“做中学,学中做”。提高各专业学生的计算机应用操作能力,使他们掌握互联网技术、计算机信息技术、电子商务等。以医学影像技术专业为例,学生既要学会影像阅片操作,又要掌握最新的X线机、CT、MRI等先进检查设备的使用与操作。如果能够将医学影像技术专业与计算机应用实践教学相结合,找出两者的学科交叉点,构建适合时展需要的复合型人才培养模式,将会起到事半功倍的作用。在大数据的背景下,各行各业都需要利用信息技术,特别是数据库技术、大数据分析技术,用以改变生产、经营、管理、工作、生活等的方式。因此各专业的毕业生都面临着行业对大数据的使用与开发的迫切需求。培养学生解决问题的实际操作能力,显得尤为重要。在专业课程的教学中,通过对大数据的应用与计算机应用技术的渗透,不但能激发学生学习专业技能的积极性,而且可以引导学生形成应用计算机解决专业问题的思维模式,对他们将来适应大数据环境下工作具有积极的引导意义。以专业培养目标为基础,合理对计算机课程进行设置与安排教学,将大数据知识、信息技术知识、计算机应用知识融入到各课程的教学中,构建适合高职类学生学习特点的高效教学模式。
(六)加强师资队伍建设加强师资队伍建设是提高学生计算机应用能力的关键。计算机应用基础课程的教师,首先应该是计算机应用方面的专家,既能掌握扎实的理论基础知识,又能熟练地操作计算机,善于使用相关行业软件。在教学中能够起到良好的操作示范作用,给予学生无形的感染力和号召力,增强学习的主动性与积极性。在实践教学过程中,计算机任课教师不仅要与专业课教师紧密合作,整合校内已有的专业资源和信息技术资源,充分利用好大数据,而且要与行业、企业加强联系,采取走出去、引进来的方式,让学生在校期间就能充分接触各种面向实际应用的信息技术产品与工具。学校要制定行之有效的师资队伍培养计划,紧密结合企业、行业的实际需求,建设“双师型”教师队伍,加强现代信息技术应用能力培训。教师应深入企业、行业,了解企业人才需求,了解企业使用的最新应用软件动态与进展,充分利用好企业、行业大数据资源的研究最新成果,更新知识结构,提高实践操作水平。
统计学论文2300字(一):统计学方法的发展及其在大数据中的应用论文
【摘要】现阶段,统计学方法在我国企业管理中有广泛应用。本文尝试对统计学方法的诞生以及发展情况进行了简要的分析,同时还对统计学方法在现今大数据时代的应用情况进行了探索。
【关键词】统计学方法发展大数据应用
对于统计学方法来说,诞生的最初只是为了进行单纯的计数以及描述,随着统计学方法的不断发展,其所涉及到的内容更加多样化。在统计学家以及各个领域专家的不懈努力之下,统计学方法正在不断的进步以及完善,在实际应用的过程中也发挥出了较为理想的效果。在现阶段大数据的时代背景之下,对统计学进行深入探究是非常重要的,会对今后多个行业的快速发展起到促进作用。
一、统计学基本发展探析
对世界统计学的发展情况进行分析,会发现,其与科学界的发展趋势较为类似,随着统计学的不断完善,也开始与其他科学进行融合发展。对统计学进行总结,可以发现,其主要具备两个基本结合趋势,即与实质性学科结合的趋势以及与计算机学结合的趋势。对于统计学来说,其与经济学结合发展我国有广泛的应用,并且产生了经济统计这一专业;而统计学与教育的结合产生了教育统计。对于这些分支学科来说,其具有双重属性。一方面是统计学的分支;另一方面是实质性学科的分支。随着计算机信息技术的不断发展,其运算能力不断提升,这也使得大规模的统计调查工作在实际展开的过程中取得了理想效果,不仅保证了数据计算的准确性,同时也保证了计算的高效性。因此,在进行统计学技术研究发展的过程中,与计算机技术的深入结合应用是重要发展途径。通过对计算机软件的有效应用可以使统计计算过程中一些疑难的部分得到有效解决,同时也使得统计计算的展开更加方便。从现阶段我国经济类统计专业的教育情况来看,一方面在对统计方法进行创新教育,另一方面在对学生利用商品化统计软件包装能力进行提升。由此我们可以看出,在今后统计学的发展过程中,势必不能离开计算机技术的支持。在今后统计学相关专业的教育过程中,应该对学生的计算机程序设计以及利用能力进行培养提升,使得在展开统计工作的时候可以通过统计模型的编程来实现。
二、统计学方法在大数据中的应用趋势
(一)统计学方法及相关领域的动态分析
目前,国内外对统计学都有较为广泛的应用,主要应用在教育行业、生产制造行业以及企业管理当中,取得了较为理想的应用效果。根据CNKI数据库中统计方法、机器学习分布情况可以看出,在机器学习领域的论文数量从2013年以后一直呈现出持续增长的势头,并且在2016年超过了统计方法领域的论文数量。由此可以说明,我国在机器学习领域的发展速度正现出稳定提升的趋势,反映了我国在大数据领域研究方面越来越深入,所应用的研究方法也开始呈现出多样化的特点。从总体上来看国内在统计学方法研究过程中已经取得了阶段性的成果,并且其所面临的拐点与国家上的统计学发展拐点基本保持一致,大概都是在2013年开始对大数据以及将其学习等方面有了深入的探究,并且开始逐渐取得突破性的成果。而机器学习方法的论文数量都是在2016年开始超过统计方法的论文数量。但是与此同时,我们也看出其差异性也很明显,国内在统计方面研究的论文以及在机器学习方法方面研究的论文与国际相比较尚且存在较为明显的差距,并且这种差距呈现出了持续性的特点,这也使得我国在这两个领域方面还有很大的发展空间。
(二)统计学方法及相关领域研究方向分析
经过对CNKI数据库中的统计方法以及大数据领域期刊论文分布情况进行分析之后,可以看出,统计方法领域中出现频次最高的是“统计分析”以及“数理统计”、“人工智能”;在大数据领域出现频次较高的是“云计算”、“图书馆”以及“物联网”等关键词。通过上述关键词来看,其所涉及到的内容都是反映当前我国统计以及大数据技术所研究的重点以及热点,同时我们也可以看出,现阶段我国在统计与大数据领域方向的研究存在着一定的重合。在进行的数据研究的时候,需要应用到统计学方法,同时统计学方法在利用的时候往往也需要与大数据进行结合。
(三)统计学方法的发展展望
有数据的地方势必就会涉及到统计学。从17世纪开始,国势学派以及算数学派的争论到今天大数据计算、计算机技术的相互作用,使得统计学的内容正在不断完善,并且其应用领域也在不断扩大,随着大数据时代的来临,使得传统的统计学发展方向发生了一定转变,开始从小样本的统计推断分析走向大数据量的挖掘分析,从而使其所掌控的数据量不断提升。在未来统计学方法发展的过程中,应该注意将统计学与新的数据思维相结合,从而产生一种新型的、应用范围更广的大数据算法。从现阶段我国大数据方法创新发展的情况来看,其与国际研究在深度以及广度上还存在不小的差距,这也恰恰说明了我国在大数据统计学方面还有很大的进步空间。现阶段,国内的大数据研究更多的是停留在信息化产业上,与其他行业的融合发展趋势尚且不明显,这也使得信息服务以及数据产业的创新发展受到了一定影响。在今后统计学发展的过程中,其研究热点势必会从数据分析以及数据发掘向算法方向转移,这样也使得大数据技术与统计学方法二者之间的联系更加紧密。
结束语
综上所述,我国统计学方法在今后发展过程中应该充分考虑到实际需求,积极适应时代变化,现阶段大数据时代已经全面到來,并且大数据技术在我国有广泛应用,在实际应用的过程中取得了较为理想的效果。将大数据与统计方法进行结合可以使统计学方法的作用得到更好的体现,也使得统计学方法不断的进步以及拓展,在大时代背景之下,其功能性得到了更加充分的展现。
统计学毕业论文范文模板(二):线上线下混合式教学在生物统计学教学中的实践与研究论文
[摘要]为提升生物统计学课程的教学水平,针对传统生物统计学教学中的局限,分析和实践基于线上网络教学+线下面授教学的混合式教学模式在生物统计学教学中的应用策略和方法。实践表明,通过线上+线下的互动与教学,能激发学生学习的兴趣与动力,丰富生物统计学的教学形式与内容,促进生物统计学教学质量的提升。
[关键词]线上线下;混合式教学;生物统计学;实践
[作者简介]严明(1981—),女,重庆人,博士,讲师,研究方向:生物技术。
[中图分类号]G642[文献标识码]A[文章编号]1674-9324(2020)25-0273-02[收稿日期]2020-03-18
生物统计学是生物医学类专业的必修课程,学生通过学习本课程掌握实验设计的原理和方法,并学会对实验数据进行统计分析和处理。然而,生物统计学涉及到大量基础理论,单纯通过教师讲解,学生理解度较低,学习效果不佳。如何在有限的课时内,改革传统的以讲授为主的教学方式,有效提高教学效果是生物统计学教学亟待解决的难题。
近年来,随着互联网信息技术的发展,一种基于线上网络教学+线下面授教学的混合式教学模式应运而生。该模式可避免传统教学模式中以教师为主导,学生学习主动性差的缺点,又可克服学生完全在线学习缺乏监管、学习效果不佳的困难。本文尝试将混合式教学方法运用到生物统计学教学中,以期在有限的教学时间内最大限度实现教学目标,提升课程教学效果。
一、线上线下混合式教学的概念及内涵
线上线下混合式教学是一种新兴的教学模式,授课教师利用网络教学平台向学生提供教学视频和课件等教学资源,并设置作业、调查等互动模块,学生利用课外时间自主完成学习任务,并通过平台与教师交流。在线下课堂,教师根据学生在线学习的情况,对疑难问题进行有针对性的讲授,帮助学生理解、掌握教学难点。
线上线下混合教学模式打破了教学的时空限制,学生可以灵活安排学习时间,通过学习在线资料提出问题,并带着问题进行课堂学习,有效提升学习效率。线上线下混合教学还可帮助教师动态掌握学生学习情况,生成客观的过程性评价材料,并丰富课程的教学形式,拓宽教学路径,因此正逐渐成为高等教育领域的一大趋势。
二、生物统计学课程教学面临的困境
1.教学时长受限。目前,本校生物统计学面向生物医学工程和医学信息工程专业开设,每学期共32个课时。由于教学内容抽象,而且学生要通过大量实践才能掌握统计学原理在生物研究中的应用,因此,教学难度高,课堂教学时间很难满足教学需求。
2.教与学不同步。传统教学模式下,教师与学生之间的沟通以课堂为主,教师按照教学安排按部就班地进行教学,对学生需求重視不足;学生缺乏主动反馈的意识,教师很难掌握学生的真实学习状况,教与学处于不同步状态。
上述困境对如何拓展教学时间,完成课程教学并指导学生学以致用提出了新的挑战。
三、线上线下混合式教学在生物统计学教学中的实践探究
1.构建线上教学平台,实现课前线上自主学习。授课教师首先以超星泛雅平台和学习通APP为依托构建线上教学平台。教师在平台上将课程每章的重难点列示出来,搭建课程框架体系,并上传包括课件和教师根据课程知识体系录制的教学视频等资料。教学视频时长控制在15分钟以内,并保证精炼、易懂,让学生不会因视频过长而放弃观看,提高学习时效。同时,在教学平台提供视频配套的课件资料,方便学生下载并配套观看。教师还在平台设置了视频弹幕问答和闯关式章节测试,学生通过答题和测试后才能进入后续章节的学习。
在教学实践中发现,线上教学平台还可以为理论教学提供良好的拓展实践平台。教师可以在线上平台提供实验设计及实验数据分析的实例供学生练习,实现对课时压缩的有效弥补。学生普遍反映网络教学平台十分有利于自主学习,尤其是遇到知识难点时,学生可以通过反复线上观看教学视频来帮助理解,能达到较好的学习效果。
此外,线上教学平台可以通过视频回放次数、测试完成程度等数据统计帮助教师了解学生之间的差异性,既方便教师掌握学生学习状态,分析存在的问题,也为线下课堂教学提供依据,在后续教学中因材施教,满足不同层次学生的个性化学习需求提供依据。
2.线下检测自主学习效果,实施针对性教学。采用线上线下混合模式教学,课堂教学的任务发生转移。教师要集中精力对知识点进行梳理和归纳,并针对重难点以及学生在线上学习过程中的困难进行答疑解惑和查漏补缺。在教学实践中,为完成上述任务,在每个章节的线上学习完成后均安排答疑和小组讨论,让每位学生通过多种方式修正和完善遗漏或理解错误的知识点。全部授课结束后,授课教师向学生发放了关于教学效果的调查问卷,结果显示,78.2%(18/23)的学生认为采用混合式教学方法可以把重要知识点学透,在课堂上有更充裕的时间进行消化吸收,更有利于教学内容的掌握。
在线下教学中,教师还对教学场景进行了编排和优化。教师提供具体的实验案例,并以某一具体实验案例(如抗癌药物筛选)为背景贯穿整个课程教学始终,模拟真实实验场景,让学生从实验参与者的角度设计实验流程、整理实验数据、统计分析和解读呈现的全部流程。帮助学生实践生物学研究提出假说—实验验证—得出结论的基本流程,理解生物统计学对生物学研究的重要指导作用,培养学生知识迁移、应用和分析并解决科学问题的能力。
3.课后回顾学习并提升。在课堂教学完成后,师生的教学活动都还没有结束。教师要对线上线下教学过程中容易出现的问题进行整理总结,并将解决方案到网络平台,供学生回顾性学习。学生要对课堂上遇到的问题,搜集学习资料进一步思考和巩固。教师还要对学生课后学习情况进行挖掘,并根据学生的不同情况进行个性化的学习支持。对于有困难的学生,教师要单独辅导和监管,帮助学生完成课程学习;对于学有余力的学生,可以鼓励学生走进实验室,跟随教师的科研工作,完成真正的动手实践,实现素质提升。最终通过师生配合,完成对课程教学效果的提升。
4.教学考核。由于教学形式发生变化,课程的教学考核模式也要随之做出调整和改变。在实践中,教师改变传统的期末考核模式,充分利用线上线下教学记录,实现全过程考核。考试成绩包含网络平台学习考核(25%)、线下课堂表现(25%)和期末闭卷考试(50%)三部分。其中网络平台学习考核由系统根据学习时间、频率以及测试情况生成;课堂表现根据学生听课及参与讨论情况,综合学生互评和教师考核给分。上述考核方式,降低了期末考试在总成绩中的比重,更加侧重于学生的平时学习积累和实践能力的培养。因此,可避免学生“突击考试”的侥幸心理,促进学生向平时主动学习转变,更符合现代教学模式和人才培养的需求。
1计算机网络安全在大数据系统中应用的必要性
1.1大数据系统中网络问题层出不穷
大数据背景下,人们的工作、生活及学习模式发生了很大改变,但人们的网络安全意识有待提高。在人们迫切追求在网络环境中的便捷性体验时,只要忽视了网络安全隐患,就必然会导致大数据系统安全问题层出不穷。在计算机系统配置中,网络软件安全性整体偏低,导致人们的重要信息很容易受到攻击而导致泄露。黑客与病毒的入侵,也恶化了大数据系统中的网络环境。当软件和程序存有漏洞,就很容易遭到病毒入侵。一旦大数据系统网络监管力度不够,网络环境的安全性就更难以保障,导致大数据系统中网络问题接二连三地出现。
1.2计算机网络安全为大数据系统安全提供了无限可能
计算机网络安全,可有效保证大数据系统的稳定安全运行。大数据主要是信息技术下的一种产物,通过储存和处理信息,在大数据系统中俺找人的需求呈现信息,进而为个人与企业发展提供数据依据。在大数据系统中,信息数据是其运行的根本因素,同时信息安全也是计算机网络安全的主要内容,可以说,计算机网络安全是大数据系统安全运行的根基。对计算机用户来说,大数据通过收集个人信息并分析,依据人的喜好来推送相关的数据。一旦这些涉及用户隐私的数据被不法分子非法使用,必然会威胁到计算机用户的根本利益。对企业来说,通过收集企业各项数据并为企业发展提供数据支持,这些数据不免涉及企业的核心机密与市场竞争力,一旦这些数据泄密,必然会对企业造成致命性打击。所以,计算机网络安全,在很大程度上保证了大数据系统安全,对企业与计算机用户信息安全都有着全面保障作用。
2计算机网络安全在大数据系统中的具体应用及改进策略
2.1计算机网络安全在大数据系统中的具体应用
一般来说,计算机网络安全在大数据系统中的应用,应充分认识到大数据系统运行中面临的各种网络安全问题。从预防与解决网络安全问题的角度实现大数据系统的安全运行。确切来说,计算机网络安全在大数据系统中的具体应用,可从数据管理、数据分析、防火墙应用及区块链防篡改技术等说起。计算机网络安全在数据管理中的应用:计算机网络安全在数据管理中的应用,主要是确保数据的完整性与安全性,避免出现数据被黑客与病毒入侵而面临着各种威胁。如在大数据系统中对用户身份进行认证,其数据信息管理时,以设定好的网络ID为主,只要登录时进行网络ID认定,就能避免网络ID被不法分子登录,也杜绝了不法分子毁坏数据及盗取数据的行为。大数据系统中身份认证过程中,以密码和特殊口令的方式来认证,就大大地提高了数据管理的安全性。身份认证技术应用时,能对需要处理的信息加密,当信息一旦被盗用,也无法正确认证身份而使用信息。计算机网络安全在数据管理中的应用,只要面临着黑客攻击,就能全面分析黑客攻击的手段,并充分运用数据信息抵御黑客攻击,全面保护大数据系统中网络环境的安全。计算机网络安全在数据分析中的应用:计算机网络安全可用在数据分析中,用来保护大数据系统的安全性。数据分析通过运用统计手段整合和处理数据,进而提取到有效的数据,在分析和整理后得到相关的结论。大数据系统中,数据分析用以保证数据的安全和完整,并确保数据的可靠性。计算机网络安全技术在数据分析中的应用,在很大程度上提升了数据分析的效率与质量,额保证了数据的准确性。数据分析中应用计算机网络安全技术,应加强大数据系统中的网络安全监管,积极地运用数据挖掘安全技术,全面分析用户日常行为,及时地跟踪和警告可能产生安全风险的操作,并告知用户。防火墙技术、区块链防篡改技术在大数据系统中的应用:计算机网络安全技术在大数据系统中的应用,通过运用防火墙技术和区块链防篡改技术,提高大数据系统网络安全的强度。计算机网络安全的基本保障来源于防火墙技术,几乎每一台计算机都配备了防火墙。计算机网络安全在大数据系统中的应用,通过为计算机网络提供安全保护,把计算机和计算机外网分离开来,分别分析计算机外网传达到计算机本身的相关信息,只要鉴别并确认后,对其进行拦截或者是放行。防火墙技术用于大数据系统中,可起到对病毒隔绝作用。区块链防篡改技术的应用,通过在每个新区块上设置数据指纹,并让每一个区块之间形成一种链条结构,只要区块中的数据被篡改,就会导致下一区块的数据指纹变动,这就无法完成用户身份认证,进而确保数据信息的完整性与保密性。
2.2计算机网络安全在大数据系统中应用的改进策略
计算机网络安全在大数据系统中的应用,应全力解决大数据系统中面临的各种网络安全问题,实现大数据系统中的安全防控。具体来说,计算机网络安全在大数据系统中的应用,可从几点做起:提升网络安全防范意识:大数据环境下,人们使用计算机网络时,只要网络安全意识薄弱,就很容易处于不安全的网络环境中。尤其是青少年和中老年群体,计算机网络防范意识相对薄弱,很容易在网络环境中遇到信息泄密与信息被盗等问题。那么,要想确保大数据环境的安全有效,每个人都应增强自身网络安全意识。社会也要积极地宣传计算机网络安全知识的宣传,以宣传的方式帮助人们提升安全意识,并做好计算机网络防范工作。提倡青少年和中老年群体,在使用计算机网络时,尽可能地把密码设置得更复杂点,起到对计算机网络用户账号的保护作用。加强计算机网络安全人才培养工作,充分发挥出网络安全人才优势,做好网络安全建设,降低计算机网络安全风险率。加强病毒检测防御:在大数据环境下,对计算机安装先进的软件,实时监测计算机网络运行的安全性。如在计算机上安装防火墙和杀毒软件,定期监测和防范病毒,提升计算机网络的安全性,全面保障人们信息的安全。对重要信息进行密钥处理,即便信息被盗也会在没有密钥情况下无法打开。增强计算机网络监管力度:在网络环境中建立网络监管制度,用于提升网络环境的安全度,并尽可能地消除网络环境面临的安全隐患。以法律法规为依据,做好网络安全控制,定期优化和完善网络安全,确保大数据系统的安全运行。因此,计算机网络安全对大数据系统来说至关重要。在大数据系统中应用计算机网络安全技术,应格外重视计算机用户网络安全防范意识的培养,并做好病毒检测防御工作,加强计算机网络监管力度。
关键词:推荐系统;云计算;数据挖掘;个性化
中图分类号:TP393 文献标识码:A DOI:10,3969/J.issn.1003-6970.2013.03.001
本文著录格式:[1]郭平,刘波,沈岳,农业云大数据自组织推送关键技术综述[J].软件,2013,34(3):1-6
0 引言
随着物联网、云计算、下一代互联网等新一代信息技术的快速发展和信息内容的日益增长,“信息过载”问题愈来愈严重,推荐系统(recommender systems)被认为可以有效的缓解此难题,帮助用户从海量数据中发现感兴趣信息,满足个性化需求。
近年来,我国在农业个性化知识服务服务领域从本体论、语义网、知识工程角度开展了广泛的研究,成果主要体现在三个方面:以搜索引擎为代表的知识检索系统,需回答大量预设问题进行知识推理的专家系统,特定领域应用系统,它们在各自的场合都发挥了积极作用。然而知识检索系统不能满足用户个性化需求,专家系统的应用很难普及,特定领域应用开发成本高和重用难度大。物联网与数据挖掘云服务提供知识服务云实现物理世界的“感知控”,知识服务云的研究主要集中在制造和图书情报领域,云环境下的农业个性化知识服务的研究尚处于起步阶段,主要集中在服务模式的构建与展望。
本文是对科技部科技支撑课题“农村农业信息化关键技术集成与示范”(2011BAD21803)与“农村物联网综合信息服务科技工程”(2012BAD35800)研究成果的总结,也是对农业云推荐系统研究的升华。
1 农业云大数据自组织区域推送的提出
1.1 农业信息资源特点
我国自“十一五”时期以来,农业农村信息化发展取得了显著成效,主要表现在农业农村信息化基础设施不断完善、业务应用深入发展、物联网技术在农业中逐步推广应用等方面。从中央到省,市、县建立了“三农”综合信息服务平台,涉农企业、组织和科研院所也积极搭建了各具特色的农业信息服务平台,目前正向乡镇村发展。农村信息员队伍及以农业综合信息服务站和农业合作社为代表的农村信息服务机构发展迅速,“三电合一”、“农民信箱”、“农村热线”等信息服务模式应用深入。云计算利用海量的存储能力把农业信息资源形成高度集成和虚拟化的计算资源一“农业知识聚合云”,支持用户在任意位置、使用各种终端方便获取信息,但由于农业领域生态区域性和过程复杂性及农业区域发展不平衡和农民文化的多层次性也带来了“信息过载”、“资源隐晦”“资源迷向”等问题。
1.2 农业云环境下大数据自组织区域推送
物联网和云计算背后是大数据,在云计算模式下,用户不确定的、智能的交互,个性化需求更加多元化,信息交互行为更加频繁;在大量用户通过社会标注达成共识的过程中,逐渐形成不同社区,涌现出群体智能,形成“农业用户兴趣社交云”。利用云的海量存储、群体涌现智能、强大的计算能力和物联网感知控优势,可以提供面向用户复杂分析计算,实现业务重点由面向应用和资源的传统信息服务,转变为基于对海量农业知识进行动态划分,有目的、主动、定制、自组织推送给有需求的农业用户,为农业用户提供实时性、个性化知识服务,指导农业生产过程。
首先以Hadoop+MapReduce+HBaSe分布式框架为处理平台,对“农业用户兴趣社交云”,融合用户兴趣偏好和社交网络进行建模,将这些多元用户信息充分融入推送系统会更好产生推荐结果;将推荐对象“农业知识聚合云”按农业知识高维性、多样性、多层次性特征分类聚类为各种知识块静态和动态元数据;通过智能算法推荐和社会网络推荐为用户发现个性化内容;根据用户的地理位置、用户服务的评价以及云基础服务提供商信息将预测值最高的服务推送给用户实现与物理世界的互动(如图1)。
从以上分析可知,农业云大数据自组织区域推送的关键技术有用户兴趣模型、推荐对象模型,推荐算法、数据挖掘四个部分,以下分别对这几项技术进行论述。
1.2.1 用户兴趣模型
用户兴趣建模是个性化服务技术的基础和核心,包括数据收集、模型表示、模型学习与模型更新。用户兴趣建模的方法有很多,常用的有向量空间模型、神经网络、遗传算法、用户一项目评价矩阵、基于案例的表示、基于本体论的表示、基于加权关键词的表示,基于社会网络的表示等。几乎每种表示形式都是以一种私有形式进行知识表示,此外一些表示技术还依赖于模型学习,如广泛使用的基于向量空间模型的表示与TF-IDF学习技术联系在一起。表示形式的私有性和对学习技术的依赖性阻碍了用户模型在系统间的共享,这种共享对于减少用户建模工作量,提高推荐算法启动效率具有重要意义。因此开发独立于模型学习技术的通用用户模型表示技术是目前研究中热点,基于语义网和社交网络的用户模型在这方面表现了优势。
用户的兴趣或需求会随时间、情景发生变化,结合长期和短期兴趣及兴趣的变化用户兴趣建模的重点,目前的更新机制很难及时跟踪用户兴趣的变化,有更好的学习效率和动态变化适应能力的建模是未来的重要研究方向,国内外大量的文献对此展开了研究,遗忘函数、时间窗、用户兴趣的漂移特性等被提出。
在湖南农业云中,基于呼叫中心、互联网,手机报、手机短信,电视广播等用户在多应用系统中形成的兴趣偏好和社交网络特征,提出“农业用户兴趣社交云”建模思路:以图论模型表示用户“兴趣图”数据和“社交图”数据,根据经典的局域世界演化理论,综合考虑实际情况中用户之间的多重关系和关系的强弱程度,以用户之间相似度为节点连接概率因素,生成动态多维网络,进行用户数据的挖掘和更新;结合农业本体,在多维社交网络的基础上,将基于农业本体的区域用户兴趣融合在云计算平台上进行处理。
1.2.2 推荐对象模型
推荐本质上是将推荐对象的特征与用户的兴趣偏好进行推荐计算,所以推荐对象的描述和用户的描述密切相关。推荐系统应用不同领域,它推荐的对象也就各不相同,目前,湖南农业云主要是文本性数据;不同的对象,特征也不相同,目前没有一个统一的标准来进行统一描述,主要有基于内容、分类、聚类的方法。
基于内容的方法是从对象本身抽取信息表示对象,常见的是向量空间模型,使用最广泛的是加权关键词矢量方法进行特征选取,使用TFIDF计算每个特征的权值。向量空间模型对模型中的特征词进行权重估计(TF-IDF)过程中不考虑特征词之间的相关性,直接用特征词作为维度构建文档向量,降低了文档向量对文档概念表达的准确性以及对不同类型文档的区分能力。
基于分类的方法是把推荐对象放入不同类别,把同类文档推荐给对该类文档感兴趣的用户。主要有两种,一种是基于知识工程的方法,使专家的类别知识直接编码为分类规则,正确率和召回率高,但工作量大;近期研究最多的是另一种一机器学习,根据训练样本集建立分类器,方法有很多,常见的有概率分类、贝叶斯回归分析、决策树分类器、决策规则分类器、Rocchio分类器、神经网络分类器、支持向量机(SVM)、分类器融合、Boosting分类器、k最近邻方法(KNN)等。
研究文本聚类的最初目的是为了提高信息检索的查全率和查准率,近年来,文本聚类用于自动产生文本的多层次的类,并利用这些新生成的类对新文本进行效率较好的归类,已经提出了大量的文本聚类算法。传统的聚类算法在处理高维和海量文本时效率不很理想。针对这样的问题,将聚类分析与计算智能理论,并行计算、云计算等相结合,设计出高效的并行聚类算法,己经成为一个比较流行的研究思路。
在湖南农业知识云数据模型中,将能更好反映特征词相关性的超图模型引入,将文档中提取的特征项表示为图中节点,特征词条之间的关系构成图中边,用边上权值表示相关联特征项之间共现程度。通过对文本图模型K最近邻划分实现降维降噪的粗粒度数据切片;对切片后数据反映用户兴趣如地域、时间、诉求等多维度特征的智能聚类,实现细粒度的聚合与分割。
“农业知识聚合云”模型算法建立在基于MapReduce处理的大规模图上,得到各种知识块静态和动态元数据。
1.2.3 推荐算法
推荐算法是整个推荐系统中核心部分,大量的论文和著作都关注了这个方面。目前,基本包括以下几种:基于内容过滤推荐、协同过滤推荐、基于关联推荐、基于知识推荐、基于效用推荐、基于网络结构推荐、基于聚类推荐、基于社会网络分析推荐、混合型推荐等。通过对众多推荐算法进行比较分析,各种算法都有优缺点(如表1):
各种推荐方法都有各自的优缺点,在实际问题中采用多种策略进行混合推荐,主要有两种混合思路:推荐结果混合和推荐算法混合。目前大部分的推荐算法都是混合推荐算法,主要还是以协同理论为核心,再配合其他算法的优点或交叉学科的理论来改善推荐的质量。另外基于社会网络个性化推荐算法研究是一个趋势,基于社会网络的推荐是协同过滤的延伸,通过考察结点之间(用户和用户之间或产品之间)的相关性和结点之间的信任度可以获得比一般协同推荐更高推荐效果,如文献提出将社会网络关系结合到推荐算法中。纵观国内外在推荐算法上的研究,主要集中在基于用户显性评分数据的协同过滤算法上,对基于非显性评分行为数据场景下的研究却显得有点不足。目前在扩展性问题上学术研究不是很具有针对性,主要集中在通过各种交叉学科中的方法来对用户进行聚类或对行为数据进行降维、压缩等缩短推荐的项目集或减少计算量,从而提升算法的性能;有关基于云平台上的推荐算法研究目前主要集中于协同过滤算法MapReduce化。而实际应用中,己出现利用分布式集群解决算法扩展性方法,如Google News的推荐算法就是部署在分布式环境下,从而满足海量数据下的推荐服务。
根据农业云大数据自组织区域推送实际情况将推荐结果和推荐算法混合,提出“三层推荐”策略:在丰富的知识块云元数据基础上,将知识块属性和用户兴趣行为基于频繁模式的知识关联撮合推荐;通过复杂网络聚类算法识别一个用户多个社区兴趣,融合“兴趣图”和“社交图”协同过滤推荐,突破算法推荐的局限性,让用户信任的朋友圈子为其发现和推荐内容,取得社交推荐的时效性和算法推荐的长尾性之间的互补,从而针对每个社区成员提供精准个性化推荐;根据基础设施服务供应商、用户所在的地理位置以及用户对服务可用性评价值的相似性等,将大量用户云终端聚类为一定数量的社区,提高云端推送服务的有效性,最终形成通过大众参与,支持云间变换,集电信网、广播电视网、互联网合一的自组织区域推送,较有效地处理一般推荐算法中存在的稀疏性、冷启动以及大规模实时计算的问题。
1.2.4 云计算下个性化数据挖掘
数据挖掘采用了多种领域中的思想,包括来自统计学的抽样、估计、假设检验以及人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。随着数据挖掘的不断发展,也采用了包括最优化、进化计算、信息论、信号处理、可视化、信息检索、云计算、并行计算等技术。与传统的数据挖掘相比,云计算下的个性化数据挖掘的目标,就是通过云计算中心,向用户提供针对其即时演化需求的数据挖掘SaaS(Software as aService,软件即服务)服务,其基础问题主要为:对于用户不同的数据挖掘需求以及针对用户特点进行个性推荐的建模和表征;数据挖掘算法适应云计算的并行分布式化;使数据挖掘的结果和算法能够支持云间变换并形成一种面向用户、即时组合的、变粒度的云服务,其中数据挖掘的云服务化是研究的难点。
(1)云计算下个性推荐的建模和表征
云下的个性推荐建模和表征与传统上个性化推荐明显的不同在于海量异构大数据和用户间群体涌现的社交网络,它们本质上形成了多个顶点的大规模图。云计算可以为大规模个性化提供技术支撑,云服务本身也有大规模个性化定制应用需求,目前研究两者结合的文献还很少,张泽华从计算资源的角度基于复杂系统理论对云计算联盟体系结构进行建模,并基于蚁群优化算法和复杂系统理论进行了负载均衡研究;郭昱就有效处理客户需求信息该如何选择与分布云计算平台中的关键节点问题,提出了基于云计算的大规模定制客户需求模型。赵东杰对复杂网络、数据挖掘与群体智能有效结合进行了探索研究。农业云大数据自组织推送通过“农业知识聚合云”分解的静态、动态知识元数据和“农业用户兴趣社交云”形成的兴趣图、社交图基于用户行为和知识元数据的关联撮合,通过人工智能和社交圈子帮助用户发现内容,实现搜索和推荐的无缝结合,为智能个性化推荐实现“内容找人”愿景。
(2)算法并行分布式与高性能计算
对于大规模数据的处理,典型系统结构大致分为三类:基于MapReduce模型的分布式并行处理系统、基于BSP模型的分布式并行处理系统和分布式图数据库系统。数据挖掘算法现在的发展趋势是基于云计算的并行数据挖掘,它的同一个算法可以分布在多个节点上,多个算法之间是并行的,多个资源实行按需分配,而且分布式计算模型采用云计算模式,数据用DFS或者HBASE,编程模式采用MapReduce这种方式。Bhaduri等整理了一个十分详尽的并行数据挖掘算法文献目录,包含了关联规则学习、分类、聚类、流数据挖掘四大类分布式数据挖掘算法,同时还包括分布式系统、隐私保护等相关的研究工作。
2 基于云计算推荐系统研究的重点、难点与热点
2.1 云环境下用户偏好获取安全与可信问题
推荐系统中,用户数据集的数量和质量问题,影响用户模型的精确度、可用性,导致问题的根本原因在于用户对隐私和安全的考虑。而云环境下,数据的安全与隐私是用户非常关心的问题。既能得到准确用户信息而提高推荐系统性能,又能有效保护用户信息同时检测并能预防推荐攻击(一些不法的用户为了提高或降低某些对象的推荐概率,恶意捏造用户评分数据而达到目的)将是未来推荐系统的一个重要研究方向。
2.2 模型过拟合问题
过拟合现象是指系统推荐给用户的对象与用户刚刚看过的不是太相似或者太不相关。过拟合(过学习)的问题本质上来自于数据的不完备性,这在实际应用中是无法完全避免的。在于兴趣偏好获取方式或隐私等原因使用户没有对足够多类别的对象进行评价。目前解决的主要方法是引入随机性,使推荐算法收敛到全局最优或者逼近全局最优,关于既要保证推荐的多样性,又不能与用户看过的对象重复或毫不相关这一问题的研究是推荐系统研究的一个难点和重点。
2.3 稀疏性与冷启动问题
稀疏性和冷启动问题困扰推荐系统很长时间了,前者的解决办法主要过滤和降维。目前针对冷启动问题提出了一些解决方法,主要分为两大方面,一是直接利用传统协同过滤的评分数据结合特定的方法进行解决,二是新用户或新项目的内容属性信息与传统的协同过滤评分数据相结合的方法进行改善冷启动问题。稀疏性与冷启动问题一直是推荐系统研究的一个难点和重点。
2.4 数据挖掘的结果和算法智能服务化
将数据挖掘算法融入针对海量用户的使用记录和计算资源间协作进行优化组合,利用这些特性通过大众参与的交互作用,提高云间服务的智能性、有效性将是大数据时代推荐系统研究的一个制高点。将数据挖掘任务及其实现算法服务化,通过SaaS方式向云计算中心索取所需的相应的数据挖掘,这可能是目前突破数据挖掘专用软件使用门槛过高、普通大众难以触及、企业用户使用成本太大、挖掘算法和结果难以实时得到评价和相应修改等问题的最有希望的解决方案之一,也是数据挖掘走向互联网大众、走向实用化的重要的一步。
2.5 大数据处理与增量计算问题
目前对大数据的研究仍处于一个非常初步的阶段,半结构化和非结构化数据给传统的数据分析带来巨大挑战,尤其算法如何快速高效地处理推荐系统海量和稀疏的数据成为迫在眉睫的问题。当产生新的数据时,算法的结果不需要在整个数据集上重新进行计算,而只需考虑增量部分,对原有的结果进行微调,快速得到准确的新结果,是增量计算的理想状态。但一般而言,随着信息量的增多,算法的误差会累积变大,最终每过一段时间还是需要利用全局数据重新进行计算。一个特别困难的挑战是如何设计一种能够保证其误差不会累积的算法,也就是说其结果与利用全部数据重新计算的结果之间的差异不会单调上升,要达到这种程度,还有很长的路要走。
结束语:
随着新一代信息技术的快速发展和信息内容的日益增长,搭载在云计算平台的自组织区域推送具有它天然的优势:云的海量存储使得推荐系统能有效获取训练数据;云的分布式计算能力提供了较高的响应能力;海量用户的使用记录和计算资源问大众参与的交互涌现,最终形成自组织优化组合的智能个性化云推送。因此,农业云自组织区域推送具有重要的研究意义和广阔的应用前景,对云环境下其他领域的个性化推送应用具有借鉴意义,但目前存在大量问题需要进行深入细致的研究。
参考文献
[1]孟祥武,胡勋,王立才,张玉洁,移动推荐系统及其应用[J],软件学报,2013,24(1):91-108
[2]杨涛,基于本体的农业领域知识服务若干关键技术研究[D],上海:复旦大学计算机科学技术学院博士论文,2011,1-50
[3]杨晓蓉,分布式农业科技信息共享关键技术研究与应用[D],北京:中国农业科学院博士学位论文,2011,3-35
[4]赵春江,农业智能系统[M],北京:科学出版社,2009,1-210,
[5]何清,物联网与数据挖掘云服务[J],智能系统学报,2012,7(3):1-5,
[6]黄卫东,于瑞强,共享学习模式下知识服务云平台的构建研究[J],电信科学,2011,12:6-11
[7]丁静,杨善林,罗贺,丁帅,云计算环境下的数据挖掘服务模式[J],计算机科学,2012,39(6):217-219,237
[8]邓仲华,钱剑红,陆颖隽,国内图书情报领域云计算研究分析[J],信息资源管理学报,2012,2:10-16
[9]胡安瑞,张霖,陶飞,罗永亮,基于知识的云制造资源服务管理[J]同济大学学报(自然科学版),2012,40(7):1093-1101
[10]程功勋,刘丽兰,林智奇,俞涛,面向用户偏好的智能云服务平台研究[J],中国机械工程,2012,23(11):1318-1323,1336
[11]刘波,方逵,沈岳,可重构的农业知识服务模式研究[J]农机化研究,2011,36(11):66-70
[12]赵星,廖桂平,史晓慧,陈诚,李文圃,物联网与云计算环境下的农业信息服务模式构建[J],农机化研究,2012,4:142-147
[13]郭永田,中国农业农村信息化发展成效与展望[J],电子政务,2012,02-03:99-106
[14]李道亮,中国农业农村信息化发展报告(2011)[M],北京:电子工业出版,2012,87-150
[15]钱平,郑业鲁,农业木体论研究与应用[M],北京:中国农业科学技术出版社,2006,1-100
[16]吴丽花,刘鲁,个性化推荐系统用户建模技术综述[J],情报学报,2006,25(2):55-62
[17]李珊,个性化服务中用户兴趣建模与更新研究[J],情报学报,2010,29(1):67-71
[18]王国霞,刘贺平,个性化推荐系统综述[J],计算机工程与应用,2012,48(7):66-76
[19]王巧容,赵海燕,曹健,个性化服务中的用户建模技术[J],小型微型计算机系统,2011,32(1):39-46
软件杂志欢迎推荐投稿:http:///
[20]张华清,动态多维社会网络中个性化推荐方法研究[D],济南:山东师范大学硕士学位论文,2012,16-31
[21]丹,面向跨系统个性化服务的用户建模方法研究[J]_情报杂志,2012,31(6):156-161
[22]邓夏玮,基于社交网络的用户行为研究[D],北京:北京交通大学硕士学位论文,2012,4-43
[23]马尧,基于多维用户特征建模的个性化社交搜索引擎的设计与实现[D],广州:华南理工大学硕士学位论文,2012,12-55
[24]陈恩红,徐童,田继雷,杨禹,移动情景感知的个性化推荐技术[J],中国计算机学会通讯,2013,9(3):19-24
[25]Jong Hwa Kima,b,,Hyun JoonLeeb,Extraction of user profile based on workflow and information flow[J],Expert Systems with Applications,2012,39(5):5478-5487
[26]南智敏,钱松荣,引入漂移特性的用户兴趣模型优化研究[J],微型电脑应用,2012,28(3):30-32
[27]郭新明,弋改珍,混合模型的用户兴趣漂移算法[J],智能系统学报,2010,5(2):181-184
[28]程显毅,朱倩,文本挖掘原理[M],北京:科学出版社,2010,9-45 [29]李涛,推荐系统中若干关键问题研究[D],南京:南京航空航天大学博士学位论文,2009,31-80
[30]姜伦,模糊聚类算法及其在中文文本聚类中的研究与实现[D],哈尔滨:哈尔滨理工大学硕士学位论文,2010,18-48
[31]冯汝伟,谢强,丁秋林,基于文本聚类与分布式Lucene的知识检索[J],计算机应用,2013,33(1):186-188
[32]陶红,周永梅,高尚,一种基于语义相似度的群智能文本聚类的新方法[J]计算机应用研究,2012,29(2):482-532
[33]孟海东,刘小荣,基于聚类分析的图模型文档分类[J]计算机应用与软件,2012,29(1):117-174,229
[34]饶君,张仁波,东呈晓,吴斌,基于MapReduce的大规模图挖掘并行计算模型[J],应用科技,2012,39(3):56-60
[35]于戈,谷峪,鲍玉斌,王志刚,云计算环境下的大规模图数据处理技术[J],计算机学报,2011,34(10):1753-1767
[36]吕善国,吴效葵,曹义亲,基于网络结构的推荐算法[J]_实验室研究与探索,2012,31(7):278-280,368
[37]周佳,罗铁坚,一种基于内容关联的学术资源协同推荐算法[J],中国科学院研究生院学报,2013,30(1):117-123
[38]唐晓波,张昭,基于混合图的在线社交网络个性化推荐系统研究[J]情报理论与实践,2013,36(2):91-95
[39]王立才,孟祥武,张玉洁,上下文感知推荐系统[J],软件学报,2012,23(1):1-20
[40]刘建国,周涛,汪秉宏,个性化推荐系统的研究进展[J],自然科学通报,2009,19(1):1-15
[41]许海玲,吴潇,李晓东,阎保平,互联网推荐系统比较研究[J]软件学报,2009,20(2):350-362
[42]孙冬婷,何涛,张福海,推荐系统中的冷启动问题研究综述[J],计算机与现代化,2012,5:59-63
[43]张亮,基于聚类技术的推荐算法研究[D],成都:电子科技大学硕士学位论文,2012,7-18
[44]Liu, F.,Lee, H.J. Use of social network information to enhance collaborative filterinperformance.Expert[J] Systems with Applications. 2010, 37(7):4772-4778.
[45]Jiang, J., Lu, J., Zhang, G., Long, G. Scaling- Up Item-Based CollaborativeFiltering Recommendation Algorithm Based on Hadoop[C].2011 IEEE World Congress onServices.IEEE[A]. 2011, 490-497.
[46]周源,基于云计算的推荐算法研究[D],成都:电子科技大学硕士学位论文,2012,26-64
[47]吕雪骥,基于云计算平台的智能推荐系统研究[D],合肥:安徽大学硕士学位论文,2012,25-43
[48]刘晨,改进的聚类挖掘算法对网络自助出版“长尾”文本的推荐应用[D],上海:复旦大学硕士学位论文,2011,10-19
[49]陈桂生,张海粟,刘玉超,云计算下的个性化数据挖掘服务[EB/OL],[2011-2-28]中国人工智能学会通讯,http://www,/contents/50/119,html
[50]张泽华,云计算联盟建模及实现的关键技术研究[D],昆明:云南大学博士学位论文,2012,26-114
[51]郭昱,吴清烈,基于云计算的大规模定制客户需求响应模型及其节点的选择与分布[J],系统工程理论与实践,2011,31(增刊2):1-6
[52]赵东杰,张海粟,韩言妮,杨海涛,何宇,基于网络化数据挖掘的群体智能研究方法[C],Proceedings of 2010 The 3rdInternational Conference on Computational Intelligence andIndustrial Application(Volume 9).IEEE[A].2010,239-243.
[53]AnandRajaraman,Jeffrey David Ullman著,王斌译,互联网大规模数据挖掘与分布式处理[M],北京:人民邮电出版社,2012,1-253
[54]Bhaduri K, Das K, Liu Kun, et al. Distributed data mining bibliography[EB/OL]. [2011-01-03]. http:// cs. umbc. edu/~hillol/DDMBIB/
[55]杨健,汪海航,王剑,俞定国,云计算安全问题研究综述[J],小型微型计算机系统,2012,33(3):472-479
统计与大数据系按照教务处“2021届毕业生实习及毕业论文(设计)相关事宜通知”,结合2018级人才培养方案,制定2021届学生毕业论文(设计)指导方案,具体内容包括以下6部分:
一、2021届毕业论文指导教师分配表(详见附件1)
二、 毕业论文写作与指导的具体安排
论文辅导时间:2020年10月1日至2021年4月1日
具体安排:
工作安排
具体内容
具体要求
截止时间
选题
确定论文题目
根据自己的专业、结合实习情况,以项目为基础选择论文题目,并经指导教师审核通过。
2021年1月1日
提纲
构思论文结构、拟订论文提纲
结合企业实践内容确定论文结构列出提纲。
2021年2月1日
写作与批改
初稿
按照论文提纲撰写初稿,主动与论文指导老师联系审核与批改。
2021年3月1日
二稿
按照论文指导老师的要求反复修改、完善、补充。
2021年4月1日
定稿
达到论文基本要求,定稿电子版发给论文指导老师。
2021年4月10日
交稿
打印提交
双面打印,毕业返校时以班级为单位提交。
2021年6月
三、 指导教师联系方式
姓名
职称
邮箱
电话
方党生
副教授
2541790217@qq.com
2541790217
15136166829
杨冬梅
讲师
339097597@qq.com
339097597
18625779090
李春花
讲师
19772728@qq.com
19772728
18638793098
魏瑶
讲师
43665723@qq.com
43665723
15838313791
马杰
高级讲师
Hnhymj@126.com
13838067063
杜旭阳
助理讲师
604696049@qq.com
604696049
17396370961
高艳云
副教授
37742562@qq.com
37742562
13939020929
钱钰
讲师
397019111@qq.com
397019111
15093132377
梁慧丹
助理讲师
1620280267@qq.com
1620280267
15188395423
秦航琪
助理讲师
1191084277@qq.com
1191084277
15670930099
范迪
助理讲师
1261810070@qq.com
1261810070
18339270887
四、毕业论文参考题目
大数据技术及应用专业
1) 大数据时代下的网络信息安全
2) 大数据对市场调查技术与研究方法的影响
3) 大数据环境下社会舆情分析方法研究
4) 大数据在房屋租赁的应用
5) 大数据在互联网金融领域的应用
6) 大数据在电子商务下的应用
7) 大数据时代下线上餐饮变革
8) 大数据在养殖业中的应用
9) 大数据对商业模式影响
10) 大数据在智能交通中的应用
11) 基于大数据小微金融
12) 大数据在农副产品中的应用
13) 大数据在用户行为分析中的应用
14) 基于大数据的会员价值分析
15) 大数据对教育模式的影响
物联网应用技术专业
1)物联网技术在蔬菜大棚中的应用
2)物联网技术对智能家居的应用
3) 物联网技术对智能物流监管的应用
4) 物联网技术在企业的应用
5) 计算机物联网技术带来的影响
6) 物联网技术在校园安全的应用
7) 浅谈物联网技术的应用与发展
8) 物联网技术在企业的应用
9) 计算机物联网技术在各个行业的应用
10) 物联网技术在食品安全追溯方面的应用
11)物联网技术在楼宇智能化系统的应用
12)物联网技术在智能停车场系统的应用
13)物联网技术在安保行业的应用
14)物联网技术在智能交通行业的应用
15)基于物联网技术的校园宿舍安防系统的设计与实现
信息统计与分析专业
1) 某企业竞争力调查分析
2) 浅谈企业统计数据质量
3) 人口素质与经济增长的关系研究
4) 地区竞争力初步分析
5) 农业结构调整与粮食安全保证问题研究
6) 我国中小企业发展现状与对策
7) 对某市房地产开发的市场分析
8) 消费者购买动机调查分析
9) 某产品市场需求调查
10) 某产品销售预测
11) 某产品销售统计分析
12) 某产品竞争力分析
13) 产业结构变动分析
14) 大数据发展对统计工作的影响分析
15) 郑州租房状况分析
五、毕业论文(设计)格式规范要求(详见附件2)
六、毕业论文(设计)格式模板(详见附件3)
附件1:2021届毕业论文指导教师分配表
附件2
河南信息统计职业学院
毕业论文格式及规范要求
河南信息统计职业学院毕业论文(设计)统一的规格要求如下:
(一)开本
A4白纸(210mm×297mm)
(二)装订
长边左侧装订
(三)全文编置
1.页码
全文页码自正文起编列,正文与附录可连续编码。页码以阿拉伯数字左右加圆点标示,置页边下脚中间。
2.边距
正文至附录的文字版面规范为:天头25mm;地脚25mm;左边距30mm;右边距25mm。上述边距的允许误差均为±1mm。
3.行字间距
正文至附录的行字间距按5mm设置;字间距为1mm,或由Word自动默认。
(四)编排构成
1.前置部分
(1)封面设置
第一排:“河南信息统计职业学院”,华文行楷一号字,居中排列,第一排前空两行(三号字);
第二排:“毕业论文(设计)”,黑体一号字,居中排列;
第三排:“ 级 专业 班”, 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字,与第二排空二行(三号字);
第四排:“题目 ” 黑体三号字,居中排列,“题目”两字中间留两个汉字的空位,横线空格处填写相应内容,填写内容使用宋体三号字,与第三排空六行(三号字);
第五排:“姓名 学号 ”, 黑体三号字,居中排列,“姓名“两字中间留两个汉字的空位,横线空格处填写相应内容,填写内容使用宋体三号字;
第六排:“指导教师 职称 ”, 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字;
第七排:“系别 ” 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字,与第六排空两行(三号字)。
第八排:“ 年 月 日” 黑体三号字,居中排列,横线空格处填写相应内容,填写内容使用宋体三号字,与第七排空两行(三号字)。
(2)声明
本人必须声明所呈交的论文是学生本人在导师的指导下独立完成的。除了文别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果。要求学生本人签名。
(3)内容提要
第二页为内容提要。内容提要是对全文基本观点的集中提炼和说明。提要中应阐明本论文(设计)要解决的主要问题及其依据,并指出创新之处。内容提要以300-500字为宜。其中“内容提要”为黑体三号字,每字间空一格,居中排列。“内容提要”下空一行编排具体内容,具体内容按照中文文章格式排列,使用宋体四号字。
(3)关键词
关键词是揭示文献主体信息的词汇。关键词在内容提要之后空一行设置。其中“关键词”三字用黑体三号字与“内容提要”对应居中排列,而后另起行设置关键词3-5个,用宋体四号字。各词汇间不用标点符号分隔,空一格汉字字符。
(4)目录页
“目录”二字用三号加黑宋居中排列,字间空三格;“目录”下空一行排全文的主要标题,用四号仿宋体。对目录中的每一个标题都要标注页码。
2.正文部分
一部完整的毕业论文(设计)正文部分一般应由以下要素构成:论文正文文字;结论;注释;参考文献。
(1)正文文字
论文(设计)的正文文字在署名后空一行排列,用四号仿宋字体打印。
(2)结论
毕业设计的体会和总结;该设计的结论、优点及有待探讨的问题。
(3)注释
注释是用于对文内某一特定内容作必要的解释或文字说明。注释的内容置于与当前页主题文字的分线以下,以带圆圈的阿拉伯数字标示,左空二格排列,用小五号宋体字。
(4)参考文献
参考文献是作者著文时研究和参阅的相关资料。“参考文献”四个字用三号黑体字左顶格标示。参考文献的内容置于主体文字之后空一行排列,其顺序与主体文字中的序号编排相对应,以带方括号的阿拉伯数字左顶格用五号宋体字排出全部内容。参考文献要列出书名,作者姓名、出版社及出版日期、并标明序号。在论文中引用所列的参考文献时,只要在方括号内注明所列文献的序号即可。
(5)毕业论文(设计)正文部分3000~5000字。
附件3
河南信息统计职业学院
毕业论文(设计)
级 专业 班
题 目
姓 名 学号
指导教师 职称
系 别
20 年 月 日
声 明
本人郑重声明所呈交的论文(设计)是我个人在导师的指导下独立完成的。除了文别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果。
论文作者签名:
20 年 月
日
内 容 提 要
××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
关键词 :××××× ××××× ××××× ×××××
目 录 1 前言 1
1.1 1
1.2 1
1.3 4
1.4 4
2 5
2.1 5
2.2 5
2.2.1 5
2.2.2 6
2.3 7
3 8
3.1 9
3.2 10
4 11
4.1 12
4.1.1 13
4.1.2 14
4.1.3 15
4.1.4 18
4.1.5 20
5 结论 22
5.1 结论 23
5.2 问题与不足 26
5.3 未来展望 27
参考文献 28
1 ×××××××××××××××× 1.1 ×××××××××× ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
1.2 ×××××××××××××××× 1.2.1 ×××××××× ××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
参考文献 [1] 江正荣编.地基与基础施工手册.北京:中国建筑工业出版社,1997
[2] 高大钊主编.土力学与基础工程.北京:中国建筑工业出版社,1998
………………………………………………………………………………………………………………………………………………………………………………
[8] 赵玉良.房屋地基基础变形事故原因分析及处理.河北建筑工程学院学报,2007,25(2)
[9] 袁迎曙,贾福萍,蔡跃. 锈蚀钢筋混凝土梁的结构性能退化模型[J].土木工程学报,2001,(3)
[10] A. Castel, R. Francois, G.Arliguie. Mechanical Behavior of Reinforced Concrete Beams-Part 2: Bond andNotch Effects[J]. Materials and Structures. 2000, (3)
…………………………………………………………………………………………………………………………………………………………………………………………
[12] 中华人民共和国国家标准.建筑地基基础设计规范(GB50007-2002)
[13] 中华人民共和国国家标准.建筑边坡工程技术规范(GB50330-2002).
论文(设计)指导评语
建议论文成绩 指导教师
20 年 月 日
论文(设计)答辩评语
论文成绩 答辩组组长
20 年 月 日
答 辩 组 成 员
姓 名
性别
年龄
职称
工作单位
关键词:计算机网络专业;毕业综合实践;教学改革
1 高职信息化教学改革概述
随着云计算技术的深入应用,大数据产品已深入我国高职院校的信息化教学改革中。如开展精品在线课程、提升微课的教学质量、在线教学培训与学习,一定程度上提升了高职院校教学管理与教学设计能力。作为计算机网络技术专业,如何通过大数据时代背景为课程提升有益价值,在高职院校信息专业的就业质量、专业对口率方面起到优化和辅助作用,是当前浙江省各高校的毕业综合实践的教学改革重点之一[1]。
信息专业的毕业综合实践课程主要包括:校外实习阶段和校内毕业论文答辩阶段,其中校外实习阶段的教学工作主要包括学生实习基地走访调研、实习周记批复。这一课程的主要特点包括:开课周期长,课程规模较课堂教学大,教学管理系统工作负担重,课程考核复杂度高。同时,学生学习和实习压力较大。
大数据作为一种覆盖广、规模宏大、能够实现实时获取、存储、管理、分析等方面功能的数据集合,其主要意义在于专业化处理教学实践相关的数据[2]。以互联网+为背景,根据大数据相关结果,可以较快地获取多届毕业生的毕业实习情况、存储应届毕业生实习相关数据、管理应届毕业生的毕业论文(设计)和实习周记等、通过多届毕业生的毕业跟踪调查报告分析人才培养方案的可行性并加以丰富和调整。以嘉兴职业技术学院为例,从浙江省2012―2014年的高院校的毕业就业率相关数据结果看,就业率和专业对口率呈现递增趋势,但是专业对口率数据连续在40%以下;在就业率方面,截至2014年计算机网络技术专业出现了下滑趋势,图像处理专业和电子商务专业呈现略微上调趋势,软件技术专业呈现持平;在专业对口率方面,4个子专业表现不甚明显;在实践教学满意度方面,截至2014年实践教学满意度普遍呈现出先下降后上升的趋势,这主要源于在2014年信息专业通过改革毕业综合实践教学模式后的首轮效果。
2 毕业综合实践课程现状
2.1 高就业率低专业对口率
随着信息技术的在我国各高校的深入应用,各高职院校均开设了信息相关专业。信息专业毕业生的就业情况良好,但是专业对口的却很少。结果如表1所示。
从有关部门的调查结果可知,信息专业人才的需求量非常大,包括网络招聘、社会招聘、校园招聘,虽然信息专业毕业生的就业情况较其他传统行业有明显的优势,但是专业对口率增长仍然不明显[4]。通过为期3年的实习调研走访和多处室研讨,分析学生高就业率和低专业对口率的主要原因大致上源于:
(1)学生择业观的改变,当代高职毕业学生大多为独生子女,异地求学的学生大多数选择毕业后返城求职,一定程度冲击了专业对口率[5]。
(2)随着信息化在各行各业的参与度的提升,跨学科、多学科交叉职位也随之增加,跨学科职位让毕业生萌生“跳槽式”求职岗位[6]。
(3)学生热衷于短期利益,热门职业的高薪、好待遇、门槛低和对口专业的低薪、门槛高都是影响因素。如当前房产销售行业月薪较其他行业员工为2~5倍,这对于毕业生而言,更具吸引力。
2.2 校企合作基地偏少
由于学院属于市属高职院校,学生毕业综合实践实习基地以浙江省为主,其中校企合作基地大多为嘉兴市本级企业。当前信息专业的校企合作基地数量约为200家,但实际上在学生毕业综合实践课程中承担联合项目的数量不足一半。通过连续3年的走访和调研,从合作基地反馈的信息中主要有3种情况:
(1)实习生较独立求职者来说,工作态度仍然保留在校学习的被动状态;且学生实际技能操作经验和工作能力往往难以胜任当前项目需求。
(2)实习生在前期的顶岗实习中表现不佳,工作进度方面存在散漫状态,且学习热情不高。
(3)信息专业学生对于出差性强的工作有抵触情绪,本土企业大多数情况无法给予实习生期待的实习经费,外地企业(如上海、苏州等地)在校企合作范围之外,但往往这些沿海地区的信息技术产业发展较本土更适合学生就业与职业规划发展。
然而,在实习基地也存在实习生源不足或者生源过剩,学生在实习基地无事可做或者实习基地给予的学生实习比例远远低于学院指标等现象。
2.3 专业核心课程内容滞后
不难看出,不管在网络招聘还是校园招聘中,对于信息专业的人才需求总是供不应求。但是往往毕业生求职时,难以与对口专业签约,主要原因是企业需要的人才专业里无法满足,这一现象在当前各高职院校普遍存在。随着大数据时代的来临,信息化技术不断地革新,也需要信息专业核心课程的不断革新。学生在校学习期间,一方面不仅要学习专业课程也要完成各类创新性实践类的课外活动,一方面校内核心课程、专业课程学习的内容与职业需求存在一定的滞后性。文献[2]指出,部分高职院校针对此类问题,改革人才培养方案已系统地完成专业核心课程的教学,却导致了学生基础知识不牢,基础的技能操作太生疏,这在一定程度上会导致学生难以胜任专业对口的职位。
3 大数据背景下毕业综合实践课程改革的必要性
毕业综合实践课程作为衔接学生在校学习和社会就业的主要课程,在毕业生就业质量方面具有关键性作用[7]。为了科学而稳定地提升信息专业中各子专业的就业质量、专业对口率以及实践课程的满意度,教师上好毕业综合实践课程、学生利用好毕业综合实践课程是高职院校毕业综合实践的必要条件。
以往的岗前综合实训效果不明显情况,增加岗前综合实训的完整度、严谨性,提升岗前综合实训的有效性,做好学生毕业综合实践中毕业生的技能知识基础,以增强学生实习时的专业对口率,一定程度上提升就业质量,决定了信息专业的毕业综合实践课程的执行性。
4 毕业综合实践课程教学改革
针对当前信息专业学生高就业率低专业对口率的情况,信息专业的毕业综合实践课程教学改革从以下几个方面展开:从教师的教学模式出发,驱动教师队伍建设,推进毕业综合实践课程的改革和发展;从课程考核方式改革切入,缓解学生实习期间的压力和教师以及管理系统的工作负担,“以学生为主,从学生出发”。
4.1 教学模式改革
为了更好地开展毕业综合实践课程以缓解现状,提升信息专业毕业生的就业率和专业对口率以及保证实践教学的满意度,改革主要从以下几点展开:
(1)在教学期初,通过案例教学、MOOC、翻转课堂等教学方法展开毕业综合实践的前期指导教学,使学生在开始实习之前就对实习流程有一个深入的认识、对毕业流程有一个清晰的了解过程。
(2)专人专带:由传统的一个老师辅导教学几个学生分散式或者分组式完成实习过程,改革为特派一个专任教师深入实习基地走访和监督学生实习状况,并通过实习基地的走访和调研获取当前企业所需人才的标准和要求。通过总结和分析,给予专任教师一定启迪和启发,推动下一轮专业核心课程的改革和创新。
(3)学生集中半集中式实习:以校企合作基地为主要实习基地,便于集中式管理,确保学生实习安全和校企合作的顺利开展;对于有特殊情况或者特别要求的学生采取半集中式管理和实习方针,尊重学生的自主选择和就业态度。以上所有实习基地都要以学生能够在专业对口的岗位为主要依据。
(4)指导教师深入企业和实习基地,走访和调研学生实习现状。一方面更加清晰地了解企业对实习生的实习评价,一方面提升专业教师团队对社会用功的需求的了解程度,同时,教师也能切身了解学生在实习期间的实习状况和毕业论文的完成状态。
4.2 课程考核方式改革
(1)以一定考核标准为课程合格指标,强制性管理实习阶段学生的实习工作,防止学生频繁调换工作岗位、,一定程度上提升学院就业声誉、学生就业质量。
(2)对校企合作基地的要求和考核制定明确的考核指标,如:每年学院的订单班、联合培养班、校企短期合作和长期合作、高校联盟、职教集团等成员单位,每年的学生实习的比例标准是否能够满足,校企合作基地是否能够按照学院的标准完成人才培养和企业项目的实际交接。
(3)分层次教学,针对专业技能知识较差的一批学生展开合作企业的集中式教学、专业技能培训课程;针对专升本学生提供专业理论知识的教学辅导,待考试结束后,督促其继续完成毕业综合实践课程。
综合而言,不仅从16次周记中检查学生实习状况,更要从实际的走访调研中企业指导老师处、专任教师处了解学生实习的实际情况,通过学生毕业论文综合质量等评价学生实习效果。
4.3 重视科研工作和师资队伍建设
专业教师的职业技能培训和专业技能培训以及实验设备的更新,都是提升R悼纬探萄能力所具备的条件。专业核心课程的教学是毕业综合实践顺利展开的基石,学生学好了,才能在实习中有信心,继而展现专业技能,为校争光。
然而,教师队伍的建设决定了专业核心课程的进展效果。针对专业核心课程的滞后性,从师资培养和科研工作的视角展开。高职院校的信息专业教师要参与到信息专业的科学研究以及相关教学研究活动总,积极参与到信息技术的科学研究和深入探索,同时研究工作要能接轨计算机网络、软件技术和计算机应用等方面的发展步伐。在科研中提升知识学习能力和更新知识库和资源库,利用新的科研知识和技能改革教学方法和教学手段,让学生在学习过程中由浅入深,技能操作方面实时掌握社会职位的操作要点,为毕业实习工作打下扎实基础。
4.4 校企合作基地配置
根据社会用工需求,在师资力量充足的情况下,增加校企合作基地数量,为学生实习寻找更多的社会实践机会。深入开展“现代学徒制”和“厂中校”的合作模式,让学生在前期校外实训和顶岗实习期间,就有机会深入企业了解和学习技能操作知识,为踏上社会工作岗位做好准备,减少在对口专业上就业的压迫感和迷茫感,一定程度上提升专业对口率。
毕业论文的写作,效果质量如何,与数据的支撑有重要作用。特别是针对医学、计算机、生科、化学等偏向于实验调查性的专业,数据的搜集更是作者需要攻克的主要任务。本文,以资讯、数据两大类与大家分享互联网常用的数据资料搜集网站,具体如下:
资讯类
新浪科技 tech.sina.com.cn/
腾讯科技 tech.qq.com/
艾瑞网 iresearch.cn/
艺恩网 entgroup.cn/
虎嗅网 whuxiu.com/
36kr 36kr.com/
钛媒体 tmtpost.com/
游戏大观 gamelook.com.cn/
亿欧网 iyiou.com/
媒介360 chinamedia360.com/main
数据类
中国票房 cbooo.cn/
中国互联网络信息中心 cnnic.net.cn/
艾瑞网 iresearch.com.cn/report/viewlist.aspx
易观智库 analysys.cn/
游戏产业网 cgigc.com.cn/list/79644663134.html
百度指数 index.baidu.com/
大数据导航 hao.199it.com/
CSM(电视收视率) csm.com.cn/