首页 > 精品范文 > 数据分析师统计学基础
时间:2023-09-18 17:07:49
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇数据分析师统计学基础范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
互联网行业在快速发展,“互联网+”概念的提出标志着互联网已叩响“万物互联时代”的大门。在这个时代,大数据渗透于各行各业,掌握数据核心价值成为企业脱颖而出并取得胜利的法宝。越来越多的企业承认竞争优势与大数据有关,由此,数据分析师这一职业逐渐得到认可并受到追捧。世界500强企业中,有90%以上都建立了数据分析部门。在国内,已有超过56%的企业在筹备和发展大数据研究,据有关部门预测未来5年,94%的公司都将需要数据分析专业人才。数据分析师的职位需求随之不断增长,全国数据分析师的职位由2014年初的200多个职位增长到接近3000个职位。正如著名出版公司O’Reilly的创始人Tim O’Reilly断言,大数据就是下一个Intel Inside,未来属于那些能把数据转换为产品的公司和人群。
优秀的数据分析师已经成为促进各行各业发展,推动国家经济进步的重要人物。但我国针对数据分析的研究起步晚,市场巨大,职位空缺现象十分严重。因此,培养数据分析人才的项目活动应引起高度重视。
1互联网环境下的数据分析师
1.1数据分析师的定义
谈起数据分析师,很多人都认为其职位高高在上,不可企及,但实际并非如此。让我们从案例出发来探索其内在含义,数据分析最经典的案例便是“啤酒与尿布”,沃尔玛超市将Aprior算法引入Pos机数据分析发现美国年轻的父亲去超市为婴儿购买尿布的同时,往往会顺便为自己购买啤酒,这样便使尿布和啤酒这两样看似不相干的商品有了某种联系。于是,沃尔玛尝试将两种商品摆放在同一区域,进而取得了意想不到的良好销售收入。可见,数据分析是运用适当的方法对收集来的大量数据进行分析整理,筛选有价值的信息并形成相应的解决方案以帮助人们作出判断,采取适当行动的过程。
1.2数据分析师的层级分类
经对多家招聘网站数据分析师的招聘信息进行分析研究,发现目前数据分析师大体分为三个层级:传统行业的数据分析师、互联网初级数据分析师、互联网高级数据分析师。传统行业的数据分析师的主要工作是整理、处理数据,专业技能只要具备一定的数学和统计学知识储备即可;第二层级是互联网初级数据分析师,职位要求在传统数据分析师的基础上掌握少数的计算机工具譬如SPSS、SQL等,从职人员需具备一定的数据敏感度和逻辑思维能力,能够对数据源进行分析并能制作数据报表;互联网高级数据分析师是一类复合型人才,要熟悉业务环境并能与技术相结合解决企业实际问题,并掌握数据挖掘常用算法和一系列相关的分析软件,他们的工作与企业发展密切相连,拥有一名优秀的数据分析师的企业将拥有与同行业竞争的资本。
1.3数据分析师的能力需求
数据分析师的工作分为采集、存储、筛选、数据挖掘、建模分析、优化、展现、应用等一系列过程。接下来从主要步骤详细分析数据分析师的能力需求。数据挖掘过程即从海量数据中提取潜在的有价值的信息,要求数据分析师掌握一系列相关分析方法譬如聚类分析、关联分析、等并能熟练运用数据挖掘算法和相关工具;建模分析即对数据抽象组织,确定数据及相关性的过程,在此基础上要掌握譬如决策树、神经网络、K-means算法、SVM等至少一种相关算法;展现过程要求具备数据整理、数据可视化、报表制作能力,熟练应用D3、Vega实现数据可视化,并能运用R和DateWangler工具将原始数据转化为实用的格式。
2数据分析师的培养现状
2.1国外数据分析师的培养现状
在国外,无论是学术研究还是企业部门,数据分析已发展到较为成熟的地步。斯坦福大学的研究成员着手开发MEGA(现代动态网络图像分析Modern Graph Analysis for Dynamic Networks)并与多家媒体公司紧密合作,研究社交媒体中的用户行为,建立模型并探究其中的规律;哥伦比亚大学已开设了《数据科学导论》和《应用数据科学》课程,从2013年秋季起开设“数据科学专业成就认证”培训项目,并于2014年设立专业硕士学位和博士学位;华盛顿大学开设《数据科学导论》课程,并对修满数据科学相关课程学分的学生颁发数据科学证书。数据分析师在国外已引起了充分的重视,他们均衡分布在各行各业,运用掌握的专业知识并结合相关思维为自身、企业乃至社会的发展做着不小的贡献。
2.2国内数据分析师的培养现状
近年来,在国内,大数据的概念虽被媒体和行业广泛提及,但数据分析算是刚刚起步,数据分析师的培养课程未得到普及,我国目前将数据分析纳入教学体系的高校寥寥无几,开设相关课程并取得一定成果的有:香港中文大学设立“数据科学商业统计科学”硕士学位;复旦大学开设数据科学讨论班,于2010年开始招收数据科学博士研究生;北京航空航天大学设立大数据工程硕士学位;中国人民大学统计学院开设数据分析方向应用统计硕士。
和国外相比,我国数据分析师的人才培养机制还未成熟,高校教育仍存在各种各样的问题,譬如,大学生虽然从多门课程中接触到与数据分析相关内容,但各门课程的教学资源未能实现有效的整合。互联网环境下,大数据带来的是一场革命性的变化,若想把握机遇,实现国家经济革命性发展,首要任务就是数据分析师的培养。
3如何成为优秀的数据分析师
数据分析师作为新时代新兴起的高薪职业,对人员的能力要求是相当高的,下面将根据数据分析师的定义、能力需求并结合互联网环境的时代背景,对数据分析师的成才途径作出详细的分析。
思维变革,数据分析师成才的前提。首先要在思维方面有所改变,培养自身数据思维、多模式思维、逻辑思维和结构化思维。数据思维即量化思维,对数据具有独特的敏感度,相信一切事物皆可量化;多模式思维即构造多种想法和解决思路,拓宽思维,从多角度出发,以寻求最优的解决问题的方案;逻辑思维,在错综复杂的海量数据中要有缜密的思维和清晰的逻辑推理能力才能按照自己既定的目标有效解决问题;结构化思维即系统性思考问题,深入分析内在原因,能够制定系统可行的解决方案。
技能变革,数据分析师成才的工具。作为一名优秀的数据分析师若想在互联网环境下对海量数据进行有效的管理,就要努力学习相关的专业技能。要掌握多种机器学习方法,不断学习相关软件应用,譬如,Java、Python、SQL、Hadoop、R等等,这将成为数据分析全过程的辅助工具;除此,还要掌握一定的心理学知识,能够很好的分析和解释客户行为;在此基础上,最核心的是要掌握一定的业务能力和管理能力。
素质变革,数据分析师成才的保证。在个人素质方面,互联网时代对数据分析师的要求增多,若想成为优秀的数据分析师就应不断学习完善以下素质能力:对工作的态度严谨认真,对数据的变化时刻保持敏锐的洞察力,对方法的运用保持一定的创新性,对团队保持团结合作之心,能与顾客沟通交流并及时了解他们的需求。
实践,数据分析师成才的推动力。数据分析师的职责是帮助企业挖掘市场价值、发现机遇、准确进行市场定位并从海量数据中找出问题,提出解决方案。因此,在数据分析师的成才道路上,实践是必不可少的。相关人员要在掌握理论的基础上,敢于应用于实践,充分考虑数据中存在的价值和风险。使自我能力在实践中不断改进和完善。
4给我国高校的建议
高校为数据分析师的成长提供指导和途径,肩负着为我国社会培养有用人才的重任,因此高校要努力构建数据分析师的人才培养机制,不断输出数据分析相关人才。
高校的首要任务是,强化师资力量,改进教学方法。各大高校应联合共建优秀师资团队,鼓励教师考取数据分析师资格证,并到实际企业中进行历练。再者,我们要组建专门师资团队到国外开展学习工作,取其精髓,去其槽粕,不断优化我国数据分析师的培养体系。
第二、培养专业化的人才就要有效整合各门课程的教学资源,构建系统性教学结构。鉴于市场对数据分析师的需求的火热程度,高校完全可以开设专门课程,将与数据相关的课程进行有机的整合并开设数据分析导论、基础等课程,制定数据分析系统性课程体系,专门为市场培养数据分析的专业人才。
第三、在具备优秀的师资力量和良好的教学体系的基础上,高校也高度应注重学生兴趣的培养。数据分析师是新时代的复合型人才,一名优秀的数据分析师需掌握包括数学、统计学、运筹学、社会学、管理学以及大量软件应用在内的大量相关知识,学习过程会十分繁琐、复杂,学习周期长,学习难度大,所以建议各大高校在制定教学体系时应合理安排课程,在教学过程中应注重课程的趣味性,寓教于乐,采用案例导入、项目教学等教学方法,逐渐培养学生对数据分析浓厚的兴趣。
第四、随时更新教学数据,培养适应时展的人才。基于大数据的4V特征即大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值化(Value),在培养数据分析人才的期间,高校一方面要注重数据的全面性,另一方面要注重数据的更新,及时更改教学方法和教学案例,与时俱进。高校要充分利用互联网的优势,引入MOOC(Massive Open Online Course,大规模网络开放课程)教学方式,充分发挥大数据在教育领域的作用,克服传统教学方法资源少、反馈慢、综合分析困难等缺点,将数据分析的研究成果应用于数据分析人才的培养,实现数据分析行业的良性循环。
第五、注重理论与实践相结合,努力为学生搭建实践的平台。高校可考虑校企合作的教学理念,边教学边实践,让学生将所学到的理论知识转化为实际应用,一方面在实践中巩固并检验自己的理论知识,另一方面数据来源真正的企业运营中,让学生切实体验数据的作用和风险,有助于塑造真正对企业有用的人才。
5结语
综上所述,互联网带来了全球范围的数据信息大爆炸,这对企业来说是机遇同时也是挑战,能将大数据为自己所用,是企业取胜的关键,因此数据分析师逐渐被各行各业认可。文章从数据分析师的定义出发,结合目前的时代背景,对数据分析师的每一工作步骤所需的能力进行研究,旨在初步探索优秀数据分析师的成才之道,为即将成为数据分析师的学者提供一定的理论参考。最后,针对如何构建数据分析人才培养体系,对我国高校提出了几点建议。高校的培养只是为数据分析师提供成才的途径,如何成为资深的数据分析师还有赖于每个学者的不断探索和研究。
参考文献:
[1]张明元.数据分析师的职业是否高不可及[J].出国与就业,2007(08):56.
[2]郑葵,马涛.经管类专业大学生数据分析能力提升策略探讨[J].商业经济,2013(19):52-53.
[3]冯海超.大数据时代正式到来[J].互联网周刊,2012(24):36-38.
[4]谭立云,李强丽,李慧.大数据时代数据分析人才培养的思考及对策[J].科技论坛,2015.
[5]尹颖尧,李鸿琳.赶紧培养数据分析师[J].大学生,2013(18):78-79.
[6]程征.提升数字阅读质感的数据分析师[J].中国记者,2013(6):46-47.
[7]张文霖.数据分析师那些事[J].统计论坛,2013(7):44-45.
关键词:大数据 市场调查与预测 教学改革 专业特色
中图分类号:F274
文献标识码:A
文章编号:1004-4914(2017)02-237-02
一、引言
信息技术和社会化媒体的飞速发展引发了数据的大爆炸,而庞大的数据集为企业进行市场调查与预测提出了新的挑战。为了适应新的企业需求,高校《市场调查与预测》课程的人才培养方案和培养模式必须做出相应的调整,引入新的教学方法和人才培养理念,使用更加先进的调查预测工具,为企业培养出具备数据分析能力的优秀人才。
二、课程改革的必要性
(一)大数据时代的要求
随着大数据时代的到来,企业越来越重视基于大数据的更多样本,更多实时数据的分析。对于市场专业本科阶段的学生来讲,虽然不能达到数据分析的专家,但是必须顺应时代及企业人才需求的变化,提升数据分析的能力,《市场调查与预测》课程的教学改革迫在眉睫。
(二)传统教学方法与教学模式存在很多弊端
《市场调查与预测》课程最显著的特点就是实践性强,但是传统的教学方法与教学模式很难达到锻炼学生实践能力的目的。主要体现在以下三个方面:第一,传统的注入式教学方法主要强调的是理论知识的传授,学生缺乏参与感,很难调动学生的自主性和积极性,培养学生的创新性;第二,传统课程安排实践课时偏少,通过查阅各类院校本课程的教学计划,多数高校实践课时占总课程课时的比例不足30%,教师很难对整个实践过程进行监管和指导。第三,传统的教学模式忽略了对实践能力的考核,基于实践课时偏少,实践成绩所占总成绩的比重很低且缺乏完整科学的成绩评定体系,容易造成学生“搭便车”的现象;第四,《市场调研与预测》课程与《统计学》存在较强的相关关系,在授课过程中如果缺乏课程衔接与配合意识,很容易造成内容的重叠。同时,如果学生的统计学知识不扎实,对数据的分析仅仅停留在问卷调查数据的初步统计,很难提高学生的数据分析能力。
三、课程改革的基本思路
《市场调查与预测》课程的教学改革应顺应大数据时展的要求,通过以学生为主体,教师为主导的教学方法,着重培养学生的实践能力、创新能力和数据分析能力。教学内容上增加数据分析的内容,主要引入SPSS统计软件的实验课程,提升学生的数据分析能力;教学形式上采用课题式教学,通过课题式教学与分组合作学习的互动式教学模式提高学生的实践能力;课程考核上,通过制定公平合理的考核制度提高学生参与实践锻炼的积极性,并在提高自身综合素质的基础上提高对教师教学的满意度。
(一)教学内容的调整
依据市场调查与预测统计分析的需要,学生要先修《统计学》课程,通过和《统计学》教师的沟通与配合,《市场调查与预测》课程教学内容减少与《统计学》重复的理论部分,增加数据分析内容,尤其是SPSS操作模块。与此同时,增加实践课时。该课程的总课时为48学时,其中课堂理论授课占用24学时,SPSS操作占用12学时,实践课时12学时。课程理论讲授模块的内容包括:市场调研方案设计、数据搜集方法、市场调研误差、数据整理与分析、市场调研报告的撰写、市场预测的基本方法。SPSS操作模块包括:问卷设计与数据收集、问卷数据的录入与清理、单变量的一维频率分析、双变量的交叉表分析、多选变量的一维频率分析和交叉表分析、描述统计分析、简单统计推断、单因素方差分析、线性相关分析与线性回归分析。@两个模块不是孤立的,而是通过课题式教学完成,学生通过选定的课题展开,围绕选题在实践课时完成完整的市场调研过程,应用SPSS完成数据的分析过程,最后以课题小组的形式进行汇报。
(二)教学的组织形式
教学组织形式上主要采用课题式教学与分组合作学习的形式,鼓励学生按照兴趣以4~6人为一组进行组队,通过发现生活中与市场调查相关的实际问题,参与教师的课题项目,参与大学生市场分析大赛或者结合大学生创新项目等形式确定调研主题,明确调查目的、调查对象和调查范围,设计调查方案。无论对于教师还是学生,新的科研项目的立项都会面对很多的新问题。在教学过程中,全体师生围绕共同感兴趣的科研课题展开教学与科研活动,形成一个学习型的教与学的团队。提高学生自主学习与实践的意识。师生在教学与科研活动中会有新的发现,达到教学相长的目的。
(三)课程成绩评定方案的优化
由于《市场调查与预测》的课程加强了实践环节,所以在最终课程的成绩评定中,学生实践环节的占比要相应的提高。我校传统课程考核中,综合成绩=平时成绩+期末成绩。平时成绩和期末成绩分别占30%和70%。现计划调整为:综合成绩=实践成绩+期末成绩。其中实践成绩和期末成绩各占50%。由于实践环节都是分小组进行,调研报告和最终的汇报只能区分不同小组的最终表现,很难区分小组成员的实践表现。为了防止小组成员在团队作业中出现搭便车的现象,所以学生个人实践成绩=小组实践成绩70%+个人平时成绩30%。小组实践成绩的评定在汇报过程中采取小组互评和老师评定相结合的方式,其中小组互评占30%,由其他小组评定的平均分计算得来,老师评定占70%,按照课题选题的难易程度及完成的工作量大小来确定。个人平时成绩=组长评分30%+老师评分70%,组长评分根据组员的参与度及完成情况决定,老师评分根据小组分工的完成情况决定。这种成绩评定结构尽可能的做到客观公正,让学生切身体会到自觉参与实践锻炼的重要性,促进学生积极投入到实践锻炼中,并在提高自身综合素质的基础上提高学生对教师教学的满意度。
四、课程改革与专业特色
由于课程采用课题式教学与分组合作学习的形式,不仅锻炼了学生的实践能力和创新能力,而且对学生团队沟通与合作能力也是一种提升。通过这种教学模式的实践也可以为市场营销专业特色的建立指明方向。
(一)以就业为导向
市场营销专业的学生将来很可能从事市场调研工作,因此如果能在学习的基础上考取相关证书可以很大程度提高就业率,比如可以鼓励学生考取中级调查分析师证书。中级调查分析师证书考核的内容主要包括五个模块:消费者行为学、调查概论、市场调查实务、抽样技术和调查数据分析。学生可以侧重以“消费者行为”为课题开展市场调查,不仅使学生掌握了市场调查的基本理论知识,而且也掌握了市场调查的实务,提高了数据分析的能力,实现了大数据时代企业对新的人才需求的无缝衔接。
(二)以专业竞赛为导向
该课程的实践环节也可以以专业大赛为依托,比如学生的选题可以先以校级大学生创新项目为基础组织教学实践,既完成了教学任务,又可以为参加更高层次的专业大赛奠定一定的基础。在现有课题的基础上选拔比较好的项目衔接省级大学生创新项目、全国及海峡两岸大学生市场调查分析大赛等。这种模式既可以加强与全国高校的交流,也可以紧追市场调研实践教学模式的前沿,拓宽任课教师的思路,促进教学质量的提升,提高教学满意度。
总之,《市场调查与预测》课程的改革不仅顺应了大数据时代的发展,同时也能体现出以市场调研为依托的专业特色。但是我校《市场调查与预测》课程的改革并非一蹴而就,也是一个循序渐进的过程。课程的改革不仅和现有师资水平有关,而且与学校的各种软硬件配置以及实验室建设也存在很大的关系。目前我校在《市场调查与预测》教学方面的软硬件还存在很大的欠缺。如何提高实验室的利用效率,加强实验室软硬件建设,实现SPSS操作课程与理论课程的无缝衔接也是需要我们通过调研来逐步改善的。同时,课程的建O需要长期的投入和努力,我们在提高学生的市场调研实践能力,增强学生将来融入社会的适应能力的过程中还要不断摸索和提升,紧跟时展的步伐。
参考文献:
[1] 段晓梅.基于SPSS软件的《市场调查与预测》实验课程教学研究[J].教育教学论坛,2014(9)58~60
[2] 李红梅.市场调研课程实践性教学模式研究[J].教育教学论坛,2015(12)107~109
[3] 陈成栋,刘晓云.“市场调查与预测“课程教学改革实证研究[J].中国市场,2012(35)26~28
[4] 赵磊,朱娜.“大数据”时代农业高职院校财经类专业市场调查与预测人才培养方法探讨与研究[J].经济研究导刊,2014(27)187~188
关键词:财务分析;大数据;教学改革
作者简介:王晖(1973-),女,黑龙江鸡西人,北京信息科技大学经济管理学院,讲师;段文军(1969-),女,山东蓬莱人,北京信息科技大学经济管理学院,副教授。(北京 100192)
基金项目:本文系北京信息科技大学教学提高-专业建设项目(项目编号:5028023501)的研究成果。
中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)25-0111-02
当今时代不断涌现各种新型信息方式,例如博客、社交网络等;不断兴起各种新技术,例如云计算、物联网等。数据的产生不受任何的限制,数据以前所未有的速度不断增长和累积,大数据时代已经来到。[1]《华尔街日报》认为大数据时代是引领未来繁荣的三大技术变革之一。麦肯锡公司在一份报告中提出数据是一种生产资料。企业每天面对海量的财务数据,如超市的销售记录、银行的交易记录、淘宝网站数千万笔交易记录(产生量超过50TB,存储量40PB①)。企业如能利用这些巨大的数据集挖掘出有价值的信息,那么企业就能掌控下一个创新、竞争和生产力提高的关键。大数据时代,尤其是财务大数据时代,呼唤创新型人才。[2]呼唤具备综合财务分析能力的人才,利用财务大数据为企业创造财富。
如何培养财务分析人才?在财经类高校本科,一般都开设“财务分析”课程,该课程教学目的是培养学生对真实企业进行综合财务分析,并能独立撰写财务分析报告的能力。[3]本文以北京信息科技大学(以下简称“我校”)为例,探讨大数据时代下财务分析人才的需求特点,对高校“财务分析”课程设置的影响,并提出改进“财务分析”课程教学的建议。
一、大数据时代下财务分析人才需求特点
相较于其他类型数据,财务数据更大、更复杂,蕴藏着更多宝贵信息。麦肯锡公司2011年报告推测,利用大数据分析,零售商可增加运营利润60%,制造业设备装配成本会减少50%。[2]在财务大数据环境下,如何整理与统计这些杂乱无章的数据?如何让财务数据开口说话为企业管理者经营决策提供科学依据?朱东华(2013)认为,大数据时代下,传统的数据分析方法已经不再适应当前的数据环境,同时,各种企业对数据的依赖与日俱增,甚至定量分析方法将逐步取代定性分析方法。[4]财务大数据和大量的财务数据分析需求助长了企业对统计和数学背景的人才需求。
可见,大数据时代下财务分析人才应该具备扎实的统计学和数学功底,能够熟练运用定量分析方法分析数据以获取信息,撰写分析报告为企业相关利益人决策提供依据。
二、“财务分析”课程教学现状
张先治(2007)认为,财务分析是财务分析主体为实现财务分析目标,以财务信息及其他相关信息为基础,运用财务分析技术,对分析对象的财务活动的可靠性和有效性进行分析,为经营决策、管理控制及监督管理提供依据的一门具有独立性、边缘性、综合性的经济应用学科。[5]财务分析课程是为我校经济管理学院财务管理专业本科三年级开设的一门专业必修课。学生前期已经学过数学、经济学、会计学、财务管理、统计学等课程。财务分析课程正是在学生掌握前期所学各门课程的基础上,培养学生综合运用所学专业知识,分析判断企业的财务状况,并根据数据分析结果找出企业存在的问题,提出解决方案。[6]为了更好地实现“财务分析”课程教学目的,课程组的老师们经过讨论,决定修改2008级财务管理专业教学计划,将原来课堂教学的方式改为1/2的学时用于课堂教授基本理论,1/2学时用于实践教学。笔者自2011年开始,按照新的教学计划给三届学生讲授了“财务分析”课程。
1.理论教学部分
教材选用东北财经大学出版社出版,张先治和陈友邦主编的《财务分析》(第五版)。该教材体系完整,内容丰富,全书以一家虚拟的ZTE公司为例,演示财务报告分析、财务效率分析和财务综合分析。每章设有案例和复习思考题,该书还有配套的习题集。在课堂教学中,以教材为主线,突出介绍各种财务分析方法的使用,以及根据分析结果得出结论,提出解决方案。
2.实践教学部分
一人一企,边学边分析。每位学生选择一家上市公司作为分析对象,利用学校购买的金融数据库以及相应网络资源,结合所学财务分析理论知识进行上机实验,在Excel内完成数据分析,并将分析结果形成财务分析报告。学生分析判断和决策能力在实战中得以锻炼,教学效果得到改善。
但是,随着大数据时代的来临,外部环境对数据分析能力要求的提升,仅仅学会利用Excel进行水平分析、垂直分析、趋势分析、比率分析和因素分析,已经远远不能满足市场对财务分析人才的需求,学生就业的竞争力无从谈起。结合前面大数据时代下财务分析人才需求特点,我校学生财务分析能力的培养存在着以下问题:
1.学生数据收集、整理和分析能力弱
定量分析方法应用的基础是数据,财务分析人员必须学会从海量的网络资源中搜集并筛选与自己的分析对象和分析目的相关性较强的资料信息,[7]这些资料信息可能是结构化数据,例如金融数据库等;也可能是非结构化数据,例如网页等。从实践教学环节反映出学生数据收集和整理能力弱,分析其原因主要是:
(1)学生不熟悉对财务分析有帮助的网络资源。搜集有价值的数据需要一定的技巧,其中最为重要的是熟悉一些重要的网站,知道相应的数据应该在哪里找到的概率比较大,做到有的放矢。
(2)学生无法将非结构数据快速地转换成所需的数据形式。类似金融数据库这样的结构数据,学生基本能够筛选出所需信息。但是,对于类似网页这样的非结构数据,他们就只能运用最原始的复制粘贴的方法提炼数据信息,耗时且耗力。2013年2月1日,人保财险执行副总裁王和在中国第七届“保险业管理信息化高峰论坛”上指出,在过去的两三年里,结构和非结构数据发生了本质性的逆转。过去就整个社会来讲,绝大多数的数据是结构数据,而现在非结构数据正呈快速增长的趋势,现在以及未来,非结构数据将占到95%,甚至更多。
“财务分析”课程讲授的基本方法主要是比率分析和因素分析法等。目前,无论是学术界还是业界,研究人员大量使用统计模型进行财务数据分析,例如聚类分析、多元回归、因子分析、时间序列预测法等。因而,我校学生数据分析能力急需加强,尤其是统计学和数学的基础要扎实。
2.学生财务分析报告撰写水平有待提高
财务分析的结果是以财务分析报告的形式展示给企业利益相关人,为其进行财务预测、财务决策、财务控制和财务评价等提供可靠信息。财务分析报告是对企业经营状况、资金运作的综合概括和高度反映。李宝智(2012)认为,报告应具备八要素:准确、完整、可比、用户导向、相关、问题的解决方案、及时和易用。[8]从我校学生提交的财务分析报告看,与上述要求还有很大差距。
三、“财务分析”课程教学改革建议
1.培训网络资源使用
重点介绍几个数据库的使用:
(1)金融数据库。我校购买了两款金融数据库,北京聚源锐思数据科技有限公司金融数据库(http://)和深圳市国泰安信息技术有限公司CSMAR财经系列研究数据库(http://)。登陆金融数据库后,输入查询条件即可下载上市公司财务数据,速度快且数据量大,数据格式可以任意选择。
(2)中国资讯行(国际)有限公司高校财经数据库(http://),INFOBANK于1995年在香港成立,是一家专门收集、处理及传播中国商业、经济信息的香港高科技企业,信息范围涵盖19个领域、197个行业。
(3)国务院发展研究中心信息网(国研网)(http://.cn)。国研网已建成了内容丰富、检索便捷、功能齐全的大型经济信息数据库集群,包括:六十几个文献类数据库、四十多个统计类数据库等。
网站资源:中国证券监督管理委员会(http://)、上海证券交易所(http://.cn)、深圳证券交易所网站(http://)、巨潮资讯网(http://.cn)和相关协会网站等。
2.培养数据预处理和建模能力
收集到数据之后,需要对数据进行预处理,利用统计学的理论和方法将数据转换成一个分析模型。[9]学生在统计学、计量经济学课程中,已经完成基本模型理论、SPSS或者Eviews三分析软件的学习。但是,若想实现对大数据的整理和分析,应该掌握R或者Matlab统计分析软件,同时,还要掌握一种编程语言,例如C++、JAVA、C#等。利用编程语言调用统计分析软件,从而实现大数据的分析。另外,建议学生了解Perl语言编程,该语言擅长处理非结构数据。
3.培养文献阅读及财务分析报告撰写能力
数据分析之后,需要撰写财务分析报告,为各方利益相关者的决策提供依据。不同财务分析的目的,形成的财务分析报告具体要求会有所差异,但是撰写财务分析报告的基本步骤相同。首先查阅文献,阅读相关学术文章、财务分析师分析报告、评级机构报告等;其次,模仿写作,组织财务分析结果,形成报告。此中没有捷径,需多看、多写。
注释:
①1TB 等于1000GB,1PB 等于1000TB。
参考文献:
[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1).
[2]邬贺铨.大数据时代的机遇与挑战[J].求是,2013,(4).
[3]张肖飞.财经类高校《财务分析》课程案例教学改革研究[J].商业会计,2013,(1).
[4]朱东华,张嶷,汪雪锋,等.大数据环境下技术创新管理方法研究[J].科学学与科学技术管理,2013,(4).
[5]张先治.财务分析理论发展与定位研究[J].财经问题研究,
2007,(4).
[6]陈卫军,徐文学,陈平.基于上市公司网上资源的《财务分析》实训教学探讨[J].财会通讯,2012,(2).
[7]王桢.网络环境下财务分析案例教学方法的改进[J].中国教育信息化,2012,(1).
电信运营商拥有多年的数据积累,拥有诸如财务收入、业务发展量等结构化数据,也会涉及到图片、文本、音频、视频等非结构化数据。从数据来源看,电信运营商的数据来自于涉及移动语音、固定电话、固网接入和无线上网等所有业务,也会涉及公众客户、政企客户和家庭客户,同时也会收集到实体渠道、电子渠道、直销渠道等所有类型渠道的接触信息。整体来看,电信运营商大数据发展仍处在探索阶段。
大数据在电信行业应用的总体情况
目前国内运营商运用大数据主要有五方面:(1)网络管理和优化,包括基础设施建设优化和网络运营管理和优化;(2)市场与精准营销,包括客户画像、关系链研究、精准营销、实时营销和个性化推荐;(3)客户关系管理,包括客服中心优化和客户生命周期管理;(4)企业运营管理,包括业务运营监控和经营分析;(5)数据商业化指数据对外商业化,单独盈利。
第一方面:网络管理和优化。此方向包括对基础设施建设的优化和网络运营管理及优化。
(1)基础设施建设的优化。如利用大数据实现基站和热点的选址以及资源的分配。运营商可以通过分析话单和信令中用户的流量在时间周期和位置特征方面的分布,对2G、3G的高流量区域设计4G基站和WLAN热点;同时,运营商还可以对建立评估模型对已有基站的效率和成本进行评估,发现基站建设的资源浪费问题,如某些地区为了完成基站建设指标将基站建设在人际罕至的地方等。
(2)网络运营管理及优化。在网络运营层面,运营商可以通过大数据分析网络的流量、流向变化趋势,及时调整资源配置,同时还可以分析网络日志,进行全网络优化,不断提升网络质量和网络利用率。
利用大数据技术实时采集处理网络信令数据,监控网络状况,识别价值小区和业务热点小区,更精准的指导网络优化,实现网络、应用和用户的智能指配。由于用户群的不同,不同小区对运营商的贡献也不同。运营商可以将小区的数据进行多维度数据综合分析,通过对小区VIP用户分布,收入分布,及相关的分布模型得到不同小区的价值,再和网络质量分析结合起来,两者叠加一起,就有可能发现某个小区价值高,但是网络覆盖需要进一步提升,进而先设定网络优化的优先级,提高投资效率。
德国电信建立预测城市里面的各区域无线资源占用模型,根据预测结果,灵活的提前配置无线资源,如在白天给CBD地区多分配无线资源,在晚上,则给酒吧地区多分配无线资源,使得无线网络的运行效率和利用率更高。
法国电信通过分析发现某段网络上的掉话率持续过高,借助大数据手段诊断出通话中断产生的原因是网络负荷过重造成,并根据分析结果优化网络布局,为客户提供了更好的体验,获得了更多的客户以及业务增长;
第二方面,市场与精准营销。此方向包括客户画像、关系链研究、精准营销、实时营销和个性化推荐。
(1)客户画像。运营商可以基于客户终端信息、位置信息、通话行为、手机上网行为轨迹等丰富的数据,为每个客户打上人口统计学特征、消费行为、上网行为和兴趣爱好标签,并借助数据挖掘技术(如分类、聚类、RFM等)进行客户分群,完善客户的360度画像,帮助运营商深入了解客户行为偏好和需求特征。
(2)关系链研究。运营商可以通过分析客户通讯录、通话行为、网络社交行以及客户资料等数据,开展交往圈分析。尤其是利用各种联系记录形成社交网络来丰富对用户的洞察,并进一步利用图挖掘的方法来发现各种圈子,发现圈子中的关键人员,以及识别家庭和政企客户;或者分析社交圈子寻找营销机会。如在一个行为同质化圈子里面,如果这个圈子大多数为高流量用户,并在这个圈子中发现异网的用户,我们可以推测该用户也是高流量的情况,便可以通过营销的活动把异网高流量的用户引导到自己的网络上,对其推广4G套餐,提升营销转化率。总之,我们可以利用社交圈子提高营销效率,改进服务,低成本扩大产品的影响力。
(3)精准营销和实时营销。运营商在客户画像的基础上对客户特征的深入理解,建立客户与业务、资费套餐、终端类型、在用网络的精准匹配,并在在推送渠道、推送时机、推送方式上满足客户的需求,实现精准营销。如我们可以利用大数据分析用户的终端偏好和消费能力,预测用户的换机时间尤其是合约机到期时间,并捕捉用户最近的特征事件,从而预测用户购买终端的真正需求,通过短信、呼叫中心、营业厅等多种渠道推送相关的营销信息到用户手中。
(4)个性化推荐。利用客户画像信息、客户终端信息、客户行为习惯偏好等,运营商可以为客户提供定制化的服务,优化产品、流量套餐和定价机制,实现个性化营销和服务,提升客户体验与感知;或者在应用商城实现个性化推荐,在电商平台实现个性化推荐,在社交网络推荐感兴趣的好友。
第三方面,客户关系管理。此方面包括客服中心优化和客户生命周期管理。
(1)客服中心优化。客服中心是运营商和客户接触较为频繁的通道,因此客服中心拥有大量的客户呼叫行为和需求数据。我们可以利用大数据技术可以深入分析客服热线呼入客户的行为特征、选择路径、等候时长,并关联客户历史接触信息、客户套餐消费情况、客户人口统计学特征、客户机型等数据,建立客服热线智能路径模型,预测下次客户呼入的需求、投诉风险以及相应的路径和节点,这样便可缩短客服呼入处理时间,识别投诉风险,有助于提升客服满意度;另外,也可以通过语义分析,对客服热线的问题进行分类,识别热点问题和客户情绪,对于发生量较大且严重的问题,要及时预警相关部门进行优化。
(2)客户关怀与客户生命周期管理。客户生命周期管理包括新客户获取、客户成长、客户成熟、客户衰退和客户离开等五个阶段的管理。在客户获取阶段,我们可以通过算法挖掘和发现高潜客户;在客户成长阶段,通过关联规则等算法进行交叉销售,提升客户人均消费额;在客户成熟期,可以通过大数据方法进行客户分群(RFM、聚类等)并进行精准推荐,同时对不同客户实时忠诚计划;在客户衰退期,需要进行流失预警,提前发现高流失风险客户,并作相应的客户关怀;在客户离开阶段,我们可以通过大数据挖掘高潜回流客户。国内外运营商在客户生命周期管理方面应用的案例都比较多。如SK电讯新成立一家公司SK Planet,专门处理与大数据相关的业务,通过分析用户的使用行为,在用户做出离开决定之前,推出符合用户兴趣的业务,防止用户流失;而T-Mobile通过集成数据综合分析客户流失的原因,在一个季度内将流失率减半。
第四方面,企业运营管理。可以分为业务运营监控和经营分析。
(1)业务运营监控分可以基于大数据分析从网络、业务、用户和业务量、业务质量、终端等多个维度为运营商监控管道和客户运营情况。构建灵活可定制的指标模块,构建QoE/KQI/KPI等指标体系,以及异动智能监控体系,从宏观到微观全方位快速准确地掌控运营及异动原因。
(2)经营分析和市场监测。我们可以通过数据分析对业务和市场经营状况进行总结和分析,主要分为经营日报、周报、月报、季报以及专题分析等。过去,这些报告都是分析师来撰写。在大数据时代,这些经营报告和专题分析报告均可以自动化生成网页或者APP形式,通过机器来完成。数据来源则是企业内部的业务和用户数据,以及通过大数据手段采集的外部社交网络数据、技术和市场数据。分析师转变为报告产品经理,制定报告框架、分析和统计维度,剩下的工作交给机器来完成。
第五方面,数据商业化。数据商业化指通过企业自身拥有的大数据资产进行对外商业化,获取收益。国内外运营商的数据商业化都处于探索阶段,但相对来说,国外运营商在这方面发展的更快一些。
(1)对外提供营销洞察和精准广告投放。
营销洞察:美国电信运营商Verizon成立了精准营销部门Precision Marketing Division。该部门提供精准营销洞察(Precision Market Insights),提供商业数据分析服务。如在美国,棒球和篮球比赛是商家最为看中的营销场合,此前在超级碗和NBA的比赛中,Verizon针对观众的来源地进行了精确数据分析,球队得以了解观众对赞助商的喜好等;美国电信运营商Sprint则利用大数据为行业客户提供消费者和市场洞察,包括人口特征、行为特征以及季节性分析等方面。
精准广告投放:Verizon的精准营销部门基于营销洞察还提供精准广告投放服务;AT&T提供Alert业务,当用户距离商家很近时,就有可能收到该商家提供的折扣很大的电子优惠券。
(2)基于大数据监测和决策支撑服务。
客流和选址:西班牙电信于2012年10月成立了动态洞察部门DynamicInsights开展大数据业务,为客户提供数据分析打包服务。该部门与市场研究机构GFK进行合作,在英国、巴西推出了首款产品名为智慧足迹(Smart Steps)。智慧足迹基于完全匿名和聚合的移动网络数据,帮助零售商分析顾客来源和各商铺、展位的人流情况以及消费者特征和消费能力,并将洞察结果面向政企客户提供客流分析和零售店选址服务。
为适应社会经济发展需要,本专业坚持以培养素质优良的复合型、创新型、应用型人才为中心,培养面向我国特别是河北省经济社会发展需要,德、智、体全面发展,具备扎实的经济学理论、西方经济学理论以及现代管理学理论,具有良好的数学素养,掌握统计学的基本理论和方法,能熟练地运用计算机进行数据管理与分析,能在企事业单位和经济管理部门从事统计调查、统计信息管理与分析等工作的应用型合格毕业生。其培养的学生具有人文素养,熟知和掌握统计学基础知识、基本理论、基本方法和技能,受到应用基础和技术开发方面的科学思维和科学实验训练,具有较强的开拓创新能力、沟通协调能力和预测决策能力;具有系统、扎实的科学文化知识和全面的身心健康素养,能够在工作中科学地采集各类信息数据,并能够运用现代技术手段建立统计模型,综合分析解决相关领域实际问题。
二、统计学专业学生素质拓展结构分析
为了实现学生实践能力培养的目标,使统计学专业毕业生掌握多种专业核心技能,按照、教育部、全国学联出台的《关于实施“大学生素质拓展计划”的意见》,在思想政治与道德素养、社会实践与志愿服务、科学技术与创新创业、文体艺术与身心发展、社团活动与社会工作、技能培训等六个方面引导和帮助广大学生完善智能结构。在课程设置上,把第一课堂的教育与第二课堂的活动有效结合,按照“平台+模块”的模式,构建以第一课堂教育课程为基础的“大学生素质拓展课程化建设体系”,实现大学生素质拓展模块化、项目化、课程化、体系化。
以第一课堂为基础,改善以提高学生综合素质与应用能力为目标的课程体系,划分多个模块,分项实施,全方面提升学生素质与能力。第一课堂的模块主要包括基本技能模块、专业技能模块、专业技能拓展与创新能力培养模块。将大学生第二课堂的各项活动分为思想道德素养、身心健康素养、科学文化素养、社会实践与志愿服务、社团活动与社会工作、技能培训与创新创业等六个功能模块,加强第二课堂教育中的实践环节,整合提升第二课堂中有助于提高大学生综合素质的各项活动和工作项目,有针对性的进行工作设置,全面发展学生的综合素质与应用能力的培养。
1、基本技能模块
基本技能模块主要包括思想道德教育、身心健康教育等内容,主要是通过思想政治课、大学生职业规划课、法律、体育和语言、计算机及数据库等课程展开,从人的基本素养方面着手培养学生的基本技能。语言模块具体包括外语、大学语文及应用文写作等内容。计算机及数据库操作模块具体包括计算机基本知识、基本操作与应用管理、数据库的建立与管理等内容。
2、专业技能模块
(1)专业基础技能模块
专业基础技能模块主要包括经济理论、管理理论、会计与财务理论以及统计基本理论等内容。经济理论部分主要包括政治经济学、微观经济学、宏观经济学以及相关的经济学分支等内容,其目标是让学生掌握基本经济理论及其分析方法,能够运用经济理论于实际问题的分析,并做出初步判断。管理理论部分主要包括管理学、现代企业管理、人力资源管理及市场营销学等内容,其目标是让学生熟知各种管理理论,掌握控制、组织、计划等管理环节的基本知识;掌握经典的管理研究方法、熟悉市场营销的基本理论以及人力资源、组织设计等相关知识。会计与财务理论部分主要包括会计基本理论、财务理论、税收筹划等内容,其目的是让学生熟悉会计和财务基本知识,了解纳税申报和税收筹划等相关知识。统计基本理论主要包括数理统计理论、描述统计、推断统计等内容,其目的是让学生理解数理统计的基本知识、掌握统计学基本原理,为专业核心技能的学习与掌握打下坚实基础。
(2)专业核心技能模块
专业核心技能模块主要包括统计分析方法、经济模型构建、经济分析与决策、统计学软件应用等内容。统计分析方法主要包括多元统计分析、时间序列分析、抽样技术、非参数统计等课程,其目的是让学生掌握基本的数据分析方法,为实际工作及进一步的深造创造有利的条件。经济模型主要包括数理经济学和计量经济分析等内容,其目的是让学生掌握计量经济分析的基本原理与实际应用,以及把经济模型与实际问题结合进行理论构建及各种检验的方法。经济分析与决策主要包括经济社会统计、国民经济统计、统计预测与决策等课程,其目的是培养学生对经济社会现象进行数据收集和统计分析的基本技能,并以此为基础对经济社会的运行进行必要的预测与决策,为经济管理提供必要的智力支持。统计学软件应用,这是一个对实践能力要求较高的层次,主要是通过对常用统计软件的掌握,为专业基础技能、统计分析方法、经济模型分析以及统计预测与决策等技能的实现创造便捷的条件,这一部分主要通过统计实验进行,是一个理论联系实践的关键环节,为使这一环节通畅、顺达,以有利于综合素质和应用能力的全面提升,故必须在各种课程设置中加强实验的比重,强化实验的掌握。
(3)综合技能模块
综合技能模块主要包括各种应用调查方法、统计数据收集与整理、数据分析方法的综合应用,这一模块主要是通过引导学生参加各种社会实践、参与教师的科研调查以及各类型比赛实现。其目的是培养学生综合运用统计学知识,进行统计设计、统计调查、统计整理、统计分析的意识和能力,并能够熟练运用统计分析方法进行统计报告的撰写与演示等工作。
3、专业技能拓展与创新能力培养模块
专业技能拓展与创新能力培养模块主要包括经济形势分析与预测、团队组织和管理技能、项目评估和专业资格认证体系等内容。其目的是加强统计学基本知识与相关专业的结合,以满足学生不同发展需要。经济形势分析与预测模块主要由经济问题报告及相关学术沙龙组成,使学生能够熟练运用经济学理论对宏观、区域、行业经济形势进行分析和预测,提出相应政策性建议的方法。经济管理研究方法模块主要由学生参与的相关科研与教学培训构成,其目的是加强科研训练,熟悉科学研究的一般程序、方法和基本流程,熟练运用各种研究方法,为实际工作和进一步深造奠定良好基础。项目评估模块主要是针对各类实际项目进行经济、社会与财务评价,通过项目评估、财务规划和税收筹划等理论知识的运用,让学生熟悉和掌握各种评估方法及可行性论证分析过程,扩大统计学专业的就业领域。与统计学专业联系紧密的资格认证有调查分析师、统计软件认证以及数据库分析等,专业资格认证体系模块主要是为学生的资格认证提供培训或相关辅导,通过学生的资格认证强化学生能力,增强就业竞争力。
三、以社会调查为平台的实践教学方案设计
这些新的技术、新兴应用和对应的IT发展趋势,使得IT人必须了解甚至掌握最新的IT技能。另一方面,云计算和大数据乃至其他助推各个行业发展的IT基础设施的新一轮部署与运维,都将带来更多的IT职位和相关技能技术的要求。
毫无疑问,这些新趋势的到来,会诞生一批新的工作岗位,比如数据挖掘专家、移动应用开发和测试、算法工程师,商业智能分析师等,同时,也会强化原有岗位的新生命力,比如网络工程师、系统架构师、咨询顾问、数据库管理与开发等等。下面分别为大家介绍着十大IT技能所体现的工作岗位:
一、算法工程师
何万青博士曾经介绍把一件事做快做好的三种方法,其中就提到过“提高流水线效率、更好的算法和更短的代码关键路径。”可以看出算法在系统效率中的重要地位。算法是让机器按照人类设想的方式去解决问题,算法很大程度上取决于问题类型和工程师对机器编程的理解,其效率的高低与算法息息相关。
在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。在大数据时代,算法的功能和作用得到进一步凸显。比如针对公司搜索业务,开发搜索相关性算法、排序算法。对公司海量用户行为数据和用户意图,设计数据挖掘算法。
算法工程师,根据研究领域来分主要有音频/视频算法处理、图像技术方面的二维信息算法处理和通信物理层、雷达信号处理、生物医学信号处理等领域的一维信息算法处理。另外数据挖掘、互联网搜索算法这些体现大数据发展方向的算法,在近几年越来越流行,而且算法工程师也逐渐朝向人工智能的方向发展。
二、商业智能分析师
算法工程师延伸出来的商业智能,尤其是在大数据领域变得更加火热。IT职业与咨询服务公司Bluewolf曾经报告指出,IT职位需求增长最快的是移动、数据、云服务和面向用户的技术人员,其中具体的职位则包括有商业智能分析师一项。
商业智能分析师往往需要精通数据库知识和统计分析的能力,能够使用商业智能工具,识别或监控现有的和潜在的客户。收集商业情报数据,提供行业报告,分析技术的发展趋势,确定市场未来的产品开发策略或改进现有产品的销售。
商业智能和逻辑分析技能在大数据时代显得特别重要,拥有商业知识以及强大的数据和数学分析背景的IT人才,在将来的IT职场上更能获得大型企业的青睐。不过这些技能并不是一般人都能掌握的,一些公司目前正在招聘统计学家并教授他们有关技术和商业的知识。
三、数据挖掘工程师
数据挖掘工程师,也可以叫做“数据挖掘专家”。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
数据挖掘专家或者说数据挖掘工程师掌握的技能,能够为其快速创造财富。当年亚马逊的首位数据挖掘工程师大卫·赛林格(David Selinger)创办的数据挖掘公司,将类似于亚马逊的产品推荐引擎系统销售给在线零售和广告销售商,而这种产品推荐引擎系统,也成为亚马逊有史以来最赚钱的工具。数据挖掘的价值由此可见一斑。
四、咨询顾问(专家)
任何业务部门和任何行业企业,都有IT系统在背后默默无闻地支撑着。在云计算大数据时代,业务面临的挑战和机遇也会给IT系统带来更多要求。在这种情况下,IT系统的规划部署和运维,都要有更为精通的专业人士才能胜任,并满足面向未来大数据分析、云计算服务应用的需要。
纽约蒙特法沃医疗中心(montefioremedical center)的副主席杰克-沃夫(JackWolf)曾经表示,他寻求不仅会建立和使用系统而且还会给予其他员工技术支持的新员工,他说:”新的系统意味着你必须有更多的咨询台来处理更多的咨询量。”当然,这里体现的主要是某个系统的技术支持的功能,但管中规豹我们不难发现,无论是部署初期的物料采购还是运维过程中的金玉良言,都凸显出这种技术咨询顾问的重要性。
五、网络工程师
网络工程师可以说是一个“绿色长青”的职业,网络技术一直以来就处于急需之中,美国人力资源公司罗勃海佛国际(Robert Half International)第三季度IT招聘指数和技能报告指出,网络管理占总需求技能排名中的第二位。对于云计算时代来说,网络在云资源池中(计算、存储、网络)更是扮演着更为重要的作用。
另一方面,IPv6标准、物联网、移动互联等蓬勃发展,使得对于网络工程师尤其是新型网络工程师(移动、IPv6、云计算方向)的人才和技能要求也越来越多。网络工程师也因此而可以细分成多个发展方向,相应的技能要求其侧重也有所不同。比如网络安全、网络存储、架构设计、移动网络等等。
六、移动应用开发工程师
移动应用开发,会随着移动互联网时代的到来变得更受追捧。截至2012年底我国已经有10亿手机用户,移动智能终端用户超过4亿,在移动支付、移动购物、移动旅游、移动社交等方面涌现了大量的移动互联网游戏、应用和创业公司。
移动平台智能系统较多,但真正有影响力的也不外乎iOS、Android、WP、Blackberry等。大量原来PC和互联网上的信息化应用、互联网应用均已出现在手机平台上,一些前所未见的新奇应用也开始出现,并日渐增多。
移动应用开发,由于存有多个平台系统,因此不同的平台开发者其所面临的机遇和挑战也不尽相同。一个很明显的例子就是,当初由Google公司和开放手机联盟领导及开发的基于Linux的安卓系统,在开源之后就给广大开发者(商)带来巨大商机,而坚定选择iOS平台的的开发工程师,也通过苹果生态系统的不断扩建和智能设备的高市场占有,使得较早的一批开发者都赚得盆满钵满。不过在国内由于用户习惯、产业环境和版权保护的问题,移动应用开发者并没有因此而获得相应的收益。
七、软件工程设计师
近年IT业界逐渐涌现出一股软件定义网络(SDN)、软件定义数据中心、软件定义存储(SDS)和软件定义服务器(MoonShot)等浪潮,大有软件定义未来一切IT基础设施的趋势。
PaaS、SaaS、数据挖掘和分析、数据管理和监控、虚拟化、应用开发等等,都是软件工程师大展身手的好舞台。相应的,这些技术领域也对软件工程师的要求会更高,尤其是虚拟化和面向BYOD、云计算、大数据等应用的开发和管理,都需要有更高深的技术支撑。
和算法工程师有点类似的地方在于,软件工程师也需要注重设计模式的使用,一位优秀的工程师通常能识别并利用模式,而不是受制于模式。工程师不应让系统去适应某种模式,而是需要发现在系统中使用模式的时机。
八、数据库开发和管理
细心的球迷一定会留意到这样一个细节:NBA比赛进行中,球队的助理教练总是坐在场边,手中拿着一块书写板记录着什么。他们的确是在记录数据,但那绝非是得分或篮板这样的“初级数据”。他们记录的是球员在油漆区的触球次数、每回合传球次数、内传外的三分投篮次数、间接助攻(真正助攻前发生的那次传球)、造犯规次数等。这一系列数据虽然跟比赛密切相关,可在任何传统意义上的数据统计单上,你都无法查询到相关数据。
这些用纸笔记录下的数据虽然重要,但都无法跟多个NBA球馆天花板上空所悬挂的那些微型摄像机所记录的相媲美。这些摄像机,是被称为Sport VU的系统的一部分,它有巨大的潜力改变我们对于NBA数据分析的一切认知。
Sport VU能告诉我们,在NBA当中,哪个球员的速度是最快的。它告诉我们的不是谁得分最多,而是谁每次触球得分最多。它能告诉我们每场比赛谁的运球次数最多,与他们投篮出手次数相比,谁的运球次数最多,这一切,其实只是显性的东西。
如果你质疑这套系统的权威性,那么你只要了解一点:Sport VU诞生于2005年,它由以色列科学家麦基·塔米尔发明,此人是导弹追踪以及高端光学识别方面的专家。塔米尔后来用其中的技术试着去追踪了以色列的一些足球赛,分析其中的数据,后来他将这项技术用在了追踪NBA及其他比赛。
2008年,美国的STATS公司收购了Sport VU,并且将精力集中在了篮球数据分析上面。2009-10赛季,STATS公司战略和发展副总裁科普找到了几支技术悟性最高的NBA球队,试图说服他们加入试验。最终,小牛、火箭、雷霆和马刺成为该系统的“小白鼠”。接下来的一年,凯尔特人和勇士也加入到了这个行列。
到了本赛季,已经有15支球队用上了Sport VU,他们分别是:尼克斯、魔术、凯尔特人、奇才、雄鹿、猛龙、76人、骑士、小牛、雷霆、森林狼、勇士、火箭、马刺和太阳,各支球队为此大概每年要花费十万美元。
这套系统究竟是如何运转的?每座球馆天花板上空都悬挂有六个跟计算机连通的摄像头,每个半场设置三个。这些摄像头跟复杂的、从XYZ定位系统中提取数据的计算公式同步,每秒能抓取25幅图片。每张图片都记录有时间,并自动由电脑处理。电脑跟比赛实况报道(play-by-play)数据相连,一个回合90秒之内就能发出报告。这一点是STATS公司员工最为自豪的一点,他们在软件中所使用的计算公式是他们的专利,被他们称之为ICE平台。几乎是同步,想要查阅数据的教练和数据研究人员就能在他们的电脑、iPad上查看这些信息,有时候他们并不知道如何使用这些数据,但起码,他们拥有这些数据。
凯尔特人主帅里弗斯曾问过球队数据分析师扎伦一个问题:当朗多每个回合持球时间超过五秒时,凯尔特人的进攻效率如何。在使用这套数据系统前,扎伦被问的哑口无言无法回答,而如今,他可以大声响亮的告诉里弗斯答案了。因为Sport VU能够追踪每一个球员每个动作、每次传球、每次投篮、每次触球,一切的一切。
事实上,这套系统能够追踪的信息,比各支球队了解的多得多。每个总经理都表示,他们所使用的这套数据系统提供的数据,只是该系统提供的数据的一小部分。不过他们均认可,这套系统,是高端篮球数据分析的未来。
“我们需要30支球队对这些数据形成一种真正的度量标准,”森林狼篮球运营助理,同时也是Sport VU工作人员的波莱罗说道,“等到30支球队全部加入,我们依然认为我们只能使用这套系统5%-10%的内容,这套系统真的会改变比赛,但是在我们到达那一步之前,这只是美好的设想。”
至于这套系统给教练、观察家们带来了哪些具体利好,我们只需要看看这套系统的一些实际应用就好了。
篮球精算师
有些球队才刚开始用Sport VU,而那些更早接触到它的球队已经走在了前面。不过这15支球队一直都对他们是如何使用这些数据遮遮掩掩,但是有一支球队——多伦多猛龙——在斯隆管理学院体育分析年会,向公众揭开它的冰山一角。
猛龙的数据分析团队写出了无比复杂的代码,把录下的比赛中每一秒的X-Y坐标全部转化成了可以看的视频资料。被还原的场面之一是今年2月23日猛龙主场战胜尼克斯的比赛的第一节,贾森·基德利用卡梅隆·安东尼的挡拆投中了一记三分球。这段视频里,尼克斯球员用蓝色显示,传递着小黄球,多伦多球员被则是白色显示。它看起来很简单,但是转换的过程需要很多人,包括三名多伦多管理层的雇员,花掉很多时间。
这些代码可以识别所有的东西——什么时候发生了挡拆,在哪里发生的,掩护是否真的挡到了防守球员,以及执行战术时场上十名球员的位置。
Sport VU还可以识别每个球员的技能的能力,所以它明白克里斯·保罗在中距离位置远比拉简·朗多要危险,还有罗伊·希伯特比埃尔·霍福德要高。这部分内容对猛龙研究出来的最有用的部分至关重要:视频里穿着猛龙球员相同号码的透明的小圈圈,它们是“影子球员”,它们跑的是多伦多教练组和分析团队认为球员在一套战术中应该做的。猛龙分析团队可以用这个期望值系统,抛开多伦多的计划,构建一个“理想化”的防守。这么说吧,在对手的一次进攻中,凯尔·科沃尔投出底角空位三分的期望值比约什·史密斯在防守下投出六米开外的跳投的期望值要高得多。当然,得出结论也未必管用,因为教练组的一些人对于这些新的数字和电脑程序的价值还有所疑虑。
“你需要执教方的视角。我们还在找哪些规则错了——哪些地方系统的数据与我们在场上实际做的不符。”猛龙分析团队的主管阿利克斯·鲁克尔说。
比方说,影子球员在协防上一般比真正的猛龙球员更有侵略性。看看猛龙同尼克斯比赛中一次进攻的初始形态,雷蒙德·菲尔顿和泰森·钱德勒在右翼挡拆时,影子德罗赞处在油漆区中央,以阻拦任何给钱德勒的传球,同时影子菲尔兹的在弱侧区域防守着安东尼和基德。
影子菲尔兹比实际比赛里更靠近位于地角的基德,原因是程序知道底角三分的期望值更高,这也是为什么影子盖伊往菲尔兹那边挪了一点,而现实版本中两名球员都更靠近自己原来盯防的球员。
尼克斯最后重新调整,把球交给了安东尼跟钱德勒打档拆。再看看钱德勒切入篮下时的影子德罗赞和真实的德罗赞都是怎样做的。
影子德罗赞很早就离开了基德去补防钱德勒,而且比真正的德罗赞站位更高。因为安东尼正朝着右翼运球,左翼成了“弱侧”,在几乎所有的NBA防守中,协防切向的大个子(钱德勒)都是弱侧防守者的责任。德罗赞这么做了,但他做的太晚了;早点的话可以更早阻止钱德勒,可以让他和瓦兰修纳斯更容易地回去防守自己对位的球员。
根据分析团队得出的结论,球队理想防守中的影子球员总是比真正的球员更凶猛地协防,而且几乎整个联盟中都是这样。球队要么就还没有意识到他们应该更多地补防中区和强侧,要么就还没有说服球员这么做。
关键问题在于,要让球员改变他们的防守习惯很难,让他们离开自己原本盯防的球员如此之远就更困难了。“球员不希望受到指责,或是在电视上看见自己没能防到一次扣篮或是空位三分。”麦卡·诺里说,他是猛龙的助理教练,与鲁克尔的团队关系密切,“尽管篮球是五个人防守一个球,你很难让球员摆脱掉‘这个人属于我’的观念。”
侵略性十足的协防需要球员们异常努力,类似尼克斯球员在传球的时候影子德罗赞所跑的距离,就不像是真实的球员能做到的。所以联盟中惟一一支在防守端能够经常打出与自己影子重合的球队只有热火,这绝非巧合。迈阿密有联盟最好的侧翼防守者之三——巴蒂尔、詹姆斯和韦德,后两位也位于全联盟运动能力最好的球员之列。“勒布朗基本上就是这个系统的‘天敌’。”鲁克尔说,“他做了很多大部分球员完全做不到的事情。”
热火的协防堪称是联盟中做得最好的,猛龙在这方面有很多不足,多伦多分析团队用Sport VU举出另外一个例子。
本赛季步行者同猛龙的一场比赛中,乔治·希尔和大卫·韦斯特在球场左侧的一次挡拆。这里发生了两件事,而且两样都是防守中最容易出现的典型错误。第一个:阿米尔·约翰逊追希尔追到了中区,让自己离他的影子(正确的防守位置)相差很远。约翰逊很擅长在三分线外追赶持球人,但在这里他并不需要走这么远,因为希尔只是往远离篮筐的方向运球,因此并没有威胁。
Sport VU还记录下盖伊犯的另一个错误:韦斯特拿到了球,而约翰逊离他很远,影子球员看到了球队潜在危机,而这是真实球员注意不到的。影子瓦兰修纳斯抛弃了希伯特跑向韦斯特,前者完全可以这么做,因为他知道影子盖伊会离开乔治以在补防希伯特。真实比赛发生的情况是,瓦兰修纳斯和盖伊都没动,韦斯特简单地投中一记中距离。
回到前面所说的,影子球员在防守中的移动是基于对方进攻中的期望值,随着进攻的推移,每秒计算好几次;影子盖伊会轮转过来,部分因为程序知道让乔治处于空位比德罗赞离开埋伏在底角的射手所带来的伤害要小得多。
进阶之路
通过比赛中具体发生的例子,人们初步知道了Sport VU在某一方面的作用,这当然要感谢猛龙队的慷慨。不过,虽然猛龙很早就启用Sport VU,但即使是接受能力最强的教练,看起来也只是把它当作一个主要用来证实他们已经想到和知道的事情。“这是对你亲眼所见的证实,它可能也会为别的东西提供灵感。”猛龙主教练凯西说,“但是你不能只基于这个做决定,它无法测量大心脏、化学反应和性格。”
虽然很多教练会说Sport VU的分析证实了他们的想法,他们会做出一些改变,但真实的情况并非这样。例如:分析团队一致同意且不停强调,所有球队都应该投更多的三分球——包括猛龙。以同一场猛龙与步行者比赛中的某次进攻为例:分析团队希望一个生涯低于联盟平均水准且本赛季表现并不算好的三分投手盖伊投出一记防守下的三分球——此时计时器上显示猛龙还剩下约六秒进攻时间。取而代之的是盖伊传给了底角的德罗赞,一个更差的三分投手,然后德罗赞试图传出一记难度极大的突破分球给切入的盖伊,却被乔治·希尔破坏出底线,计时器上只剩下了不到一秒。
对于鲁克尔和他的团队,这是由投篮的价值、计时器的影响及教练如何执教球员的引出来的问题。“当你问教练28%的三分命中率和42%的中距离哪个好,他们会说42%的那个。这显然是不对的。”鲁克尔说。
想让教练们接受这种快乐扔三分的哲学并不简单。“你可以想投多少三分就投多少。”凯西说,“但是如果你投不进的话,这个理论就要被扔出窗外了。数据分析可能给你一个数字,但是你不能靠那个数字过活。”
凯西说德罗赞的三分不好,这肯定没错。但是分析团队争辩说,即使是低于35%的三分手也应该投出更多的三分,教练们应该花更多的时间把低于平均水平的三分手变成接均水准的投手。“一个球员的三分命中率从25%长到30%远比中距离从35%提到40%更有意义。”鲁克尔说。在分析团队看来,就算爵士球员米尔萨普职业生涯的三分线命中率只有27.7%(112投31中),但还是要让他更多的三分球,把训练时间的一部分分出来——努力提升此前并不属于他的技能。
当然,猛龙的数据分析团队更关心自家球员,瓦兰修纳斯当然是他们本赛季的头号目标,而这也引发了他们和教练组之间的紧张关系。像很多的新秀一样,瓦兰修纳斯会忘记轮转、协防过度,还会在防守上犯简单的站位错误。教练组痛恨这些,他们经常在关键时刻把立陶宛人摁在板凳上,重用阿隆·格雷——一个基础不错但缺少运动能力的球员。
分析团队和教练组的矛盾还会继续,但他们不会互相掐来掐去或是威胁说自己要辞职。部分原因是Sport VU的数据做出了很多最聪明的NBA工作人员长时间以来都在做的事:把比赛与先进的统计学结合。理解体育不是非此即彼;它两者兼有,而这些摄像机代表了这次联姻中最先进的现实化效果。