神策数据招聘
1. HR需要掌握的数据分析工具有哪些
MATLAB、SPSS、Stata、SAS、EViews、Excel、Python、R这几款工具。
MATLAB
MATLAB是Matrix Laboratory(矩阵实验室)的缩写,是一款由美国The MathWorks公司出品的商业数学软件。MATLAB不仅仅是一款可以用来做统计分析的软件,它还可以高效地处理其他很多的数学问题。它常被用于各种数学建模和工程设计,相比于它强大的统计分析功能,这可说是大材小用。它具有丰富的库函数(工具箱);内嵌绘图功能,可实现数据的多维度展现;同时有良好的交互设计,活跃的社区以及丰富的文档……这些都使它具有极高的易用性,我们也可使用解释执行语言对其进行编程。
SPSS
SPSS是Statistical Proct and Service Solutions的缩写,是一款由IBM公司推出的用于分析运算、数据挖掘、预测分析和决策支持等一系列任务的软件产品及相关服务的总称[5]。SPSS可以用在经济分析、市场调研、自然科学等林林总总的领域。它最大的特点是“简单易用”。虽然它对前沿理论的支持不够全面,但是囊括了绝大部分常用的统计方法。简单的操作方式、友好的操作界面,再加上强大的功能,使其在国内统计分析工作领域吸引了大量用户。
Stata
Stata是Statacorp于1985年开发出来的统计程序[6]。和SPSS一样,它也支持常用分析方法,可用于多个领域,不过实践中在医学和生物学研究上的应用较多。Stata采用菜单和编程相结合的使用方式,其易用性虽不如SPSS,但在功能上略胜一筹。它在企业和学术机构的应用比较广泛。
SAS
SAS诞生于北卡罗莱纳州立大学,起初只是一个用于分析农业研究的项目。随着需求的增长,它的使用范围扩展至医药企业、银行业以及学术和政府机关。SAS系统提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等。SAS功能极其强大,算法包非常完善,但是它是纯编程界面,易用性低且入门困难,适合高级数据分析师或者专业人士使用。在统计分析领域,SAS一度是“统计分析系统”的缩写,被誉为国际上的标准软件和最具权威性的优秀统计软件包。
EViews
EViews是Econometrics Views的缩写,由Quantitative MicroSoftware(QMS)开发,是一款基于Windows设计的统计分析软件[8]。EViews可以用于常规的统计分析,但它在计量经济分析方面特别有效。它的易用性高,且相比于上述其他分析软件,入门级别低。针对计量经济学相关的分析,可以首先考虑该软件。
Excel
Excel是微软公司为Windows操作系统编写的一款电子表格系统,可以画各种图表、做方差分析、回归分析等基础分析。它的专业性虽然不高,但是完全可以胜任日常工作中简单的统计分析工作。同时,它极其方便的操作方式,以及Microsoft Office软件包成员之一的身份,使它成为最流行的个人计算机数据处理软件。
Python
Python是由荷兰人Guido van Rossum于1989年发明的一种面向对象的解释型编程语言,并于1991年公开发行第一个版本。Python是本书各种代码实现所使用的语言。之所以把Python语言列为数据分析的工具,是因为围绕它实现的各种数据分析与数据可视化的开源代码库被广泛应用。同时,Excel、SPSS等工具虽然具有可操作的界面,但并不能有效地结合Hadoop、Hive等组件有效地处理海量数据,而这些都是Python可以胜任的。
R
R是专用于统计分析以及可视化的语言,是AT&T研发S语言时的产物,可以认为是S语言的另一种实现方式。同Python一样,R也提供了极其丰富的库函数来做统计和展现。因为R太过强大且拥有大量的用户,为了能顺应用户的习惯,降低学习的成本,Python在数据处理上的很多库函数都是模仿R的实现,以保持与其基本一致的使用方式。
2. 数据分析软件有哪些
数据分析软件有Excel、SAS、R、SPSS、Tableau Software。
1、Excel
为Excel微软办公套装软件的一个重要的组成部分,它可以内进行各种数据容的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。
5、Tableau Software
Tableau Software用来快速分析、可视化并分享信息。Tableau Desktop 是基于斯坦福大学突破性技术的软件应用程序。它可以以在几分钟内生成美观的图表、坐标图、仪表盘与报告。
3. 数据挖掘的应用领域有哪些
数据挖掘的应用非常广泛,只要该产业有分析价值与需求的数据库,皆可利用数据挖掘工具进行有目的的发掘分析。常见的应用案例多发生在零售业、制造业、财务金融保险、通讯及医疗服务:
(1)商场从顾客购买商品中发现一定的关联规则,提供打折、购物券等促销手段,提高销售额;
(2)保险公司通过数据挖掘建立预测模型,辨别出可能的欺诈行为,避免道德风险,减少成本,提高利润;
(3)在制造业中,半导体的生产和测试中都产生大量的数据,就必须对这些数据进行分析,找出存在的问题,提高质量;
(4)电子商务的作用越来越大,可以用数据挖掘对网站进行分析,识别用户的行为模式,保留客户,提供个性化服务,优化网站设计;
一些公司运用数据挖掘的成功案例,显示了数据挖掘的强大生命力:
美国AutoTrader是世界上最大的汽车销售站点,每天都会有大量的用户对网站上的信息点击,寻求信息,其运用了SAS软件进行数据挖掘,每天对数据进行分析,找出用户的访问模式,对产品的喜欢程度进行判断,并设特定服务,取得了成功。
Reuteres是世界著名的金融信息服务公司,其利用的数据大都是外部的数据,这样数据的质量就是公司生存的关键所在,必须从数据中检测出错误的成分。Reuteres用SPSS的数据挖掘工具SPSS/Clementine,建立数据挖掘模型,极大地提高了错误的检测,保证了信息的正确和权威性。
Bass Export是世界最大的啤酒进出口商之一,在海外80多个市场从事交易,每个星期传送23000份定单,这就需要了解每个客户的习惯,如品牌的喜好等,Bass Export用IBM的Intelligent Miner很好的解决了上述问题。