搜索
查看: 4644|: 4

分析师都会用到那些软件?

[复制链接]

149

主题

5

回帖

554

积分

高级会员

积分
554
发表于 2014-12-2 16:25:07 | 显示全部楼层 |阅读模式
大家说说数据分析师一般都会用到那些软件呢?

202

主题

6

回帖

885

积分

高级会员

积分
885
发表于 2014-12-2 16:27:41 | 显示全部楼层
第一维度:数据存储层——>数据报表层——>数据分析层——>数据展现层
第二维度:用户级——>部门级——>企业级——>BI级

首先,存储层:
我们必须能够存储数据,对个人来讲至少应该掌握一种数据库技术,当然也不一定要熟练操作,但至少要能够理解数据的存储和数据的基本结构和数据类型,比如数据的安全性、唯一性、冗余性,表的关系,粒度,容量等,最好能够理解SQL查询语言的基本结构和读取等等!

Access2003、Access07等:这是最基本的个人数据库,经常用于个人或部分基本的数据存储;
MySQL数据库,这个对于部门级或者互联网的数据库应用是必要的,这个时候关键掌握数据库的库结构和SQL语言的数据查询能力;
SQL Server 2005或更高版本,对中小企业,一些大型企业也可以采用SQL Server数据库,其实这个时候本身除了数据存储,也包括了数据报表和数据分析了,甚至数据挖掘工具都在其中了;
DB2,Oracle数据库都是大型数据库了,主要是企业级,特别是大型企业或者对数据海量存储需求的就是必须的了,一般大型数据库公司都提供非常好的数据整合应用平台;
BI级,实际上这个不是数据库,而是建立在前面数据库基础上的,这个主要是数据库的企业应用级了,一般这个时候的数据库都叫数据仓库了,Data Warehouse,建立在DW级上的数据存储基本上都是商业智能平台,或许整合了各种数据分析,报表、分析和展现!

第二:报表层

当企业存储了数据后,首先要解决的报表,还不是分析问题,是要能够看到,看到报表,各种各样的报表!国内外有专门提供报表分析服务的企业和软件。

Crystal Report水晶报表,Bill报表,这都是全球最流行的报表工具,非常规范的报表设计思想,早期商业智能其实大部分人的理解就是报表系统,不借助IT技术人员就可以获取企业各种信息——报表。而且很多数据库内置的报表也是采用CR报表的开发版嵌入的!
Tableau软件,这个软件是近年来非常棒的一个软件,当然它已经不是单纯的数据报表软件了,而是更为可视化的数据分析软件,因为我经常用它来从数据库中进行报表和可视化分析,先暂列在报表层;

这个软件从3.0开始,现在已经有了5.1版本,两年的时间已经到了服务器和Web方式了!
当然,如果企业有上万张报表,需要好好管理起来,还有安全性,并发请求等,就需要有Server版;

博易智讯公司专门提供Crystal Report和Crystal Report Server版销售和软件服务;

第三:数据分析层


这个层其实有很多分析工具,当然我们最常用的就是Excel,我经常用的就是统计分析和数据挖掘工具;

Excel软件,首先版本越高越好用这是肯定的;当然对Excel来讲很多人只是掌握了5%Excel功能,Excel功能非常强大,甚至可以完成所有的统计分析工作!但是我也常说,有能力把Excel玩成统计工具不如专门学会统计软件;
SPSS软件:当前版本是18,名字也改成了PASW Statistics;我从3.0开始Dos环境下编程分析,到现在版本的变迁也可以看出SPSS社会科学统计软件包的变化,从重视医学、化学等开始越来越重视商业分析,现在已经成为了预测分析软件。
Clementine软件:当前版本13.0,数据挖掘工具,我从6.0开始用,到了13版,已经越来越多的提高了更多有好的建模工具,现在改名叫PASW Modeler 13建模器了。而且与SPSS统计功能有了更多的整合,数据处理也更加灵活和好用。
SAS软件:SAS相对SPSS其实功能更强大,SAS是平台化的,EM挖掘模块平台整合,相对来讲,SAS比较难学些,但如果掌握了SAS会更有价值,比如离散选择模型,抽样问题,正交实验设计等还是SAS比较好用,另外,SAS的学习材料比较多,也公开,会有收获的!

当然,我主要是采用SPSS和Clementine,有时候就是习惯,当然会了一种软件在学其他的也不是很困难!

JMP分析:SAS的一个分析分支
XLstat:Excel的插件,可以完成大部分SPSS统计分析功能
Ucinet社会网分析软件:SNA社会网络分析是非常流行和有价值的分析工具和方法,特别是从关系角度进行分析社会网络,关系分析非常重要,过去我们都是属性数据分析

大家如果有需要试用版,可以联系博易智讯,他们可以提供SPSS和Clementine软件版本的咨询。

第四:表现层
最近我一直在研究数据可视化技术,一方面是因为Excel大家有需求,另一方面就是我第一个购买了Xcelsius,也写了《Excel高级应用与数据分析》和《数据展现的艺术——Xcelsius》。这个领域的软件,特别是一些小工具非常有价值!

PowerPoint软件:这个没得说了,大部分人都是用PPT写报告;
Visio、SmartDraw软件:这些都是非常好用的流程图、营销图表、地图等,而且从这里可以得到很多零件;
Swiff Chart软件:制作图表的软件,生成的是Flash;
Color Wheel软件:配色软件
Yed软件:网络关系图、流程图和图形分析软件,类似SNA分析,我经常用来设计流程图,还有就是分析优化关系图;
Netdraw软件:这是社会网络分析展现软件,主要是可视化网络关系图的,读取Ucinet软件;
Mindmanager软件:思维导图,非常好的软件,可以把非线性思维很快构建起来,并且项目组织管理、报告设计构想都可以应用,直接生成PPT等,当然这个软件功能非常强大,我的学生都用它来做笔记和会议记录;
Xcelsius软件:Dashboard制作和数据可视化报表工具,可以直接读取数据库,在Excel里建模,互联网展现,最大特色还是可以在PPT中实现动态报表;这个是我最希望应用的一个软件工具,非常有价值!

最后,需要说明的是,我这样的分层分类并不是区分软件,只是想说明软件的应用,其实每个层次的软件都是相互融合的,追求:平台化,整合化,智能化,可视化,专业化,都是各有特色;价格也不同,有免费的,有上百万的;有单机版的,有服务器版的;有正版的,有盗版的!

有时候我们把数据库就用来进行报表分析,有时候报表就是分析,有时候分析就是展现;当然有时候展现就是分析,分析也是报表,报表就是数据存储了!

1.QUEST

QUEST是IBM公司Almaden研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。系统具有如下特点:

提供了专门在大型数据库上进行各种开采的功能:关联规则发现、序列模式发现、时间序列聚类、决策树分类、递增式主动开采等。

各种开采算法具有近似线性(O(n))计算复杂度,可适用于任意大小的数据库。

算法具有找全性,即能将所有满足指定类型的模式全部寻找出来。

为各种发现功能设计了相应的并行算法。
2.MineSet

MineSet是由SGI公司和美国Standford大学联合开发的多任务数据挖掘系统。MineSet集成多种数据挖掘算法和可视化工具,帮助用户直观地、实时地发掘、理解大量数据背后的知识。MineSet有如下特点:

MineSet以先进的可视化显示方法闻名于世。

提供多种 萃诰蚰J健0 ǚ掷嗥鳌⒒毓槟J健⒐亓 嬖颉⒕劾喙椤⑴卸狭兄匾 取?br>
支持多种关系数据库。可以直接从Oracle、Informix、Sybase的表读取数据,也可以通过SQL命令执行查询。

多种数据转换功能。在进行挖掘前,MineSet可以去除不必要的数据项,统计、集合、分组数据,转换数据类型,构造表达式由已有数据项生成新的数据项,对数据采样等。

操作简单、支持国际字符、可以直接发布到Web。

3.DBMiner

DBMiner是加拿大SimonFraser大学开发的一个多任务数据挖掘系统,它的前身是DBLearn。该系统设计的目的是把关系数据库和数据开采集成在一起,以面向属性的多级概念为基础发现各种知识。DBMiner系统具有如下特色:

能完成多种知识的发现:泛化规则、特性规则、关联规则、分类规则、演化知识、偏离知识等。

综合了多种数据开采技术:面向属性的归纳、统计分析、逐级深化发现多级规则、元规则引导发现等方法。

提出了一种交互式的类SQL语言——数据开采查询语言DMQL。

能与关系数据库平滑集成。

实现了基于客户/服务器体系结构的Unix和PC(Windows/NT)版本的系统。

167

主题

4

回帖

573

积分

管理员

积分
573
发表于 2014-12-2 16:31:18 | 显示全部楼层
Excel :

Microsoft Excel 是微软公司的办公软件 Microsoft office 的组件之一,是由 Microsoft 为 Windows 和 Apple Macintosh 操作系统的电脑而编写和运行的一款试算表软件。 Excel 是微软办公套装软件的一个重要的组成部分,它可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。功能强大,益于学生学习,通常情况下,功能完全可以满足用户的需求;

Matlab :

Matlab 是矩阵实验室( Matrix Laboratory )的简称,是美国 MathWorks 公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括 MATLAB 和 Simulink 两大部分。

SPSS :

SPSS ( Statistical Product and Service Solutions ),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”( SolutionsStatistical Package for the Social Sciences ),但是随着 SPSS 产品服务领域的扩大和服务深度的增加, SPSS 公司已于 2000 年正式将英文全称更改为“统计产品与服务解决方案”,标志着 SPSS 的战略方向正在做出重大调整。

QUANTUM :

Quantum 软件是一款市场分析软件,原为英国 quantum 公司生产, 1998 年被 SPSS 公司收购,成为 SPSS MR 中的一个模块,主要针对市场研究需要而定做。软件用于对调查数据的统计分析,与 SPSS 类似,但是统计功能一般,分组方法很多,使用非常方便。该软件采用软件狗加密,在市场上不出售,只提供出租(类似 SAS) 。

SAS:

SAS 是美国使用最为广泛的三大著名统计分析软件( SAS , SPSS 和 SYSTAT )之一,是目前国际上最为流行的一种大型统计分析系统,被誉为统计分析的标准软件。 SAS 为“ Statistical Analysis System ”的缩写,意为统计分析系统。它于 1966 年开始研制, 1976 年由美国 SAS 软件研究所实现商品化。 1985 年推出 SAS PC 微机版本, 1987 年推出 DOS 下的 SAS6 。 03 版,之后又推出 6 。 04 版。以后的版本均可在 WINDOWS 下运行,目前最高版本为 SAS6 。 12 版。 SAS 集数据存取,管理,分析和展现于一体,为不同的应用领域提供了卓越的数据处理功能。它独特的“多硬件厂商结构”( MVA )支持多种硬件平台,在大,中,小与微型计算机和多种操作系统(如 UNIX , MVS WINDOWS 和 DOS 等)下皆可运行。 SAS 采用模块式设计,用户可根据需要选择不同的模块组合。它适用于具有不同水平于经验的用户,处学者可以较快掌握其基本操作,熟练者可用于完成各种复杂的数据处理。

Surveycraft :

SurveyCraft 在短时间内不会被其他软件取代,其在数据录入和表格批处理方面有很大的优势,其他的软件只能望其项背。

Origin :

Origin 是美国 OriginLab 公司(其前身为 Microcal 公司)开发的图形可视化和数据分析软件,是科研人员和工程师常用的高级数据分析和制图工具。

Origin 为 OriginLab 公司出品的较流行的专业函数绘图软件,是公认的简单易学、操作灵活、功能强大的软件,既可以满足一般用户的制图需要,也可以满足高级用户数据分析、函数拟合的需要。

Origin 自 1991 年问世以来,由于其操作简便,功能开放,很快就成为国际流行的分析软件之一,是公认的快速、灵活、易学的工程制图软件。它的最新的版本号是 8.5.1 SR2 ,另外分为普通版和专业版( Pro )两个版本。

大量的处理数据和分析时, SPSS 在效率上没有 Surveycraft / QUANTUM   快。

Surveycraft 可以录制宏后批量出 TABLE 。宏自动更改设定的条件后。电脑就会自动搞定。

152

主题

47

回帖

3015

积分

管理员

积分
3015
发表于 2014-12-2 16:34:16 | 显示全部楼层
一张图说明:
QQ图片20141202163853.jpg
大数据中国(http://www.bigdatas.cn),以数据的力量改变生活!

1

主题

4

回帖

123

积分

注册会员

积分
123
发表于 2014-12-2 16:35:08 | 显示全部楼层
应该就这些吧
图片5.jpg
图片3.png
图片4.png
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-12-22 20:22 , Processed in 0.056959 second(s), 36 queries .

快速回复 返回顶部 返回列表