搜索
查看: 1627|: 0

数据挖掘、可视化ETL、大数据大并发……这才是企业需要的BI工具!

[复制链接]

26

主题

0

回帖

473

积分

中级会员

积分
473
发表于 2019-3-25 14:20:39 | 显示全部楼层 |阅读模式
在没有利用BI(商业智能)搭建完备的数据分析结构前,企业都是按照传统的方式来实现业务数据需求,就是各部门将自己的需求提给信息化部门去做。
但“技术问题一股脑的扔给IT部”的方式,沟通成本高、需求响应慢。在倡导“人人都是数据分析师”的年代,是很低效的配合方式。
自助式BI工具可以解决这些问题。
我们可以试着将企业涉及数据分析的人群分为两大类:
1、数据管理员
这部分人群掌握着数据库、数据仓库,对基础数据拥有设计和建模能力。针对他们,BI可以作为一个平台帮助连接各数据库、数据仓库。管控、整合、清洗数据,为有分析需求的人准备数据,在分析过程中自动建模。功能上力求做到——高速度高性能、稳定。
2、分析用户
针对深度分析用户,他们往往就有数据分析基础和理解模型的能力,对数据有再处理加工和深度分析挖掘的需求。此时BI更多充当快速可视化分析的工具,通过可视化辅助数据分析时的思考。
针对初级分析用户,他们的需求往往是Dashboard即席分析,结合可视化有主题的展示业务数据,实时监控,预警分析。此时的BI最好能有较低的上手门槛,能快速取数。
针对一些查看数据的用户,比如领导boss们,他们的诉求就是看报告,了解业务状况,辅助业务决策。BI要做到报告可读美观,让用户聚焦于理解仪表板要表达的数据含义。
也正是基于以上的实际数据分析场景,FineBI 5.0做了焕然一新的升级。聚焦于两个环节,数据的分发和数据的分析。
数据的分发
基于数据安全和精细的权限管理,让科技部门放心的把数据权限下放,业务部门能完整方便的拿到所需数据,这是自助分析推行的根基。
数据的管理是阻碍企业数据分析推行的很大原因。科技部门担心风险,导致业务部门很简单的需求不能得到及时响应;很多数据的需求本身时效性很高,一旦过了这个数据再拿到也已经没有价值了;还有部分是数据给的不完整,脏数据很多,导致业务想进行的分析做到一半进行不下去,逐渐放弃…
数据的分析
好的工具能提高效率,优化协作方式。FineBI 5.0想让人人都能成为数据分析师:业务能够很容易的对数据进行分析和观察,甚至一定程度的专业分析;专业的数据分析师能够借助BI,更高效的处理数据做分析。
最低成本的发现数据价值,也是FineBI 5.0最核心解决的问题。




FineBI 5.0可以说是真正能够覆盖“个人数据分析”到“企业数据价值挖掘”的数据分析平台。
新版本赋予了其4类特性:数据分析挖掘、数据处理、大数据高性能、企业级数据管控。
——数据分析挖掘——
1、更符合人类思维的探索分析——step by step
数据分析思考过程不可能是一步到位的,一定是分析——发现问题——修正的螺旋上升的过程。我们发现用户在拿到数据时,都先是尝试性的分析看一下数据的趋势,然后在逐渐一步一步地去深入分析。在这过程中,有可能很多思考是错误的,有些指标是需要再计算的。对于这些“探索性”的操作,FineBI提供增加,修改,删除历史操作功能,及时修正,每一个步骤都可以预览数据。且提供无限层级的数据分析:用户可以对自己权限下的数据任意处理。
2、分析思维主导的可视化
5.0的可视化分析,采用全新的设计理念。基于著名的图形语法(The Grammar Of Graphics)设计改良,提供了无限的视觉分析可能,我们称之为“无限图表类型”。
取消了传统图表类型的概念,取代以'形状'和形状对应的'颜色','大小','提示',‘标签’等属性;取消了'分类'、'系列'等概念,取代以'横轴'、 '纵轴'两个方向。当你分析两个数据字段的相关性时,会自动选择最合适的图表(也可手动调整)。这样的思维更符合大家拿到数据不知如何分析,先初步了解数据情况的探索式分析场景。


每种图表背后都有很强的数据分析算法,让分析更加专业科学。此外FineBI 5.0还优化了底层数据逻辑,重新设计了图表的大数据模式,支撑图表展示数据量可达百万以上。
一些FineBI 5.0实现的可视化效果:






3、新增数据挖掘算法
在5.0版本中,增加了五类挖掘算法,分别为时间序列、聚类、分类、回归和关联规则。
也就是说,在这一版本中,如果你想预测未来的销售额,你想智能地给用户群分类,或者你想知道短信发给哪个用户获得的反馈可能性比较大,将会成为现实。
此外,我们将时间序列算法和聚类算法和图表分析相结合,不用写任何算法代码只需要简单的拖拖拽着就可以立马看到预测和聚类的结果。




如果需要更多的算法怎么办,我们当然为这种复杂的挖掘需求做好了准备, 5.0可以集成了R语言,可以直接在FineBI中进行R语言编译,实现数据统计和分析的需求。并且直接将数据统计和分析结果通过finebi展现,完美的结合了R语言的统计能力优势和FineBI的展现优势。
当然,以上还只是开始,未来还会增强FineBI的数据挖掘能力,开发更多的内置算法,让数据挖掘更为简单易用。
——数据处理——
让业务人员拿到需要的数据,让IT部门放心的提供数据,是自助分析推行、人人都是数据分析师的根基。FineBI 5.0数据准备功能整合了原SPA螺旋分析和ETL,并做了进一步的增强,更方便、更高效、更强大,业务人员可以在精准的数据权限下,实现对数据进行再处理和深度分析挖掘的需求。
(1)清晰全面的数据掌控。FineBI 5.0可以让用户对自己的数据,有更全面、更清晰的了解。表结构和表预览两种视图,让表基础信息查看更清晰、更方便,大面积的数据预览区域,更易了解数据内容。数据血缘分析功能,让用户对数据的来源去向、应用状况一目了然。同时,数据的更新情况,何时更新、更新频繁程度,也能直观展示。
(2)简单高效的数据配置。高效的数据准备和配置,可以减少用户不必要的麻烦。关联智能继承,可以自动对新创建的分析表建立关联,延续数据关联关系。在基础数据更新时,将自动触发分析用户的数据更新。根据数据量、使用频率以及实时性的要求,能实现实时数据和抽取数据的无缝切换,完全不影响用户已经做好的分析。
(3)强大友好的数据处理。用户可以对自己的数据进行任意处理,即便是已经参与分析的数据也一样,进行如清洗过滤、新增字段、表合并、排序、分组汇总、数据挖掘等操作,来得到自己想要的数据。每一步操作都有数据预览,操作后立即收到反馈,增强用户的数据操纵感,减少不确定性。
——大数据高性能——
5.0将直接对接数据库的实时数据引擎与抽取数据的引擎整合统一为Spider计算引擎。用户可以根据数据量、实时性要求、使用频次等,自由选择实时或抽取的方式。实时数据与抽取数据方式的无缝切换,将更加灵活高效支撑前端的高性能分析。
Spider数据引擎可灵活支撑不同数据量级的分析,在数据量激增之后,可横向扩展机器节点,利用Spider引擎专为支撑海量大数据分析而生的分布式方案。


Spider引擎分布式方式,结合Hadoop大数据处理思路,以最轻量级的架构实现大数据量高性能分析。此分布式方案集成了Alluxio 、Spark、 HDFS、zookeerer等大数据组件,结合自研高性能算法,列式存储、并行内存计算、计算本地化加上高性能算法,解决大数据量分析问题与在FineBI中快速展示的问题。同时从架构上保证了计算引擎系统全年可正常使用。
优势:
(1)引擎支撑前端快速地展示分析,真正实现亿级数据,秒级展示。
(2)用户可以根据数据量、实时性要求、使用频次等,自由选择实时或抽取的方式,灵活满足实时数据分析与大数据量历史数据分析的需求。
(3)抽取数据的高性能增量更新功能,可满足多种数据更新场景,减少数据更新时间,减少数据库服务器压力。
(4)合理的引擎系统架构设计可保证全年无故障,全年可正常使用。
——企业级数据管控——
数据管控能力决定BI工具的应用范围和深度。FineBI 5.0提供了精准的企业级数据权限管控方案,管理员可以高效便捷的进行权限配置,放心大胆的交付给分析人员相关数据,无需担心隐私数据泄露。
(1)权限统一配置。平台统一控制权限,如业务包权限、数据表行权限、数据表列权限等,权限控制的粒度更细致,更科学。通过配置主表权限,所有关联的业务表权限也会生效。


(2)权限智能继承。分析人员所做的分析表默认继承基础数据的权限,管理员无需再担心这些数据表的权限分配,每个阅读用户自动看到自己权限范围内的数据,这有利于促进分析人员之间的分享和交流。
(3)满足不同场景。不同场景对数据权限的要求是不同的,每个用户有权将自己权限范围的数据,在有需要的情况下开放给其他用户。比如总部制作的各大区的汇总销售额,想要让每个用户都可以看到,权限继承的情况下,各大区是没有权限看到其他大区的数据的,但是总部的分析表制作用户有权不继承权限,将数据开放给各大区用户。
——最后——
此次的FineBI 5.0版,焕然一新,将企业级自助式BI工具提升到一个新的高度。不仅是数据分析挖掘工具、数据可视化工具、更是适合多数企业复杂流程下的数据分析平台。
目前5.0 版本已在FineBI官网上线,大家可以自行下载体验!
转自:
https://ask.hellobi.com/blog/data/33789

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2025-1-15 21:39 , Processed in 0.214771 second(s), 24 queries .

快速回复 返回顶部 返回列表