搜索
查看: 1897|: 0

数据挖掘师作为诚实的代理人和变革推动者的角色

[复制链接]

128

主题

5

回帖

433

积分

中级会员

积分
433
发表于 2014-7-25 08:41:38 | 显示全部楼层 |阅读模式

人们说你不可能在自己的土地上成为一位先知。作为一名总是以局外人的身份做数据挖掘的人,我发现这是真的。我发现建造一个模型时很少有超过10 - 20%的时间是花在电脑前的,有三分之一的时间是根本没有花在电脑前的。这就解释了我发现自己那些时间里并没有在用数据挖掘软件,或任何软件。还有什么别的要做的吗?

鼓励冷静:我经常遇到我的新客户承认他们的数据仓库不够完整,也不完全如他们想要的那样成熟。没有一家是的!有趣的是,它是最早被分享的一个事实是因为它暗示着,如果他们有了完善的数据仓库,数据挖掘项目就会很容易。嗯,他们从来都不容易。重要的工作是艰苦的工作,而且没有人真的有一种完美的数据仓库,因为IT的工作也很难。所以, 一个经验丰富的数据挖掘师正是要向客户解释他们并不是有太多落后。

在部门内宣传分析团队所花的时间:是的,这是一种专职的工作!意外的是数据挖掘被认为是即时查询,比如“我们在A地区第一季度的X销售是多少?”。我不确定这是从哪来的,但新的数据挖掘师会想知道他们能否在下周的会议之前完成CRISP-DM的所有六阶段的工作。到那时一个外来顾问资源的参与可以在很大程度上消除这些困惑,但有时还会有小部分逗留下来。内部成员怎样做才能完成所有他们正在进行的职能,并提交一份专业的多周的工作成效呢?当然,他们不能。在项目的第一周期间经常会有现实渗入。早解决比迟解决更好。

鼓励更加崇高的目标:据说数据准备要占70 - 90%的工作量。我的经历让我相信这些估计是偏离的。如果不仔细的话,“让我们做些预备”这样的事情可以是低效率的,因为要每天对输入的交互做出决策。用更多的最新数据更新模型是简单的,但是如果你实质上改变的是你在挖掘的变量因素,你必须要重复很多工作,而且要重新回顾很多决策。这是有可能的,用仔细的规划使影响最小化,但你有增加(虽然不会翻倍)数据准备时间的风险。最终最好与重要的工作进行沟通,敲敲门,整理资源,做你现在能做到的最完善的工作。

担当与IT的联络者:一种几乎普遍的事实是,IT被提醒说数据挖掘师需要他们的数据,但是IT并没有被提醒说,数据挖掘师需要他们的时间和注意力。当然,没有人想要成为其他团队的负担,但一些额外的负担是不可避免的。一位即将开始数据挖掘项目的分析师会有没有回答的问题或未满足的需要,需要IT团队的支持。外部的数据挖掘资源往往要对IT管理人员解释没有办法完全消除这种情况;这是自然的,而它并不是分析团队的过错。与此同时,有经验的数据挖掘师在额外的工作将要出现时就已经预测到了,会采取行动来减轻它,并试图尽可能方便地安排它。

争取其他部门对项目(和数据) 支持:企业中的某些部门是期待参与其中的,像IT部门。经常有人说一个成功的数据挖掘项目是从上到下地搜索相关数据。有些人会感到惊讶,他们的部门并未尽一切努力。他们可能会不高兴。他们可能会为项目能为整个公司产生利益而激励,但你也可能在不恰当的时候在找他们 — 在他们要外出度假或正临近至关重要的最后项目期限时。清楚的提醒总是明智的,而且应该早一点。做的好的话,在一项高能见度的项目中的主要部门得到一些政治资本,而他们应该小心使用。

从一开始就让每个人思考部署和投资回报率(ROI):分析师太经常被认定是负责“洞察力”的,而已经收到魔力幻灯片的管理团队会从幻灯片里取出它,一路依靠洞察力来完成部署和投资回报率(ROI)。真有这样的好事吗?数据挖掘师必须要细心教育别人很好的规划必须到位,而这个很好的规划必须从数据挖掘项目的第一周就开始执行。让高管们发挥至关重要的作用,但稍加指导对每个人都有好处。毕竟,它可能是每个人的第一个数据挖掘项目。

渐渐消失在幕后:每个人都想因他们的辛勤工作获得赞扬,但聪明的数据挖掘师在告别会上让项目的提倡者和内部客户做所有的发言。数据挖掘师已有最佳的位置,但要保持安静。坦白地说,如果数据挖掘师仍然在项目中肩挑重任,那该项目还没有到准备庆典的时候。最后的会议,可能是许多最终的会议的第一次应该交接工作,报告最初(或预算的)投资回报率(ROI) ,并宣布部署细节的时候。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-24 16:42 , Processed in 0.120970 second(s), 25 queries .

快速回复 返回顶部 返回列表