搜索
查看: 1012|: 0

关于游戏与大数据,怎样在局限性中突破重围

[复制链接]

218

主题

4

回帖

5051

积分

论坛元老

积分
5051
发表于 2015-6-16 16:14:42 | 显示全部楼层 |阅读模式
QQ图片20150616101848.png
如今的游戏研究中,可以通大数据来提升正在设计或开发中游戏的游戏体验。在大数据之前,我们只能想像游戏中一些行为或者一些重点关注人群告诉我们可能地行为。但在大数据之后,我们就可以了解游戏中的实际发生的行为了。高效地数据采集系统成为了游戏地一个感官系统。但是,这是否意味着我们应该无条件地信任数据分析了呢?
在分析数据时我们经常会陷入困境,特别是当我们不明白该如何分析获得的数据时。在游戏里,我们通常在事件发生时获取与事件发生有关的参数,如日期、场景、状态等信息。但最重要的数据可能会丢失。如:一个玩家决定不再玩这个游戏,我们能够知道这个玩家什么时间从服务器下线,但不可能知道玩家做出不再继续游戏决定的时间点,因此需要从玩家下线时间点回溯推断出这个时间点。
但是通常有各种各样不同的原因导致玩家离开,我们不清楚到底是现实生活所致、还是游戏关卡难度过高导致、或者是玩家觉得游戏世界过于无聊,也许还有其它更好解释的原因。为了提高游戏的质量,我们所能做的就是尽力找到那些我们能改变的。
游戏数据分析什么?
    在我们分析游戏数据的算法中,有大量的以平均值的方式展现的指标,怎样计算该平均值可能会影响到数据分析的结果。哪一个计算方式会更合理一些呢?代数平均值?几何平均值?调合平均值?希望我们正确的使用了这些不同的平均值计算方法。然而,即使这样的一个平均值指标,也可能将更重要的信息淹没掉!
    有数据显示,一个游戏的平均在线时长为2.5分钟。当我们仔细分析该平均数据时发现,有近70%的玩家在不到10秒钟的时间内直接退出了游戏。这也意味着剩余的玩家在游戏中平均会花费12到15分钟的时间。那么平均在线时长的意义有多少呢?
    上面说过可能会丢失数据:一些是“终点”丢失的结果,比如强制断线;而另一些可能来自于数据传输过程中的损坏或者失效。那么这些数据的实际意义有多大呢?丢失的数据对数据分析的影响不亚于使用错误的分析方法。
不确定的游戏数据…
    当我们意识到我们无法清楚地知道一件事行不行时,情况变得更糟糕了。那么对于游戏来说,到底应该如何做呢?我们需要一些基本的东西去反映游戏的变化,否则我们就不能够知道如何去做。a/b测试可以提供一些帮助。我们可以给玩家提供两种不同的游戏版本,然后看哪一个版本能够带来更好的成绩。在这两个版本中,我们可以建立一个对照,在这里我们能够看到一些变化。当然,这建立在游戏的玩家群体有相当大的数量基础之上。
    我们能够得到哪些选项是玩家喜欢的:是红色的还是蓝色的付费按钮能够让玩家更乐于付费。可惜的是,这样做并非无懈可击:做出改变本身可能就是销售改善的原因,改变一个按钮的颜色可能与玩家付不付费毫无关系,而一个不同的游戏版本会吸引到其它的玩家,进而导致付费改善。
    更糟糕的是,我们不知道:我们在任何特定的事件点上获取的数据实际是重要的,还是仅仅只是随机发生的,这样的数据在统计学上意义有多大。这取决于同一级数据样本的大小和行为是否能够重现。即使如此,我们依然很难确定改变是行为的结果、还是改变是行为的原因。现实的情况是,任何测试或者改变都会影响到最后的结果。
正确方法分析数据
    拥有不同的玩家样本组是非常有用的,但对于笔者来说,更重要的是验证玩家的非一致性:玩家在玩游戏的过程中是会进化的,他们对游戏的态度、付费的意愿会随着游戏时间发生变化。
    我们需要认识到这一点。这也是我通常使用玩家的实际游戏时间还展现玩家的进度,而不是用实际日期来表示。有一些方法可以用来解决上面我提出的数据分析的几个问题:使用好的统计工具,有一个好的数据分析师。大数据魔镜有500多种数据可视化效果,能将游戏数据进行完整呈现。但是没有任何一个数据分析师可以预测玩家行为或过滤外部因素的影响,依然有待商榷。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-23 13:44 , Processed in 0.134744 second(s), 31 queries .

快速回复 返回顶部 返回列表